Amazon Web Services y Google Cloud Platform registraron impresionantes estadísticas sobre cuán confiables fueron sus nubes públicas de IaaS en el 2014; ambos proveedores se aproximaron a lo que algunos consideran el Santo Grial de la disponibilidad: Cinco nueves.
Retrocedamos al 2012 y veremos que los críticos se quejaron que la nube estaba plagada de caídas -desde aquella caída que trajo abajo a Reddit y a muchos otros sitios hasta el fiasco de vísperas de Navidad que impactó en Netflix. La historia fue diferente el año pasado.
CloudHarmony, firma de seguimiento de sitios web, monitorea la frecuencia con la que un grupo de más de cuatro docenas de proveedores de nube experimentan caídas en sus servicios. La compañía tiene un servidor web en cada una de las nubes de estos proveedores y registra los momentos en los que no está disponible el servicio, registrando tanto el número como la duración de las caídas. Este método no es perfecto pero ofrece una buena idea de cómo están trabajando los proveedores. Y en general, los proveedores lo están haciendo bien y están mejorando.
Amazon y Google destacaron en particular. La Elastic Compute Cloud (EC2) de Amazon registró 2,41 horas de downtime en 20 caídas en el 2014, lo cual significa que funcionó en el 99,9974% del tiempo. Dado el tamaño de AWS -Gartner predijo el año pasado que Amazon tenía un sistema distribuido que es cinco veces más grande que sus competidores- estas cifras son impresionantes.
Quizás incluso más impresionante es el uptime del servicio de almacenamiento de la Google Cloud Platform, el cual experimentó 14 minutos de downtime en todo el 2014, de acuerdo a CloudHarmony. Eso significa un porcentaje de uptime de 99,9996%.
“Los actores mejor establecidos están afinando sus sistemas y se están haciendo muy estables”, señaló Jason Read, CEO de CloudHarmony (vea los datos completos aquí). AWS ha estado proporcionando servicios de nube más tiempo que cualquier otro del mercado y Google utiliza su actual infraestructura para su nube, por lo que también tiene un prolongado registro de tiempo administrando un sistema distribuido confiable”.
A pesar de todo esto, los proveedores de nube tuvieron problemas en el 2014. Alrededor del 10% de las instancias EC2 de AWS tuvieron que ser rebootedas luego de que se identificara una vulnerabilidad Xen el pasado otoño septentrional. Rackspace también tuvo que hacer un gran reboot, y Microsoft tuvo una interrupción en su servicio de almacenamiento en noviembre. Verizon ha comenzado el 2015 diciendo a sus clientes que su nube estará fuera de servicio por hasta 48 horas este mes por mantenimiento programado.
La caída de Microsoft contribuyó para que el año fuera difícil para Azure en términos de disponibilidad. En el campo de la computación, Azure experimentó 92 caídas totalizando 39,77 horas. Su plataforma de almacenamiento tuvo 141 caídas, totalizando 10,97 horas. En comparación, la plataforma de almacenamiento de AWS tuvo 23 caídas y 2,69 horas de downtime. Microsoft no ofreció comentarios para este artículo.
La mayoría de los proveedores parecen estar mejorando sus plataformas, pero ¿podrá algún día la nube llegar a un punto de ofrecer los cinco nueves de disponibilidad que ofrecen los carriers?
Donnie Berkholz, analista senior de la consultora RedMonk, señala que al mirar con cuidado los datos de CloudHarmony se puede ver que algunos proveedores ya están logrando los cinco nueves. Google, por ejemplo, lo está haciendo con su plataforma de almacenamiento. Algunas de las regiones de AWS -CloudHarmony monitorea múltiples regiones en la nube de AWS- tuvieron solo unos cuantos minutos o cero downtime el año pasado, y esto logra cinco nueves. Con cada año que pasa, y con el incremento en el tamaño, los proveedores de nube se vuelven mejores en la oferta de sus servicios, al parecer. Pero otra tendencia interesante, señala Berkholz, es que los usuarios podrían estar aprendiendo de las caídas.
Algunos proveedores de nube -Microsoft Azure y el relativamente nuevo Digital Ocean, por ejemplo- son populares a pesar de no tener fantásticos uptimes en el 2014 (Azure tuvo 39 horas de downtime mientras que CenturyLink tuvo 26 horas y Digital Ocean tuvo 16). “La frecuencia de las caídas, dentro de un cierto rango, no es un obstáculo para la adopción de un proveedor de nube”, escribió Berkholz en un correo electrónico. “La pregunta entonces no es cuál proveedor es el mejor, sino cuál es el límite de los que los clientes consideran aceptable”.
Hay muchas formas en que los usuarios pueden prepararse para una caída de la nube: no alojar cargas de trabajo en un solo lugar, usar herramientas para transferir el tráfico desde los servidores con problemas, evaluar frecuentemente el sistema en cuanto a su tolerancia a los fallos, etcétera. Quizás los usuarios están prestando atención a estas mejores prácticas. O quizás no están colocando material confidencial en la nube que podría afectarse con una caída. Los proveedores de nube y los usuarios parecen estar mejorando, ambos, en la provisión y uso de estos servicios.
Brandon Butler, Network World (EE.UU.)