El proveedor cloud Joyent sufrió una caída de su servicio el martes luego que un administrador pudo reiniciar simultáneamente todos los servidores virtuales hosteados en el centro de datos US-East-1.
“Nos ha mortificado esta situación. Si bien la causa inmediata fue un error operativo, hay temas sistémicos que permitieron que un error traiga abajo un centro de datos”, dijo Bryan Cantrill, CTO en Joyent, en un post en Hacker News.
La compañía se dio cuenta de esto cuando comenzó a ver varios problemas de disponibilidad.
“Debido a un error operativo, todos los nodos de computación del US-East-1 fueron reseteados simultáneamente. Algunos nodos ya están operativos, pero debido al alto volúmen, esto está tomando tiempo”, dijo Joyent en su primera actualización sobre el tema.
Una hora después de reportar el problema, la compañía dijo que todos los nodos y máquinas virtuales ya estaban operativos.
Joyent no dijo cuántos clientes o servidores fueron afectados por el reinicio. Sin embargo, un error de esta magnitud no debería volver a pasar, y muestra la importancia de los procesos de seguridad contra estos temas.”Tan pronto como podamos, haremos un análisis de esto: cómo fue posible, qué paso exactamente, cómo se recobró el sistema y qué mejoras necesitamos hacer”, escribió Cantrill.La compañía está buscando cómo mejorar sus procedimientos operacionales y su software para asegurar que esto no pase en el futuro, dijo Cantrill.Como cualquier otro sistema de TI, los servicios en la nube y los servidores pueden sufrir de caídas, pero debido a su número estas consecuencias son mayores.Esta semana algunos usuarios de Amazon Web Services tuvieron problemas de energía. Los servidores en una de las zonas de la región US-West-1 fueron afectados y tomó unas tres horas para volver a dejarlos operativos. Amazon no dijo qué sucedió.Recientemente, Twitter también sufrió una caída tras el cambio de uno de sus servicios principales, así como los molestos usuarios de HBO y de su servicio Go, por el gran número de personas que querían ver la premiere de Game of Thrones.
Fuente: CIO / Mikael Ricknas / 28-05-2014