Ayer Microsoft añadió tres nuevos servicios de big data a su plataforma de nube Azure como parte de sus esfuerzos para hacer de Azure una plataforma líder en servicios de big data, y para prepararla para la Internet de las Cosas (IoC).
“Todos los días, la IoC está alimentando vastas cantidades de datos provenientes de millones de endpoints que transmiten a alta velocidad en la nube”, sostuvo Joseph Sirosh, vicepresidente corporativo de Aprendizaje de Máquina de Microsoft. “En muchos negocios, como la comercialización de acciones, detección de fraudes, servicios de protección de identidad, sensores, analítica de web clickstream y alertas de aplicaciones CRM, se pueden encontrar ejemplos de streaming de analítica. En este nuevo y veloz mundo de nubes y dispositivos, los negocios ya no pueden esperar meses o semanas para obtener los insights generados desde los datos”.
Dos de los servicios –Stream Analytics y Azure Event Hubs– están dirigidos a ayudar a los clientes a procesar los datos provenientes de dispositivos y sensores en la IoC. Mientras que el servicio Azure Data Factory ofrece producción de información mediante la orquestación y administración de diversos datos, especialmente en ambientes híbridos en donde algunas fuentes de datos residen en la nube y otras se encuentran on premise.
Stream Analytics es un motor de procesamiento de eventos, similar al framework Apache Storm, excepto que Stream Analytics es un servicio administrado. Microsoft anunció el soporte para Apache Storm en Azure HDInsight este mes.
“Los escenarios son similares”, sostuvo Herain Oberoi, director de gestión de producto de Microsoft Data Platform de Microsoft. “Stream Analytics es más un servicio administrado mientras que Storm es un proyecto adicional en el ecosistema de Hadoop que uno tiene que administrar por sí mismo. Para los clientes que quieren un servicio más administrado donde haya menos código y donde haya que administrar menos el paquete, Stream Analytics tiene más sentido. Nosotros estamos invirtiendo en ambos”.
Stream Analytics tiene el propósito de trabajar de la mano con Azure Event Hubs, un servicio escalable de recolección de datos a partir de millones de eventos por segundo.
Más allá de la Internet de las Cosas
Sin embargo, Microsoft no se está enfocando solo en la Internet de las Cosas. El servicio Azure Data Factory tiene como propósito hacer frente a un desafío más fundamental: Administrar, coordinar y procesar, de manera efectiva, datos provenientes de muchas fuentes diferentes -entre diferentes lugares geográficos, on premises o nube, datos estructurados o no estructurados- mientras que al mismo tiempo enfrenta cambios en los requerimientos de negocio.
“Una de las razones por las que hemos visto la necesidad de Data Factory es debido a que muchos de nuestros clientes están haciendo cosas en un ambiente híbrido”, afirmó Oberoi. “La necesidad de soportar la producción de información on premise y en la nube se ha desarrollado bastante”.
Oberoi comparó a Data Factory con la integración de datos 2.0, proporcionando orquestación entre la miríada de almacenes de datos y tipos de procesamiento que se encuentran crecientemente disponibles.
Stream Analytics y Azure Data Factory actualmente se encuentran disponibles en preview. Azure Event Hubs ya se encuentra disponible para todos.
Francisco Carrasco, CIO America Latina