EMC quiere golpear fuerte este 2012 y ha lanzado su más reciente producto NAS (Network Attached Storage) Isilon, que presenta soporte nativo para la plataforma de analítica de código abierto Hadoop, basado en Apache.
La compañía señala que la adopción de Hadoop en las empresas ha sido difícil, debido a que los adoptadores tempranos tenían que confiar en infraestructuras de almacenamiento improvisadas que no se encontraban optimizadas para la exploración de Grandes Datos (Big Data), inhibiendo así el acceso compartido a los datos que se requiere para realizar un análisis robusto.
La integración del protocolo Distributed File System (HDFS) de Hadoop con el NAS Isilon de EMC “elimina las complejidades de la integración de los componentes dispares de código abierto y el hardware”, lo que significa que los clientes pueden ahora aprovechar los beneficios de la analítica de Grandes Datos sin tener que tratar con varios proveedores. La integración también elimina el punto único de falla inherente al tradicional Hadoop Apache de código abierto, sostuvo la compañía.
EMC planea combinar el nuevo producto NAS Isilon con su propio sistema de analítica de código abierto Greenplum HD, afirmando que esto también ayudará a reducir las complejidades asociadas con los despliegues de Hadoop.
“La solución integrada Isilon permite a los clientes conectar los insights derivados de Hadoop directamente en un flujo de analítica de datos estructurados sin tener que mover los datos”, afirmó Luke Lonergan, chief technology officer de Greenplum.
“Esto mejora la colaboración y acelera la analítica de datos para nuestros clientes, permitiéndoles descubrir nuevos insights de manera rápida y eficiente, para mantener su ventaja competitiva”.
EMC afirma que Isilon es la única plataforma de almacenamiento NAS que integra HDFS nativo como protocolo, proporcionando acceso a la protección de datos, almacenamiento y movimiento acelerado de datos de la empresa sobre una amplia gama de protocolos estándar de la industria (NFS, CIFS, FTP, HTTP).
Aunque originalmente diseñada para ayudar a los grandes servicios de búsquedas, Hadoop está encontrando un hogar dentro de las empresas, particularmente en aquellas en las que los conjuntos de datos son demasiado grandes para las tradicionales bases de datos relacionales, o en los casos en donde la organización recolecta muchos datos pero no sabe aún qué análisis necesita realizar en esos datos.
JPMorgan Chase usa la tecnología para la detección de fraudes y para la gestión del riesgo, e eBay está usando la tecnología para construir un nuevo motor de búsqueda para su servicio de subastas.
A pesar de haber estado activa por seis años, Hadoop solo llegó a la versión 1.0 al final del 2011. Sin embargo, la tecnología ya ha ganado mucho soporte comercial. Las startups Cloudera, Hortonworks (nacida a partir de Yahoo) y MapR ofrecen distribuciones comerciales del software, IBM ha incorporado Hadoop en su paquete de análisis de datos InfoSphere BigInsights, y Microsoft tiene una copia de Hadoop que corre en su servicio de nube Windows Azure.
“Hadoop será un game changer en la analítica de los datos no estructurados una vez que los clientes empresariales estén convencidos que su adopción puede simplificar su infraestructura y arquitectura sin comprometer la seguridad de los datos o las capacidades de administración”, señaló Sam Grocott, vicepresidente de Marketing de EMC Isilon.
“Hemos dejado atrás las conjeturas acerca de los despliegues de Hadoop al unir las fortalezas de los sistemas de almacenamiento NAS Isilon con el ecosistema de Hadoop”.
Sophie Curtis, Techworld.com