La nube y el Big Data, más cerca que nunca. Las dos tendencias dominantes en el mercado TIC actual confluyen en la nueva propuesta de IBM, que está orientando su SmartCloud hacia el análisis de datos en tiempo real al implementar una actualización clave de su base de datos BD2.
Desde el segundo semestre de este año, la IBM SmartCloud (una oferta de infraestructura como servicio, IaaS) comenzará a usar la versión 10.5 de la base de datos DB2, que debería estar disponible para todos los usuarios desde inicios de junio.
Esta actualización traerá consigo la tecnología BLU Acceleration, un conjunto de soluciones que pueden acelerar el análisis de los datos en 25 veces o más, sostienen desde el Gigante Azul. Por otro lado, IBM también ha anunciado que SmartCloud soporte ahora copias de la base de datos en memoria HANA, principalmente para tareas de evaluación y trabajos de desarrollo.
“Somos el único actor en el mercado que tiene un servicio de nube para datos en movimiento capaz de analizar los datos en tiempo real”, asegura Bob Picciano, director general de IBM para Information Management, recordando el lema de la compañía (Business In Motion).
BLU (nombre en código que significa Big data, Lightening fast, Ultra easy) es un conjunto de tecnologías que optimizan la velocidad de los queries de DB2 para bases de datos in-memory. Ofrece procesamiento por columnas, en donde, para acelerar el rendimiento, se leen solo las columnas que se necesitan de una tabla de base de datos. De este modo, se dejan de lado los datos no necesarios, como las entradas duplicadas. Puede utilizar varios núcleos de procesadores para ejecutar una query, usando técnicas de procesamiento vectorial paralelo. También incluye una tecnología de compresión que minimiza la cantidad de espacio que necesita un conjunto de datos, pero proporcionando una fácil accesibilidad a ellos para realizar análisis rápidos.
El cliente puede continuar usando el software de Business Intelligence que prefiera y simplemente redireccionar los queries SQL y OLAP (Online analytical processing) desde el software al servicio de IBM. Cada instancia de DB2 en SmartCloud puede correr hasta 16 núcleos de procesador, los cuales colectivamente pueden administrar un terabyte o más de memoria.
“No se necesitan muchos núcleos para poder aprovechar este tipo de paralelismo, ya que somos muy eficientes en la forma en que usamos los procesadores y la memoria”, afirma Picciano.
Con esta tecnología, un cliente puede configurar un sistema que analice los datos a medida que vayan llegando, señaló el ejecutivo. Generalmente, las organizaciones podrían almacenar sus datos en un data warehouse o, si los datos se recogen en suficiente cantidad, en un cluster Hadoop. Luego podrían usar varias herramientas de inteligencia de negocios para extraer patrones y otro tipo de inteligencia del conjunto de datos. IBM propone mantener los datos en memoria y analizarlos al vuelo, usando las mismas herramientas de inteligencia de negocios.