Con el despliegue de una actualización de su base de datos BD2, IBM está dirigiendo su infrastructure as a service (IaaS) SmartCloud para su uso en reportes y análisis de datos.
“Somos el único actor en el mercado que tiene un servicio de nube para ‘datos en movimiento’, que puede analizar los datos en tiempo real”, sostuvo Bob Picciano, gerente general de IBM para Information Management.
Desde el segundo semestre de este año, el IBM SmartCloud IaaS comenzará a usar la versión 10.5 de la base de datos DB2, la cual debería estar disponible para todos desde inicios de junio. BLU Acceleration, un conjunto de tecnologías que vendrá con esta base de datos, puede acelerar el análisis de los datos en 25 veces o más, sostuvo IBM.
La corporación también anunció que SmartCloud puede ahora correr copias de la base de datos en memoria HANA, inicialmente para evaluación y trabajos de desarrollo.
BLU
BLU (nombre código que significa Big data, Lightening fast, Ultra easy) es un conjunto de tecnologías que optimizan la velocidad de los queries de DB2 para bases de datos en memoria. Ofrece procesamiento por columnas, en donde, para acelerar el desempeño, se leen solo las columnas que se necesitan de una tabla de base de datos. Deja de lado los datos no necesarios, como las entradas duplicadas. Puede utilizar varios núcleos de procesadores para ejecutar una query, usando técnicas de procesamiento vectorial paralelo. También incluye una tecnología de compresión que minimiza la cantidad de espacio que necesita un conjunto de datos, pero proporcionando una fácil accesibilidad a ellos para realizar análisis rápidos.
Un cliente puede continuar usando el software de inteligencia de negocios que prefiera y simplemente redireccionar los queries SQL y OLAP (Online analytical processing) desde el software de inteligencia de negocios al servicio de IBM. Cada instancia de DB2 en SmartCloud puede correr hasta 16 núcleos de procesador, los cuales colectivamente pueden administrar un terabyte o más de memoria.
“Uno no necesita muchos núcleos para poder aprovechar este tipo de paralelismo, ya que somos tan eficientes en la forma en que usamos los procesadores y la memoria”, afirmó Picciano.
Con esta tecnología, un cliente puede configurar un sistema que podría analizar los datos a medida que vayan llegando, señaló el ejecutivo. Generalmente, las organizaciones podrían almacenar sus datos en un data warehouse o, si los datos se recogen en suficiente cantidad, en un cluster Hadoop. Luego podrían usar varias herramientas de inteligencia de negocios para extraer patrones y otro tipo de inteligencia del conjunto de datos. IBM propone mantener los datos en memoria y analizarlos al vuelo, usando las mismas herramientas de inteligencia de negocios. El enfoque ‘en memoria’ puede reducir los tiempos de query en miles de veces, afirmó Picciano.
“Las queries que solían correrse en siete minutos en conocidos sistemas de data warehouse pueden correr en ocho milisegundos en nuestros sistemas”, detalló el ejecutivo.
La nube sigue creciendo
IBM se une así a varias empresas que están señalando a la computación en la nube como la plataforma ideal para análisis de datos de gran escala. Google, por ejemplo, ofrece su servicio BigQuery para procesar datos en línea. VMware, junto con su compañía madre EMC, recientemente independizó a una subsidiaria de servicios de nube llamada Pivotal, que se concentrará en proporcionar servicios de análisis de datos.
IBM también está ofreciendo correr copias de SAP HANA en su SmartCloud, en donde puede usarse para el análisis de datos. La compañía no especificó si va a proporcionar sus propias licencias para los servicios o si los clientes deben tener las suyas propias. Un cliente inicial de este servicio ha sido la tienda por departamentos Globus, la cual monitorea las ventas de aproximadamente 800 mil clientes en una instancia de HANA en SmartCloud.
Picciano no reveló información sobre los precios del servicio SmartCloud, señalando que IBM trabaja con cada cliente caso por caso.
Otros proveedores de nube también realizaron anuncios esta semana. Google ha reducido los precios de su Google Cloud Datastore, un servicio de almacenamiento de datos NoSQL, en hasta 25%. Igualmente, Microsoft anunció que está ampliando su servicio de nube Azure a China, lo que lo hace en el primer proveedor de nube principal en hacerlo, sostuvo la compañía.
Joab Jackson, IDG News Service