En el ambiente de negocios de hoy en día, las organizaciones están demandando cada vez más de análisis avanzados que les permitan usar mayores volúmenes y diversos tipos de datos para descubrir patrones y anomalías, y predecir resultados.
“En nuestras investigaciones se ve claramente que la analítica avanzada se está integrando completamente a los procesos de operaciones y de toma de decisiones en compañías de diferentes industrias y rubros”, escribieron Marcia Kaufman, COO y analista principal, y Daniel Kirsch, analista senior de Hurwitz & Associates, en el reciente reporte Advanced Analytics: The Hurwitz Victory. “Ya no es suficiente para los negocios entender que es lo que pasó, sino ahora es esencial preguntar qué es lo que pasará en el futuro para anticipar tendencias y tomar acciones con el fin de optimizar los resultados”.
Por ejemplo, señala Kirsch, las farmacias están ahora usando la analítica avanzada para ayudar a predecir el alcance de alguna temporada de gripe o de alergias seis meses antes, para así poder tener más stock -no quedarse cortos ni tener demasiado stock; de esta manera el lugar en la repisa podrá ser ocupado para algún otro medicamento.
Las granjas están aprovechando la analítica avanzada para ver cuándo sembrar, cómo optimizar el rendimiento de los cultivos y cuándo cosechar. Los fabricantes están usando también la analítica avanzada para predecir cuándo es que una máquina de la planta de producción va a fallar, y poder así realizarle un mantenimiento preventivo antes de que cause gastos inesperados.
Las firmas o empresas de servicios financieros están aprovechando la tecnología para combatir fraudes internos y externos. Los equipos profesionales de deportes están también utilizando la tecnología para varias cosas, incluyendo el uso de sensores en los atletas para crear rutinas de ejercicios optimizadas y predecir lesiones. Los casos de uso de la tecnología y la analítica avanzada son ilimitados.
“Donde estamos viendo que se está haciendo más popular es en predecir el comportamiento del consumidor”, anota Kirsch. “Las compañía quieren ser capaces de proporcionar ofertas personalizadas: Si antes había comprado tres sudaderas, ahora se le va a incentivar a comprar un paquete de camisetas con el 30% de descuento. Si llegáramos a ese nivel de personalización de un servicio, sería más probable que la gente caiga”.
“Lo que el análisis avanzado ofrece está evolucionando rápidamente para satisfacer los deseos y necesidades cambiantes de estas organizaciones”, agrega Kirsch. A continuación, once tendencias del mercado que están dominando el espacio de la analítica avanzada hoy en día según Hurwitz & Associates.
1. Los consumidores buscan hardware y software integrado para las cargas de trabajo analíticas Los consumidores de analítica avanzada están buscando cada vez más, un hardware que esté pre-integrado y optimizado para ejecutar cargas de trabajo de analítica avanzada, dándoles a proveedores tradicionales como SAP,IBM y SAS, una ventaja en el mercado. En el reporte, Kaufman y Kirsch notaron que estas ofertas de hardware, permiten que los usuarios apoyen los grandes datos o Big Data y la analítica avanzada, mientras mantienen altos niveles de velocidad y confiabilidad.
“SAP ofrece una plataforma interna de memoria, HANA, la cual permite a los consumidores ejecutar su solución InfiniteSight en un hardware diseñado para analíticas de alta velocidad y volumen”, escriben. “Además, el PureData System de IBM es un sistema integrado diseñado y optimizado para cargas de trabajo de análisis operacional. Los consumidores pueden beneficiarse gracias a la gran confiabilidad, escalabilidad y velocidad de un una plataforma pre-integrada y optimizada ofrecida por la alianza entre SAS y el fabricante de base de datos Teradata”.
2. Los proveedores están haciendo paquetes para casos de uso horizontales y verticales Kirsch señala que los clientes están buscando cada vez más soluciones horizontales y verticales end-to-end, y los proveedores están siendo obligados a encontrar soluciones especializadas para problemas verticales como la salud, finanzas y el gobierno. El objetivo de la realización de paquetes horizontales es mejorar el servicio al cliente y prevenir fraudes.
“Las soluciones vienen pre-integradas con las mejores prácticas, la automatización de la preparación de los datos y de la construcción de modelos, pero también permiten cierto tipo de personalización”, señalan Kaufman y Kirsch. “Algunos ejemplos de esto incluyen a la plataforma de inteligencia del cliente de SAS que le dan al cliente herramientas para personalizar la experiencia del consumidor, y las extensiones de Pega para SAP y salesforce.com. La oferta de Pega permite a los clientes ejecutar analítica BPM (business process management,gestión de procesos de negocio) y CRM (costumer relationchip management, gestión de relaciones con el cliente)”.
3. El lenguaje de programación de código abierto R se está volviendo penetrante R, un lenguaje de programación de código abierto para estadísticas, visualizaciones y datos computacionales, se está convirtiendo en una herramienta ubicua de las ofertas de analítica avanzada.
Kirsch señala que casi todos los proveedores más importantes de analítica avanzada han integrado R en sus ofertas, eso significa que ahora pueden importar modelos R. Esto permite que los científicos de datos, los estadistas y otros usuarios sofisticados de las empresas aprovechen R dentro del paquete de analítica.
Uno de los grandes beneficiados de esta tendencia, anota Kirsch, es Revolution Analytics, el mayor proveedor de apoyo empresarial para R. Kaufman y Kirsch, por su parte, señalan a Predixion, una empresa de analítica avanzada que se enfoca en extender R más allá de los científicos de datos y estadísticos a los usuarios de negocio, a través de una interfaz.
4. Python está abriendo sus puertas a programadores generales en analítica avanzada Aunque R está normalmente bajo el dominio de los científicos de los datos, que son los que pueden desarrollar modelos de análisis complejos usando análisis de datos profundos y sofisticados; Python, el lenguaje de código abierto, está permitiendo que muchos programadores generales entren al juego.
“Por más que Python no tenga las capacidades de análisis sofisticado y profundo de datos que tiene R, la comunidad está trabajando muchísimo para desarrollar capacidades analíticas más avanzadas y enfocadas para Python”, añaden Kaufman y Kirsch. “IBM y SAS permiten que los clientes integren los proyectos de R y Python en unos de mayor envergadura”.
5. Las interfaces visuales están haciendo que la analítica avanzada sea cada vez más accesible y asequible para los usuarios de negocio Los científicos de datos son pocos y muy dispersos, y las pequeñas y medianas empresas, en particular, están luchando para crear analíticas con equipos experimentados, debido a la falta de presupuesto. Al mismo tiempo, la analítica se está haciendo espacio y está formando parte de la toma de decisiones en todos los niveles de la empresa, haciendo que cada vez sea más importante que los usuarios de negocio tengan acceso a los datos. Esa combinación ha hecho que los proveedores de analítica avanzada se enfoquen en ofrecer características que hagan que sus plataformas sean fáciles de usar.
“Por ejemplo, SAP se está enfocado en automatizar el proceso predictivo, mientras Angoss ofrece una interfaz súper visual para la toma de decisiones y estrategias a usar”, escriben Kaufman y Kirsch. “SAS e IBM han lanzado ofertas específicas para los usuarios de negocio. Por ejemplo, la oferta de Visual Analytics de SAS y la de Analytics Catalyst de IBM están dirigidas a los usuarios de negocio”.
6. Los streams de datos en tiempo real y la Internet de las Cosas están que arden La demanda por el análisis destreams de datos en tiempo real está aumentando rápidamente cada vez que más dispositivos se conectan a Internet. Aplicando analítica avanzada a estos streams, las organizaciones pueden responder con mucha más agilidad, ya sea para proporcionar recomendaciones personalizadas mientras compra online, o monitorear las métricas clave del motor de un jet para identificar pequeños signos de falla incluso antes de que el equipo de mantenimiento se dé cuenta.
“Normalmente, la aerolínea se basaría en las configuraciones manuales de los umbrales y confiaría en las inspecciones visuales”, señalan Kaufman y Kirsch. “Estos umbrales mandan una alerta si el motor se está recalentando, pero son incapaces de identificar los problemas potenciales; resultado de la aparición de varios factores normalmente inocuos, pero que cuando se combinan se convierten en un problema. Los proveedores están respondiendo y reaccionando a la necesidad de proporcionar el análisis de los datos en tiempo real. Event Stream Processing Engine de SAS e InfoSphere Streams de IBM, permiten a los usuarios ejecutar el análisis mientras los datos están en movimiento”.
7. La visualización de los datos se está convirtiendo en un requisito de la empresa La visualización de los datos está jugando un papel sumamente importante dentro de las organizaciones, a medida que se inundan de datos provenientes de los medios sociales, de máquinas, de stream de datos y otros grandes volúmenes de datos estructurados, semi estructurados y no estructurados. Las visualizaciones son necesarias, ya que ayudan a los analistas a descubrir situaciones que serían imposibles de ver en tablas de datos de vértice, hojas de cálculo y cuadros.
“La visualización puede ser la interfaz primaria para los usuarios de negocio y puede, también, ser el primer paso para los científicos de datos”, señalan Kaufman y Kirsch. “Para ayudar a llenar la brecha o el vacío entre los usuarios de negocio y los científicos de datos, los proveedores están ofreciendo más capacidad de visualización. Estas pueden ser personalizadas para diferentes grupos de usuarios para ser entendidas fácilmente. Algunos proveedores ofrecen productos complejos de visualización; por ejemplo, SAS tiene una herramienta interactiva de visualización basada en una memoria interna, SAS Visual Analytics; y Rapidly Adaptive Visualization Engine (RAVE) de IBM está construida dentro del SPSS Analytic Catalyst y da a los usuarios concejos de visualizaciones basados en conjuntos de datos. Otros proveedores como Megaputes, RapidMiner y StatSoft se basan en las capacidades de visualizaciones construidas o que se construyen en la oferta básica”.
8. Las organizaciones están infundiendo el análisis Big Data en todas las actividades de toma de decisiones Ya no es suficiente para el análisis el hecho de ser gestionado o manejado únicamente por el departamento de estadística o análisis de datos. Las organizaciones quieren hacer que la analítica sea parte del proceso de toma de decisiones en todas y cada una de las áreas de la empresa, incluyendo marketing, ventas, operaciones, finanzas y recursos humanos.
“Para mejorar el compromiso de los clientes y optimizar los resultados de todas estas áreas funcionales, las compañías quieren incluir una variedad más amplia de datos en su análisis”, indican Kaufman y Kirsch. “Por ejemplo, los tipos de datos que van desde los generados por una máquina y otros datos de los sensores, hasta las fuentes de datos móviles y financieros y datos de medios sociales, están incluidos en el análisis de Big Data. Estas compañías esperan que sus proveedores apoyen grandes conjuntos de datos”.
Los proveedores están respondiendo con plataformas holísticas que ayudan a integrar los procesos de análisis de Big Data con los esfuerzos de análisis de todas las áreas de la empresa. Kirsch señala como ejemplo al SPSS Analytic Server de IBM, el cual ayuda a las compañías a obtener rápidos resultados del análisis predictivo de Big Data.
9. Muchos servicios de análisis están ubicados o alojados en la nube
Los proveedores de análisis avanzado están apostando cada vez más por la nube para proporcionar un servicio de manera más asequible, haciendo que este sea mucho más práctico y fácil, y que destaque entre tantas grandes empresas capaces y dispuestas a gastar mucho más dinero en soluciones más complejas dentro de las instalaciones.
“Algunas de estas ofertas son para casos específicos de uso”, anotan Kaufman y Kirsch. “Por ejemplo, Angoss, Pega y SAP ofrecen aplicaciones salesforce.com a través del AppExchange para llevar realizar un análisis de los datos CRM. Angoss, IBM y SAS también ofrecen un software más flexible como Software as a Service o Software como Servicio (SaaS) que permite a los consumidores hacer un análisis general con un software basado en la nube”.
10. El análisis in-database esquiva los retos del ETL El rendimiento o desempeño, el gobierno de los datos y la seguridad pueden convertirse en grandes retos y obstáculos para la realización de análisis avanzados sobre conjuntos de datos masivos. Los análisis in-database pueden aliviar o facilitar muchos de estos retos dándole a los usuarios la capacidad de desplegar sus modelos en la base de datos misma, en vez de mover los datos a un ambiente de análisis. Mediante la realización de análisis de los datos en el lugar (in-database), los usuarios pueden reconocer el rendimiento o desempeño y los aumentos en la eficiencia, mientras simplifica la seguridad y el gobierno de los datos, ya que los datos nunca dejarán la segura base de datos.
“Muchos proveedores están ofreciendo capacidades in-database para un gran número de plataformas de datos, incluyendo Hadoop”, señalan Kaufman y Kirsch. “IBM, SAS, RapidMiner, Revolution Analytics, Predixion, StatSoft, SAS y Angoss todos apoyan la explotación de esta característica (in-database). Cuando se evalúa a un proveedor basándose en las capacidades in-database, es importante investigar el apoyo que le dan a la plataforma de datos que su organización está usando. Algunos proveedores solo apoyan Hadoop; y otros, casi todas las plataformas de datos”.
11. Las empresas están empezando a apostar por PMML Mientras las compañías hacen el cambio del análisis por lotes a usar feedback en tiempo real y a mejorar continuamente la precisión de los modelos, están aprovechando cada vez más el Predictive Model Markup Language (PMML). PMML es un estándar para los modelos estadísticos y de explotación de datos desarrollado por el Data Mining Group (DMG), un consorcio independiente dirigido por proveedores. IBM y SAS son miembros completos del DMG; mientras SAP, StatDoft, RapidMiner y Angoss contribuyeron al desarrollo de PMML. Kirsch señala que el estándar hace que sea más fácil desarrollar un modelo en un sistema con una aplicación particular y luego desplegarlo en un sistema diferente usando una aplicación diferente.
“Estas compañías encontraron que desplegar modelos en aplicaciones con PMML ayuda a superar demoras y aceleran el proceso de mover los modelos a la producción”, anotan Kaufman y Kirsch. “Uno de los mayores beneficios de usar PMML es que elimina la necesidad de procesos patentados y de codificación caros y que consumen demasiado tiempo”.
Thor Olavsrud, CIO (EE.UU.) – CIOPeru.pe