Hacer que sus datos le digan lo que no sabe requiere análisis. De analítica. Y la analítica requiere de la nube.
Por Matt Asay | Original de IDGN
Los datos por sí mismos no son muy útiles. Solo se vuelven útiles a medida que se entienden y se infunden en las experiencias de la aplicación.
Este deseo de poner los datos a trabajar ha impulsado un auge en el análisis basado en la nube.
Aunque actualmente una cantidad relativamente pequeña del gasto en TI se destina a la nube (aproximadamente el 6% según IDC en 2020), todo el impulso se está alejando de las herramientas de inteligencia empresarial heredadas locales hacia opciones más modernas nativas de la nube como:
- Google BigQuery
- Amazon Redshift
- Databricks
- O Snowflake
La popularidad de unir los datos y la nube se muestra en el aumento vertiginoso de Snowflake en las clasificaciones de popularidad de la base de datos de DB-Engines, del número 170 en noviembre de 2016 al número 11 en enero de 2023.
Parte del éxito de Snowflake se reduce absolutamente al:
- Rendimiento
- La escalabilidad
- La separación de almacenamiento
- Y computación
- Así como otros beneficios
Pero podría decirse que un beneficio aún mayor es – simplemente – la nube.
Snowflake nació en la nube y ofrece un camino natural para las empresas que buscan migrar a ella.
Sí, esa misma nube sigue impulsando nuevas bases de datos frente a las alternativas heredadas.
Esa misma nube promete continuar revolucionando el mundo de los datos en 2023.
¿Toda la nube, todo el tiempo?
Si bien no estoy completamente de acuerdo con mi colega de InfoWorld, David Linthicum en qué “2023 podría ser el año de la repatriación de la nube pública”, puedo estar de acuerdo en que no debemos enamorarnos ciegamente de una tecnología o verla como un martillo y, por lo tanto, tratar cada problema de negocios como un clavo.
La nube resuelve muchos problemas, pero no todos.
Sin embargo, en áreas relacionadas con aplicaciones avanzadas basadas en datos, la nube es indispensable, como reconoce Linthicum:
“Cuando se trata de servicios de TI avanzados (IA, análisis profundo, escalado masivo, computación cuántica, etc.), las nubes públicas suelen ser más económicas”.
No solo más económico, sino también más práctico.
Hace años, el ejecutivo de AWS, Matt Wood, me explicó este caso, y es tan persuasivo hoy como lo fue en 2015.
“Aquellos que salen y compran infraestructura costosa descubren que el alcance del problema y el dominio cambian muy rápidamente”, dijo. “Para cuando logran responder la pregunta original, el negocio ha avanzado”.
Continuó diciendo que si arroja una gran cantidad de cambio en un centro de datos que está congelado en el tiempo.
Las preguntas que puede hacer sobre sus datos quedan atrapadas en un túnel del tiempo. Incluso en tiempos económicos difíciles, la manera incorrecta de pensar en la nube es a través de una lente estrecha de costos.
La infraestructura elástica genera flexibilidad para dar sentido a los datos. Dólares de sentido, por así decirlo, en lugar de dólares y centavos. Esas son herramientas de análisis basadas en la nube.
Las empresas parecen entender esto.
En una reciente conferencia de analistas, el director financiero de Snowflake, Mike Scarpelli, habló sobre la dinámica competitiva en el mercado de almacenamiento de datos.
“Nunca competiremos con Teradata [una empresa de análisis de datos establecida fundada en la era del software local]. Cuando un cliente ha tomado la decisión de irse fuera de las instalaciones, nunca está en contra de Teradata. Han tomado la decisión de irse”.
Si la empresa ya está mirando hacia la nube cuando realiza un ejercicio de transformación digital, ¿hacia dónde mira?
Según Scarpelli:
“Cuando competimos por una migración local, siempre es [contra] Google, Microsoft [y] AWS [pero AWS] tiende a asociarse con nosotros más [fuera] de la puerta”.
En otras palabras, es probable que el cliente haya pasado años con su almacén de datos local o su solución de BI, pero no es ahí donde está apostando su futuro.
Su futuro es la nube. Si están considerando el próximo paso, no es probable que Sea Oracle a menos que estén tan metidos en Oracle como para que la introducción de un nuevo sistema parezca difícil.
La mayoría de las veces, las empresas buscarán una base de datos basada en la nube, un almacén de datos/lakehouse o un sistema de aprendizaje automático/inteligencia artificial.
Más Google BigQuery, en otras palabras, y menos SAP BusinessObjects.
Democratizar los datos
Otra razón del éxito de la nube es la simplicidad. O puede serlo.
La nube, por supuesto, no es inherentemente más fácil de usar, pero muchos sistemas en la nube han enfatizado un enfoque SaaS que otorga una gran importancia a la experiencia del usuario.
Tome, por ejemplo, este comentario de un tablero de Reddit, que describe su experiencia con Snowflake:
“Si necesita un doctorado en física para usar su herramienta SaaS, su herramienta es inútil. A los usuarios de MySQL les encanta (analistas), al C-suite le encanta, las únicas personas a las que les cuesta ganar son los ingenieros nerds como yo que tenían suficiente arrogancia para pensar que podían hacerlo todo ellos mismos y que todos en el mundo aprenderían PySpark uno. día”.
Recientemente escribí sobre la democratización de los datos: cómo las empresas están tratando de brindar a más empleados acceso y capacidad para trabajar con más y diferentes datos.
Señalé que si las empresas realmente quieren democratizar los datos, deberán enseñar a los empleados cómo usar de manera efectiva las herramientas basadas en la nube para probar los datos basados en la nube.
Afortunadamente, la nube también permite que los sistemas de aprendizaje automático asuman parte de la carga pesada.
Como escribe mi colega de MongoDB, Adam Hughes:
“La combinación de análisis en tiempo real, operativos e integrados (lo que algunos llaman translytics, HTAP o bases de datos de transacciones aumentadas) ahora permite análisis impulsados por datos de aplicaciones para ayudar a determinar, influir y automatizar la toma de decisiones, para proporcionar información en tiempo real para el usuario”.
Esto no significa que las máquinas piensen por nosotros, sino que eliminan el trabajo (pesado) indiferenciado del procesamiento de datos de cómputo, dejando al usuario con el trabajo más reflexivo de comprender qué significan esos datos para una aplicación y, en última instancia, el negocio.
Todo esto no está completamente impulsado por la nube, pero está absolutamente mejorado y acelerado por la nube.
Los datos nunca han sido más importantes, y acceder a ellos y comprenderlos nunca ha sido tan fácil gracias a la computación en la nube.
Si quisiera elegir una predicción casi segura para 2023, es que esta tendencia continuará y se acelerará.