Lenovo AION impulsa la IA híbrida con inferencia en CPU

Lenovo apuesta por la IA híbrida para reducir costos y acelerar la inferencia empresarial

La iniciativa de Lenovo aprovecha procesadores Intel Xeon 6 para ampliar la escalabilidad de la IA empresarial y reducir la dependencia de las GPU.

La IA híbrida se perfila como una de las estrategias más prometedoras para responder al creciente costo de la infraestructura de inteligencia artificial. Con ese objetivo, Lenovo presentó AION, un proyecto de investigación y desarrollo diseñado en Brasil que propone un modelo de ejecución donde las CPUs asumen una parte importante de las tareas de inferencia, reservando las GPU para las cargas de trabajo de mayor complejidad. La iniciativa busca mejorar el aprovechamiento de la infraestructura existente y acelerar la adopción de IA empresarial sin depender exclusivamente de hardware especializado.

AION representa un paso adicional dentro de la estrategia de Hybrid AI de Lenovo. La compañía deja de posicionarse únicamente como proveedor de infraestructura para ofrecer una arquitectura integral que combina hardware, software y optimización de cargas de trabajo.

El proyecto se apoya en los procesadores Intel Xeon 6 con Performance-cores, capaces de ejecutar procesos de inferencia directamente sobre CPU mediante optimizaciones de software como OpenVINO y aceleradores Intel AMX. La propuesta responde a una realidad que afecta a numerosas organizaciones: la limitada disponibilidad de GPU, sus elevados costos y la existencia de una importante capacidad de procesamiento desaprovechada en los centros de datos.

Ricardo Bloj, presidente de Lenovo Brasil, explica que el objetivo consiste en construir entornos de inteligencia artificial más eficientes y flexibles, adaptados a las necesidades reales de cada negocio. Según el ejecutivo, las arquitecturas híbridas permiten distribuir inteligentemente las cargas de trabajo para obtener un mejor rendimiento y una utilización más eficiente de la infraestructura instalada.

IA híbrida: aprovechar mejor la infraestructura existente

Uno de los principales aportes de AION consiste en trasladar parte de las tareas de inferencia hacia CPUs modernas, especialmente aquellas aplicaciones que no requieren la enorme capacidad de cálculo de una GPU.

Esta aproximación permite ejecutar modelos de IA destinados a chatbots corporativos, APIs de inteligencia artificial, plataformas transaccionales y múltiples servicios empresariales sin incrementar significativamente la inversión en nuevos aceleradores gráficos.

La estrategia también mejora el retorno de inversión de la infraestructura existente. Muchas organizaciones cuentan con servidores equipados con procesadores de última generación que permanecen infrautilizados durante buena parte de su operación diaria. Lenovo plantea convertir esos recursos disponibles en capacidad efectiva para proyectos de IA.

Resultados técnicos de AION

Los primeros resultados compartidos por Lenovo muestran cifras relevantes para cargas de inferencia ejecutadas exclusivamente sobre CPU.

Entre los indicadores destacados figura un Time to First Token (TTFT) de apenas 0,3 milisegundos, junto con una velocidad de generación de 11 tokens por segundo, sin utilizar GPU. Estas métricas reflejan el potencial de este enfoque para aplicaciones empresariales donde la velocidad de respuesta resulta crítica.

El proyecto también aprovecha la arquitectura multinúcleo del Intel Xeon 6 para ejecutar múltiples solicitudes de inferencia en paralelo, aumentando el throughput del servidor y permitiendo atender un mayor número de usuarios simultáneamente.

Marcelo Bertolami, Director del Equipo de Ventas y Tecnología de Intel para América Latina, afirma que la combinación entre Xeon 6, los aceleradores AMX y OpenVINO demuestra que la IA empresarial puede escalar de forma más eficiente y accesible, reduciendo costos mientras incrementa el rendimiento operativo.

Una estrategia para escalar la IA empresarial

Más allá de los resultados técnicos, AION refleja una tendencia creciente: la distribución inteligente de cargas entre CPU, GPU y aceleradores especializados según las necesidades específicas de cada aplicación.

Este enfoque ofrece ventajas relevantes para organizaciones que buscan expandir sus iniciativas de inteligencia artificial sin incrementar proporcionalmente sus inversiones en infraestructura.

Lenovo presentará esta visión durante Lenovo Accelerate, donde mostrará cómo las arquitecturas híbridas pueden facilitar una adopción más sostenible de la IA corporativa.

La compañía sostiene que el futuro de la inteligencia artificial no dependerá exclusivamente del incremento en la potencia de las GPU, sino de la capacidad para combinar distintos tipos de procesamiento dentro de una misma arquitectura, optimizando recursos, reduciendo costos y acelerando el despliegue de aplicaciones en producción.