Un informe de Omdia revela que el crecimiento de parámetros en los grandes modelos cae al 5% anual mientras los agentes reconfiguran la demanda de cómputo.
La era del escalado masivo en los modelos de IA frontier parece estar tocando techo. Según un nuevo informe de Omdia, el crecimiento de parámetros en estos modelos se ha desacelerado hasta apenas el 5% anual desde 2021, frente a la expansión de más de cien veces registrada entre 2019 y 2021. El cambio no anuncia un retroceso del sector, sino una transformación estructural en la forma en que los sistemas de IA obtienen rendimiento.
Para entender la magnitud de este giro, conviene precisar qué se entiende por modelo frontier en el campo de la inteligencia artificial. El término designa a los modelos que se encuentran en la frontera del estado del arte: los más avanzados y capaces disponibles en un momento dado, entrenados con el mayor volumen de datos y recursos computacionales. Ejemplos actuales son GPT-4o de OpenAI, Gemini Ultra de Google, Claude Opus de Anthropic o las versiones más grandes de Llama 3 de Meta.
La frontera no es estática: un modelo que la define hoy puede quedar desplazado en seis meses por uno más potente. Lo que el informe de Omdia señala es que esa frontera ha dejado de expandirse al ritmo vertiginoso al que lo hacía hace apenas cinco años.
El informe AI Model Trends Spring 2026: State of the Art AI Models and their Compute Demands, publicado por Omdia, documenta con precisión este punto de inflexión. La firma de análisis tecnológico —parte de Informa TechTarget (Nasdaq: TTGT)— advierte que la ralentización en el tamaño de los modelos no debe confundirse con un estancamiento del sector. La razón es más estratégica que técnica.
Agentes de IA: el factor que reorganiza el cómputo
“En años anteriores, las desaceleraciones sostenidas en el crecimiento de los modelos de IA solían asociarse con ‘inviernos de IA’, como el de los años ochenta, cuando el campo enfrentaba desafíos sistémicos. Hoy claramente no es ese el caso”, afirmó Alexander Harrowell, analista principal sénior de Computación Avanzada en Omdia. “Creemos que gran parte de este cambio está vinculado al auge de los agentes. Los sistemas modernos de IA derivan cada vez más su rendimiento del uso de herramientas, lo que implica intercambiar cómputo de CPU —relativamente económico— por recursos de GPU, considerablemente más costosos.”
Esta migración hacia arquitecturas agénticas tiene una consecuencia directa sobre la infraestructura: la proporción CPU:GPU tiende a aproximarse a 1:1, lo que altera los supuestos de diseño de los centros de datos construidos bajo parámetros anteriores.
Los agentes también demandan ventanas de contexto cada vez más extensas. Toda interacción, entrada de datos y comunicación entre herramientas debe procesarse a través de la ventana de contexto, lo que convierte la gestión del desbordamiento de contexto en un vector crítico de optimización. Para responder a esta presión, está emergiendo una nueva jerarquía de caché que abarca memoria RAM y almacenamiento rápido. Sin embargo, esta diversificación —modelos de IA en GPU, agentes en CPU, desbordamiento de contexto en almacenamiento— ejercerá una presión creciente sobre las redes de los centros de datos.
Los modelos medianos y los modelos de IA frontier pequeños ganan protagonismo
Paralelamente, la definición de modelo “pequeño” está siendo reescrita. Los modelos de entre 7.000 y 14.000 millones de parámetros desplazan progresivamente a los que rondan los 100 millones, y una categoría de modelos medianos de código abierto gana impulso en desarrollo, adopción y percepción de mercado.
Este segmento cobra relevancia, entre otras razones, por su función como coordinadores de agentes en sistemas como OpenClaw. Sus capacidades multimodales en expansión también los posicionan como alternativa viable frente a los grandes modelos frontier en un amplio espectro de aplicaciones empresariales.
En el plano del hardware, Harrowell señaló un interés creciente en las GPU de rango medio, como la NVIDIA B40, tanto para estos modelos como para el lado de decodificación en arquitecturas de inferencia desagregada. “El desafío competitivo clave para cualquier nuevo chip de IA sigue siendo la GPU insignia del año anterior. Las GPU más antiguas retienen valor y permanecen en servicio, ya que continúan ofreciendo una opción rentable para la inferencia y desagregación de modelos pequeños y medianos”, añadió el analista.
Una reconfiguración silenciosa con consecuencias visibles
El informe de Omdia apunta a una transición que, aunque no genera titulares tan llamativos como los lanzamientos de nuevos modelos frontier, tiene implicaciones profundas para los responsables de tecnología en las organizaciones. La presión sobre las redes de centros de datos, la reevaluación del hardware instalado y la aparición de modelos medianos como protagonistas de la arquitectura agéntica configuran un nuevo mapa de decisiones para los CIO y CTO que afrontan sus estrategias de infraestructura de IA para los próximos años.







