La nueva apuesta de Meta en IA física promete avances técnicos notables, pero deja entrever una carrera contrarreloj para no perder protagonismo frente a gigantes como Nvidia.
¿Puede una tecnología liderar una revolución cuando nace desde la presión y no desde la visión? Esa es la pregunta que deja flotando el reciente anuncio de Meta: el lanzamiento de V-JEPA 2, su nueva arquitectura de inteligencia artificial orientada a interpretar y actuar en el mundo físico. Técnicamente, es un avance. Estratégicamente, parece una jugada a la desesperada.
V-JEPA 2: ¿el nuevo camino hacia la IA física?
El nombre lo dice todo: Video Joint Embedding Predictive Architecture 2. La evolución natural de la arquitectura JEPA que Meta presentó en 2022 para imágenes, ahora extendida a video. Con 1.200 millones de parámetros y un entrenamiento sobre más de un millón de horas de contenido audiovisual, V-JEPA 2 aspira a dotar a robots físicos de capacidad de razonamiento y planificación sin experiencia previa (zero-shot).
En teoría, estamos ante un modelo preparado para interpretar dinámicas físicas, realizar tareas inéditas y responder a preguntas sobre causalidad con notable precisión. En la práctica, el contexto del anuncio es tan revelador como la tecnología misma.
¿Innovación genuina o cortina de humo?
El lanzamiento de V-JEPA 2 se produjo apenas 24 horas después de que se filtrara el rumor de una posible compra multimillonaria: Meta habría adquirido Scale AI por 15 mil millones de dólares. ¿Coincidencia? Difícil creerlo. Todo apunta a una estrategia sincronizada para reposicionar la marca en la carrera de la IA, justo cuando Nvidia pisa el acelerador con su modelo Cosmos —entrenado, por cierto, con 20 veces más horas de video.
David Nicholson, analista de The Futurum Group, lo resume sin filtros: “Mucho de esto es desesperación de Meta”.
Y es que, si bien Meta ha ganado relevancia con LLaMA en el universo de modelos de lenguaje open source, no ha logrado el mismo impacto en el campo de la IA física. De ahí que este anuncio se sienta más como un movimiento táctico que como una ruptura de paradigma, tal y como lo sugieren los analistas.
Scale AI: el as bajo la manga
La posible adquisición de Scale AI no es un simple movimiento financiero. Es una declaración de intenciones. Zuckerberg quiere un enfoque “human-in-the-loop”, y eso requiere datos etiquetados con precisión casi quirúrgica. Justo el fuerte de Scale AI. El mensaje es claro: si no puedo construirlo todo desde dentro, entonces lo compro.
Esta estrategia dual —desarrollo interno + adquisición externa— revela tanto el tamaño de la ambición de Meta como su urgencia. Y en el mundo de la inteligencia artificial, la urgencia rara vez es amiga de la claridad estratégica.
Benchmarks y apertura: democratizar para competir
A favor de Meta hay que decir que ha liberado el acceso a V-JEPA 2 en plataformas como GitHub y Hugging Face, junto a un sitio web dedicado. Además, ha introducido tres benchmarks específicos para evaluar el rendimiento de modelos de IA física:
- IntPhys 2: mide la comprensión de plausibilidad física.
- Minimal Video Pairs: evalúa la capacidad de responder preguntas múltiples desde video-lenguaje.
- CausalVQA: analiza la habilidad para deducir relaciones causa-efecto.
Una apertura que parece querer ganar simpatía entre investigadores y desarrolladores, al tiempo que presiona para que su ecosistema crezca rápidamente.
Meta vs Nvidia: David con recursos, pero sin la honda
Comparar V-JEPA 2 con Nvidia Cosmos no es sólo inevitable. Es obligatorio. Y aunque Meta ha hecho avances técnicos notables, lo cierto es que Nvidia lidera no solo en hardware, sino en la integración vertical del software de IA física. Desde los chips hasta los algoritmos, su dominio es cada vez más abrumador.
Tuong Huy Nguyen, analista de Gartner, matiza esta visión con algo más de optimismo: “Esta es la próxima frontera para la IA. La mayoría de los modelos actuales no entienden el mundo físico, y eso es lo que cambiará”.
Tiene razón. La IA física es la frontera por conquistar. Pero la pregunta sigue siendo: ¿quién llegará primero con impacto real?
El dilema de Meta: correr rápido o quedar atrás
Meta ha estado trabajando en IA física desde hace al menos cinco años. Proyectos como Project Spatial, orientado a capturar movimientos en 3D para VR, dan testimonio de esa trayectoria. Pero en este punto, la narrativa de innovación parece haber sido reemplazada por la de urgencia.
¿Es V-JEPA 2 una verdadera apuesta por liderar el futuro? ¿O es una respuesta acelerada para no quedar fuera de la conversación? Por ahora, es ambas cosas. Y esa ambigüedad le resta fuerza.
¿Movimiento audaz o maniobra reactiva?
V-JEPA 2 no es un mal producto. Al contrario, representa un avance importante en un área clave para el futuro de la IA. Pero en un mercado donde el liderazgo depende tanto del relato como de la ejecución, Meta parece estar corriendo para alcanzar a un pelotón que ya le lleva ventaja.
Puede que estemos ante el inicio de una nueva etapa para Meta. O simplemente ante otra gran tecnología que llega demasiado tarde para cambiar las reglas del juego. Porque en la carrera por la inteligencia artificial física, el reloj no perdona.