Hermes Agent: NVIDIA acelera la IA autónoma local

El nuevo sistema de agentes de IA de Nous Research lleva autoaprendizaje y ejecución local a PCs NVIDIA RTX.

Después de años dominados por chatbots y asistentes reactivos, la industria empieza a moverse hacia sistemas capaces de actuar, aprender y evolucionar de forma continua. El lanzamiento de Hermes Agent, desarrollado por Nous Research y optimizado para hardware de NVIDIA RTX, es una señal clara de ese cambio.

El nuevo sistema introduce una categoría de agentes de IA autónomos diseñados para ejecutarse localmente en PCs y workstations RTX, sin depender completamente de la nube. La propuesta combina ejecución persistente, acceso a aplicaciones locales y capacidad de autoaprendizaje, una combinación que empieza a redefinir cómo podría funcionar la productividad asistida por IA en los próximos años.

La noticia llega en un momento clave. La conversación tecnológica ya no gira únicamente alrededor de modelos más grandes o interfaces conversacionales más sofisticadas. El foco empieza a desplazarse hacia agentes capaces de ejecutar tareas complejas, mantener contexto operativo y mejorar su desempeño con el tiempo.

Hermes quiere posicionarse exactamente en ese espacio.

Agentes de IA autónomos: del chatbot al trabajo persistente

Hasta ahora, buena parte de los asistentes de IA operaban bajo un modelo transaccional: el usuario realiza una consulta, el sistema responde y el contexto desaparece. Hermes rompe esa lógica introduciendo persistencia y capacidad evolutiva.

Según explicó NVIDIA en su presentación oficial, Hermes puede trabajar de forma continua, integrarse con aplicaciones de mensajería, acceder a archivos locales y ejecutar subtareas mediante subagentes especializados. Pero el elemento diferencial es otro: el sistema aprende de cada interacción y transforma esa experiencia en nuevas habilidades reutilizables.

Eso significa que el agente no solo ejecuta tareas. También optimiza cómo las realiza.

La arquitectura incorpora mecanismos de autoaprendizaje que permiten guardar conocimiento derivado de tareas complejas o retroalimentación del usuario. Con el tiempo, el agente perfecciona procesos y mejora su desempeño sin necesidad de reentrenamientos externos permanentes.

En otras palabras, la IA empieza a comportarse más como un colaborador persistente que como una simple interfaz conversacional.

NVIDIA apuesta por la IA local

Durante los últimos años, la expansión de la IA generativa estuvo asociada principalmente a grandes infraestructuras cloud. Hermes plantea una aproximación diferente: trasladar capacidades avanzadas de IA directamente al dispositivo del usuario utilizando GPUs RTX y sistemas como NVIDIA DGX Spark.

La estrategia responde a varias tensiones crecientes dentro del mercado. Por un lado, existe una demanda creciente de privacidad, baja latencia y control local de datos. Por otro, las cargas de trabajo asociadas a IA agente requieren tiempos de respuesta rápidos y ejecución persistente que no siempre encajan eficientemente en arquitecturas completamente dependientes de la nube.

Hermes se apoya en modelos abiertos como Qwen 3.6, desarrollados por Alibaba, capaces de ofrecer rendimiento equivalente a modelos mucho más grandes con menores requerimientos de memoria.

Según NVIDIA, el modelo Qwen 3.6 35B puede superar el desempeño de arquitecturas de más de 120 mil millones de parámetros utilizando apenas una fracción de los recursos necesarios tradicionalmente.

La consecuencia es importante: la IA avanzada empieza a ser viable fuera de grandes centros de datos.

IA local y hardware: una nueva carrera estratégica

El anuncio también revela cómo el hardware vuelve a convertirse en un factor crítico dentro de la evolución de la inteligencia artificial.

Durante años, buena parte del valor estuvo concentrado en los modelos y plataformas cloud. Pero la aparición de agentes persistentes y sistemas locales reabre la discusión sobre capacidad de cómputo en el edge.

NVIDIA está apostando fuerte a esa transición.

Las GPUs RTX incorporan Tensor Cores optimizados para inferencia de IA y permiten acelerar tareas complejas con baja latencia. Según la compañía, esto posibilita que Hermes complete procesos de múltiples pasos o refine habilidades en segundos, no minutos.

El lanzamiento de DGX Spark refuerza esa visión. El sistema, diseñado específicamente para flujos de trabajo agentivos continuos, incorpora 128 GB de memoria unificada y hasta un petaflop de rendimiento de IA.

La lógica es clara: si los agentes van a operar de manera permanente, autónoma y local, la infraestructura de hardware deja de ser un accesorio y pasa a convertirse en parte central de la experiencia.

El inicio de una nueva generación de asistentes

La aparición de Hermes también refleja un cambio más amplio dentro del ecosistema de IA. La industria empieza a alejarse del paradigma del chatbot aislado para avanzar hacia sistemas capaces de planificar tareas, mantener memoria operativa, coordinar subprocesos y adaptarse dinámicamente al usuario.

El concepto de “agentic AI” deja de ser una promesa experimental para convertirse en una nueva capa de productividad digital.

La pregunta ya no es únicamente qué tan inteligente es un modelo. La verdadera discusión pasa por cuánto contexto puede mantener, qué autonomía puede alcanzar y hasta qué punto puede evolucionar sin intervención constante.

Porque la próxima generación de IA no será simplemente conversacional. Será persistente, local y operativa.