NVIDIA impulsa la estandarización de los sistemas de inteligencia artificial multiagente con su nueva arquitectura abierta Nemotron 3

Diseñados para superar los desafíos de costes y eficiencia a los que se enfrentan las empresas al desplegar flujos de trabajo colaborativos entre múltiples agentes de IA, llegan acompañados de herramientas para facilitar los desarrollos.
18 de diciembre, 2025

NVIDIA ha anunciado el lanzamiento de la familia de modelos de lenguaje grandes (LLM) Nemotron 3, una nueva generación de modelos abiertos que llegan acompañados de datos y bibliotecas, concebida para potenciar el desarrollo transparente y especializado de la inteligencia artificial agéntica en diversos sectores industriales.

Según la compañía dirigida por Jensen Huang, esta iniciativa surge como respuesta a la evolución de un mercado en el que las organizaciones están transitando desde el uso de chatbots basados en un único modelo, hacia sistemas de IA colaborativos y multiagente, una nueva arquitectura que busca solucionar los crecientes desafíos técnicos a los que se enfrentan los desarrolladores, tales como la sobrecarga en la comunicación, la pérdida de contexto y los elevados costes de inferencia.

Según el mismo Huang, el objetivo declarado por la firma que dirige es transformar la IA avanzada en una plataforma abierta que otorgue a los desarrolladores la transparencia necesaria para confiar en los modelos que automatizarán flujos de trabajo complejos.

La propuesta técnica de Nemotron 3 se fundamenta en una arquitectura híbrida de mezcla de expertos latente (MoE, por sus siglas en inglés), un diseño que permite a los departamentos de TI construir y desplegar sistemas multiagente fiables y a gran escala.

La familia se compone de tres variantes de distinto tamaño denominadas Nano, Super y Ultra, con cada una de ellas optimizada para cargas de trabajo específicas. El primero de los modelos, Nemotron 3 Nano, es el modelo de entrada que ya se encuentra disponible a través de plataformas como Hugging Face y diversos proveedores de servicios de inferencia, así como mediante microservicios NVIDIA NIM para un despliegue seguro en infraestructuras aceleradas.

Se trata de un modelo de 30.000 millones de parámetros que activa hasta 3.000 millones por tarea y que destaca por su eficiencia en costes computacionales, optimizado para funciones como la depuración de software, el resumen de contenidos y la recuperación de información.

Gracias a su diseño, esta versión Nano reduce la generación de tokens de razonamiento hasta en un 60% y ofrece un rendimiento cuatro veces superior a su predecesor, lo que disminuye significativamente los costes operativos. Además, cuenta con una ventana de contexto de un millón de tokens, lo que le permite retener más información y mejorar la precisión en tareas largas y de múltiples pasos.

Por su parte, las versiones de mayor capacidad llegarán a lo largo del primer semestre de 2026. Nemotron 3 Super, con aproximadamente 100.000 millones de parámetros, está diseñado como un modelo de razonamiento de alta precisión para aplicaciones multiagente que requieren baja latencia. El tercero y más potente modelo, Nemotron 3 Ultra, funcionará como un motor de razonamiento avanzado con cerca de 500.000 millones de parámetros, y estará orientado a aplicaciones complejas que exigen investigación profunda y planificación estratégica.

Tanto la versión Super como la Ultra utilizan el formato de entrenamiento NVFP4 de 4 bits sobre la arquitectura NVIDIA Blackwell, lo que permite entrenar modelos de mayor tamaño en la infraestructura existente sin comprometer la precisión.

Junto a estos modelos, NVIDIA ha liberado también herramientas para facilitar la personalización de los agentes creados, consistentes en conjuntos de datos de preentrenamiento y aprendizaje por refuerzo que suman tres billones de tokens, así como bibliotecas de código abierto como NeMo Gym y NeMo RL. Estos recursos proporcionan a los equipos técnicos los entornos de entrenamiento y la base necesaria para crear agentes especializados en dominios concretos y validar su seguridad antes del despliegue.

Finalmente, desde NVIDIA destacan que este lanzamiento respalda los esfuerzos de IA soberana, permitiendo a organizaciones de regiones como Europa adoptar modelos abiertos que se alinean con sus propias normativas de datos y valores locales.