El gobierno español publica nuevo modelo de lenguaje público ALIA 40B Instruido, con 40.000 millones de parámetros

Amplía su capacidad frente a la anterior versión, y se ha alineado con instrucciones y datos adaptados al contexto sociocultural de España.
24 de diciembre, 2025
Digital inside_modelo lenguaje publico ALIA

La familia de modelos de lenguaje de ALIA (infraestructura pública de IA en castellano y lenguas cooficiales); arrancó el pasado enero con el modelo base 40B, sobre el que se ha ido erigiendo el desarrollo posterior. En los meses siguientes se publicaron un modelo Roberta Multilingüe, orientado a analizar y clasificar información en varios idiomas, y SalamandraTA 7B, un sistema de traducción automática que trabaja con todas las lenguas oficiales y cooficiales del Estado y con las de la Unión Europea.

Con ALIA 40B Instruido, la infraestructura pública ALIA pone a disposición del ecosistema español un nuevo modelo de lenguaje entrenado con 40.000 millones de parámetros, frente a los 7.000 millones de la versión anterior. En la práctica, estos “parámetros” son la cantidad de ajustes internos que el modelo utiliza para aprender patrones del lenguaje: cuantos más incorpora, mayor capacidad potencial tiene para entender contextos y generar respuestas, aunque el resultado final depende también de cómo se haya entrenado y afinado.

El nuevo modelo se ha alineado e instruido con un conjunto de datos y pautas adaptado a las características socioculturales de España, combinando aportaciones de traductores humanos con generación sintética supervisada. Dicho de otro modo, además de entrenar el modelo, se le ha “enseñado” cómo responder siguiendo instrucciones concretas y ejemplos: por un lado, trabajo humano especializado y, por otro, datos generados de forma artificial, pero revisados y controlados para mantener coherencia con los objetivos del proyecto.

Según la información facilitada desde el gobierno, el propósito de este desarrollo es que la diversidad cultural y lingüística de toda España quede representada en los desarrollos de IA basados en estos modelos.

El anuncio se realizó en la apertura, el pasado día 17 de diciembre, de la jornada «Impulsando el ecosistema de IA«, que ha acogido la final del prompt-a-thon «Desafío ALIA«, la primera actividad de la Comunidad de IA de Código Abierto lanzada recientemente desde la SEDIA.

Un prompt-a-thon es una competición en la que los participantes trabajan con “prompts”, y en la que la calidad del resultado depende tanto del contenido como de la precisión de esas instrucciones. El encuentro, enmarcado en el Programa Nacional de Algoritmos Verdes y organizado por la Dirección General de Inteligencia Artificial, ha abordado cómo construir una IA más responsable, eficiente y sostenible.

Durante dicha jornada, la Secretaría de Estado de Digitalización e Inteligencia Artificial, María González Veracruz, ha enmarcado: «Desde nuestra responsabilidad pública y siempre en el marco de la defensa de nuestros valores y de los derechos de las personas, lo que queríamos y lo que queremos con ALIA son dos cosas: reforzar nuestra soberanía e impulsar nuestro talento. Fuimos los primeros en proporcionar una infraestructura pública y abierta de recursos de IA y ahora nos siguen otros países. La propia Comisión Europea nos toma como inspiración para Open Europe LLM. El desafío que hemos propuesto hoy demuestra que el camino de ALIA continúa. Es un proyecto abierto, un proceso continuo en el que se va sumando experiencia, investigación, formación y nuevo conocimiento, y que publica mejoras constantemente. Y en este camino, va generando oportunidades para el ecosistema”.

El evento incluyó un espacio de demostradores en el que entidades públicas y privadas presentaron iniciativas en las que ya se está implementando ALIA y otros modelos desarrollados en el marco del programa ILENIA, y que consisten en aplicaciones orientadas a mejorar eficiencia, accesibilidad y sostenibilidad en ámbitos como el jurídico, la atención a la ciudadanía, la gestión de emergencias o la verificación de noticias.