La secretaria de Estado de Digitalización e Inteligencia Artificial, María González Veracruz. José Verdugo

España

ALIA, la familia de modelos de IA en castellano que no busca ser "el ChatGPT español", sino superar "los sesgos culturales"

La presentación de esta familia de modelos fundacionales llega horas después de que Donald Trump anuncie un plan para impulsar la IA de la mano de grandes tecnológicas.

Más información: De la supercomputación a la ética: el Gobierno despliega una estrategia para liderar la inteligencia artificial

Sandra Viñas

Publicada 22 enero 2025 12:35h

Actualizada 22 enero 2025 17:24h

Hace apenas dos días, a principios de esta semana, el presidente del Gobierno, Pedro Sánchez, anunció la puesta en marcha de los trabajos para aplicar ALIA, la familia de modelos fundacionales de inteligencia artificial en castellano y en las lenguas cooficiales impulsada desde el Gobierno. La elección de Sánchez para presentar los avances en este proyecto, que se enmarca dentro de la última Estrategia de Inteligencia Artificial, da cuenta de la relevancia que le otorga el Ejecutivo a esta iniciativa, que él mismo presentó durante la cena oficial del Mobile World Congress de 2024.

En concreto, los dos casos de usos que se están desarrollando ahora mismo son, por un lado, un chatbot dentro de la Agencia Tributaria y, por otro, una aplicación en la medicina primaria para mejorar el diagnóstico en las insuficiencias cardíacas.

Sin embargo, a pesar de la expectativa que genera este proyecto, también son muchas las incógnitas que planean sobre el mismo. Con el objetivo de resolverlas, la secretaria de Estado de Digitalización e Inteligencia Artificial, María González Veracruz, y el equipo detrás de su despliegue han celebrado un encuentro en el que han desgranado algunas de las particularidades de esta familia de modelos en castellano, que busca dar prioridad a la cuarta lengua más hablada en el mundo y la segunda en internet.

Sánchez destina 150 millones de euros para impulsar la inteligencia artificial en el tejido productivo español

González ha insistido en que esta iniciativa "no busca ser un ChatGPT en español". Tal y como ha señalado, ya existen aplicaciones en tecnologías de lenguaje que funcionan muy bien en este idioma, por lo que el objetivo del desplegado por el Ejecutivo no es competir con los grandes hiperescalares en funcionalidades, sino ofrecer recursos a los desarrolladores e innovadores españoles para poder innovar con la IA desde un punto de vista seguro y soberano.

En este sentido, la secretaria de Estado ha destacado algunos de los valores que caracterizan a ALIA, entre ellos, su verificación y alineación con la ley europea de IA, algo a lo que ha contribuido la Agencia Española de Supervisión de la Inteligencia Artificial (AESIA); la transparencia del modelo (el código es abierto), lo que permite que cualquiera pueda mejorarlo y utilizarlo; o que está entrenado en un porcentaje mayor que el resto de su tipo en castellano y lenguas cooficiales. Aquí ha destacado el trabajo que están llevando a cabo con el Gobierno vasco para poder incorporar mayor porcentaje de euskera en las próximas actualizaciones de este proyecto con la intención de superar "los sesgos culturales".

En la presentación, ha explicado que esta familia de modelos persigue cuatro objetivos principales: fomentar la investigación y el desarrollo en este campo para poder desplegar soluciones tecnológicas relacionadas; tender puentes con Latinoamérica basados en el uso de un idioma común; impulsar su aplicación en la industria para evitar que pymes y emprendedores queden rezagados; desplegar casos de uso en las Administraciones Públicas que mejoren la gestión y la eficiencia.

Asimismo, ha destacado que esta iniciativa se ha puesto en marcha con menos de tres millones de euros de inversión, dado que se nutre de otros proyectos ya anunciados como el proyecto ILENIA (Impulso de las Lenguas en Inteligencia Artificial).

Tres modelos, de momento

Todo esto se ha materializado en la presentación de tres modelos (el 2B, el 7B y, el más reciente, el 40B), que se encuentran en "punto de arranque", y a los cuales se puede acceder a través de la web habilitada. Eso sí, ha precisado que los tres se encuentran sin alinear, es decir, que no tienen la "capa de edición humana", algo que se resolverá en las próximas entregas.

Estos beben de datos de patentes médicas, de la Constitución Española, diferentes intervenciones en las Cortes, consultas tributarias, todo lo publicado en el Boletín Oficial del Estado o de recursos audiovisuales disponibles de forma abierta, entre muchos otros. Desde la secretaría de Estado han puntualizado que, en el último de ellos, el 40B, no se han incorporado datos de la Biblioteca Nacional de momento, aunque siguen trabajando en ello para que se pueda hacer "con máximo respeto a los derechos de autor".

La secretaria de Estado ha insistido en que este proyecto forma parte de la Estrategia de Inteligencia Artificial anunciada en mayo de 2024 por parte del exministro de Transformación y de la Función Pública, José Luis Escrivá. González ha precisado que la importancia de ALIA "no se entiende sin el resto de palancas" que contempla este documento, entre las que ha mencionado algunas como el sandbox de IA, el despliegue de la primera fábrica de IA o los programas de talento. "Todo responde a un mismo objetivo: democratizar el acceso a la inteligencia artificial", ha afirmado.

“ALIA es la punta de lanza de esta visión, de un proyecto de país que está despegando y que esperamos que tenga éxito”, ha añadido.

Próximos pasos

La presentación de las particularidades de esta familia de modelos fundacionales de inteligencia artificial en español llega, precisamente, escasas horas después de que el recién nombrado presidente de Estados Unidos, Donald Trump, haya anunciado un plan ambicioso para impulsar la IA de la mano de grandes tecnológicas como OpenAI, SoftBank y Oracle. En total, el mandatario prevé invertir 500.000 millones para, en sus palabras, hacer frente a la competencia con China.

Con un enfoque radicalmente opuesto al estadounidense, Europa sigue avanzando con sus propios proyectos de IA enfocados en el humanismo tecnológico y en el respeto a los derechos fundamentales. Entre ellos, destacan algunos similares a ALIA como el puesto en marcha por Suecia, que fue el primero en desarrollarse, o los presentados por Alemania o Italia, que ya se están desplegando, pero que aún están en etapas muy iniciales.

Fuentes del Ministerio de Transformación Digital y de la Función Pública han destacado que, de momento, no existe nada comparable a la iniciativa española en el ámbito de América Latina y el Caribe y, de hecho, la voluntad del mismo es convertirse en el estándar de todos los territorios de habla hispana y lusófona. Así, han señalado que ya han firmado acuerdos con países como Brasil, Chile o México y esperan consolidar otros en los próximos meses para seguir avanzando en este sentido.

A nivel nacional, las mismas fuentes han precisado que están trabajando en el desarrollo de, al menos, un caso de uso más que verá la luz próximamente en colaboración con otras carteras del Ejecutivo. Todo ello, en un futuro, redundará en el despliegue de aplicaciones que ayudan a mejorar la vida de los ciudadanos a través de una mayor eficiencia en diferentes gestiones, han avanzado.

ALIA, la familia de modelos de IA en castellano que no busca ser "el ChatGPT español", sino superar "los sesgos culturales"

La presentación de esta familia de modelos fundacionales llega horas después de que Donald Trump anuncie un plan para impulsar la IA de la mano de grandes tecnológicas.

Más información: De la supercomputación a la ética: el Gobierno despliega una estrategia para liderar la inteligencia artificial

Tres modelos, de momento

Próximos pasos

Más en España

nproxy.org