El Gobierno invertirá 10,2 millones de euros en ALIA, una familia de modelos fundacionales en inteligencia artificial (IA) entrenada con datos en español y en las lenguas cooficiales (castellano, catalán, gallego, valenciano y vasco). Así lo refleja la Estrategia Nacional de Inteligencia Artificial 2024 recientemente aprobada. Hasta ahora, se habían destinado otros 15,2 millones de fondos europeos a otros proyectos vinculados a la IA y el uso de las lenguas oficiales.
Los primeros resultados de ALIA estarán disponibles (ámbito público y privado) después del verano, aunque según confirman a Newtral.es desde el Ministerio para la Transición Digital y Función Pública su desarrollo no concluirá hasta el primer trimestre de 2026.
Más de 15 millones en proyectos cuyos resultados aprovecha ALIA
Desde 2020, año en la que se publicaron las primeras medidas de la estrategia de inteligencia artificial, se han desarrollado diferentes proyectos de los que ALIA “aprovecha algunos resultados” como “la generación y curado de algunos corpus [conjunto de texto y datos] para entrenarlo”, según Transición Digital.
En la tabla inferior se recogen algunos de los proyectos más relevantes, así como las partidas presupuestarias de ALIA -captura de datos, curación, preprocesamiento, alineamiento o evaluación, entre otros trabajos a desarrollar-.
ILENIA (Impulso de las Lenguas en Inteligencia Artificial) es una de estas iniciativas de cuyos resultados se nutre, en parte, ALIA, y que cuenta con mayor presupuesto. Siete millones y medio de euros para desarrollar un corpus (o conjunto de texto y datos) de las lenguas cooficiales.
El segundo con mayor dotación, cinco millones, es el proyecto LEIA (Lengua Española e Inteligencia Artificial) impulsado por la RAE desde 2019 para proyectos como verificación ortográfica o dar respuesta a consultas lingüísticas.