proyectos de investigación


Asesoria sobre la construcción, evaluación y uso de Modelos de Lenguaje

(2025 - 2027)

l lenguaje natural es la herramienta más común y eficiente para que los humanos transmitan información. Usamos el lenguaje, nuestro medio natural de comunicación, para codificar, almacenar, transmitir, compartir y manipular información. El Procesamiento del Lenguaje Natural (PLN), por tanto, una de las áreas de aplicación funcional de la Inteligencia Artificial más importantes y disruptoras de la transformación digital actual.

La Tecnología del Lenguaje se encuentra inmerso actualmente en un cambio de paradigma debido a las técnicas de aprendizaje profundo y los modelos preentrenados, también llamados Modelos de Lenguaje (MdL) o Modelos Fundacionales. Dichos modelos han surgido como herramientas transversales que dominan este área de la IA.

Los MdL están siendo entrenados por grandes corporaciones tecnológicas, lo que significa que no atienden a las necesidades o especificaciones de los hablantes, instituciones o empresas de una lengua. En ese sentido es primordial avanzar en la investigación local para construir MdL, y así lo entiende el Ministerio para la Transformación Digital y de la Función Pública al lanzar el PERTE de la nueva tecnología del lenguaje, que ha sido seguida de la iniciativa ALIA (Eje 1 de la Estrategia de Inteligencia Artificial 2024 de la SEDIA) y los planes autonómicos Nos, GAITU y AINA que abarcan el gallego, euskera y catalán. Dichas iniciativas tienen un objetivo claramente finalista, la construcción de MdL propios para los idiomas oficiales.

Por otro lado, el dominio tecnológico de MdL viene de la mano de unos pocos centros de investigación y desarrollo del mundo, tanto públicos como privados, con una masa crítica de investigadores y expertos de excelencia, que son los que investigaron hace unos pocos años en las técnicas que luego han dado lugar a los avances en MdL. Los centros que componen esta propuesta están involucrados en la iniciativas gubernamentales arriba citada, y son interlocutores habituales de los cargos relevantes del Ministerio de Transformación Digital y la Función Pública.

La red RutaMdL tiene como objetivo final articular una estrategia coordinada de investigación básica para que los centros del país puedan competir con los investigadores del entorno y centrarse en avanzar la frontera del conocimiento en MdL. La red es por tanto complementaria a las iniciativas gubernamentales antes mencionadas, ya que se centrará en analizar qué áreas de investigación de los MdL son las prioritarias y más prometedoras y elaborará una hoja de ruta de interés estratégico que permita asesorar a las autoridades políticas y así conseguir el liderazgo científico en esas áreas, así como estudiar estrategias para incrementar el impacto de los resultados de investigación obtenidos en dichos proyectos.

Esta red fomentará asimismo la colaboración, coordinación y creación de sinergias y complementariedad entre los grupos de investigación más relevantes del área de MdL, todos ellos financiados en convocatorias anteriores del Plan Estatal de I+D+I e involucrados en las iniciativas gubernamentales mencionadas anteriormente. El IP es también responsable de la Cátedra Inteligencia Artificial y Tecnología del Lenguaje financiada por la SEDIA, única en su área, e IP de la propuesta del proyecto HumanAIze: Humanizing AI with language technology en la convocatoria de planes de investigación en cooperación en inteligencia artificial del Ministerio de Universidades

Note: Pag 21 instrucciones publicidad https://www.aei.gob.es/ayudas-concedidas/comunicacion-publicidad-ayudas-concedidas

Organización:  Ministerio de Ciencia, Innovación y Universidades (MCIU)
Investigador principal: Eneko Agirre
Participantes
Eneko Agirre


Más proyectos

HiTZ lo conforman los siguientes grupos de investigación: