2023 – 2025
Investigando en tecnología del lenguaje para aumentar la presencia del euskera en el entorno digital
El objetivo general del proyecto IKER-GAITU es investigar en tecnología del lenguaje para aumentar la presencia del euskera en el entorno digital. El proyecto se ha llevado a cabo entre 2023 y 2025 gracias a la subvención del Departamento de Cultura y Política Lingüística del Gobierno Vasco.
Las tecnologías actuales y futuras requieren enormes cantidades de datos textuales y orales para cada idioma, pero los datos que el euskera y otros idiomas más pequeños pueden ofrecer en la actualidad no son suficientes para que estas tecnologías tengan la calidad necesaria. Por lo tanto, es fundamental investigar en tecnología del lenguaje para que el euskera tenga presencia en esa tecnología que será cada vez más común y así alcanzar el nivel de otros idiomas.
En el centro HiTZ hemos creado modelos, código y datos para el euskera que están disponibles para todos. Los hemos organizado en tres categorías según el perfil del usuario. Salvo que se indique lo contrario, todos tienen licencias abiertas (incluyendo uso comercial).
Chatbot general en euskera disponible para probar
latxa.hitz.eus → ⚠️ Pronto disponible para uso masivoDemos de sistemas de reconocimiento y generación de voz
Ver demos →Modelos de diferentes tamaños. El 70B es el mejor; el 8B es más rápido.
¿Necesitas acceso por API? Contacta: transfer.hitz@ehu.eus
Además de lo anterior, todos nuestros modelos, código y datos especializados están en repositorios públicos:
Publicaciones científicas: www.hitz.eus/publications
Departamento de Cultura y Política Lingüística del Gobierno Vasco