2023 โ€“ 2025

Hizkuntza teknologian ikertzen ingurune digitalean euskararen presentzia areagotzeko

Euskara bultzatzen aro digitalean

IKER-GAITU proiektuaren helburu orokorra hizkuntza teknologian ikertzea da, ingurune digitalean euskararen presentzia areagotzeko asmoz. Proiektua 2023-2025 urteen bitartean gauzatu da Eusko Jaurlaritzako Kultura eta Hizkuntza Politika sailaren dirulaguntzari esker.

Egungo eta etorkizuneko teknologiek hizkuntza bakoitzeko testuzko eta ahozko datu-masa erraldoiak eskatzen dituzte, baina euskarak eta hizkuntza txikiagoek gaur egun eskaini ditzaketen datuak ez dira nahikoak teknologia horiek behar adina kalitate izateko. Horregatik, ezinbestekoa da hizkuntza teknologian ikertzea euskarak gero eta ohikoagoak izango diren teknologietan presentzia izateko, eta beste hizkuntzen maila erdiesteko.

Lortutako helburuak

1

Euskararen gaitasun maila, idatzizkoa zein ahozkoa, era automatikoan ezagutuko duen sistema garatzea

2

Ahots pertsonalizatuen teknologia desgaitasuna duten pertsonengana hurbiltzea

3

Ahots espontaneoaren transkripzioa garatzea, euskara eta gaztelania nahasten direnean eta hainbat hiztun daudenean ere

4

Testuzko elkarrizketa-sistema ahaltsuenak (egungo ChatGPT edo Gemini bezalakoak) euskaraz ere beste hizkuntzen pare aritzea

Emaitzak

HiTZ zentroan euskararako sortu ditugun eredu, kode eta datu guztiak daude eskuragarri. Hiru ataletan banatu ditugu, erabiltzailearen perfilaren arabera. Kontrakoa ez bada esaten, denak dituzte lizentzia irekiak (erabilera komertziala barne).

๐Ÿ  Etxean eta lantokian erabiltzeko

Demo

Ahotsa ezagutzea eta sortzea

Ahotsa ezagutzeko eta sortzeko sistemen demoak

Demoak ikusi โ†’

๐Ÿข Produktu berritzaileak egiteko industrian eta administrazioan

Demoak

Ahotsari buruzko demo eta APIak

Gure teknologiak konbinatzen dituzten produktuen demoak

HiTZketan โ†’
Demo

ILENIA demostradoreak

ILENIA proiektuko demostradoreak

Demoak ikusi โ†’

Eredu publikoak

Latxa familia

Tamaina ezberdinetako ereduak. 70B da hoberena; 8B azkarragoa.

ASR - Ahotsa ezagutzea

Hizketa automatikoki ezagutzeko sistema

TTS - Ahotsa sortzea

Ahotsa sortzeko sistema

API bidez atzitzea behar? Kontaktua: transfer.hitz@ehu.eus

๐Ÿ”ฌ Ikerkuntzan eta garapen aurreratuetan erabiltzeko

Goian aipatutakoetaz aparte, gure eredu, kode eta datu espezializatu guztiak errepositorio publiko hauetan topatu daitezke:

Datu-multzo esanguratsuak

Latxa eraikitzeko datuak

Latxa sortzeko erabilitako datuak

Datuak ikusi โ†’

ASR datuak (irekiak)

Ahotsa ezagutzeko sistemak sortzeko datuak

Datuak ikusi โ†’

TTS datuak (irekiak)

Ahotsa sortzeko sistemak eraikitzeko datuak

Datuak ikusi โ†’

Publikazio zientifikoak: www.hitz.eus/publications

Berriak

Dirulaguntza

Eusko Jaurlaritzako Kultura eta Hizkuntza Politika Saila