ikerkuntza proiektuak

UnsupNMT: Traducción Automática Neuronal no Supervisada: un nuevo paradigma basado solo en textos monolingües.


UnsupNMT: Itzulpen Automatiko Neuronal ez-gainbegiratua: testu elebakarretan oinarritutako paradigma berria

(2018 - 2020)

Itzulpen automatikoa teknologia heldua da eta pisu ekonomiko handia du, baina oraindik ere hobekuntza marjina handia du testu elebidun gutxi daudenean. Proiektu honek itzulpen automatikoa egiteko metodo guztiz berria proposatzen du: gainbegiratu gabeko itzulpena. Hau da, testu elebakarretan soilik oinarritua, baliabide elebidunik gabe. Metodoa hizkuntzen arteko hitz-errepresentazioak (cross-lingual word embeddings) eta sekuentzien ikaskuntza sakona erabiltzen ditu.

Proposamen berritzailea izateaz gain, itzulpen automatikoaren paradigma berri bat zabaltzen du beste diziplina batzuetako adarkatzeekin. Bi hizkuntzetako esaldiak kodifikatzaile bera erabiliz kodetzea planteatzen denez, horrek eragina du egungo hizkuntza-prozesadoreak entrenatzen diren eran, eta, beraz, hizkuntza natural eleaniztuna prozesatzeko eta hizkuntzaren industrietan eragina izateko modua erabat alda dezake.

Proiektuak itzulpenaren industria asaldatzeko ahalmena du. Egungo itzulpen automatikoak arazoak ditu testu elebidun gutxi dituzten hizkuntza bikoteak (alemana eta errusiera, adibidez), eta domeinuak (medikoa edo juridikoa, adibidez) itzultzeko. Proposatutako itzultzaile ez gainbegiratuari baliabide elebidunak gehitzerakoan itzulpen kalitatea hobetzen denez, proiektu honek kasu horietan gaur egun lortzen den itzulpen automatikoaren kalitatea hobetuko aukera emango du.
Webgunea:
Erakundea:  Ministerio de Economía, Industria y Competitividad. (Explora)
Ikerlari nagusia: Eneko Agirre
Partaideak
Eneko Agirre, Itziar Aldabe, Nora Aranberri, Mikel Artetxe, Xabier Artola , Ander Barrena, Arantza Díaz de Ilarraza, Gorka Labaka, Mikel Lersundi, Oier López de Lacalle , Olatz Perez de Viñaspre


Atzera

HiTZ Ikerkuntza talde hauek osatzen dute :