demoak

Analhitza

Testu-multzoetatik informazio linguistikoa modu errazean erauzteko online aplikazioa

AnCora

AnCora euskarazko, gaztelaniazko eta katalanezko corpusa da, hainbat hizkuntza-mailatan etiketatua

Anhitz

Euskararako 3D aditu birtuala Zientzian eta Tekonologian

BASYQUE

Euskararen sintaxiaren aldaketak aztertzeko aplikazioa

Berbatek_bikoizketa

Dokumentalen azpitituluen itzulpen automatikoa

Berbatek_Irakasle

Euskara ikasteko tutore pertsonala

Bertso-eskola digitala

Bertso bat osatzeko laguntzak: Errimak bilatzeko, bertsoaren neurria ondo dagoela egiaztatzeko, sinonimoak, doinuak eta neurriak bilatzeko ere...

BertsolariXa

Errimak bilatzeko tresna.

Biografix

Biografietan agertzen diren egitura parentetikoak ezabatu eta informazio horrekin esaldi berriak sortzen dituen tresna eleanitza.

CommonsCaptions Corpora

Wikimedia Commons-eko irudien azalpen elebidunak. es-eu eta en-ga // Bilingual captions of images from Wikimedia Commons, en-ga and es-eu

Diccionario Básico Escolar

Ikasleentzako oinarrizko hiztegia (Kuba).

DoQA

Ingelesezko elkarrizketa bidezko galdera-erantzunen datu-multzoa

e-ROLda

Euskarazko aditzen BVI lexikoia eta predikatu-mailan etiketatuko EPEC-RolSem corpusa kontsultatzeko tresna

EDBL

EDBL Euskararen DatuBase Lexikala

EDGK

Hizkuntza-ezagutzan oinarrituta osatu den Euskarako Dependentzia Gramatika Konputazionala (EDGK) da.

EDIEC

Euskararako Desanbiguatutako Izendun Entitateen Corpusa

EIEC

Euskararako Izendun Entitateen Corpusa

Eihera

Euskarazko entitate izendunak ezagutzen eta sailkatzen dituen tresna

Elhuyar-Word

Word 2000 testu-prozesadorean integratzen den hiztegi-sistema.

ElkarHizketak

Euskarazko elkarrizketa bidezko galdera-erantzunen datu-multzoa

EPEC-DEP (BDT)

Sintaktikoki etiketatutako EPEC corpusa Dependentzia Gramatikaren Teorian oinarrituta (Basque Dependency Treebank)

EPEC-EuSemcor

Hainbat izenen agerpenak EusWN-eko adieraz markatuta dauden corpusa

EPEC-KORREF

Euskararako Korreferentzia Corpusa

Erreus

Euskarazko erroreen datu-basea

Eulia

Testuak etiketatzeko ingurunea

EusEduSeg: euskarazko diskurtso segmentatzaile automatikoa

EusEduSeg tresnak testu-fitxategia aditza duten perpaus adberbial edo adjuntuetan zatitzen du hiru formatu ezberdinetan: i) testu fitxategia, lerro saltoekin, ii) RS3 formatuan, RSTTool tresnarekin erlaziozko diskurtso egitura etiketatzeko eta iii) DiZer analizatzaile diskurtsibo automatikoan erabiltzeko.

Euskal RST Treebank

Euskal RSTko erlazio eta zuhaitz bankua

Euskarazko hizkuntza ereduak

Euskararako entrenatu diren hiru eredu neuronal daude publikoki atzigarriak.

Euskarazko Testu Sinplifikatuen Corpusa (ETSC) - Corpus of Basque simplified texts (CBST)

Testu Sinplifikatuen Corpusa

EUSMT

Itzulpen automatiko estatistikoa euskararako

Eustagger

Euskararako etiketatzaile/desanbiguatzaile morfosintaktikoa

EusWN

Euskal Wordnet

Gero Corpus Historikoa

Datu-multzoa, euskararen testu historikoak normalizatzeko atazan erabilia

Ihardetsi

Galderak erantzuteko sistema

IXA pipes: Hizkuntzaren Prozesamendurako tresnak

Eleaniztasun tresnak

ixaKat

Euskararen tratamendurako balio duen hizkuntza prozesatzaileen kate modularra

IxaMedTagger

Gaztelerazko txosten medikuetan entitate izendunak (gaixotasunak, gorputz atalak, medikamentuak ...) identifikatzen dituen tresna. Ataza hori aurrera eramateko pertzeptroia erabiltzen du.

Ixati

Euskararako analizatzaile sintaktikoa (azalekoa)

Konbitzul

Izen+aditz konbinazio-itzulpenen datu-basea

leXkit

Hiztegien edukiak editatzeko eta kudeatzeko ingurunea, XMLn oinarritua

LibiXaml

Prozesatzaile linguistikoak integratzeko liburutegia.

Maltixa

Analizatzaile sintaktiko-estatistikoa

MateIXA

Euskararako Mate analizatzaile estatistikoa

Matxin

Euskaratik/Euskararako itzulpen automatikoa

MCR: Multilingual Central Repository

Europako zenbait hizkuntzatako wordnet-ez osatutako datu-base lexikal eleaniztuna.

Morfeus

Analisi morfologikoa

Multimeteo euskaraz

Parte meteorologikoen sorkuntza automatikoa euskaraz

NLTK-eu

Hizkuntzaren prozesamendua irakasteko NLTK paketerako euskarazko eta espainerarako baliabideak

Opentrad

Itzultzaile automatikoa

QLDB

Kitxuaren datu-base lexikala

SentiTegi: Basque lexicon with semantic-oriented words

The lexicon contains 1,237 words of four grammatical categories. The semantic values of the words are between -5 and +5.

Spanish AMR Corpus

AMR etiketatutako corpusa gaztelaniarako

TZOS-rdf

TZOS terminologiaren RDF errepresentazioa

UKB

Desanbiguazio eta antzekotasun semantikoa grafotan oinarrituta

Universal Dependencies treebank for Basque

Dependentzia Unibertsalak proiektuko gidalerroak jarraituta etiketatutako euskarazko zuhaitz-bankua

VecMap: cross-lingual word embedding mappings

Hitzen errepresentazioak hizkuntzen artean mapatu eta hiztegi elebidunak sortzeko inplementazio irekia.

Web Corpus

Sintaxi mailara arte automatikoki aztertutako 150 milioi hitzeko corpusa

Wikipedia_tituluak_es_eu_2018

Corpus elebiduna: Euskal Wikipedian eta Espainierazko Wikipedian dauden artikuluen tituluak

WordNetetik DBpediarako mapaketa

Ingeleseko WordNet 3.0-ko URIetatik DBpedia 3.9-ko URIetara mapaketa

WSD-IXA

Euskarazko Adiera-Desanbiguazioa

Xuxen

Euskarazko zuzentzaile ortografikoa

ZT Corpusa

Zientzia eta Teknologiako testuen corpusa (morfosintaktikoki etiketatua).

AhoTTS Demo
AhoTTS is the Aholab Signal Processing Laboratory  Text to Speech Synthesizer for Basque and Spanish. You can try it in the following link

AhoTTS Demo

Bizkaifon

Bizkaifon: speech and video database for the Western dialects of the Basque Language

Bizkaifon is a multimodal (speech and video) database containing thousands recordings of the many different western dialects of Basque. Most of them are transcribed to Standard Basque. It is accessible via web through this page. The database is available at ELRA.

AhoSR: Automatic Speech Recognizer for Basque
CALL-CAPT Aplications demos can be accessed here.
Voice conversion demo
Accesss some voice conversion samples here.
Basque Speech Recognizer
Implemented in the Elhuyar Hiztegia basque dictionary.
AhoTTS public use
AhoTTS is being use in some public media. Find it at any news from eitb.eus or berria.eus.
Speech intelligibility
Enhancing speech intelligibility in noise. Demo
AhoTTS Linguistic Module (Module 1)

AhoTTS Linguistic Module performes the normalization of a Basque written text and provides an xml formatted file with the normalized and POS annotated text. The module can be executed from this link.

Iparrahotsa: AhoTTS for Lapurdian Basque

Iparrahotsa is the AhoTTS version for Lapurdian Basque.This project has been funded by the Euroregion Aquitaine Euskadi under grant EUSKADI 2012-004. You can test it in this demo shown  or download it from sourceforge. 

sf-download-button

Automatic Speech Dubbing Demo

In the context of BERBATEK research project an automatic speech dubbing demo has been developed. The demo integrates three main technologies: automatic text and audio alignment, machine translation and text to speech synthesis. Subtitles for documentary videos in Spanish are automatically generated using the audio and the corresponding script. The subtitles are then translated to Basque and the new audio signal in Basque is generated using AhoTTS.