demoak
Analhitza
Testu-multzoetatik informazio linguistikoa modu errazean erauzteko online aplikazioa
AnCora
AnCora euskarazko, gaztelaniazko eta katalanezko corpusa da, hainbat hizkuntza-mailatan etiketatua
Anhitz
Euskararako 3D aditu birtuala Zientzian eta Tekonologian
BASYQUE
Euskararen sintaxiaren aldaketak aztertzeko aplikazioa
Berbatek_bikoizketa
Dokumentalen azpitituluen itzulpen automatikoa
Berbatek_Irakasle
Euskara ikasteko tutore pertsonala
Bertso-eskola digitala
Bertso bat osatzeko laguntzak: Errimak bilatzeko, bertsoaren neurria ondo dagoela egiaztatzeko, sinonimoak, doinuak eta neurriak bilatzeko ere...
BertsolariXa
Errimak bilatzeko tresna.
Biografix
Biografietan agertzen diren egitura parentetikoak ezabatu eta informazio horrekin esaldi berriak sortzen dituen tresna eleanitza.
CommonsCaptions Corpora
Wikimedia Commons-eko irudien azalpen elebidunak. es-eu eta en-ga // Bilingual captions of images from Wikimedia Commons, en-ga and es-eu
Diccionario Básico Escolar
Ikasleentzako oinarrizko hiztegia (Kuba).
DoQA
Ingelesezko elkarrizketa bidezko galdera-erantzunen datu-multzoa
e-ROLda
Euskarazko aditzen BVI lexikoia eta predikatu-mailan etiketatuko EPEC-RolSem corpusa kontsultatzeko tresna
EDBL
EDBL Euskararen DatuBase Lexikala
EDGK
Hizkuntza-ezagutzan oinarrituta osatu den Euskarako Dependentzia Gramatika Konputazionala (EDGK) da.
EDIEC
Euskararako Desanbiguatutako Izendun Entitateen Corpusa
EIEC
Euskararako Izendun Entitateen Corpusa
Eihera
Euskarazko entitate izendunak ezagutzen eta sailkatzen dituen tresna
Elhuyar-Word
Word 2000 testu-prozesadorean integratzen den hiztegi-sistema.
ElkarHizketak
Euskarazko elkarrizketa bidezko galdera-erantzunen datu-multzoa
EPEC-DEP (BDT)
Sintaktikoki etiketatutako EPEC corpusa Dependentzia Gramatikaren Teorian oinarrituta (Basque Dependency Treebank)
EPEC-EuSemcor
Hainbat izenen agerpenak EusWN-eko adieraz markatuta dauden corpusa
EPEC-KORREF
Euskararako Korreferentzia Corpusa
Erreus
Euskarazko erroreen datu-basea
Eulia
Testuak etiketatzeko ingurunea
EusEduSeg: euskarazko diskurtso segmentatzaile automatikoa
EusEduSeg tresnak testu-fitxategia aditza duten perpaus adberbial edo adjuntuetan zatitzen du hiru formatu ezberdinetan: i) testu fitxategia, lerro saltoekin, ii) RS3 formatuan, RSTTool tresnarekin erlaziozko diskurtso egitura etiketatzeko eta iii) DiZer analizatzaile diskurtsibo automatikoan erabiltzeko.
Euskal RST Treebank
Euskal RSTko erlazio eta zuhaitz bankua
Euskarazko hizkuntza ereduak
Euskararako entrenatu diren hiru eredu neuronal daude publikoki atzigarriak.
Euskarazko Testu Sinplifikatuen Corpusa (ETSC) - Corpus of Basque simplified texts (CBST)
Testu Sinplifikatuen Corpusa
EUSMT
Itzulpen automatiko estatistikoa euskararako
Eustagger
Euskararako etiketatzaile/desanbiguatzaile morfosintaktikoa
EusWN
Euskal Wordnet
Gero Corpus Historikoa
Datu-multzoa, euskararen testu historikoak normalizatzeko atazan erabilia
Ihardetsi
Galderak erantzuteko sistema
IXA pipes: Hizkuntzaren Prozesamendurako tresnak
Eleaniztasun tresnak
ixaKat
Euskararen tratamendurako balio duen hizkuntza prozesatzaileen kate modularra
IxaMedTagger
Gaztelerazko txosten medikuetan entitate izendunak (gaixotasunak, gorputz atalak, medikamentuak ...) identifikatzen dituen tresna. Ataza hori aurrera eramateko pertzeptroia erabiltzen du.
Ixati
Euskararako analizatzaile sintaktikoa (azalekoa)
Konbitzul
Izen+aditz konbinazio-itzulpenen datu-basea
leXkit
Hiztegien edukiak editatzeko eta kudeatzeko ingurunea, XMLn oinarritua
LibiXaml
Prozesatzaile linguistikoak integratzeko liburutegia.
Maltixa
Analizatzaile sintaktiko-estatistikoa
Maria chatbot
Maria txatbota gai da Wikipedian dagoen pertsona bati edo beste zerbaiti buruzko galderak erantzuteko euskaraz gaztelaniaz eta ingelesez.
MateIXA
Euskararako Mate analizatzaile estatistikoa
Matxin
Euskaratik/Euskararako itzulpen automatikoa
MCR: Multilingual Central Repository
Europako zenbait hizkuntzatako wordnet-ez osatutako datu-base lexikal eleaniztuna.
Morfeus
Analisi morfologikoa
MultiAzterTest: a Multilingual Analyzer on Multiple Levels of Language and Readability Assessment
MultiAzterTest is an open source NLP tool and web application which analyzes texts on over 125 measures of cohesion, language, and readability for English, Spanish and Basque.
Multimeteo euskaraz
Parte meteorologikoen sorkuntza automatikoa euskaraz
NLTK-eu
Hizkuntzaren prozesamendua irakasteko NLTK paketerako euskarazko eta espainerarako baliabideak
Opentrad
Itzultzaile automatikoa
QLDB
Kitxuaren datu-base lexikala
SentiTegi: Basque lexicon with semantic-oriented words
The lexicon contains 1,237 words of four grammatical categories. The semantic values of the words are between -5 and +5.
Spanish AMR Corpus
AMR etiketatutako corpusa gaztelaniarako
TZOS-rdf
TZOS terminologiaren RDF errepresentazioa
UKB
Desanbiguazio eta antzekotasun semantikoa grafotan oinarrituta
Universal Dependencies treebank for Basque
Dependentzia Unibertsalak proiektuko gidalerroak jarraituta etiketatutako euskarazko zuhaitz-bankua
VecMap: cross-lingual word embedding mappings
Hitzen errepresentazioak hizkuntzen artean mapatu eta hiztegi elebidunak sortzeko inplementazio irekia.
Web Corpus
Sintaxi mailara arte automatikoki aztertutako 150 milioi hitzeko corpusa
Wikipedia_tituluak_es_eu_2018
Corpus elebiduna: Euskal Wikipedian eta Espainierazko Wikipedian dauden artikuluen tituluak
WordNetetik DBpediarako mapaketa
Ingeleseko WordNet 3.0-ko URIetatik DBpedia 3.9-ko URIetara mapaketa
WSD-IXA
Euskarazko Adiera-Desanbiguazioa
Xuxen
Euskarazko zuzentzaile ortografikoa
ZT Corpusa
Zientzia eta Teknologiako testuen corpusa (morfosintaktikoki etiketatua).
Multilingual Speech 2 speech demo.
Transcripts, translates and synthesizes a spoken text.
The goal of the EU-funded ENRICH project is to modify or augment speech with additional information to make it easier to process. Enrichment reduces listening burden by minimising cognitive load, while maintaining or improving intelligibility. In this demo voice enrichment is performed applying the developed techniques.
AhoTTS is the Aholab Signal Processing Laboratory Text to Speech Synthesizer for Basque and Spanish. You can try it in the following link
AhoTTS Demo
Bizkaifon: speech and video database for the Western dialects of the Basque Language
Bizkaifon is a multimodal (speech and video) database containing thousands recordings of the many different western dialects of Basque. Most of them are transcribed to Standard Basque. It is accessible via web through this page. The database is available at ELRA.
CALL-CAPT Aplications demos can be accessed here.
Accesss some voice conversion samples here.
Implemented in the Elhuyar Hiztegia basque dictionary.
AhoTTS is being use in some public media. Find it at any news from eitb.eus or berria.eus.
Enhancing speech intelligibility in noise. Demo
AhoTTS Linguistic Module performes the normalization of a Basque written text and provides an xml formatted file with the normalized and POS annotated text. The module can be executed from this link.
Iparrahotsa is the AhoTTS version for Lapurdian Basque.This project has been funded by the Euroregion Aquitaine Euskadi under grant EUSKADI 2012-004. You can test it in this demo shown or download it from sourceforge.
In the context of BERBATEK research project an automatic speech dubbing demo has been developed. The demo integrates three main technologies: automatic text and audio alignment, machine translation and text to speech synthesis. Subtitles for documentary videos in Spanish are automatically generated using the audio and the corresponding script. The subtitles are then translated to Basque and the new audio signal in Basque is generated using AhoTTS.