Synthèse et reconnaissance vocales [FR]

Le groupe est dédié aux technologies de traitement de la parole et à ses applications, en se concentrant sur les domaines spécifiques suivants :

Conversion texte-parole: Le groupe dispose de son propre système de conversion texte-parole multilingue, qui fonctionne en anglais, espagnol et basque. Notre système AhoTTS pour basque (aholab.ehu.es/TTS) est le seul développé entièrement au Pays Basque et il est disponible gratuitement. Il est également capable de générer du discours synthétique émotionnel.
Synthèse vocale : Un grand effort de recherche est consacré aux algorithmes et technologies de génération synthétique de la parole, à intégrer dans AhoTTS pour son évaluation. Pratiquement toutes les technologies de pointe de génération de la parole ont été développées et évaluées au cours des 15 dernières années.
Musique et chant : On a exploré les applications de la synthèse vocale dans ce domaine, développant la synthèse de voix chantée et un outil de traitement du signal pour l'éducation musicale.
Modélisation de la prosodie : Des modèles de prosodie et des techniques de génération de prosodie ont été développés spécifiquement pour la langue basque. L'accent a été mis sur l'analyse de la prosodie et sur les techniques de conversion appliquées à la génération de la parole émotionnelle.
Reconnaissance de la parole : Le groupe a développé plusieurs banques de données vocales pour le développement et la validation de systèmes de reconnaissance de la parole en basque, tous disponibles via ELRA. Un système de reconnaissance d'un vocabulaire réduit de mots isolés et reliés entre eux a également été mis au point pour le basque, et un système de reconnaissance continue de la parole est en cours d'élaboration.
Reconnaissance du locuteur et diarisation du locuteur : Nous avons participé dans le passé à plusieurs projets nationaux sur le sujet de la reconnaissance du locuteur. Il s'agit actuellement d'un domaine de recherche très actif, avec 2 projets nationaux en cours et plusieurs collaborations internationales (voir publications de 2010). La reconnaissance des émotions du locuteur a également été un domaine de recherche très actif et productif au cours des 4 dernières années.
Écoute automatique : Nous avons de l'expérience dans l'extraction d'information à partir de signaux vocaux et sonores, la réalisation la plus importante étant la détection de bruits dans les véhicules.