Síntesis y Reconocimiento del Habla

El grupo está comprometido con las tecnologías de procesado de voz y sus aplicaciones, con especial atención en las siguientes áreas:

  • Conversión de texto en habla: El grupo ha desarrollado su propio conversor de texto en habla multilenguaje, en Inglés, Castellano y Euskera. Nuestro sistema AhoTTS para el euskera (aholab.ehu.es/TTS) es el único desarrollado íntegramente en el País Vasco y públicamente disponible. También tiene capacidad de generar habla emocional.

  • Síntesis de voz: Se ha dedicado un gran esfuerzo investigador al desarrollo de algoritmos y tecnologías de generación de voces sintéticas, para incorporarlas en AhoTTS y evaluarlas. Durante los últimos 15 años se han desarrollado sistemas basados en, virtualmente, todas las tecnologías pinteras de generación de voz.

  • Música y canto: Se han explorado las aplicaciones de la síntesis de voz en este campo, desarrollando síntesis de voz cantada y una herramienta de procesado de señal para la enseñanza musical.
  • Modelado prosódico: Se han desarrollado modelos prosódicos y técnicas de generacion de prosodia específicos para el euskera, con especial atención a las técnicas de análisis y conversión prosódicas aplicadas al habla emocional.

  • Reconocimiento de habla: El grupo ha desarrollado varias bases de datos públicas para el desarrollo y pruebas de sistemas de reconocimiento de habla en euskera, disponibles a través de ELRA. También se ha desarrollado un reconocedor de palabras aisladas y conectadas de vocabulario reducido, y se está desarrollando un reconocedor de habla continua.

  • Reconocimiento de locutor y diarización: Hemos participado en diferentes proyectos nacionales relacionados con el reconocimiento de locutor. A día de hoy es unárea de investigación muy activa, con dos proyectos nacionales activos y varias colaboraciones internacionales (ver pubicaciones de 2010). LA detección de las emociones del hablante también ha sido una campo de investigación muy activo y productivo en os últimos 4 años.

  • Escucha automática: Tenemos experiencia en la extracción de información de señales vocales y sonoras, siendo el más importante logro la detección de ruidos en vehículos.

Investigador/a principal: 

ver más