Tecnologías del habla en euskera: reconocimiento, identificación y traducción de voz

Tesis doctoral de Victor Gabriel Guijarrubia Anton

El presente trabajo gira en torno al estudio de la aplicación de las tecnologías del habla al euskera, principalmente alrededor del reconocimiento automático del habla. Partiendo de cero, hemos tenido que crear los componentes de un sistema de reconocimiento, como los modelos acústicos y grabar corpus como aplicación del sistema. Más adelante hemos estudiado el uso y la integración de distintos tipos de unidades léxicas en procesos de reconocimiento, pensando principalmente en su utilidad para idiomas morfológicamente ricos como el euskera. En concreto hemos probado el uso de lemas, morfemas y secuencias de palabras. El primero ha resultado no ser efectivo debido a la pérdida de la relación entre las palabras. el segundo tipo he resultado ser más adecuado, ya que proporciona mejoras de resultados, tiempo de cálculo y/o cobertura de palabras. Para el tercer caso, hemos observado como es posible mejorar los resultados con una selección adecuada. aunque el reconocimiento ha sido el apartado fundamental, tecnologías y modelos desarrollados para ello han servido para otros campos de las tecnologías del habla, como la traducción o la identificación del idioma. En concreto, hemos probado el uso de las secuencias de palabras al caso de traducción, obteniéndose mejoras respecto al sistema base basado en palabras. Respecto a la identificación, nos hemos concentrado en el análisis de métodos basados en la fonotáctica, estudiando el caso de modelos fonotácticos entrenados a partir de muestras de voz, así como de texto, y el uso de secuencias en ambos casos. Los resultados han mostrado que los modelos basados en texto pueden rendir de manera similar a los basados en voz. Respecto al uso de secuencias, su uso tiende en general a empeorar los resultados, siendo únicamente de utilidad cuando el conocimiento fonotáctico se aplica durante el proceso de decodificación.

 

Datos académicos de la tesis doctoral «Tecnologías del habla en euskera: reconocimiento, identificación y traducción de voz«

  • Título de la tesis:  Tecnologías del habla en euskera: reconocimiento, identificación y traducción de voz
  • Autor:  Victor Gabriel Guijarrubia Anton
  • Universidad:  País vasco/euskal herriko unibertsitatea
  • Fecha de lectura de la tesis:  14/12/2010

 

Dirección y tribunal

  • Director de la tesis
    • María Ines Torres Barañano
  • Tribunal
    • Presidente del tribunal: José manuel Pardo muñoz
    • m. José Castro bleda (vocal)
    • eduardo Lleida solano (vocal)
    • Emilio Sanchis arnal (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio