Euskarazko hizketa jarraituaren ezagutza automatikoa eredu estokastikoen bidez

Tesis doctoral de Miren Karmele Lopez De Ipiña Peña

La presente memoria culmina un proces de 10 años dedicados al desarrollo de recursos y sistemas de reconocimiento del habla continua (csr) en euskera, que constituyen un trabajo pionero en esta lengua. en este trabajo hemos tenido que reproducir esfuerzos, trabajos y resultados que ya existían para otras lenguas, y también nos hemos beneficiado del estado del arte actual en muchos aspectos del desarrollo de los sistemas de reconocimiento automático del habla (asr). una parte fundamental del trabajo es el desarrollo de recursos para el análisis estadístico de la lengua y para la construcción de los sistemas de reconocimiento. Estos recursos abarcan textos de diversas fuentes, en un intento de realizar un muestreo exhaustivo de la lengua, así como una base de datos fonética de voz en la que se ha tratado de obtener una representación adecuada para las diversas variedades dialectales. también se incluyen tareas de complejidad controlada para la evaluación de sistemas de reconocimiento. este trabajo, que normalmente se realiza con grandes equipos humanos y fuertes financiaciones, ha sido realizado por un grupo escaso de voluntarios que colaboraron de modo desinteresado en las diversas fases de la tesis, y con limitados recursos teóricos. los trabajos se inician con la construcción de un decodificador acústico fonético para el euskera. El conjunto base de unidades subléxicas de tipo fonético independientes del contexto se escogieron de acuerdo a criterios lingí¼ísticos y estadísticas fonéticas y fonológicas de la lengua. Posteriormente se realizo una selección de las unidades de mínima confusión para todas las variedades dialectales de la zona sur. Este sistema es la base y piedra angular de los posteriores desarrollados. los trabajo se orientan a continuación a la selección de unidades léxicas para csr. En muchas lenguas (ingles, francés o español) las unidades léxicas se identifican habitualmente co

 

Datos académicos de la tesis doctoral «Euskarazko hizketa jarraituaren ezagutza automatikoa eredu estokastikoen bidez«

  • Título de la tesis:  Euskarazko hizketa jarraituaren ezagutza automatikoa eredu estokastikoen bidez
  • Autor:  Miren Karmele Lopez De Ipiña Peña
  • Universidad:  País vasco/euskal herriko unibertsitatea
  • Fecha de lectura de la tesis:  25/06/2003

 

Dirección y tribunal

  • Director de la tesis
    • Manuel Graña Romay
  • Tribunal
    • Presidente del tribunal: José bernardo Mariño acebal
    • nerea Ezeiza ramos (vocal)
    • Torrealdea folgado Francisco Javier (vocal)
    • itziar Aduriz agirre (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio