{"id":66013,"date":"2008-07-07T00:00:00","date_gmt":"2008-07-07T00:00:00","guid":{"rendered":"https:\/\/www.deberes.net\/tesis\/sin-categoria\/adaptaca%c2%adon-eficiente-del-modelo-de-lenguaje-para-transcripcion-automatica-de-voz-en-un-entorno-bilinga%c2%bce\/"},"modified":"2008-07-07T00:00:00","modified_gmt":"2008-07-07T00:00:00","slug":"adaptaca%c2%adon-eficiente-del-modelo-de-lenguaje-para-transcripcion-automatica-de-voz-en-un-entorno-bilinga%c2%bce","status":"publish","type":"post","link":"https:\/\/www.deberes.net\/tesis\/ciencias-tecnologicas\/adaptaca%c2%adon-eficiente-del-modelo-de-lenguaje-para-transcripcion-automatica-de-voz-en-un-entorno-bilinga%c2%bce\/","title":{"rendered":"Adaptac\u00ed\u00f3n eficiente del modelo de lenguaje para transcripci\u00f3n autom\u00e1tica de voz en un entorno bilingue"},"content":{"rendered":"<h2>Tesis doctoral de <strong> Francisco Javier Di\u00e9guez Tirado <\/strong><\/h2>\n<p>El problema del reconocimiento de voz, si bien ha experimentado un notable avance en los \u00faltimos a\u00f1os, contin\u00faa presentando dificultades en entornos adversos tales como la presencia de habla espont\u00e1nea, canales ruidosos, o variaciones continuas de tema y estilo de habla. Los reconocimientos de voz actuales se basan en encontrar la secuencia de palabras con un mejor ajuste a las observaciones, tanto a nivel ac\u00fastico en base a modelos de palabra, como sem\u00e1ntico y gramatical utilizando modelos de lenguaje. Para ello se aplican algoritmos que recorren de manera eficiente el espacio de b\u00fasqueda despreciando de manera temprana las hip\u00f3tesis menos probables. el objeto de la presente tesis doctoral es la mejora de la tasa de reconocimiento a trav\u00e9s de avances en el modelado de lenguaje. Para ello se atacan dos vertientes fundamentales: c\u00f3mo aplicar el modelo de lenguaje en el reconocedor de la manera m\u00e1s temprana posible, y c\u00f3mo adaptar el modelo de lenguaje para que se ajuste mejor a aquello que se desea reconocer. Para efectuar esta investigaci\u00f3n se escogi\u00f3 la tarea de transcripci\u00f3n de noticias, creando para ello un nuevo marco experimental a partir de recursos limitados. en lo que se refiere a la aplicaci\u00f3n del modelo de lenguaje, las mejoras fueron realizadas durante el desarrollo del reconocedor de la universidad de vigo, y se basan en t\u00e9cnicas para el acceso r\u00e1pido a las bases de datos de probabilidades, as\u00ed como algoritmos que intentan explotar la redundancia de los c\u00e1lculos de manera que se minimice el n\u00famero de c\u00f3mputos necesarios. Estas modificaciones permiten aplicar modelos m\u00e1s complejos en las primeras fases de reconocimiento, permitiendo as\u00ed guiar la b\u00fasqueda de manera m\u00e1s eficiente. una vez finalizado el reconocedor de la universidad de vigo se construy\u00f3 el marco experimental de transcripci\u00f3n de noticias para investigar la adaptaci\u00f3n de modelos de lenguaje. Nuestro sistema de transcripci\u00f3n, denominado transcrigal, goza de la particularidad de que est\u00e1 formado por una base de datos de noticiarios en gallego, en los cuales est\u00e1 presente asimismo una cantidad significativa de idioma castellano. Este biling\u00ed\u00bcismo es un factor novel y su tratamiento constituye un problema m\u00e1s a los problemas comunes de variedad de tema, locutor o estilo. la estimaci\u00f3n de modelos de lenguaje adaptados para transcrigal utiliza t\u00e9cnicas basadas en interpolaci\u00f3n de modelos individuales, de manera que la mezcla de modelos est\u00e9 adaptada a un tema, estilo y\/o idioma concreto. Dentro de las estrategias de interpolaci\u00f3n propondremos esquemas que aplican en paralelo varios modelos adaptados a p\u00ed\u00a0rtir de particiones manuales del corpus de texto, as\u00ed como un sistema basado en clustering jer\u00e1rquico que ha dado buenos resultados. Esta estrategia, unida a la aplicaci\u00f3n temprana del modelo de lenguaje, conduce a incrementos no despreciables en la tasa de reconocimiento.<\/p>\n<p>&nbsp;<\/p>\n<h3>Datos acad\u00e9micos de la tesis doctoral \u00ab<strong>Adaptac\u00ed\u00f3n eficiente del modelo de lenguaje para transcripci\u00f3n autom\u00e1tica de voz en un entorno bilingue<\/strong>\u00ab<\/h3>\n<ul>\n<li><strong>T\u00edtulo de la tesis:<\/strong>\u00a0 Adaptac\u00ed\u00f3n eficiente del modelo de lenguaje para transcripci\u00f3n autom\u00e1tica de voz en un entorno bilingue <\/li>\n<li><strong>Autor:<\/strong>\u00a0 Francisco Javier Di\u00e9guez Tirado <\/li>\n<li><strong>Universidad:<\/strong>\u00a0 Vigo<\/li>\n<li><strong>Fecha de lectura de la tesis:<\/strong>\u00a0 07\/07\/2008<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<h3>Direcci\u00f3n y tribunal<\/h3>\n<ul>\n<li><strong>Director de la tesis<\/strong>\n<ul>\n<li>Carmen Garc\u00eda Mateo<\/li>\n<\/ul>\n<\/li>\n<li><strong>Tribunal<\/strong>\n<ul>\n<li>Presidente del tribunal: Jos\u00e9 bernardo Mari\u00f1o acebal <\/li>\n<li>Luis alfonso Hernandez gomez (vocal)<\/li>\n<li>Mar\u00eda asunci\u00f3n Moreno bilbao (vocal)<\/li>\n<li>leandro Rodr\u00edguez li\u00f1ares (vocal)<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Tesis doctoral de Francisco Javier Di\u00e9guez Tirado El problema del reconocimiento de voz, si bien ha experimentado un notable avance [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"footnotes":""},"categories":[332,18657],"tags":[22108,145500,17031,142326,22109,15976],"class_list":["post-66013","post","type-post","status-publish","format-standard","hentry","category-ciencias-tecnologicas","category-vigo","tag-carmen-garcia-mateo","tag-francisco-javier-dieguez-tirado","tag-jose-bernardo-marino-acebal","tag-leandro-rodriguez-linares","tag-luis-alfonso-hernandez-gomez","tag-maria-asuncion-moreno-bilbao"],"_links":{"self":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/66013","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/comments?post=66013"}],"version-history":[{"count":0,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/66013\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/media?parent=66013"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/categories?post=66013"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/tags?post=66013"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}