{"id":65329,"date":"2018-03-09T22:53:25","date_gmt":"2018-03-09T22:53:25","guid":{"rendered":"https:\/\/www.deberes.net\/tesis\/sin-categoria\/produccion-de-un-corpus-oral-y-modelado-prosodico-para-la-sa%c2%adntesis-del-habla-expresiva\/"},"modified":"2018-03-09T22:53:25","modified_gmt":"2018-03-09T22:53:25","slug":"produccion-de-un-corpus-oral-y-modelado-prosodico-para-la-sa%c2%adntesis-del-habla-expresiva","status":"publish","type":"post","link":"https:\/\/www.deberes.net\/tesis\/linguistica-computacional\/produccion-de-un-corpus-oral-y-modelado-prosodico-para-la-sa%c2%adntesis-del-habla-expresiva\/","title":{"rendered":"Producci\u00f3n de un corpus oral y modelado pros\u00f3dico para la s\u00edntesis del habla expresiva"},"content":{"rendered":"<h2>Tesis doctoral de <strong> Ignacio Iriondo Sanz <\/strong><\/h2>\n<p>Esta tesis aborda diferentes aspectos relacionados con la s\u00edntesis del habla expresiva. Se parte de la experiencia previa en sistemas de conversi\u00f3n de texto en habla del grup en processament multimodal (gpmm) de enginyeria i arquitectura la salle, con el objetivo de mejorar la capacidad expresiva de este tipo de sistemas.  El habla expresiva transmite informaci\u00f3n paraling\u00ed\u00bc\u00edstica como, por ejemplo, la emoci\u00f3n del hablante, su estado de \u00e1nimo, una determinada intenci\u00f3n o aspectos relacionados con el entorno o con su interlocutor.  Los dos objetivos principales de la presente tesis consisten, por una parte, en el desarrollo de un corpus oral expresivo y, por otra, en la propuesta de un sistema de modelado y predicci\u00f3n de la prosodia para su utilizaci\u00f3n en el \u00e1mbito de la s\u00edntesis expresiva del habla.   en primer lugar, se requiere un corpus oral adecuado para la generaci\u00f3n de algunos de los m\u00f3dulos que componen un sistema de s\u00edntesis del habla expresiva. La falta de disponibilidad de un recurso de este tipo motiv\u00f3 el desarrollo de un nuevo corpus. A partir del estudio de los procedimientos de obtenci\u00f3n de habla emocionada o expresiva y de la experiencia previa del grupo, se plantea el dise\u00f1o, la grabaci\u00f3n, el etiquetado y la validaci\u00f3n del nuevo corpus. El principal objetivo consiste en conseguir una elevada calidad de la se\u00f1al y una cobertura fon\u00e9tica suficiente (segmental y pros\u00f3dica), sin renunciar a la autenticidad desde el punto de vista de la expresividad oral. El corpus desarrollado tiene una duraci\u00f3n de m\u00e1s de cinco horas y contiene cinco estilos expresivos: neutro, alegre, sensual, agresivo y triste. Al tratarse de habla expresiva obtenida mediante la lectura de textos sem\u00e1nticamente relacionados con los estilos definidos, se ha requerido un proceso de validaci\u00f3n que garantice que las locuciones que forman el corpus incorporen el contenido expresivo deseado. La evaluaci\u00f3n exhaustiva de todos los enunciados del corpus ser\u00eda excesivamente costosa en un corpus de gran tama\u00f1o. Por otro lado, no existe suficiente conocimiento cient\u00edfico para emular completamente la percepci\u00f3n subjetiva mediante t\u00e9cnicas autom\u00e1ticas que permitan una validaci\u00f3n exhaustiva y fiable de los corpus orales. En el presente trabajo se ha propuesto un m\u00e9todo que supone un avance hacia una soluci\u00f3n pr\u00e1ctica y eficiente de este problema, mediante la combinaci\u00f3n de una evaluaci\u00f3n subjetiva con t\u00e9cnicas de identificaci\u00f3n autom\u00e1tica de la emoci\u00f3n en el habla. El m\u00e9todo propuesto se utiliza para llevar a cabo una revisi\u00f3n autom\u00e1tica de la expresividad del corpus desarrollado. Finalmente, una prueba subjetiva con oyentes ha permitido validar el correcto funcionamiento de este proceso autom\u00e1tico.  en segundo lugar y, sobre la base de los conocimientos actuales, a la experiencia adquirida y a los retos que se deseaban abordar, se ha desarrollado un sistema de estimaci\u00f3n de la prosodia basado en corpus. Tal sistema se caracteriza por modelar de forma conjunta las funciones ling\u00ed\u00bc\u00edstica y paraling\u00ed\u00bc\u00edstica de la prosodia a partir de la extracci\u00f3n autom\u00e1tica de atributos pros\u00f3dicos del texto, que constituyen la entrada de un sistema de aprendizaje autom\u00e1tico que predice los rasgos pros\u00f3dicos modelados previamente. El sistema de modelado pros\u00f3dico presentado en este trabajo se fundamenta en el razonamiento basado en casos que se trata de una t\u00e9cnica de aprendizaje autom\u00e1tico por analog\u00eda. Para el ajuste de algunos par\u00e1metros del sistema desarrollado y para su evaluaci\u00f3n se han utilizado medidas objetivas del error y de la correlaci\u00f3n calculadas en las locuciones del conjunto de prueba. Dado que las medidas objetivas siempre se refieren a casos concretos, no aportan informaci\u00f3n sobre el grado de aceptaci\u00f3n que tendr\u00e1 el habla sintetizada en los oyentes. Por lo tanto, se han llevado a cabo una serie de pruebas de percepci\u00f3n en las que un conjunto de oyentes ha puntuado un grupo de est\u00edmulos en cada estilo. Finalmente, se han analizado los resultados para cada estilo y se han comparado con las medidas objetivas obtenidas, lo que ha permitido extraer algunas conclusiones sobre la relevancia de los rasgos pros\u00f3dicos en el habla expresiva, as\u00ed como constatar que los resultados generados por el m\u00f3dulo pros\u00f3dico han tenido una buena aceptaci\u00f3n, aunque se han producido diferencias seg\u00fan el estilo.<\/p>\n<p>&nbsp;<\/p>\n<h3>Datos acad\u00e9micos de la tesis doctoral \u00ab<strong>Producci\u00f3n de un corpus oral y modelado pros\u00f3dico para la s\u00edntesis del habla expresiva<\/strong>\u00ab<\/h3>\n<ul>\n<li><strong>T\u00edtulo de la tesis:<\/strong>\u00a0 Producci\u00f3n de un corpus oral y modelado pros\u00f3dico para la s\u00edntesis del habla expresiva <\/li>\n<li><strong>Autor:<\/strong>\u00a0 Ignacio Iriondo Sanz <\/li>\n<li><strong>Universidad:<\/strong>\u00a0 Ram\u00f3n llull<\/li>\n<li><strong>Fecha de lectura de la tesis:<\/strong>\u00a0 18\/06\/2008<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<h3>Direcci\u00f3n y tribunal<\/h3>\n<ul>\n<li><strong>Director de la tesis<\/strong>\n<ul>\n<li>Joan Claudi Socor\u00f3 Carri\u00e9<\/li>\n<\/ul>\n<\/li>\n<li><strong>Tribunal<\/strong>\n<ul>\n<li>Presidente del tribunal: josep Mart\u00ed roca <\/li>\n<li>Juan  Manuel Montero mart\u00ednez (vocal)<\/li>\n<li>Juan  Mar\u00eda Garrido almi\u00f1ana (vocal)<\/li>\n<li>Jos\u00e9 bernardo Mari\u00f1o acebal (vocal)<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Tesis doctoral de Ignacio Iriondo Sanz Esta tesis aborda diferentes aspectos relacionados con la s\u00edntesis del habla expresiva. Se parte [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"footnotes":""},"categories":[10487,2528,2302,32959],"tags":[144088,144089,17031,96279,77420,144090],"class_list":["post-65329","post","type-post","status-publish","format-standard","hentry","category-fonetica","category-inteligencia-artificial","category-linguistica-computacional","category-ramon-llull","tag-ignacio-iriondo-sanz","tag-joan-claudi-socoro-carrie","tag-jose-bernardo-marino-acebal","tag-josep-marti-roca","tag-juan-manuel-montero-Martinez","tag-juan-maria-garrido-alminana"],"_links":{"self":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/65329","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/comments?post=65329"}],"version-history":[{"count":0,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/65329\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/media?parent=65329"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/categories?post=65329"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/tags?post=65329"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}