{"id":102897,"date":"2018-03-11T10:25:16","date_gmt":"2018-03-11T10:25:16","guid":{"rendered":"https:\/\/www.deberes.net\/tesis\/sin-categoria\/modelado-de-la-cualidad-de-la-voz-para-la-sa%c2%adntesis-del-habla-expresiva\/"},"modified":"2018-03-11T10:25:16","modified_gmt":"2018-03-11T10:25:16","slug":"modelado-de-la-cualidad-de-la-voz-para-la-sa%c2%adntesis-del-habla-expresiva","status":"publish","type":"post","link":"https:\/\/www.deberes.net\/tesis\/linguistica-computacional\/modelado-de-la-cualidad-de-la-voz-para-la-sa%c2%adntesis-del-habla-expresiva\/","title":{"rendered":"Modelado de la cualidad de la voz para la s\u00edntesis del habla expresiva"},"content":{"rendered":"<h2>Tesis doctoral de <strong> Carlos Manuel Monzo S\u00e1nchez <\/strong><\/h2>\n<p>Esta tesis se realiza dentro del marco de trabajo existente en el grupo de investigaci\u00f3n grup de recerca en tecnologies m\u00e9dia (gtm) de enginyeria i arquitectura la salle, con el objetivo de dotar de mayor naturalidad a la interacci\u00f3n hombre-m\u00e1quina. Para ello nos basamos en las limitaciones de la tecnolog\u00eda empleada hasta el momento, detectando puntos de mejora en los que poder aportar soluciones. Debido a que la naturalidad del habla est\u00e1 \u00edntimamente relacionada con la expresividad que esta puede transmitir, estos puntos de mejora se centran en la capacidad de trabajar con emociones o estilos de habla expresivos en general. el objetivo \u00faltimo de esta tesis es la generaci\u00f3n de estilos de habla expresivos en el \u00e1mbito de sistemas de conversi\u00f3n de texto en habla (cth) orientados a la s\u00edntesis del habla expresiva (she), siendo posible transmitir un mensaje oral con una cierta expresividad que el oyente sea capaz de percibir e interpretar correctamente. No obstante, este objetivo implica diferentes metas intermedias: conocer las opciones de parametrizaci\u00f3n existentes, entender cada uno de los par\u00e1metros, detectar los pros y contras de su utilizaci\u00f3n, descubrir las relaciones existentes entre ellos y los estilos de habla expresivos y, finalmente, llevar a cabo la s\u00edntesis del habla expresiva. El propio proceso de s\u00edntesis implica un trabajo previo en reconocimiento de emociones, que en s\u00ed mismo podr\u00eda ser una l\u00ednea completa de investigaci\u00f3n, ya que muestra la viabilidad de usar los par\u00e1metros seleccionados en la discriminaci\u00f3n de estos y aporta el conocimiento necesario para extraer los modelos que pueden ser usados durante el proceso de s\u00edntesis. la b\u00fasqueda del incremento de la naturalidad ha implicado una mejor caracterizaci\u00f3n del habla emocional o expresiva, con lo que para ello se ha investigado en parametrizaciones que pudieran llevar a cabo este cometido. Estos son los par\u00e1metros de cualidad de la voz  -voice quality- (voq), que presentan como caracter\u00edstica principal que son capaces de caracterizar individualmente el habla, identificando cada uno de los factores que hacen que sea \u00fanica. Los beneficios potenciales, que este tipo de parametrizaci\u00f3n puede aportar a la interacci\u00f3n natural, son de dos clases: el reconocimiento y la s\u00edntesis de estilos de habla expresivos. La propuesta de la parametrizaci\u00f3n de voq no pretende sustituir a la ya empleada prosodia, sino todo lo contrario, trabajar conjuntamente con ella para mejorar los resultados obtenidos hasta el momento. una vez realizada la selecci\u00f3n de los par\u00e1metros se plantea el modelado de la voq, es decir, la metodolog\u00eda de an\u00e1lisis y de modificaci\u00f3n de forma que cada uno de ellos pueda ser extra\u00eddo a partir de la se\u00f1al de voz y posteriormente modificado durante la s\u00edntesis. Asimismo, se proponen variaciones para los par\u00e1metros implicados y tradicionalmente utilizados, adaptando su definici\u00f3n al contexto del habla expresiva. a partir de aqu\u00ed se pasa a trabajar en las relaciones existentes con los estilos de habla expresivos, presentando finalmente la metodolog\u00eda de transformaci\u00f3n de estos \u00faltimos, mediante la modificaci\u00f3n conjunta de voq y prosodia, para la she en un sistema de cth.<\/p>\n<p>&nbsp;<\/p>\n<h3>Datos acad\u00e9micos de la tesis doctoral \u00ab<strong>Modelado de la cualidad de la voz para la s\u00edntesis del habla expresiva<\/strong>\u00ab<\/h3>\n<ul>\n<li><strong>T\u00edtulo de la tesis:<\/strong>\u00a0 Modelado de la cualidad de la voz para la s\u00edntesis del habla expresiva <\/li>\n<li><strong>Autor:<\/strong>\u00a0 Carlos Manuel Monzo S\u00e1nchez <\/li>\n<li><strong>Universidad:<\/strong>\u00a0 Ram\u00f3n llull<\/li>\n<li><strong>Fecha de lectura de la tesis:<\/strong>\u00a0 14\/07\/2010<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<h3>Direcci\u00f3n y tribunal<\/h3>\n<ul>\n<li><strong>Director de la tesis<\/strong>\n<ul>\n<li>Joan Claudi Socor\u00f3 Carri\u00e9<\/li>\n<\/ul>\n<\/li>\n<li><strong>Tribunal<\/strong>\n<ul>\n<li>Presidente del tribunal: angel Rodriguez bravo <\/li>\n<li>Juan  Manuel Montero mart\u00ednez (vocal)<\/li>\n<li>Juan  ignacio Godino  llorente (vocal)<\/li>\n<li>Jos\u00e9 Antonio Mor\u00e1n moreno (vocal)<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Tesis doctoral de Carlos Manuel Monzo S\u00e1nchez Esta tesis se realiza dentro del marco de trabajo existente en el grupo [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"footnotes":""},"categories":[10487,2528,2302,32959,2535],"tags":[29272,208545,144089,208546,56208,77420],"class_list":["post-102897","post","type-post","status-publish","format-standard","hentry","category-fonetica","category-inteligencia-artificial","category-linguistica-computacional","category-ramon-llull","category-tecnologia-de-los-ordenadores","tag-angel-rodriguez-bravo","tag-carlos-manuel-monzo-sanchez","tag-joan-claudi-socoro-carrie","tag-jose-antonio-moran-moreno","tag-juan-ignacio-godino-llorente","tag-juan-manuel-montero-Martinez"],"_links":{"self":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/102897","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/comments?post=102897"}],"version-history":[{"count":0,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/102897\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/media?parent=102897"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/categories?post=102897"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/tags?post=102897"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}