{"id":65490,"date":"2018-03-09T22:53:37","date_gmt":"2018-03-09T22:53:37","guid":{"rendered":"https:\/\/www.deberes.net\/tesis\/sin-categoria\/sa%c2%adntesis-multilocutor-aplicando-tecnicas-de-conversion-de-hablante\/"},"modified":"2018-03-09T22:53:37","modified_gmt":"2018-03-09T22:53:37","slug":"sa%c2%adntesis-multilocutor-aplicando-tecnicas-de-conversion-de-hablante","status":"publish","type":"post","link":"https:\/\/www.deberes.net\/tesis\/politecnica-de-madrid\/sa%c2%adntesis-multilocutor-aplicando-tecnicas-de-conversion-de-hablante\/","title":{"rendered":"S\u00edntesis multilocutor aplicando t\u00e9cnicas de conversi\u00f3n de hablante"},"content":{"rendered":"<h2>Tesis doctoral de <strong> Juan a Mar\u00eda Guti\u00e9rrez Arriola <\/strong><\/h2>\n<p>Las t\u00e9cnicas de conversi\u00f3n de locutor transforman la se\u00f1al de voz pronunciada por una persona para que sea percibida como si la hubiera dicho otra persona. Se denomina locutor fuente al hablante inicial y locutor deseado a la identidad que se pretende obtener. Tradicionalmente la transformaci\u00f3n se aplica al habla natural o al habla sint\u00e9tica como un procesado posterior a la s\u00edntesis. El objetivo de esta tesis es estudiar las t\u00e9cnicas propuestas hasta el momento e incorporarlas en un sistema de s\u00edntesis de voz. Por ello es necesario conocer a fondo el m\u00e9todo de s\u00edntesis a utilizar y estudiar y desarrollar la t\u00e9cnica que mejor se adapte a sus caracter\u00edsticas. se han estudiado dos propuestas de sintetizador: 1. Sintetizador de formantes que concatena unidades parametrizadas. En este caso los par\u00e1metros que se utilizan para la s\u00edntesis son las cinco primeros formantes y cuatro par\u00e1metros de fuente glotal del modelo lf (lijencrants &#038; fant). 2. El segundo de los sintetizadores es un sintetizador lp (linear prediction) que concatena unidades codificadas. El modelo de fuente utilizado es un polinomio de sexto orden para modelar la integral del residuo y un filtro posterior para a\u00f1adir riqueza frecuencial a la se\u00f1al. en ambos casos se han desarrollado o modificado las herramientas necesarias para realizar el an\u00e1lisis de 455 unidades correspondientes a cuatro locutores: dos hombres y dos mujeres. las t\u00e9cnicas de conversi\u00f3n utilizadas son: 1. Para el sintetizador por formantes se aplica una transformaci\u00f3n lineal para convertir los cinco primeros formantes y copiamos los par\u00e1metros del modelo lf del locutor deseado. 2. En el caso del sintetizador lp la t\u00e9cnica de transformaci\u00f3n empleada es la del mapeado de codebooks para acercar lo m\u00e1ximo los coeficientes lpc (linear prediction coefficients) del locutor base a los del locutor deseado y en este caso se mantiene la fuente del locutor base. se ha estudiado la relevancia de los par\u00e1metros utilizados en la s\u00edntesis por formantes en cuanto a la identidad del locutor se refiere. La conclusi\u00f3n de dicho estudio nos indica que la informaci\u00f3n sobre la identidad del locutor est\u00e1 repartida entre todos los par\u00e1metros analizados siendo los m\u00e1s relevantes la frecuencia fundamental, fo, y las frecuencias form\u00e1nticas. se ha modificado la fuente del sintetizador lp para favorecer la transformaci\u00f3n del locutor. Se ha comprobado que el modelo de fuente propuesto mantiene una calidad equivalente al sintetizador que utiliza las unidades codificadas celp. se han realizado pruebas objetivas y subjetivas para evaluar la capacidad de transformar el hablante y la calidad de la voz sintetizada. Se demuestra que las t\u00e9cnicas empleadas son eficientes a la hora de cambiar la identidad del locutor pero tambi\u00e9n se observa una degradaci\u00f3n de la calidad de la voz.<\/p>\n<p>&nbsp;<\/p>\n<h3>Datos acad\u00e9micos de la tesis doctoral \u00ab<strong>S\u00edntesis multilocutor aplicando t\u00e9cnicas de conversi\u00f3n de hablante<\/strong>\u00ab<\/h3>\n<ul>\n<li><strong>T\u00edtulo de la tesis:<\/strong>\u00a0 S\u00edntesis multilocutor aplicando t\u00e9cnicas de conversi\u00f3n de hablante <\/li>\n<li><strong>Autor:<\/strong>\u00a0 Juan a Mar\u00eda Guti\u00e9rrez Arriola <\/li>\n<li><strong>Universidad:<\/strong>\u00a0 Polit\u00e9cnica de Madrid<\/li>\n<li><strong>Fecha de lectura de la tesis:<\/strong>\u00a0 23\/06\/2008<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<h3>Direcci\u00f3n y tribunal<\/h3>\n<ul>\n<li><strong>Director de la tesis<\/strong>\n<ul>\n<li>Jos\u00e9 Manuel Pardo Mu\u00f1oz<\/li>\n<\/ul>\n<\/li>\n<li><strong>Tribunal<\/strong>\n<ul>\n<li>Presidente del tribunal: pedro G\u00f3mez vilda <\/li>\n<li>Antonio Bonafonte c\u00e1vez (vocal)<\/li>\n<li>joaquin Gonzalez rodriguez (vocal)<\/li>\n<li>eduardo Rodr\u00edguez banga (vocal)<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Tesis doctoral de Juan a Mar\u00eda Guti\u00e9rrez Arriola Las t\u00e9cnicas de conversi\u00f3n de locutor transforman la se\u00f1al de voz pronunciada [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"footnotes":""},"categories":[16008,27844],"tags":[45785,40492,81889,30791,144423,16193],"class_list":["post-65490","post","type-post","status-publish","format-standard","hentry","category-politecnica-de-madrid","category-reconocimiento-y-sintetizacion-de-habla","tag-antonio-bonafonte-cavez","tag-eduardo-rodriguez-banga","tag-joaquin-gonzalez-rodriguez","tag-jose-manuel-pardo-munoz","tag-juan-a-maria-gutierrez-arriola","tag-pedro-gomez-vilda"],"_links":{"self":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/65490","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/comments?post=65490"}],"version-history":[{"count":0,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/65490\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/media?parent=65490"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/categories?post=65490"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/tags?post=65490"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}