{"id":92022,"date":"2009-03-03T00:00:00","date_gmt":"2009-03-03T00:00:00","guid":{"rendered":"https:\/\/www.deberes.net\/tesis\/sin-categoria\/analisis-diseno-y-aplicacion-de-modelos-de-dialogo-flexibles-contextuales-y-dinamicos-basados-en-redes-bayesianas\/"},"modified":"2009-03-03T00:00:00","modified_gmt":"2009-03-03T00:00:00","slug":"analisis-diseno-y-aplicacion-de-modelos-de-dialogo-flexibles-contextuales-y-dinamicos-basados-en-redes-bayesianas","status":"publish","type":"post","link":"https:\/\/www.deberes.net\/tesis\/traduccion-automatica\/analisis-diseno-y-aplicacion-de-modelos-de-dialogo-flexibles-contextuales-y-dinamicos-basados-en-redes-bayesianas\/","title":{"rendered":"An\u00e1lisis, dise\u00f1o y aplicaci\u00f3n de modelos de di\u00e1logo flexibles, contextuales y din\u00e1micos basados en redes bayesianas"},"content":{"rendered":"<h2>Tesis doctoral de <strong> Fernando Fern\u00e1ndez Mart\u00ednez <\/strong><\/h2>\n<p>El habla es el medio de comunicaci\u00f3n natural entre personas. Como evoluci\u00f3n de todo lo aprendido durante pr\u00e1cticamente medio siglo de investigaci\u00f3n en tecnolog\u00eda del habla, ha llegado el momento de dise\u00f1ar sistemas que hagan uso de la capacidad comunicativa del habla, aunque esta vez con m\u00e1quinas como interlocutoras. En ese sentido creemos que es fundamental incorporar al dise\u00f1o de tales sistemas las ideas recogidas bajo el concepto de \u00abinteligencia ambiental\u00bb, ofreciendo as\u00ed, interfaces inteligentes que sean capaces de negociar siguiendo un di\u00e1logo natural para conseguir los objetivos que sean requeridos por los usuarios.  los di\u00e1logos humano-m\u00e1quina u hombre-m\u00e1quina siempre requieren de un sistema de di\u00e1logo. Un sistema de di\u00e1logo puede verse como un programa o aplicaci\u00f3n inform\u00e1tica que permite la interacci\u00f3n y la comunicaci\u00f3n entre la m\u00e1quina y el humano con la mayor naturalidad posible. Adem\u00e1s de los t\u00edpicos m\u00f3dulos de reconocimiento y conversi\u00f3n de texto a voz, entre otros, todos estos sistemas presentan un elemento en com\u00fan: un m\u00f3dulo central o n\u00facleo denominado gestor de di\u00e1logo (gd) responsable de una doble tarea fundamental: interpretar la intenci\u00f3n del usuario y decidir c\u00f3mo continuar\u00e1 el di\u00e1logo.  para alcanzar con \u00e9xito el objetivo de ofrecer al usuario una respuesta lo m\u00e1s pr\u00f3xima posible a una interacci\u00f3n humano-humano, consideramos que el dise\u00f1o de un sistema de di\u00e1logo debe abordarse tanto desde una perspectiva te\u00f3rica como pr\u00e1ctica. De este modo, es preciso prestar atenci\u00f3n no s\u00f3lo al \u00abmodelado del di\u00e1logo\u00bb (i.E. Conjunto de teor\u00edas generales o modelos que proporcionan la base necesaria para la \u00abgesti\u00f3n de di\u00e1logo\u00bb), sino tambi\u00e9n a la necesaria integraci\u00f3n de esos modelos junto con el conocimiento espec\u00edfico de la tarea y el dominio de aplicaci\u00f3n (i.E. Modelos de tarea y dominio) para poder desarrollar procedimientos que soporten la interacci\u00f3n hombre-m\u00e1quina en un di\u00e1logo colaborativo, cooperativo, en definitiva, \u00fatil. Fruto de este estudio, a continuaci\u00f3n presentaremos las principales aportaciones de la presente tesis doctoral:  1) nuevas soluciones de di\u00e1logo basadas en redes bayesianas (bayesian networks, bns). como alternativa a los sistemas de di\u00e1logo cl\u00e1sicos (aut\u00f3matas de estados finitos o fsms, sistemas basados en scripts o planes de di\u00e1logo, etc.), Se han explorado nuevos esquemas de di\u00e1logo que permiten una mayor flexibilidad y naturalidad mediante una definici\u00f3n m\u00e1s conveniente del di\u00e1logo como la interacci\u00f3n con un sistema de inferencia. Las nuevas estrategias permiten avanzar en varios aspectos fundamentales:   1.A) el motor de inferencia basado en bns permite una mejor identificaci\u00f3n de los objetivos de di\u00e1logo del usuario (i.E. Actividades que puede realizar el sistema) a partir de los conceptos (i.E. Informaci\u00f3n sem\u00e1ntica) facilitados por \u00e9ste y de forma coherente con el contexto de di\u00e1logo actual. El motor de inferencia puede obtenerse a partir de tales conceptos lo que permite su dise\u00f1o con el mayor grado posible de independencia del idioma empleado. Adem\u00e1s, las bns permiten llevar a cabo un an\u00e1lisis de congruencia entre los objetivos que el sistema cree que el usuario ha solicitado y el conjunto de datos recogidos durante la interacci\u00f3n. Gracias a este an\u00e1lisis el sistema puede decidir el flujo de la interacci\u00f3n y reaccionar conforme a la l\u00f3gica del dominio de aplicaci\u00f3n (e.G. Realizando las tareas requeridas o solicitando al usuario la informaci\u00f3n necesaria para ello). La idea principal es detectar de forma autom\u00e1tica qu\u00e9 conceptos son necesarios (est\u00e9n disponibles o no), err\u00f3neos u opcionales en relaci\u00f3n a los objetivos inferidos. De este modo el di\u00e1logo podr\u00eda dirigirse hacia la producci\u00f3n de mensajes solicitando los \u00edtems que sean precisos, aclarando los err\u00f3neos y obviando los opcionales. Esto permite evitar di\u00e1logos innecesariamente largos y facilita la consecuci\u00f3n de los objetivos de forma \u00e1gil y eficaz.  1.B) como alternativa a las soluciones tradicionales basadas en varios modelos de bn, uno por cada objetivo de informaci\u00f3n, se propone replantear el problema a partir de un modelo \u00fanico para todos los conceptos y objetivos de informaci\u00f3n definidos en el dominio de aplicaci\u00f3n. Para ello se ha definido un nuevo algoritmo de \u00abfusi\u00f3n\u00bb de los modelos espec\u00edficos para cada objetivo. Contar con modelos espec\u00edficos para cada uno de los objetivos de di\u00e1logo resulta una decisi\u00f3n especialmente inapropiada ya que obliga a asumir una hip\u00f3tesis de independencia entre los diferentes objetivos. En di\u00e1logo, dicho requisito se incumple muy frecuentemente en la medida en que una intervenci\u00f3n pueda corresponder no s\u00f3lo a un objetivo en concreto sino a m\u00faltiples objetivos (e.G. El usuario decide simult\u00e1neamente llevar a cabo un cierto conjunto de acciones). Por este motivo consideramos que dicha simplificaci\u00f3n va en contra de nuestros intereses en cuanto a eficiencia y flexibilidad del di\u00e1logo. Gracias a esta estrategia basada en un modelo \u00fanico, el resultado del an\u00e1lisis de congruencia es tambi\u00e9n \u00fanico y se obtiene considerando un contexto global, com\u00fan a todos los objetivos, evitando as\u00ed posibles resultados dispares para un mismo dato o concepto al analizar cada objetivo por separado.  2) respuesta flexible. supone probablemente la gran diferencia y a su vez la gran ventaja de las soluciones propuestas respecto a las convencionales, es decir, no existe ninguna secuencia de datos ni de objetivos prefijada a la que tenga que ce\u00f1irse el usuario. As\u00ed, las bns nos permiten un modelado del di\u00e1logo basado en iniciativa mixta en el que el usuario puede elegir el conjunto de objetivos que quiere que el sistema le ofrezca. Esta flexibilidad es doble ya que no s\u00f3lo se permite al usuario decidir los objetivos al comienzo de la interacci\u00f3n, sino que tambi\u00e9n se le permite saltar a otros objetivos sin haber completado el anterior. Por otra parte, el usuario puede responder con m\u00e1s datos de los solicitados en la pregunta o incluso responder a un dato no preguntado de los pertenecientes a un objetivo decidido por el sistema. Con objeto de evitar giros bruscos en la interpretaci\u00f3n realizada (los cuales podr\u00edan producir desorientaci\u00f3n o desconcierto en el usuario) el gd debe integrar en el proceso de decisi\u00f3n acerca de c\u00f3mo continuar el di\u00e1logo toda la informaci\u00f3n disponible.  3) respuesta contextual. habitualmente los sistemas deben hacer frente a situaciones complicadas en las que el usuario tiende a omitir cierta informaci\u00f3n, en ocasiones, informaci\u00f3n que resulta fundamental para el correcto desenlace del di\u00e1logo. La soluci\u00f3n propuesta permite, a trav\u00e9s de un proceso de negociaci\u00f3n orquestado en base al procedimiento de inferencia, obtener dicha informaci\u00f3n. Adicionalmente, esta soluci\u00f3n cuenta con la capacidad de recuperar r\u00e1pidamente la informaci\u00f3n restante a partir del contexto del di\u00e1logo. Para ello, se han dise\u00f1ado e implementado estrategias de aprovechamiento de la informaci\u00f3n contextual que mejoran la robustez del sistema de di\u00e1logo produciendo respuestas coherentes a partir de, entre otros: las medidas de confianza proporcionadas por los m\u00f3dulos de reconocimiento y comprensi\u00f3n, la historia del di\u00e1logo, el estado del sistema, el modelo de tarea (e.G. Un marco sem\u00e1ntico con todos los elementos de informaci\u00f3n necesarios para satisfacer un determinado objetivo de di\u00e1logo), el modelo del dominio de aplicaci\u00f3n en cuesti\u00f3n (e.G. Informaci\u00f3n de vuelos) y el modelo de usuario. Gracias a las estrategias dise\u00f1adas el sistema es capaz de dar el tratamiento adecuado a fen\u00f3menos como: \u00aban\u00e1foras\u00bb (o elementos que hacen referencia a otras partes del di\u00e1logo aparecidas con antelaci\u00f3n), \u00abelipsis\u00bb (u omisi\u00f3n de ciertos elementos vitales para el di\u00e1logo pero que pueden deducirse a partir del contexto), y \u00abde\u00edxis\u00bb o referencias de\u00edcticas (aquellas cuyo significado depende del contexto, sobre todo del contexto f\u00edsico, de los elementos extraling\u00ed\u00bc\u00edsticos e.G. \u00abReproduce la otra\u00bb, la otra canci\u00f3n por ejemplo, la anterior).  4) respuesta din\u00e1mica. la robustez de los sistemas pasa en buena parte por que la respuesta de estos sea din\u00e1mica. Con ese prop\u00f3sito se han previsto los siguientes mecanismos de adaptaci\u00f3n:  4.A) el gd es capaz, a partir de la informaci\u00f3n contextual (e.G. Turno anterior, historia) y la evoluci\u00f3n del di\u00e1logo, extraer informaci\u00f3n sobre la expectativa que tiene el sistema acerca de lo que el usuario puede decir. Esta previsi\u00f3n puede emplearse para preparar el sistema con modelos adaptados (e.G. Ac\u00fasticos, de lenguaje,&#8230;Etc.) De tal forma que se incentiven interpretaciones congruentes con las respuestas esperadas.  4.B) como caracter\u00edstica din\u00e1mica del comportamiento del sistema, se han introducido mecanismos de atenuaci\u00f3n que rebajan la relevancia o latencia de los elementos de informaci\u00f3n almacenados en la historia conforme a la evoluci\u00f3n del di\u00e1logo. Tras ser almacenados, y debido a la atenuaci\u00f3n sufrida tras cada turno de di\u00e1logo, estos elementos pueden evolucionar hasta alcanzar una relevancia por debajo de un cierto umbral predeterminado, motivo por el cual desaparecen definitivamente de la historia de di\u00e1logo. Gracias a este mecanismo es posible mantener la historia permanente actualizada en todo momento otorgando mayor peso a la informaci\u00f3n m\u00e1s reciente frente a la m\u00e1s antigua. Otra utilidad inmediata de este mecanismo es que de forma autom\u00e1tica, sin necesidad de ning\u00fan proceso de aclaraci\u00f3n, podr\u00edan desaparecer del di\u00e1logo tanto las observaciones err\u00f3neas como espurias simplemente por el hecho de que \u00e9stas no vuelvan a ser referenciadas en adelante por el usuario.  5) definici\u00f3n de una metodolog\u00eda de dise\u00f1o. finalmente, la presente tesis profundiza en el an\u00e1lisis y aplicaci\u00f3n de mecanismos y t\u00e9cnicas eficientes que minimicen el esfuerzo invertido para generar un nuevo sistema de di\u00e1logo (cambio de contexto sem\u00e1ntico). Para ello se propone el uso de estrategias que permiten caracterizar el dominio de aplicaci\u00f3n del sistema y que facilitan el aprendizaje autom\u00e1tico de los modelos de di\u00e1logo. Gracias a esta metodolog\u00eda es posible obtener un modelo de di\u00e1logo completo de la aplicaci\u00f3n partiendo del an\u00e1lisis de situaciones reales etiquetadas y de una descripci\u00f3n del modelo de datos de la aplicaci\u00f3n junto con una descripci\u00f3n sem\u00e1ntica de la misma (ontolog\u00eda).  todas estas aportaciones han sido finalmente evaluadas encontr\u00e1ndose el suficiente apoyo experimental como para demostrar su relevancia.<\/p>\n<p>&nbsp;<\/p>\n<h3>Datos acad\u00e9micos de la tesis doctoral \u00ab<strong>An\u00e1lisis, dise\u00f1o y aplicaci\u00f3n de modelos de di\u00e1logo flexibles, contextuales y din\u00e1micos basados en redes bayesianas<\/strong>\u00ab<\/h3>\n<ul>\n<li><strong>T\u00edtulo de la tesis:<\/strong>\u00a0 An\u00e1lisis, dise\u00f1o y aplicaci\u00f3n de modelos de di\u00e1logo flexibles, contextuales y din\u00e1micos basados en redes bayesianas <\/li>\n<li><strong>Autor:<\/strong>\u00a0 Fernando Fern\u00e1ndez Mart\u00ednez <\/li>\n<li><strong>Universidad:<\/strong>\u00a0 Polit\u00e9cnica de Madrid<\/li>\n<li><strong>Fecha de lectura de la tesis:<\/strong>\u00a0 03\/03\/2009<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<h3>Direcci\u00f3n y tribunal<\/h3>\n<ul>\n<li><strong>Director de la tesis<\/strong>\n<ul>\n<li>Javier Ferreiros L\u00f3pez<\/li>\n<\/ul>\n<\/li>\n<li><strong>Tribunal<\/strong>\n<ul>\n<li>Presidente del tribunal: Jos\u00e9 manuel Pardo mu\u00f1oz <\/li>\n<li>eduardo Lleida solano (vocal)<\/li>\n<li>alessandro Vinciarelli (vocal)<\/li>\n<li>ascension Gallardo antolin (vocal)<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Tesis doctoral de Fernando Fern\u00e1ndez Mart\u00ednez El habla es el medio de comunicaci\u00f3n natural entre personas. Como evoluci\u00f3n de todo [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"footnotes":""},"categories":[2302,16008,19520,27844,656],"tags":[190502,60364,4155,190501,60365,30791],"class_list":["post-92022","post","type-post","status-publish","format-standard","hentry","category-linguistica-computacional","category-politecnica-de-madrid","category-procesos-de-markov","category-reconocimiento-y-sintetizacion-de-habla","category-traduccion-automatica","tag-alessandro-vinciarelli","tag-ascension-gallardo-antolin","tag-eduardo-lleida-solano","tag-fernando-fernandez-Martinez","tag-javier-ferreiros-lopez","tag-jose-manuel-pardo-munoz"],"_links":{"self":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/92022","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/comments?post=92022"}],"version-history":[{"count":0,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/92022\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/media?parent=92022"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/categories?post=92022"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/tags?post=92022"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}