{"id":115358,"date":"2014-07-03T00:00:00","date_gmt":"2014-07-03T00:00:00","guid":{"rendered":"https:\/\/www.deberes.net\/tesis\/sin-categoria\/improving-statistical-machine-translation-through-adaptation-and-learning\/"},"modified":"2014-07-03T00:00:00","modified_gmt":"2014-07-03T00:00:00","slug":"improving-statistical-machine-translation-through-adaptation-and-learning","status":"publish","type":"post","link":"https:\/\/www.deberes.net\/tesis\/sintaxis-y-analisis-sintactico\/improving-statistical-machine-translation-through-adaptation-and-learning\/","title":{"rendered":"Improving statistical machine translation through adaptation and learning"},"content":{"rendered":"<h2>Tesis doctoral de <strong> Carlos Alberto Henr\u00edquez Quintana <\/strong><\/h2>\n<p>Con la aparici\u00f3n de los sistemas gratuitos de traducci\u00f3n autom\u00e1tica (ta) en internet surge la posibilidad de mejorar las traducciones autom\u00e1ticas con la ayuda de los usuarios de dichos sistemas. Uno de los m\u00e9todos para lograr estas mejoras es solicitarle a los usuarios que provean una mejor traducci\u00f3n. Es posible que el sistema haya cometido un error y si el usuario es capaz de detectarlo, ser\u00eda de gran ayuda que le ense\u00f1e al sistema d\u00f3nde cometi\u00f3 el error, de manera que pueda ser corregido para una futura ocasi\u00f3n. Actualmente, la mayor\u00eda de los sistemas de traducci\u00f3n que se encuentran en internet proporcionan un \u00e1rea de texto para que los usuarios sugieran una mejor traducci\u00f3n (como el traductor de google) o un sistema de clasificaci\u00f3n para puntuar una traducci\u00f3n (como el sistema de microsoft).     en 2009, como parte del s\u00e9ptimo programa macro de la comisi\u00f3n europea, se da inicio al proyecto faust con el objetivo de \u00abdesarrollar sistemas de traducci\u00f3n autom\u00e1tica que respondan con rapidez y de forma inteligente a la retroalimentaci\u00f3n de los usuarios\u00bb. En concreto, uno de los objetivos del proyecto era \u00abdesarrollar mecanismos para incorporar de forma instant\u00e1nea respuesta de los usuarios en los motores de ta que se utilizan en entornos de producci\u00f3n, &#8230;\u00bb. Como miembro del proyecto faust, esta tesis se centra en el desarrollo de un mecanismo de este tipo.      formalmente, el objetivo general de este trabajo fue dise\u00f1ar e implementar una estrategia para mejorar la calidad de la traducci\u00f3n de un sistema de traducci\u00f3n estad\u00edstica previamente entrenado, con traducciones humanas que sean correcciones de traducciones autom\u00e1ticas del sistema.     para hacer frente a este problema lo dividimos en tres objetivos espec\u00edficos:     1. Definir una relaci\u00f3n entre las palabras de una frase corregida y las palabras de la traducci\u00f3n del sistema, con el fin de detectar los errores que el sistema haya cometido.     2. Incluir las correcciones de dichos errores en el sistema original, de manera que aprenda a solucionarlos en caso de que se produzca una situaci\u00f3n similar.     3. Probar la estrategia en diferentes escenarios y con diferentes datos, con el fin de validar las aplicaciones de la metodolog\u00eda propuesta.          las principales aportaciones realizadas en el campo de traducci\u00f3n autom\u00e1tica estad\u00edstica que pueden encontrarse en esta tesis doctoral son:      &#8211; definimos una funci\u00f3n de similitud que compara la salida de un sistema de ta con una referencia de traducci\u00f3n para esa salida y al\u00ednea los errores cometidos con las traducciones correctas encontradas en la referencia. Esta informaci\u00f3n se utiliza para calcular un alineamiento entre la frase original y la referencia.      &#8211; definimos un m\u00e9todo para llevar a cabo la adaptaci\u00f3n de dominio basado en la alineaci\u00f3n antes mencionada. Utilizando este alineado con un corpus paralelo perteneciente al dominio a adaptar, extraemos unidades de traducci\u00f3n que corresponden tanto a unidades existentes que fueron utilizadas correctamente por el traductor, como a unidades nuevas que corrigen los errores de traducci\u00f3n detectados durante el alineado.       &#8211; aplicamos con \u00e9xito el m\u00e9todo en un escenario real: mejorar la calidad de traducci\u00f3n de un sistema de traducci\u00f3n autom\u00e1tica estad\u00edstica, usando post ediciones facilitadas por usuarios reales de dicho sistema.       &#8211; el m\u00e9todo propuesto en esta tesis es capaz de lograr mejoras significativas en la calidad de la traducci\u00f3n con un material de aprendizaje peque\u00f1o, correspondiente al 0,5%\u00c2\u00a0del material utilizado para el entrenamiento del sistema original. Los resultados de nuestras evaluaciones tambi\u00e9n indican que la mejora conseguida con la estrategia de adaptaci\u00f3n de dominio es observable tanto en m\u00e9tricas de evaluaci\u00f3n autom\u00e1tica como en m\u00e9tricas de evaluaci\u00f3n manual.<\/p>\n<p>&nbsp;<\/p>\n<h3>Datos acad\u00e9micos de la tesis doctoral \u00ab<strong>Improving statistical machine translation through adaptation and learning<\/strong>\u00ab<\/h3>\n<ul>\n<li><strong>T\u00edtulo de la tesis:<\/strong>\u00a0 Improving statistical machine translation through adaptation and learning <\/li>\n<li><strong>Autor:<\/strong>\u00a0 Carlos Alberto Henr\u00edquez Quintana <\/li>\n<li><strong>Universidad:<\/strong>\u00a0 Polit\u00e9cnica de catalunya<\/li>\n<li><strong>Fecha de lectura de la tesis:<\/strong>\u00a0 07\/03\/2014<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<h3>Direcci\u00f3n y tribunal<\/h3>\n<ul>\n<li><strong>Director de la tesis<\/strong>\n<ul>\n<li>Jos\u00e9 Bernardo Mari\u00f1o Acebal<\/li>\n<\/ul>\n<\/li>\n<li><strong>Tribunal<\/strong>\n<ul>\n<li>Presidente del tribunal: enric Monte moreno <\/li>\n<li>adria de Gispert ramis (vocal)<\/li>\n<li>  (vocal)<\/li>\n<li>  (vocal)<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Tesis doctoral de Carlos Alberto Henr\u00edquez Quintana Con la aparici\u00f3n de los sistemas gratuitos de traducci\u00f3n autom\u00e1tica (ta) en internet [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"footnotes":""},"categories":[25948,2302,15596,409,656],"tags":[228250,228249,4153,17031],"class_list":["post-115358","post","type-post","status-publish","format-standard","hentry","category-interpolacion-aproximacion-y-ajuste-de-curvas","category-linguistica-computacional","category-politecnica-de-catalunya","category-sintaxis-y-analisis-sintactico","category-traduccion-automatica","tag-adria-de-gispert-ramis","tag-carlos-alberto-henriquez-quintana","tag-enric-monte-moreno","tag-jose-bernardo-marino-acebal"],"_links":{"self":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/115358","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/comments?post=115358"}],"version-history":[{"count":0,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/115358\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/media?parent=115358"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/categories?post=115358"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/tags?post=115358"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}