{"id":100132,"date":"2010-07-04T00:00:00","date_gmt":"2010-07-04T00:00:00","guid":{"rendered":"https:\/\/www.deberes.net\/tesis\/sin-categoria\/speech-and-text-translation-involving-basque-language-an-application-of-stochastic-finite-state-transducers\/"},"modified":"2010-07-04T00:00:00","modified_gmt":"2010-07-04T00:00:00","slug":"speech-and-text-translation-involving-basque-language-an-application-of-stochastic-finite-state-transducers","status":"publish","type":"post","link":"https:\/\/www.deberes.net\/tesis\/inteligencia-artificial\/speech-and-text-translation-involving-basque-language-an-application-of-stochastic-finite-state-transducers\/","title":{"rendered":"Speech and text translation involving basque language: an application of stochastic finite-state transducers"},"content":{"rendered":"<h2>Tesis doctoral de <strong> Alicia Perez Ramirez <\/strong><\/h2>\n<p>El objeto de este trabajo es la traducci\u00f3n autom\u00e1tica de texto y de voz tomando el euskera bien como lengua origen, bien como lengua destino. No nos restringimos a la traducci\u00f3n de texto, sino que consideramos tambi\u00e9n la voz. abordamos la traducci\u00f3n autom\u00e1tica dentro del marco probabil\u00edstico, que durante los \u00faltimos a\u00f1os ha despertado un gran inter\u00e9s en la comunidad cient\u00edfica principalmente debido a los algoritmos que permiten inferir autom\u00e1ticamente modelos de traducci\u00f3n a partir de muestras biling\u00ed\u00bces. En este contexto, hacemos uso del algoritmo giati (definido previamente en la literatura), que da lugar a un transductor estoc\u00e1stico de estados finitos (teef). como contribuci\u00f3n principal de este trabajo se destaca la definici\u00f3n e implementaci\u00f3n de una extensi\u00f3n del algoritmo giati que explota secuencias de palabras, o phrases, en lugar de palabras aisladas. Los modelos basados en phrases, sean de naturaleza estad\u00edstica o ling\u00ed\u00bc\u00edstica, tienen la ventaja de hacer un mejor uso del contexto dando lugar a traducciones m\u00e1s precisas. Como contrapartida, requieren de tratamientos espec\u00edficos de suavizado a fin de alcanzar un nivel de generalidad similar al de los modelos basados en palabras. En lo que a modelado de transductores se refiere, tambi\u00e9n hemos explorado el uso de t\u00e9cnicas de categorizaci\u00f3n. Se han estudiado dos aproximaciones: la primera utiliza categor\u00edas como lenguaje intermedio entre la lengua origen y la destino a fin de obtener dos traductores m\u00e1s precisos que el traductor directo; la segunda, engasta transductores espec\u00edficos en un modelo de categor\u00edas que ser\u00e1 el responsable de guiar la traducci\u00f3n. en lo que a la traducci\u00f3n de voz respecta, la aproximaci\u00f3n cl\u00e1sica implica a un sistema de reconocimiento autom\u00e1tico del habla seguido de un sistema de traducci\u00f3n de texto. Esta arquitectura desacoplada ha sido criticada debido a que el sistema de traducci\u00f3n obvia la contribuci\u00f3n de la fuente de conocimiento ac\u00fastico. A este respecto, los modelos de estados finitos ofrecen gran versatilidad. La integraci\u00f3n del modelo de traducci\u00f3n con modelos ac\u00fasticos da lugar a una nueva red de estados finitos que aborda la traducci\u00f3n en un s\u00f3lo paso explotando conjuntamente conocimiento ac\u00fastico y de traducci\u00f3n. los modelos y las arquitecturas propuestas han sido evaluados en una tarea de dominio restringido en castellano y euskera, las dos lenguas oficiales de la comunidad aut\u00f3noma vasca. El \u00e9xito de los sistemas de traducci\u00f3n depende en gran medida de la calidad de las muestras de entrenamiento, pero tambi\u00e9n de las propias lenguas involucradas, y como es sabido, el castellano y el euskera difieren notablemente tanto en la sintaxis como en la morfolog\u00eda. A pesar de que los modelos propuestos superan al modelo de referencia, la necesidad de seguir investigando en este campo es manifiesta, particularmente, en lo que a modelado de reordenamiento se refiere.<\/p>\n<p>&nbsp;<\/p>\n<h3>Datos acad\u00e9micos de la tesis doctoral \u00ab<strong>Speech and text translation involving basque language: an application of stochastic finite-state transducers<\/strong>\u00ab<\/h3>\n<ul>\n<li><strong>T\u00edtulo de la tesis:<\/strong>\u00a0 Speech and text translation involving basque language: an application of stochastic finite-state transducers <\/li>\n<li><strong>Autor:<\/strong>\u00a0 Alicia Perez Ramirez <\/li>\n<li><strong>Universidad:<\/strong>\u00a0 Pa\u00eds vasco\/euskal herriko unibertsitatea<\/li>\n<li><strong>Fecha de lectura de la tesis:<\/strong>\u00a0 07\/04\/2010<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<h3>Direcci\u00f3n y tribunal<\/h3>\n<ul>\n<li><strong>Director de la tesis<\/strong>\n<ul>\n<li>Francisco Casacuberta Nolla<\/li>\n<\/ul>\n<\/li>\n<li><strong>Tribunal<\/strong>\n<ul>\n<li>Presidente del tribunal: enrique Vidal ruiz <\/li>\n<li>phil Blunsom (vocal)<\/li>\n<li>Jos\u00e9 bernardo Mari\u00f1o acebal (vocal)<\/li>\n<li>isabel Trancoso (vocal)<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Tesis doctoral de Alicia Perez Ramirez El objeto de este trabajo es la traducci\u00f3n autom\u00e1tica de texto y de voz [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"footnotes":""},"categories":[2528,12909],"tags":[204092,17029,4152,22110,17031,204093],"class_list":["post-100132","post","type-post","status-publish","format-standard","hentry","category-inteligencia-artificial","category-pais-vasco-euskal-herriko-unibertsitatea","tag-alicia-perez-ramirez","tag-enrique-vidal-ruiz","tag-francisco-casacuberta-nolla","tag-isabel-trancoso","tag-jose-bernardo-marino-acebal","tag-phil-blunsom"],"_links":{"self":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/100132","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/comments?post=100132"}],"version-history":[{"count":0,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/100132\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/media?parent=100132"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/categories?post=100132"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/tags?post=100132"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}