{"id":109310,"date":"2018-03-11T10:34:41","date_gmt":"2018-03-11T10:34:41","guid":{"rendered":"https:\/\/www.deberes.net\/tesis\/sin-categoria\/text-summarisation-based-on-human-language-technologies-and-its-applications\/"},"modified":"2018-03-11T10:34:41","modified_gmt":"2018-03-11T10:34:41","slug":"text-summarisation-based-on-human-language-technologies-and-its-applications","status":"publish","type":"post","link":"https:\/\/www.deberes.net\/tesis\/inteligencia-artificial\/text-summarisation-based-on-human-language-technologies-and-its-applications\/","title":{"rendered":"Text summarisation based on human language technologies and its applications"},"content":{"rendered":"<h2>Tesis doctoral de <strong> Elena Lloret Pastor <\/strong><\/h2>\n<p>La informaci\u00f3n juega un papel muy importante en la sociedad actual, puesto que si se procesa y maneja correctamente, proporciona grandes ventajas a los usuarios. Sin embargo, debido al crecimiento exponencial de la misma, los usuarios son incapaces de procesar toda esta informaci\u00f3n, y por tanto, las tecnolog\u00edas del lenguaje humano (tlh) son fundamentales para manejar dicha informaci\u00f3n de manera eficiente y efectiva, siendo de gran ayuda para los usuarios. La generaci\u00f3n autom\u00e1tica de res\u00famenes es un \u00e1rea de las tlh, cuyo objetivo es procesar, sintetizar y presentar al usuario la informaci\u00f3n de manera condensada, de tal manera que evita a los usuarios tener que leer multitud de documentos y extraer lo m\u00e1s importante de cada uno.  el trabajo de investigaci\u00f3n que se ha desarrollado en esta tesis doctoral se centra en este \u00e1rea; en concreto, en la generaci\u00f3n autom\u00e1tica de res\u00famenes, demostrando que los res\u00famenes autom\u00e1ticos son beneficiosos tanto para los usuarios, como para otras aplicaciones de tlh. Despu\u00e9s de realizar un an\u00e1lisis exhaustivo del estado de la cuesti\u00f3n  tanto en enfoques para la generaci\u00f3n de res\u00famenes como para su evaluaci\u00f3n, se propone la herramienta de res\u00famenes compendium. esta herramienta sigue un enfoque cognitivo, que se basa en las teor\u00edas de (van dijk, 1980), (van dijk &#038; kintsch, 1983), que explican c\u00f3mo generan res\u00famenes los humanos, pero tambi\u00e9n aporta una componente computacional (hovy, 2005) que permite su automatizaci\u00f3n.  compendium es capaz de generar distintos tipos de res\u00famenes de texto en ingl\u00e9s. La longitud de dichos res\u00famenes se determina en funci\u00f3n de un n\u00famero fijo de palabras o una tasa de compresi\u00f3n. Adem\u00e1s, en lo que respecta a la entrada de la herramienta, se pueden generar res\u00famenes a partir de uno o de varios documentos (mono- o multi-documento, respectivamente). Como salida, los res\u00famenes siguen un paradigma extractivo (extractos) u orientado a abstractos. Finalmente, en cuanto a su finalidad, \u00e9stos pueden ser res\u00famenes gen\u00e9ricos, orientados a un t\u00f3pico, o res\u00famenes subjetivos, y en todos los casos, se pretende que puedan servir como sustituto del documento original, siendo informativos.  la arquitectura propuesta para compendium se divide en dos tipos de etapas: las que forman el n\u00facleo central de la herramienta, cuyo resultado son extractos gen\u00e9ricos y una serie de etapas adicionales, que sirven para generar tipos de res\u00famenes espec\u00edficos: res\u00famenes orientados a un t\u00f3pico, res\u00famenes subjetivos y res\u00famenes orientados a abstractos. Por un lado, las etapas que forman el n\u00facleo de compendium son: i) an\u00e1lisis ling\u00ed\u00bc\u00edstico; ii) detecci\u00f3n de redundancia; iii) identificaci\u00f3n del t\u00f3pico; iv) detecci\u00f3n de relevancia; y v) generaci\u00f3n del resumen. Por otro lado, las que etapas adicionales son: i) similitud con la pregunta; ii) detecci\u00f3n de informaci\u00f3n subjetiva; y iii) compresi\u00f3n y fusi\u00f3n de informaci\u00f3n. adem\u00e1s, algunas de las etapas anteriormente citadas se basan en m\u00e9todos y enfoques novedosos. En concreto, el uso del reconocimiento de la implicaci\u00f3n textual como m\u00e9todo para detectar y eliminar la redundancia de un documento, mientras que el principio de la cantidad de codificaci\u00f3n se propone, junto con la frecuencia de las palabras, para identificar qu\u00e9 frases contienen la informaci\u00f3n m\u00e1s relevante. Tambi\u00e9n se propone un m\u00e9todo basado en grafos de palabras que permite combinar informaci&#8217;on extractiva y abstractiva, y que produce como resultado, res\u00famenes orientados a abstractos.  compendium  se ha evaluado de manera intr\u00ednseca y extr\u00ednseca. En lo que respecta a la evaluaci\u00f3n intr\u00ednseca, se han usado distintos tipos de textos pertenecientes a diversos dominios: noticias period\u00edsticas, descripciones de im\u00e1genes, blogs y art\u00edculos cient\u00edficos del dominio m\u00e9dico. Para su evaluaci\u00f3n extr\u00ednseca, compendium  se ha integrado en: miner\u00eda de opiniones, b\u00fasqueda de respuestas y clasificaci\u00f3n de textos. El objetivo de integrar compendium en la primera de estas aplicaciones es mejorar la generaci\u00f3n de res\u00famenes subjetivos con respecto a los enfoques que no tienen en cuenta t\u00e9cnicas de generaci\u00f3n de res\u00famenes. Para la segunda aplicaci\u00f3n, se han utilizado res\u00famenes orientados a un t\u00f3pico, en vez de los snippets que devuelven los motores de b\u00fasqueda, para que un sistema de b\u00fasqueda de respuestas encuente de manera m\u00e1s eficaz las respuestas a preguntas factuales. Finalmente, en en la tercera, compendium se ha usado para generar res\u00famenes que ayuden a predecir la puntuaci\u00f3n asociada a un rese\u00f1a, en lugar de procesar la rese\u00f1a completa.  por lo tanto, de todo ello se demuestra que los res\u00famenes autom\u00e1ticos generados con compendium son adecuados para que se usen de manera individual o para que se integren en otra aplicaciones de tlh, con la finalidad de mejorar su rendimiento.<\/p>\n<p>&nbsp;<\/p>\n<h3>Datos acad\u00e9micos de la tesis doctoral \u00ab<strong>Text summarisation based on human language technologies and its applications<\/strong>\u00ab<\/h3>\n<ul>\n<li><strong>T\u00edtulo de la tesis:<\/strong>\u00a0 Text summarisation based on human language technologies and its applications <\/li>\n<li><strong>Autor:<\/strong>\u00a0 Elena Lloret Pastor <\/li>\n<li><strong>Universidad:<\/strong>\u00a0 Alicante<\/li>\n<li><strong>Fecha de lectura de la tesis:<\/strong>\u00a0 20\/06\/2011<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<h3>Direcci\u00f3n y tribunal<\/h3>\n<ul>\n<li><strong>Director de la tesis<\/strong>\n<ul>\n<li>Manuel Palomar Sanz<\/li>\n<\/ul>\n<\/li>\n<li><strong>Tribunal<\/strong>\n<ul>\n<li>Presidente del tribunal: isidro Ramos salavert <\/li>\n<li>pablo Gerv\u00e1s g\u00f3mez-navarro (vocal)<\/li>\n<li>Rafael Mu\u00f1oz guillena (vocal)<\/li>\n<li>ruslan Mitkov (vocal)<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Tesis doctoral de Elena Lloret Pastor La informaci\u00f3n juega un papel muy importante en la sociedad actual, puesto que si [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"footnotes":""},"categories":[19166,2528],"tags":[218730,17055,37679,72663,171189,54024],"class_list":["post-109310","post","type-post","status-publish","format-standard","hentry","category-alicante","category-inteligencia-artificial","tag-elena-lloret-pastor","tag-isidro-ramos-salavert","tag-manuel-palomar-sanz","tag-pablo-gervas-gomez-navarro","tag-rafael-munoz-guillena","tag-ruslan-mitkov"],"_links":{"self":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/109310","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/comments?post=109310"}],"version-history":[{"count":0,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/109310\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/media?parent=109310"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/categories?post=109310"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/tags?post=109310"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}