{"id":109086,"date":"2018-03-11T10:34:16","date_gmt":"2018-03-11T10:34:16","guid":{"rendered":"https:\/\/www.deberes.net\/tesis\/sin-categoria\/methods-and-resources-for-sentiment-analysis-in-multilingual-documents-of-different-text-types\/"},"modified":"2018-03-11T10:34:16","modified_gmt":"2018-03-11T10:34:16","slug":"methods-and-resources-for-sentiment-analysis-in-multilingual-documents-of-different-text-types","status":"publish","type":"post","link":"https:\/\/www.deberes.net\/tesis\/linguistica-computacional\/methods-and-resources-for-sentiment-analysis-in-multilingual-documents-of-different-text-types\/","title":{"rendered":"Methods and resources for sentiment analysis in multilingual documents of different text types"},"content":{"rendered":"<h2>Tesis doctoral de <strong> Alexandra Balahur Dobrescu <\/strong><\/h2>\n<p>La presente tesis doctoral se ocupa de las cuestiones y los desaf\u00edos en el desarrollo de m\u00e9todos y recursos para la tarea del pln denominada an\u00e1lisis de sentimientos. Definido de forma general, el objetivo de esta tarea es la detecci\u00f3n autom\u00e1tica de los sentimientos expresados en textos (normalmente por una fuente, sobre un \u00abobjeto\u00bb, que puede ser una persona, un evento, un producto, una organizaci\u00f3n etc.) Y su clasificaci\u00f3n seg\u00fan la polaridad\/orientaci\u00f3n que tienen (normalmente positiva, negativa o neutra, aunque distintos autores han propuesto escalas m\u00e1s finas de sentimientos, incluyendo por ejemplo las clases muy positivo o muy negativo).  la investigaci\u00f3n en este campo, la miner\u00eda de opiniones (an\u00e1lisis de sentimientos), ha demostrado que el an\u00e1lisis de los sentimientos es un problema dif\u00edcil, que se tiene que abordar desde diferentes perspectivas y en diferentes niveles, dependiendo de una serie de factores. Estos factores incluyen: nivel de de inter\u00e9s (general o espec\u00edfico, dependiendo de si la opini\u00f3n general sobre el objeto en cuesti\u00f3n es suficiente o se necesita conocimiento detallado de los sentimientos expresados sobre distintos componentes del objeto), la f\u00f3rmula de consulta  (\u00abnokia e65&#8243;\/ \u00ab\u00c2\u00bfpor qu\u00e9 la gente compra el nokia e65?\u00bb), El tipo de texto (revisi\u00f3n en un foro\/blog\/di\u00e1logo\/art\u00edculo de peri\u00f3dico), y la forma de expresar la opini\u00f3n &#8211;  directamente  (mediante declaraciones opini\u00f3n, por ejemplo, \u00ab\u00c2\u00a1me parece que este producto es maravilloso!\u00bb O \u00ab\u00c2\u00a1esta es una iniciativa brillante!\u00bb), De forma indirecta (utilizando vocabulario relacionado con la expresi\u00f3n del afecto, por ejemplo, \u00abme encantan las fotos tomadas con esta c\u00e1mara!\u00bb O \u00abpersonalmente, \u00c2\u00a1estoy conmocionado por c\u00f3mo se puede proponer una ley as\u00ed!\u00bb)  O  impl\u00edcitamente (con adjetivos que expresan una evaluaci\u00f3n, cuyo objeto se sobrentiende, por ejemplo, \u00abes ligero como una pluma y cabe perfectamente en mi bolsillo\u00bb o presentando una situaci\u00f3n factual de la que se puede inferir, utilizando conocimiento com\u00fan, una emoci\u00f3n positiva o negativa, por ejemplo \u00abse rompi\u00f3 en dos d\u00edas.\u00bb). Otros factores que hacen la tarea de miner\u00eda de sentimientos dif\u00edcil es la aplicaci\u00f3n final y el tipo de texto que se utiliza (rese\u00f1as, que contienen solo opiniones sobre un producto, escritas por una solo fuente, en comparaci\u00f3n con blogs o debates, que tienen una estructura de dialogo, en el que se expresan opiniones sobre distintos objetos, por distintas fuentes). Finalmente, para las aplicaciones finales, el an\u00e1lisis de sentimientos no es la primera ni la \u00faltima tarea que se debe realizar. Para extraer el sentimiento de textos, primero es necesario recuperar un conjunto de documentos relevantes. El resultado del procesamiento de un texto con un sistema de an\u00e1lisis de sentimientos puede tener mucha informaci\u00f3n redundante e incluso puede no resolver totalmente el problema, debido a la gran cantidad de datos existentes.  los sistemas implementados para la tarea de an\u00e1lisis de sentimientos se basan en reglas, bolsas de palabras, utilizando un l\u00e9xico de palabras que tienen una orientaci\u00f3n del sentimiento (positivo o negativo), m\u00e9todos estad\u00edsticos o aprendizaje autom\u00e1tico.   analizando los sistemas existentes, hemos identificado los siguientes problemas: &#8211; la tarea de an\u00e1lisis de sentimientos y los conceptos relacionados no son definidos de forma \u00fanica en los diferentes trabajos de investigaci\u00f3n. Por tanto, no est\u00e1 claro siempre si los distintos investigadores que trabajan en el an\u00e1lisis de sentimientos pueden comparar el rendimiento de sus sistemas, ya que los textos sobre los que eval\u00faan pueden tener diferentes elementos anotados. &#8211; la tarea de an\u00e1lisis de sentimientos se resuelve de la misma manera, independientemente del tipo de texto que se procesa y del objetivo de la aplicaci\u00f3n final. &#8211; no existen recursos anotados para la tarea de an\u00e1lisis de sentimientos en todos los g\u00e9neros textuales. &#8211; no existen l\u00e9xicos de palabras que expresen sentimientos para otros idiomas distintos al ingl\u00e9s. &#8211; la mayor\u00eda de sistemas trabajan a nivel l\u00e9xico, utilizando reglas, l\u00e9xicos, m\u00e9todos estad\u00edsticos o aprendizaje autom\u00e1tico. La investigaci\u00f3n que se ha hecho hasta ahora no toma en cuenta otros niveles de an\u00e1lisis, como el sint\u00e1ctico o sem\u00e1ntico. Por tanto, el asegurar que la fuente de la opini\u00f3n expresada es la requerida o sobre qu\u00e9 objeto se expresa la opini\u00f3n en un texto son aspectos que no se toman en consideraci\u00f3n. Estos aspectos pueden tener un alto impacto sobre el rendimiento y la utilidad de los sistemas de an\u00e1lisis de opiniones.  &#8211; la mayor parte de la investigaci\u00f3n no distingue sobre los distintos componentes de un texto, en especial sobre el autor, el texto y el lector. La tarea de an\u00e1lisis de sentimientos puede tener diferentes objetivos, dependiendo de la perspectiva que se requiere analizar (por ejemplo, si el autor tiene preferencia sobre un cierto objeto descrito, si el texto contiene informaci\u00f3n que es buena o mala en s\u00ed, si el lector conf\u00eda en la fuente de la informaci\u00f3n).  &#8211; las tareas tradicionales (b\u00fasqueda de informaci\u00f3n, b\u00fasqueda de respuestas, res\u00famenes autom\u00e1ticos) se enfrentan con problemas adicionales en el caso de que la informaci\u00f3n buscada o resumida es de tipo opini\u00f3n, dadas por las caracter\u00edsticas del lenguaje afectivo. Por tanto, para poder adecuar los sistemas de este tipo para tratar informaci\u00f3n que contiene expresiones de afecto, las peculiaridades de este lenguaje tienen que ser estudiadas y se tienen que proponer m\u00e9todos adecuados para resolver los problemas encontrados de forma eficaz.  el objetivo de nuestro trabajo ha sido crear, explotar y evaluar m\u00e9todos y recursos tanto nuevos como consagrados para la detecci\u00f3n y posterior clasificaci\u00f3n de acuerdo a su polaridad (positiva \/ negativa\/ neutro) de los sentimientos expresados en textos.  en concreto, el primer objetivo es desarrollar t\u00e9cnicas adecuadas para la detecci\u00f3n y clasificaci\u00f3n autom\u00e1tica de los sentimientos expresados de forma directa, indirecta o impl\u00edcita en los textos de diferentes tipos (rese\u00f1as, art\u00edculos de peri\u00f3dicos, di\u00e1logos\/debates y blogs) en diferentes idiomas. El segundo objetivo es aplicar los m\u00e9todos de an\u00e1lisis de sentimientos que se proponen en el contexto o conjuntamente con otras tareas de  pln (b\u00fasqueda de respuestas y res\u00famenes autom\u00e1ticos) y proponer t\u00e9cnicas adecuadas para hacer frente a las cuestiones planteadas en estas tareas por las peculiaridades de la expresi\u00f3n del afecto.  en concreto, nos centramos en: &#8211; definir la tarea y conceptos generales relacionados, a partir del estudio de las definiciones existentes en la literatura y la clarificaci\u00f3n de las inconsistencias detectadas; &#8211; proponer y evaluar m\u00e9todos para definir y abordar el an\u00e1lisis de los sentimientos de diversos g\u00e9neros textuales en diferentes idiomas; &#8211; redefinir la tarea y proponer m\u00e9todos para anotar corpus espec\u00edficos para el an\u00e1lisis de sentimientos en para un tipo de texto en diferentes idiomas, en el caso de que la tarea de an\u00e1lisis de sentimientos no hubiera sido claramente definida para el g\u00e9nero textual en cuesti\u00f3n y\/o ning\u00fan corpus estuviera disponible para el mismo. Estos recursos est\u00e1n disponibles al p\u00fablico para el uso de la comunidad cient\u00edfica; &#8211; aplicaci\u00f3n de t\u00e9cnicas de miner\u00eda de opini\u00f3n en el contexto de los sistemas \u00abend-to-end\u00bb y tambi\u00e9n en conjunto con otras tareas del pln. Para ello, nos hemos concentrado en realizar an\u00e1lisis de emociones en las tareas de b\u00fasqueda de respuesta y resumen autom\u00e1tico; &#8211; llevar a cabo experimentos con sistemas de b\u00fasqueda de respuesta y sistemas de res\u00famenes autom\u00e1ticos, dise\u00f1ados para hacer frente a datos factuales solamente; &#8211; proponer y evaluar un nuevo marco para lo que llamamos \u00abb\u00fasqueda de respuestas a preguntas de opini\u00f3n\u00bb (en ingl\u00e9s &#8211; opinion question answering) y los nuevos m\u00e9todos para \u00abelaborar res\u00famenes de opiniones de forma autom\u00e1tica\u00bb (en ingl\u00e9s &#8211; opinion summarization), tras realizar un conjunto de experimentos que mostraron que los sistemas de b\u00fasqueda de respuestas y de resumen autom\u00e1tico sobre textos presentando hechos no  funcionaban correctamente para analizar textos que conten\u00edan opiniones; &#8211; presentaci\u00f3n de un m\u00e9todo general para la detecci\u00f3n de la emoci\u00f3n expresada de manera impl\u00edcita en texto. En primer lugar, presentamos el m\u00e9todo para construir un l\u00e9xico de t\u00e9rminos que en s\u00ed mismos no contienen la emoci\u00f3n, pero que disparan la emoci\u00f3n en un lector. Posteriormente, se propuso un m\u00e9todo para resumir textos a partir del an\u00e1lisis de los sentimientos expresados basado en claves ling\u00ed\u00bc\u00edsticas, as\u00ed como se propuso y evalu\u00f3 un m\u00e9todo para representar el texto como las cadenas de acci\u00f3n. La emoci\u00f3n provocada por la situaci\u00f3n que se presenta en el texto se juzga posteriormente en base a conocimiento de sentido com\u00fan sobre el efecto emocional de cada acci\u00f3n en la cadena; &#8211; la evaluaci\u00f3n de nuestros enfoques en las competiciones internacionales, a fin de comparar nuestros enfoques con los dem\u00e1s y validarlos.  con el fin de alcanzar los objetivos propuestos, el trabajo que se presenta ha sido estructurado en torno a responder a cinco preguntas de investigaci\u00f3n. Cada uno de los cap\u00edtulos de esta tesis presenta m\u00e9todos y evaluaciones hechas con el fin de responder a estas preguntas.<\/p>\n<p>&nbsp;<\/p>\n<h3>Datos acad\u00e9micos de la tesis doctoral \u00ab<strong>Methods and resources for sentiment analysis in multilingual documents of different text types<\/strong>\u00ab<\/h3>\n<ul>\n<li><strong>T\u00edtulo de la tesis:<\/strong>\u00a0 Methods and resources for sentiment analysis in multilingual documents of different text types <\/li>\n<li><strong>Autor:<\/strong>\u00a0 Alexandra Balahur Dobrescu <\/li>\n<li><strong>Universidad:<\/strong>\u00a0 Alicante<\/li>\n<li><strong>Fecha de lectura de la tesis:<\/strong>\u00a0 13\/06\/2011<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<h3>Direcci\u00f3n y tribunal<\/h3>\n<ul>\n<li><strong>Director de la tesis<\/strong>\n<ul>\n<li>Juan  Andres Montoyo Guijarro<\/li>\n<\/ul>\n<\/li>\n<li><strong>Tribunal<\/strong>\n<ul>\n<li>Presidente del tribunal: manuel Palomar sanz <\/li>\n<li>v\u00e9ronique Hoste (vocal)<\/li>\n<li>horacio Rodr\u00edguez hontoria (vocal)<\/li>\n<li>dan Tufis (vocal)<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Tesis doctoral de Alexandra Balahur Dobrescu La presente tesis doctoral se ocupa de las cuestiones y los desaf\u00edos en el [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"footnotes":""},"categories":[19166,2302],"tags":[218364,218366,13269,55066,37679,218365],"class_list":["post-109086","post","type-post","status-publish","format-standard","hentry","category-alicante","category-linguistica-computacional","tag-alexandra-balahur-dobrescu","tag-dan-tufis","tag-horacio-rodriguez-hontoria","tag-juan-andres-montoyo-guijarro","tag-manuel-palomar-sanz","tag-veronique-hoste"],"_links":{"self":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/109086","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/comments?post=109086"}],"version-history":[{"count":0,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/109086\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/media?parent=109086"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/categories?post=109086"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/tags?post=109086"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}