{"id":109338,"date":"2018-03-11T10:34:41","date_gmt":"2018-03-11T10:34:41","guid":{"rendered":"https:\/\/www.deberes.net\/tesis\/sin-categoria\/desarrollo-de-una-metodologa%c2%ada-para-la-construccion-automatica-de-ontologa%c2%adas-en-espanol-a-partir-de-texto-libre\/"},"modified":"2018-03-11T10:34:41","modified_gmt":"2018-03-11T10:34:41","slug":"desarrollo-de-una-metodologa%c2%ada-para-la-construccion-automatica-de-ontologa%c2%adas-en-espanol-a-partir-de-texto-libre","status":"publish","type":"post","link":"https:\/\/www.deberes.net\/tesis\/inteligencia-artificial\/desarrollo-de-una-metodologa%c2%ada-para-la-construccion-automatica-de-ontologa%c2%adas-en-espanol-a-partir-de-texto-libre\/","title":{"rendered":"Desarrollo de una metodolog\u00eda para la construcci\u00f3n autom\u00e1tica de ontolog\u00edas en espa\u00f1ol a partir de texto libre."},"content":{"rendered":"<h2>Tesis doctoral de <strong> Jos\u00e9 Luis Ochoa Hernandez <\/strong><\/h2>\n<p>La creciente cantidad de informaci\u00f3n que se genera d\u00eda a d\u00eda, est\u00e1 haciendo que la informaci\u00f3n existente para consultar por las personas sea inmanejable. Con la llegada de las nuevas tecnolog\u00edas, se ha facilitado la forma de publicar informaci\u00f3n. Uno de los medios m\u00e1s difundidos para ello es internet y, dada la facilidad con la que se publica la informaci\u00f3n, es muy f\u00e1cil transgiversarla y, en muchas ocasiones, publicarla con errores o, simplemente, sin verificar o comprobar su validez. Por tal raz\u00f3n, es necesario que exista una metodolog\u00eda que adquiera informaci\u00f3n a partir de textos y esta sea almacenada en una fuente segura y fiable de representaci\u00f3n del conocimiento &quot;las ontolog\u00edas&quot;. Adicionalmente, las ontolog\u00edas son la base para trabajar con la denominada web sem\u00e1ntica, una de las caracter\u00edsticas de esta web es que posibilitar\u00e1 la interacci\u00f3n tanto entre ordenadores como entre usuarios, algo muy \u00fatil en estos tiempos.  actualmente las ontolog\u00edas, se est\u00e1n aplicando en varios dominios como la poblaci\u00f3n de ontolog\u00edas, traducci\u00f3n autom\u00e1tica, recuperaci\u00f3n de informaci\u00f3n, sistemas pregunta-respuesta, informaci\u00f3n geogr\u00e1fica y librer\u00edas digitales, entre otros. Adem\u00e1s, estas ontolog\u00edas se desarrollan mayoritariamente para el idioma ingl\u00e9s,  el principal objetivo que se propone en esta tesis doctoral es, desarrollar un nuevo m\u00e9todo para la construcci\u00f3n autom\u00e1tica de ontolog\u00edas a partir de textos escritos en lenguaje natural, que tenga en cuenta un amplio conjunto de relaciones sem\u00e1nticas entre conceptos, de forma independiente del dominio y en el idioma espa\u00f1ol, es decir, una aplicaci\u00f3n de ontology learning para el espa\u00f1ol. El sistema se divide en 3 m\u00f3dulos principales: m\u00f3dulo de b\u00fasqueda de conceptos, m\u00f3dulo de extracci\u00f3n de relaciones y m\u00f3dulo de construcci\u00f3n de la ontolog\u00eda.   el m\u00f3dulo de b\u00fasqueda de conceptos, tiene como objetivo extraer conceptos autom\u00e1ticamente de textos escritos en lenguaje natural y en espa\u00f1ol. Para ello, se ha hecho uso de m\u00e9todos h\u00edbridos, combinando t\u00e9cnicas y aproximaciones de varias disciplinas, como son la ingenier\u00eda de conocimiento, la ingenier\u00eda ling\u00ed\u00bc\u00edstica y el aprendizaje computacional. El primer paso en dicha etapa, consiste en aplicar herramientas ling\u00ed\u00bc\u00edsticas para obtener informaci\u00f3n morfol\u00f3gica del texto y el segundo, emplear el m\u00e9todo tf-idf para la extracci\u00f3n de conceptos sencillos, y el m\u00e9todo c-value \/ nc-value para la extracci\u00f3n de conceptos compuestos. Con la combinaci\u00f3n de estos m\u00e9todos se obtienen los conceptos del dominio.  el m\u00f3dulo de extracci\u00f3n de relaciones se encarga de obtener la totalidad de relaciones que contengan conocimiento expl\u00edcito contenido en las expresiones verbales existentes en la totalidad del corpus, esta etapa es indispensable para poder crear una ontolog\u00eda. Por tal raz\u00f3n, una buena metodolog\u00eda tiene que cumplir con todas las expectativas que nosotros nos planteemos. Sabemos que hay varios tipos de relaciones, por ejemplo, las taxon\u00f3micas, las parton\u00f3micas, etc. Pero en las que menos se ha investigado son las no taxon\u00f3micas. Es por ello, que el esfuerzo en este sentido se ha dirigido, sobre todo, a descubrir estas relaciones para el idioma espa\u00f1ol. Sabemos que estas relaciones est\u00e1n ligadas a los verbos, as\u00ed que el primer paso es identificarlos para, despu\u00e9s, con ayuda de algunas bases de conocimiento como adesse, obtener el significado sem\u00e1ntico que nos ayudar\u00e1 a obtener las relaciones no taxon\u00f3micas.  el m\u00f3dulo de creaci\u00f3n de la ontolog\u00eda se encarga de crear una ontolog\u00eda de forma autom\u00e1tica y sin supervisi\u00f3n a partir del conocimiento previo adquirido, identificando clases, subclases, relaciones, dominios y rangos, apoy\u00e1ndose en la librer\u00eda owl api.  adicionalmente, se ha desarrollado un m\u00f3dulo que permite el aprendizaje autom\u00e1tico de patrones ling\u00ed\u00bc\u00edsticos, que se encuadra dentro del m\u00f3dulo de b\u00fasqueda de conceptos y fue desarrollado para trabajar en dos funcionalidades distintas, una, la de generar patrones autom\u00e1ticos desde cero, y la segunda, para generar patrones de forma incremental.   la evaluaci\u00f3n de esta metodolog\u00eda, se ha realizado con las medidas de evaluaci\u00f3n est\u00e1ndar que fueron empleadas para comprobar el rendimiento de la metodolog\u00eda. Las m\u00e9tricas de evaluaci\u00f3n son: la precisi\u00f3n, el recall y la medida f. Esta evaluaci\u00f3n, se ha realizado en dos dominios distintos: el dominio financiero y el dominio oncol\u00f3gico. El corpus utilizado en el experimento financiero est\u00e1 formado uno por 82 documentos y el utilizado en el experimento oncol\u00f3gico esta formado por 20 documentos (mas extensos), ambos han sido dividido en tres partes, con el objetivo de conocer el comportamiento de la metodolog\u00eda en tres tama\u00f1os de corpus distintos.  los resultados obtenidos para ambos dominios han sido bastante prometedores, ya que se ha obtenido un valor global del 83% en el dominio oncol\u00f3gico y un valor de casi 76% en el dominio financiero, ambos de medida f. Con estos resultados, se prueba la utilidad de la metodolog\u00eda desarrollada en esta tesis doctoral.   para que cualquier investigador pueda poner en pr\u00e1ctica esta metodolog\u00eda, se ha desarrollado un sistema de f\u00e1cil utilizaci\u00f3n, este sistema permite la configuraci\u00f3n de los par\u00e1metros iniciales necesarios por el sistema y la libre elecci\u00f3n del modelo a implementar, ya sea, el modelo de conceptos sencillos, compuestos o combinados para generar ontolog\u00edas de forma autom\u00e1tica y sin supervisi\u00f3n en espa\u00f1ol.    i.S.C jos\u00e9 luis ochoa hern\u00e1ndez<\/p>\n<p>&nbsp;<\/p>\n<h3>Datos acad\u00e9micos de la tesis doctoral \u00ab<strong>Desarrollo de una metodolog\u00eda para la construcci\u00f3n autom\u00e1tica de ontolog\u00edas en espa\u00f1ol a partir de texto libre.<\/strong>\u00ab<\/h3>\n<ul>\n<li><strong>T\u00edtulo de la tesis:<\/strong>\u00a0 Desarrollo de una metodolog\u00eda para la construcci\u00f3n autom\u00e1tica de ontolog\u00edas en espa\u00f1ol a partir de texto libre. <\/li>\n<li><strong>Autor:<\/strong>\u00a0 Jos\u00e9 Luis Ochoa Hernandez <\/li>\n<li><strong>Universidad:<\/strong>\u00a0 Murcia<\/li>\n<li><strong>Fecha de lectura de la tesis:<\/strong>\u00a0 21\/06\/2011<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<h3>Direcci\u00f3n y tribunal<\/h3>\n<ul>\n<li><strong>Director de la tesis<\/strong>\n<ul>\n<li>Rodrigo Mart\u00ednez B\u00e9jar<\/li>\n<\/ul>\n<\/li>\n<li><strong>Tribunal<\/strong>\n<ul>\n<li>Presidente del tribunal: jesualdo tomas Fern\u00e1ndez breis <\/li>\n<li>Juan  Miguel Gomez berbis (vocal)<\/li>\n<li>dagoberto Castellanos nieves (vocal)<\/li>\n<li>Francisco Garcia sanchez (vocal)<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Tesis doctoral de Jos\u00e9 Luis Ochoa Hernandez La creciente cantidad de informaci\u00f3n que se genera d\u00eda a d\u00eda, est\u00e1 haciendo [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"footnotes":""},"categories":[13880,2528,8235],"tags":[137360,6397,69328,218774,206773,69329],"class_list":["post-109338","post","type-post","status-publish","format-standard","hentry","category-informatica","category-inteligencia-artificial","category-murcia","tag-dagoberto-castellanos-nieves","tag-francisco-garcia-sanchez","tag-jesualdo-tomas-fernandez-breis","tag-jose-luis-ochoa-hernandez","tag-juan-miguel-gomez-berbis","tag-rodrigo-Martinez-bejar"],"_links":{"self":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/109338","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/comments?post=109338"}],"version-history":[{"count":0,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/109338\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/media?parent=109338"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/categories?post=109338"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/tags?post=109338"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}