{"id":98264,"date":"2018-03-11T10:19:02","date_gmt":"2018-03-11T10:19:02","guid":{"rendered":"https:\/\/www.deberes.net\/tesis\/sin-categoria\/integracion-automatica-de-datos-epidemiologicos-distribuidos-basada-en-ontologa%c2%adas\/"},"modified":"2018-03-11T10:19:02","modified_gmt":"2018-03-11T10:19:02","slug":"integracion-automatica-de-datos-epidemiologicos-distribuidos-basada-en-ontologa%c2%adas","status":"publish","type":"post","link":"https:\/\/www.deberes.net\/tesis\/inteligencia-artificial\/integracion-automatica-de-datos-epidemiologicos-distribuidos-basada-en-ontologa%c2%adas\/","title":{"rendered":"Integraci\u00f3n autom\u00e1tica de datos epidemiol\u00f3gicos distribuidos basada en ontolog\u00edas"},"content":{"rendered":"<h2>Tesis doctoral de <strong> Jos\u00e9 Manuel V\u00e1zquez Naya <\/strong><\/h2>\n<p>La epidemiolog\u00eda es la ciencia que estudia la distribuci\u00f3n y los determinantes de enfermedades en las poblaciones humanas.  algunos estudios epidemiol\u00f3gicos, especialmente el caso de enfermedades multifactoriales como el c\u00e1ncer, requieren cantidades masivas de datos para poder extraer conclusiones relevantes.   una forma de obtener un gran volumen de datos epidemiol\u00f3gicos sobre una misma tem\u00e1tica es coordinando la recogida de datos a gran escala. Esta t\u00e9cnica suele proporcionar buenos resultados, pero es muy costosa, tanto en tiempo como en recursos humanos, de modo que s\u00f3lo puede utilizarse en casos muy concretos.   otra forma de obtener cantidades grandes de datos es reutilizando distintos conjuntos de datos epidemiol\u00f3gicos sobre un mismo tema, procedentes de distintos registros o de otros estudios. Esta t\u00e9cnica se conoce como pooled-analysis (un tipo de meta-an\u00e1lisis) y est\u00e1 adquiriendo mucha importancia en los \u00faltimos a\u00f1os. Se ha demostrado que es una t\u00e9cnica muy potente, pero es tambi\u00e9n muy costosa, ya que exige un trabajo enorme de b\u00fasqueda e integraci\u00f3n de datos, para el cual no se dispone todav\u00eda de las herramientas adecuadas.  en definitiva, lo que se pretende es reunir datos de distintas fuentes, que pueden estar distribuidas geogr\u00e1ficamente, para disponer de un mayor volumen de datos, y as\u00ed poder realizar nuevos estudios. Para conseguir esto, algunos autores proponen la creaci\u00f3n de un repositorio centralizado. Sin embargo, trabajos m\u00e1s recientes demuestran que un enfoque distribuido, en el que las fuentes proporcionan acceso a sus datos, manteniendo su autonom\u00eda, es m\u00e1s adecuado para el caso de datos epidemiol\u00f3gicos. El problema se traduce entonces en integrar datos procedentes de distintas fuentes.   la integraci\u00f3n de datos de distintas fuentes no es un problema nuevo. Se trata de un problema complejo, que carece a d\u00eda de hoy de una soluci\u00f3n general. Son varios los autores que han tratado este problema, proponiendo distintos enfoques, normalmente vinculados a un problema espec\u00edfico.   la mayor parte de las aproximaciones de integraci\u00f3n de datos se basa en el desarrollo de un sistema, que implementa mecanismos de interacci\u00f3n (e.G. Traducci\u00f3n de consultas, traducci\u00f3n de datos, etc.) Con las fuentes de datos. Este enfoque obtiene buenos resultados. Sin embargo, como se ver\u00e1, no resulta adecuado al problema que aqu\u00ed se plantea, ya que, entre otras cosas, las fuentes de datos no se conocen de antemano.  en este trabajo se plantea una nueva aproximaci\u00f3n que combina ideas de las aproximaciones de integraci\u00f3n de informaci\u00f3n existentes con ideas de la web sem\u00e1ntica, para conseguir una integraci\u00f3n autom\u00e1tica de datos epidemiol\u00f3gicos distribuidos. La web sem\u00e1ntica es una extensi\u00f3n de la web existente, en la que la informaci\u00f3n se ofrece con un significado bien definido, permitiendo a computadoras y personas trabajar de forma cooperativa. Para a\u00f1adir significado bien definido a la informaci\u00f3n, se utilizan \u00abontolog\u00edas\u00bb. Una ontolog\u00eda es una descripci\u00f3n de conocimiento compartido, utilizando un lenguaje formal. As\u00ed, la aproximaci\u00f3n que se plantea en esta tesis se basa en describir sem\u00e1nticamente los datos epidemiol\u00f3gicos utilizando ontolog\u00edas, de forma que agentes software puedan comprenderlos y realizar las operaciones necesarias para integrarlos, de forma similar a como operar\u00eda un humano. Se proponen tambi\u00e9n mecanismos de b\u00fasqueda y acceso sem\u00e1ntico a las fuentes de datos. A diferencia de otras aproximaciones, la que aqu\u00ed se propone no incluye como parte del propio sistema la l\u00f3gica para realizar las transformaciones necesarias. En lugar de eso, propone el desarrollo de agentes capaces de interpretar el conocimiento existente en ontolog\u00edas compartidas (shared ontologies) y utilizar tal conocimiento para realizar las trasformaciones. Esta aproximaci\u00f3n permite incrementar o corregir la capacidad de integraci\u00f3n de forma autom\u00e1tica, al tiempo que se incrementa o corrige el conocimiento existente en las ontolog\u00edas. Adem\u00e1s, la capacidad de integraci\u00f3n puede mejorarse mediante la inclusi\u00f3n de nuevos agentes, siguiendo as\u00ed un paradigma de inteligencia colectiva. La aproximaci\u00f3n propuesta no es dependiente de ninguna tecnolog\u00eda. Adem\u00e1s, puede ser generalizada para otros campos de aplicaci\u00f3n.  para validar la aproximaci\u00f3n propuesta se han seleccionado varias fuentes de datos reales, se ha tomado su estructura y se ha simulado su adaptaci\u00f3n a la aproximaci\u00f3n propuesta. A continuaci\u00f3n se ha desarrollado un prototipo que sirve como \u00abprueba de concepto\u00bb de la aproximaci\u00f3n propuesta. El prototipo permite buscar y recuperar datos epidemiol\u00f3gicos de una tem\u00e1tica concreta a trav\u00e9s de internet. Seguidamente, detecta las variables susceptibles de ser integradas (aqu\u00e9llas que hacen referencia al mismo concepto) y permite seleccionar qu\u00e9 variables y qu\u00e9 fuentes de datos se desea integrar. Finalmente, los datos integrados se pueden exportar a un formato interpretable por herramientas de an\u00e1lisis tradicionales.   en definitiva, este trabajo constituye un nuevo enfoque de integraci\u00f3n de informaci\u00f3n, que se basa en ideas de la web sem\u00e1ntica para permitir una integraci\u00f3n basada en el significado de los datos.<\/p>\n<p>&nbsp;<\/p>\n<h3>Datos acad\u00e9micos de la tesis doctoral \u00ab<strong>Integraci\u00f3n autom\u00e1tica de datos epidemiol\u00f3gicos distribuidos basada en ontolog\u00edas<\/strong>\u00ab<\/h3>\n<ul>\n<li><strong>T\u00edtulo de la tesis:<\/strong>\u00a0 Integraci\u00f3n autom\u00e1tica de datos epidemiol\u00f3gicos distribuidos basada en ontolog\u00edas <\/li>\n<li><strong>Autor:<\/strong>\u00a0 Jos\u00e9 Manuel V\u00e1zquez Naya <\/li>\n<li><strong>Universidad:<\/strong>\u00a0 A coru\u00f1a<\/li>\n<li><strong>Fecha de lectura de la tesis:<\/strong>\u00a0 18\/12\/2009<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<h3>Direcci\u00f3n y tribunal<\/h3>\n<ul>\n<li><strong>Director de la tesis<\/strong>\n<ul>\n<li>Javier Pereira Loureiro<\/li>\n<\/ul>\n<\/li>\n<li><strong>Tribunal<\/strong>\n<ul>\n<li>Presidente del tribunal: Juan Pazos sierra <\/li>\n<li>Jorge Teijeiro vidal (vocal)<\/li>\n<li>norberto Ezquerra (vocal)<\/li>\n<li>Jos\u00e9 Luis Oliveira (vocal)<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Tesis doctoral de Jos\u00e9 Manuel V\u00e1zquez Naya La epidemiolog\u00eda es la ciencia que estudia la distribuci\u00f3n y los determinantes de [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"footnotes":""},"categories":[18576,4149,13880,2528],"tags":[85750,1813,201029,201028,4012,53650],"class_list":["post-98264","post","type-post","status-publish","format-standard","hentry","category-a-coruna","category-diseno-y-componentes-de-sistemas-de-informacion","category-informatica","category-inteligencia-artificial","tag-javier-pereira-loureiro","tag-jorge-teijeiro-vidal","tag-jose-luis-oliveira","tag-jose-manuel-vazquez-naya","tag-juan-pazos-sierra","tag-norberto-ezquerra"],"_links":{"self":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/98264","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/comments?post=98264"}],"version-history":[{"count":0,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/98264\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/media?parent=98264"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/categories?post=98264"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/tags?post=98264"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}