{"id":67125,"date":"2018-03-09T22:55:30","date_gmt":"2018-03-09T22:55:30","guid":{"rendered":"https:\/\/www.deberes.net\/tesis\/sin-categoria\/index-compression-for-information-retrieval-systems\/"},"modified":"2018-03-09T22:55:30","modified_gmt":"2018-03-09T22:55:30","slug":"index-compression-for-information-retrieval-systems","status":"publish","type":"post","link":"https:\/\/www.deberes.net\/tesis\/diseno-y-componentes-de-sistemas-de-informacion\/index-compression-for-information-retrieval-systems\/","title":{"rendered":"Index compression for information retrieval systems"},"content":{"rendered":"<h2>Tesis doctoral de <strong> Roi Blanco Gonz\u00e1lez <\/strong><\/h2>\n<p>Dada la creciente cantidad de informaci\u00f3n disponible hoy en d\u00eda, existe una clara necesidad de sistemas de recuperaci\u00f3n de informaci\u00f3n (ri) que sean capaces de procesar esa informaci\u00f3n de una manera efectiva y eficiente. En este contexto, eficiente significa cantidad de tiempo y espacio requeridos para procesar datos, mientras que efectivo significa identificar de una manera precisa qu\u00e9 informaci\u00f3n es relevante para el usuario y cual no lo es. Tradicionalmente, eficiencia y efectividad se encuentran en polos opuestos &#8211; lo que es beneficioso para la eficiencia, normalmente perjudica la efectividad y viceversa &#8211; as\u00ed que un reto para los sistemas de ri es encontrar un compromiso adecuado entre el procesamiento efectivo y eficiente de los datos.   esta tesis investiga el problema de la eficiencia de los sistemas de ri. Sugiere diferentes estrategias novedosas que pueden permitir la reducci\u00f3n de los \u00edndices de los sistemas de ri, enmarcadas dentro da las t\u00e9cnicas conocidas como compresi\u00f3n de \u00edndices. El \u00edndice es la estructura de datos que almacena la informaci\u00f3n utilizada en el proceso de recuperaci\u00f3n. Se presentan dos aproximaciones diferentes para la compresi\u00f3n de los \u00edndices, referidas como reordenaci\u00f3n de documentos y pruneado est\u00e1tico del \u00edndice. Ambas aproximaciones explotan caracter\u00edsticas de colecciones de documentos para reducir el tama\u00f1o final de los \u00edndices, mediante la reasignaci\u00f3n de los identificadores de los documentos de la colecci\u00f3n o bien descartando selectivamente la informaci\u00f3n que es \u00abmenos relevante\u00bb para el proceso de recuperaci\u00f3n.  las estrategias de compresi\u00f3n propuestas en este tesis se pueden agrupar en dos categor\u00edas: (i) estrategias que extienden el estado del arte en la eficiencia de una manera novedosa y (ii) estrategias derivadas de propiedades relacionadas con los principios de la efectividad en los sistemas de ri; estas estrategias son novedosas porque son derivadas desde principios de la efectividad como contraposici\u00f3n a los de la eficiencia, e porque revelan como la eficiencia y la efectividad pueden ser combinadas de una manera efectiva para la recuperaci\u00f3n de informaci\u00f3n.   las contribuciones de esta tesis abarcan la elaboraci\u00f3n de t\u00e9cnicas del estado del arte en compresi\u00f3n de \u00edndices y tambi\u00e9n en la derivaci\u00f3n de t\u00e9cnicas de compresi\u00f3n basadas en fundamentos te\u00f3ricos derivados de los principios de la efectividad de los sistemas de ri. Todas estas t\u00e9cnicas han sido evaluadas extensamente con numerosos experimentos que involucran conjuntos de datos y t\u00e9cnicas de referencia bien establecidas en el campo, las cuales permiten una comparaci\u00f3n directa con el estado del arte. Finalmente, la optimalidad de las aproximaciones presentadas es tratada desde una perspectiva te\u00f3rica.<\/p>\n<p>&nbsp;<\/p>\n<h3>Datos acad\u00e9micos de la tesis doctoral \u00ab<strong>Index compression for information retrieval systems<\/strong>\u00ab<\/h3>\n<ul>\n<li><strong>T\u00edtulo de la tesis:<\/strong>\u00a0 Index compression for information retrieval systems <\/li>\n<li><strong>Autor:<\/strong>\u00a0 Roi Blanco Gonz\u00e1lez <\/li>\n<li><strong>Universidad:<\/strong>\u00a0 A coru\u00f1a<\/li>\n<li><strong>Fecha de lectura de la tesis:<\/strong>\u00a0 26\/09\/2008<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<h3>Direcci\u00f3n y tribunal<\/h3>\n<ul>\n<li><strong>Director de la tesis<\/strong>\n<ul>\n<li>Alvaro Barreiro Garc\u00eda<\/li>\n<\/ul>\n<\/li>\n<li><strong>Tribunal<\/strong>\n<ul>\n<li>Presidente del tribunal: amparo Alonso betanzos <\/li>\n<li>fabio Crestani (vocal)<\/li>\n<li>ricardo Baeza yates (vocal)<\/li>\n<li>fabrizio Silvestri (vocal)<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Tesis doctoral de Roi Blanco Gonz\u00e1lez Dada la creciente cantidad de informaci\u00f3n disponible hoy en d\u00eda, existe una clara necesidad [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"footnotes":""},"categories":[18576,4149,13880],"tags":[17146,56498,42336,147742,16549,147741],"class_list":["post-67125","post","type-post","status-publish","format-standard","hentry","category-a-coruna","category-diseno-y-componentes-de-sistemas-de-informacion","category-informatica","tag-alvaro-barreiro-garcia","tag-amparo-alonso-betanzos","tag-fabio-crestani","tag-fabrizio-silvestri","tag-ricardo-baeza-yates","tag-roi-blanco-gonzalez"],"_links":{"self":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/67125","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/comments?post=67125"}],"version-history":[{"count":0,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/67125\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/media?parent=67125"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/categories?post=67125"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/tags?post=67125"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}