{"id":115931,"date":"2018-03-11T10:44:41","date_gmt":"2018-03-11T10:44:41","guid":{"rendered":"https:\/\/www.deberes.net\/tesis\/sin-categoria\/hierarchical-information-representation-and-efficient-classification-of-gene-expression-microarray-data\/"},"modified":"2018-03-11T10:44:41","modified_gmt":"2018-03-11T10:44:41","slug":"hierarchical-information-representation-and-efficient-classification-of-gene-expression-microarray-data","status":"publish","type":"post","link":"https:\/\/www.deberes.net\/tesis\/analisis-de-datos\/hierarchical-information-representation-and-efficient-classification-of-gene-expression-microarray-data\/","title":{"rendered":"Hierarchical information representation and efficient classification of gene expression microarray data"},"content":{"rendered":"<h2>Tesis doctoral de <strong> Mattia Bosio <\/strong><\/h2>\n<p>En el campo de la biolog\u00eda computacional, los microarrays son utilizados para medir la actividad de miles de genes a la vez y producir una representaci\u00f3n global de la funci\u00f3n celular. Los microarrays permiten analizar la expresi\u00f3n de muchos genes en un solo experimento, r\u00e1pidamente y eficazmente. Aunque los microarrays sean una tecnolog\u00eda de investigaci\u00f3n consolidada hoy en d\u00eda y la tendencia es en utilizar nuevas tecnolog\u00edas como next generation sequencing (ngs), aun no se ha encontrado un m\u00e9todo \u00f3ptimo para la clasificaci\u00f3n de muestras.  la clasificaci\u00f3n de muestras de microarray es una tarea complicada, debido al alto n\u00famero de variables y a la falta de estructura entre los datos. Esta caracter\u00edstica impide la aplicaci\u00f3n de t\u00e9cnicas de procesado que se basan en relaciones estructurales, como el filtrado con wavelet u otras t\u00e9cnicas de filtrado. Por otro lado, los genes no se expresen independientemente unos de otros: los genes est\u00e1n inter-relacionados seg\u00fan el proceso biol\u00f3gico que les regula.  el objetivo de esta tesis es mejorar el estado del arte en la clasificaci\u00f3n de microarrays y contribuir a entender como se pueden dise\u00f1ar y aplicar t\u00e9cnicas de procesado de se\u00f1al para analizar microarrays. El objetivo de construir un algoritmo de clasificaci\u00f3n, necesita un estudio de comprobaciones y adaptaciones de algoritmos existentes a los datos analizados. Los algoritmos desarrollados en esta tesis encaran el problema con dos bloques esenciales. El primero ataca la falta de estructura, derivando un \u00e1rbol binario usando herramientas de clustering no supervisado. El segundo elemento fundamental para obtener clasificadores precisos reduciendo el riesgo de overfitting es un elemento de selecci\u00f3n de variables.  la principal tarea en esta tesis es la clasificaci\u00f3n de datos binarios en la cual hemos obtenido mejoras relevantes al estado del arte. El primer paso es la generaci\u00f3n de una estructura, para eso se ha utilizado el algoritmo treelets disponible en la literatura. M\u00faltiples alternativas a este algoritmo original han sido propuestas y evaluadas, cambiando las m\u00e9tricas de similitud o las reglas de fusi\u00f3n durante el proceso. Adem\u00e1s, se ha estudiado la posibilidad de usar fuentes de informaci\u00f3n externas, como ontolog\u00edas de informaci\u00f3n biol\u00f3gica, para mejorar la inferencia de la estructura. Se han estudiado dos enfoques diferentes para la selecci\u00f3n de variables: el primero es una modificaci\u00f3n del algoritmo iffs y el segundo utiliza un esquema de aprendizaje con fi ensembles\u00bb. El algoritmo iffs ha sido adaptado a las caracter\u00edsticas de microarrays para obtener mejores resultados, a\u00f1adiendo elementos como la medida de fiabilidad y un sistema de    evaluaci\u00f3n para seleccionar la mejor variable en cada iteraci\u00f3n. El m\u00e9todo que utiliza \u00c2\u00bfensembles\u00bb aprovecha la abundancia de features de los microarrays para implementar una selecci\u00f3n diferente. En este campo se han estudiado diferentes algoritmos, mejorando alternativas ya existentes al escaso n\u00famero de muestras y al alto n\u00famero de variables, t\u00edpicos de los microarrays.  el problema de clasificaci\u00f3n con m\u00e1s de dos clases ha sido tambi\u00e9n tratado al estudiar un nuevo algoritmo que combina m\u00faltiples clasificadores binarios. El algoritmo propuesto aprovecha la redundancia ofrecida por m\u00faltiples clasificadores para obtener predicciones m\u00e1s fiables.   todos los algoritmos propuestos en esta tesis han sido evaluados con datos p\u00fablicos y de alta  calidad, siguiendo protocolos establecidos en la literatura para poder ofrecer una comparaci\u00f3n fiable con el estado del arte. Cuando ha sido posible, se han aplicado simulaciones monte carlo para mejorar la robustez de los resultados.<\/p>\n<p>&nbsp;<\/p>\n<h3>Datos acad\u00e9micos de la tesis doctoral \u00ab<strong>Hierarchical information representation and efficient classification of gene expression microarray data<\/strong>\u00ab<\/h3>\n<ul>\n<li><strong>T\u00edtulo de la tesis:<\/strong>\u00a0 Hierarchical information representation and efficient classification of gene expression microarray data <\/li>\n<li><strong>Autor:<\/strong>\u00a0 Mattia Bosio <\/li>\n<li><strong>Universidad:<\/strong>\u00a0 Polit\u00e9cnica de catalunya<\/li>\n<li><strong>Fecha de lectura de la tesis:<\/strong>\u00a0 27\/06\/2014<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<h3>Direcci\u00f3n y tribunal<\/h3>\n<ul>\n<li><strong>Director de la tesis<\/strong>\n<ul>\n<li>Philippe Salembier Clairon<\/li>\n<\/ul>\n<\/li>\n<li><strong>Tribunal<\/strong>\n<ul>\n<li>Presidente del tribunal: josep Vidal manzano <\/li>\n<li>charlotte Soneson (vocal)<\/li>\n<li>  (vocal)<\/li>\n<li>  (vocal)<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Tesis doctoral de Mattia Bosio En el campo de la biolog\u00eda computacional, los microarrays son utilizados para medir la actividad [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"footnotes":""},"categories":[2207,3148,13880,16191,15596],"tags":[229100,15971,229099,54668],"class_list":["post-115931","post","type-post","status-publish","format-standard","hentry","category-analisis-de-datos","category-analisis-multivariante","category-informatica","category-metodos-iterativos","category-politecnica-de-catalunya","tag-charlotte-soneson","tag-josep-vidal-manzano","tag-mattia-bosio","tag-philippe-salembier-clairon"],"_links":{"self":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/115931","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/comments?post=115931"}],"version-history":[{"count":0,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/115931\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/media?parent=115931"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/categories?post=115931"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/tags?post=115931"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}