Genome evolution and systems biology in bacterial endosymbionts of insects

Tesis doctoral de Eugeni Belda Cuesta

Introduccion la comparación de genomas bacterianos ha revelado diferencias importantes en tamaño, estructura, y contenido génico a todos los niveles de la escala evolutiva, poniendo de manifiesto la importancia de fenómenos como la transferencia genética horizontal en la generación de nuevas variantes genómicas asi como el papel decisivo de diferentes elementos genéticos móviles como secuencias de inserción, transposones, bacteriófagos y diferentes islas genómicas en la estabilidad de los genomas bacterianos tanto a nivel de la inactivación de genes endógenos consecuencia de su translocacion e inserción en diferentes puntos del genoma como a nivel de su papel como secuencias repetidas que pueden mediar sucesos recombinacionales que alteran el orden y contenido génico de los genomas (bordenstein et al. 2005;lawrence et al. 2003). La genómica comparada ha sido clave para el estudio del proceso de evolución reductiva que sufren los genomas de bacterias endosimbiontes intracelulares. Estos organismos han evolucionado desde bacterias de vida libre ancestrales que en un determinado momento establecieron la asociación simbiótica con su correspondiente huésped iniciando un proceso de reducción genómica debido a una una inactivacion de genes masiva consecuencia de la disminución de la presión selectiva sobre una gran parte del genoma ancestral y de los efectos de la deriva genética por los sucesivos cuellos de botella que sufren las poblaciones de estas bacterias endosimbiontes a lo largo de su transmisión estrictamente vertical desde las madres a sus descendientes. Esto hace que se acumule una gran cantidad de dna no codificante que es eliminado por sucesivos procesos de deleción (moran et al. 2008;moya et al. 2008). el objetivo de este proyecto de tesis doctoral ha sido estudiar la evolución del orden génico en genomas de gamma proteobacterias, que es la subdivision taxonómica con el mayor número de genomas endosimbiontes completamente secuenciados, para ver cuales son las dinámicas evolutivas a nivel de reordenaciones genómicas que han afectado a estos genomas a lo largo de su evolución, analizar el fenómeno de reducción genómica en las primeras etapas de la asociación endosimbionte para lo cual nos hemos centrado en el genoma del endosimbionte secundario de la mosca tsetse sodalis glossinidius que con un genoma de 4.17 megabases se encuentra mas próximo a bacterias entéricas de vida libre que a los endosimbiontes intracelulares, y utilizar una aproximación sistémica al proceso de reducción genómica sobre este mismo organismo para evaluar las consecuencias de la reducción genómica sobre la funcionalidad de la red metabolica de s glossinidius a diferentes etapas de la evolución reductiva. metodología para el estudio de la evolución del orden génico en gamma proteobacterias utilizamos 31 genomas completamente secuenciados incluyendo 6 genomas de endosimbiontes bacterianos de insectos (3 genomas de buchnera aphidicola y los genomas de wigglesworthia glossinidia, blochmannia floridanus y s. Glossinidius). A partir del contenido génico de estos 31 genomas identificamos un total de 244 genes ortólogos presentes en los 31 genomas con los cuales inferimos dos tipos de distancias basadas en orden génico: ¿ inversion distance: minimo número de inversiones necesarias para pasar de un orden génico a otro. Estas distancias son estimadas a través del servidor web grimm (tesler 2002) ¿ breackpoint distance: número de adyacencias génicas presentes en un genoma pero ausentes en otro. Estas distancias son estimadas a partir de la tabla de 244 genes ortólogos. utilizamos las distancias de orden génico para reconstruir la filogenia de las 31 especies en estudio utilizando métodos de reconstrucción filogenética basados en distancias (neighbor joining an fitch-margoliash) y realizando un test jacknife de remuestreo para evauar la fiabilidad de la reconstrucción filogenética. para comparar las distancias estimadas en base al orden génico con distancias inferidas a partir de datos de secuencia utilizamos las distancias de sustitución aminoacídicas inferidas a partir del alineamiento concatenado de las proteínas codificadas por 10 genes altamente conservados en los 31 genomas en estudio. Utilizamos este alineamiento para reconstruir la filogenia de las 31 especies por máxima verosimilitud utilizando el programa treepuzzle (schmidt et al. 2002). calculamos la tasa de inversiones relativa en determinados linajes de la filogenia de inversiones mediante una aproximacion basada en el test de tasas relativas de tajima. para el estudio de las etapas iniciales de la reducción genómica llevamos a cabo una reanotacion exhaustiva del genoma de s. Glossinidius str morsitans que fue secuenciado en 2006 por toh y colaboradores (toh et al. 2006). Este genoma habita en el interior de la mosca tsetse tanto intracelularmente como extracelularmente en diferentes tejidos, y representa un estadio inicial en el proceso de adaptación a la vida dependiente de huésped. Este trabajo se lleva a cabo conjuntamente con la unidad de secuenciación de patógenos (psu) del instituto sanger en cambridge, motivo de mi estancia de 3 meses desde el 15 de septiembre al 15 de diciembre de 2007, y consiste en 4 objetivos principales: ¿ caracterizacion a nivel nucleotídico y aminoacídico del conjunto de pseudogenes presentes en el genoma de s. Glossinidius utilizando herramientas bioinformáticas de búsqueda por similitud y predicción de pautas abiertas de lectura como blastx y genewise respectivamente. ¿ anotación functional del conjunto de genes y pseudogenes integrando información de diferentes bases de datos especializadas en predicción de dominios proteicos y localización funcional (pfam, interpro, signalp, tmhmm, psort) conjuntamente con los resultados de búsquedas por similitud con genomas próximos anotados de manera similar por la psu. ¿ caracterizacion de las diferentes familias de secuencias de inserción, análisis de sus niveles de divergencia, y evaluación de su impacto en el proceso de pseudogenizacion. ¿ análisis metabólico del genoma completo de s. Glossinidius (genes + pseudogenes) y de wigglesworthia glossinidia, el endosimbionte primario de la mosca tsetse, con el objetivo de determinar el impacto de la pseudogenizacion sobre las capacidades funcionales de s. Glossinidius y analizar posibles sucesos de complementación o reemplazamiento entre ambas bacterias endosimbiontes. para el análisis sistémico del proceso de reducción genómica reconstruimos la red metabólica ancestral (genes + pseudogenes) y la red funcional (genes) de s. Glossinidius partiendo de la red metabólica jr904 de escherichia coli (reed et al. 2003) y utlizando la reanotacion realizada en el trabajo anterior. Los objetivos de este trabajo son: ¿ analizar la transición desde la red metabólica ancestral hasta la red metabolica funcional. Para ello llevamos a cabo un análisis de balance de flujos (fba) sobre ambas redes para evaluar su funcionalidad en diferentes condiciones ambientales en términos de optimización de la producción de biomasa. ¿ identificacion de sucesos de delecion génica que han afectado a la red metabólica funcional de s. Glossinidius; para ello detectamos sucesos de delecion en el genoma de s. Glossinidius a partir de comparaciones con el genoma de e. Coli k12 mediante tblastx y determinamos que dichas hipotéticas deleciones se han producido en el linaje que conduce a s. Glossinidius mediante el mapeo de dichos genes delecionados en genomas próximos utilizando el programa orthomcl (li et al. 2003). ¿ simulacion de evolución reductiva sobre la red metabólica funcional del s. Glossinidius, para lo cual llevamos a cabo deleciones sistemáticas de todos los genes de la red restringiendo el flujo a través de las reacciones que catalizan a cero y evaluando a cada delecion la viabilidad de la red resultante en función de si el flujo a través de la red delecionada es mayor o menor que un determinado valor de corte. Llevamos a cabo 500 experimentos de delecion aleatoria para cada valor de corte, testando 3 diferentes valores de corte. El objetivo es determinar el conjunto de genes esenciales de la red y el conjunto de genes susceptibles a ser eliminados en términos del efecto de su delecion sobre la red metabólica. ¿ comparacion de los experimentos de evolución reductiva en condiciones de mínima disponibilidad de nutrientes (solo glucosa como fuente de carbono) y en condiciones ricas en nutrientes que simulan las condiciones en las que se encuentra s. Glossinidius en el interior de la mosca tsetse. ¿ análisis comparado del índice de adaptación de codones (cai) y de las tasas de sustitución sinónimas (ds) y no sinónimas (dn) promedio del conjunto de genes esenciales y no esenciales en condiciones de mínima disponibilidad de nutrientes y en condiciones ricas en nutrientes. resultados la comparación entre las distancias de orden génico inferidas a partir del número de inversiones y el número de puntos de ruptura revela una correlacion prácticamente perfecta entre ambas distancias (r=0.996), lo cual indica que las inversiones son el suceso de reordenación predominante en la evolución del orden génico entre este conjunto de genomas. Por otro lado, la comparación de las distancias de orden génico frente a la distancia de sustitución aminoacídica revela la existencia de una clara tendencia general de incremento del número de reordenaciones a medida que aumenta la distancia de sustitución aminoacídica entre genomas aunque nos encontramos con desviaciones significativas en el grupo de las pasteurellaceaes, que muestran unas distáncias de orden génico extremadamente elevadas respecto a las distancias de sustitución aminoacídica, y en el grupo de los tres genomas de b. Aphidicola comparados entre ellos, que muestran una ausencia total de reordenaciones a pesar de presentar distancias de sustitución aminoacídicas significativas. Estas diferencias entre ambos tipos de distancias evolutivas se reflejan también en los resultados de las reconstrucciones filogenéticas. El análisis de las distancias de inversión relativas confirma la aceleración en las tasas de reordenación de los genomas pertenecientes al grupo de las pasteurellaceaes así como en los genomas de endosimbiontes bacterianos respecto a los genomas de bacterias entéricas de vida libre que utilizamos como referencia. la reanotacion del genoma de s. Glossinidius ha permitido caracterizar un total de 1501 pseudogenes, significativamente superior a los 972 pseudogenes inicialmente descritos en la anotación original por toh y colaboradores lo que aumenta la densidad codificante de un 50.9% a un 75.4% del genoma. La reanotación funcional de los 2431 genes inicialmente anotados y los 1501 pseudogenes reveló la presencia masiva de genes relacionados con elementos genéticos móviles , especialmente bacteriófagos, que representan un 17.8% del total de secuencias codificantes del genoma, siendo también la categoría funcional más afectada por la pseudogenizacion con 353 pseudogenes, detectando 2 genomas fágicos completos y hasta 13 genomas fágicos parciales no descritos en la anotación original. Tambien hemos caracterizado 5 familias diferentes de secuencias de inserción, tanto completas como parciales, que representan el 2.8 % del genoma, similar a otras bacterias comensales y patógenas de reciente adaptación a un modo de vida dependiente del huésped como yersina pestis (moran et al. 2004). Por último, el análisis metabólico ha revelado la inactivación de la ruta de biosíntesis de arginina no descrita en la anotación original así como la importancia de la ruta de biosíntesis de tiamina, siendo esta la única ruta metabólica inactiva en s. Glossinidius y funcional en w. Glossinidia. Se detectaron posibles sucesos de complementación entre ambos endosimbiontes en las rutas de biosíntesis de coenzimaa y folato. por último, la reconstrucción de las redes metabólicas ancestrales y funcionales ha confirmado la reciente transición al modo de vida dependiente de huésped por parte de s. Glossinidius dada la funcionalidad de la red metabólica ancestral utilizando únicamente glucosa como fuente de carbono con un rendimiento muy similar al observado para la red metabolica de e. Coli. La inactivación de la ruta de biosíntesis de arginina hace que la red requiera el suplemento de arginina exógena para ser funcional en los mismos términos de producción de biomasa que la red de e. Coli, siendo este el probable desencadenante de la asociación dependiente de huésped. El análisis de la red funcional con diferentes fuentes de carbono confirma los resultados experimentales obtenidos por dale & maudlin (dale et al. 1999), con un mayor rendimiento de la red utilizando n-acetil-glucosamina como fuente de carbono. La comparación del conjunto de genes esenciales y no esenciales identificados por los experimentos de delecion revelan que los genes esenciales presentan un índice de adaptación de codones significativamente superior al conjunto de genes no esenciales, mientras que los genes no esenciales muestran unas tasas de sustitución sinónimas y no sinónimas significativamente superiores a los genes esenciales. Entre los genes no esenciales se encuentran la mayoría de genes de biosíntesis de cofactores debido al hecho de que los cofactores no están incluidos en la función de biomasa que optimizamos por fba. El análisis independiente de estos genes indican que están evolucionando a unas tasas de sustitución sinónimas y no sinónimas significativamente superiores al conjunto de genes esenciales. discusion el análisis de las reordenaciones genómicas ha revelado el papel primordial de las inversiones como generadoras de variación del orden génico sobre el conjunto de genes esenciales comunes a todos los genomas bajo estudio, y demuestra la utilidad de este tipo de distancias en el análisis filogenético sobretodo entre especies evolutivamente próximas. La comparación de las distancias de reordenaciones con las distancias basadas en sustituciones aminoacídicas revelan la heterogeneidad existente en las tasas de reordenaciones entre diferentes especies, con genomas como las pasteurellaceae que evolucionan a una tasa de inversiones aproximadamente el doble que las bacterias entéricas de vida libre, y otros genomas como los de b. Aphidicola que muestran una estabilidad genómica total con ninguna reordenación entre estos genomas desde su divergencia de su ancestro común. En el caso de los genomas de b. Aphidicola, asumiendo que la divergencia desde su ancestro de vida libre tuvo lugar hace 200-300 millones de años (moran et al. 1993) y que los genomas de las tres cepas han experimentado un número mínimo de reordenaciones durante los últimos 100-150 millones de años (tamas et al. 2002), su evolución a nivel de reordenaciones genómicas se puede dividir claramente en una primera fase en la que se acumularían reordenaciones a una tasa aproximadamente el doble de la inferida en base a las distancias de inversión relativas seguida de una segunda fase de estabilidad genómica con una tasa de reordenaciones próxima a cero consecuencia de la incapacidad de estos genomas de producir y fijar reordenaciones consecuencia de la pérdida de genes recombinacionales como reca (silva et al. 2003). Asimismo, la reconstrucción filogenética basada en datos de orden génico revela la ausencia de monofiletismo en el grupo de bacterias endosimbiontes en contraste con lo observado en base a datos de secuencia, aunque este monofiletismo puede ser consecuencia de un fenómeno de atracción de ramas largas consecuencia de las elevadas tasas de sustitución asociadas a estos genomas que generan elevados sesgos composicionales hacia un incremento en el contenido de adenina y timina que puede afectar a los métodos de reconstrucción filogenética (herbeck et al. 2005). en el caso de s. Glossinidius, el estudio de tasas de reordenaciones relativas muestra que está evolucionando a una tasa de reordenaciones aproximadamente el doble que las bacterias entéricas de vida libre, similar al lo inferido para las primeras etapas de la evolución reductiva de b. Aphidicola, en cocordancia con su reciente transición a un modo de vida depediente de huésped. Esta reciente transición se refleja también en el perfil funcional de su genoma, mas próximo a una bacteria de vida libre que a una bacteria endosimbionte obligada. La disminución de la presión selectiva sobre una porción importante del genoma ancestral que deja de ser necesario en el ambiente asociado a huésped explica el elevado número de pseudogenes caracterizados asi como la proliferación de elementos genéticos móviles, principalmentes bacteriófagos y secuencias de inserción a lo largo del genoma. Sin embargo, la proliferación de estos elementos genéticos móviles ha tenido un efecto mínimo en el proceso de pseudogenizacion, con solo 18 de los 1501 pseudogenes identificados producidos por la inserción de una secuencia de inserción, con la mayoría de pseudogenes producidos por mutaciones que generan cambios en la pauta de lectura o stops prematuros en concordancia con lo observado en otros endosimbiontes bacterianos de insectos (silva et al. 2001). por último, la capacidad de la biología de sistemas para conectar la información genética con el fenotipo a nivel de perfil funcional del organismo ha sido utilizada para analizar el proceso de reducción genómica desde el hipotético genoma ancestral de s. Glossinidius, explorando los límites del sistema metabólico a los procesos de deleción génica. Los resultados de los experimentos de deleción permiten identificar un conjunto de 255 genes esenciales que muestran un índice de adaptación de codones significativamente superior respecto al conjunto de 127 genes susceptibles de ser delecionados, que a su vez muestran unas tasas de sustitución sinónimas y no sinónimas significativamente elevadas respecto a los genes esenciales, de tal forma que los perfiles de esencialidad de los genes de la red se ajustan a lo esperado desde el punto de vista evolutivo. Dentro de los genes delecionables se incluyen los genes implicados en biosíntesis de cofactores, que se postula como el principal motivo de la asociación simbiótica entre la mosca tsetse y su endosimbionte primario w. Glossinidia (akman et al. 2002); estos genes, que se encuentran funcionales en s. Glossinidius, están evolucionando a unas tasas de sustitución sinónimas y no sinónimas similares al resto de genes no esenciales, significativamente mayor que el conjunto de genes esenciales, lo que se puede explicar como un indicador de un proceso de complementación metabólica con w. Glossinidia. biblioografia akman l, yamashita a, watanabe h et al. (2002) genome sequence of the endocellular obligate symbiont of tsetse flies, wigglesworthia glossinidia. Nat.Genet., 32, 402-407. becker sa, feist am, mo ml et al. (2007) quantitative prediction of cellular metabolism with constraint-based models: the cobra toolbox. Nat.Protoc., 2, 727-738. bordenstein sr, reznikoff ws (2005) mobile dna in obligate intracellular bacteria. Nat.Rev.Microbiol., 3, 688-699. dale c, maudlin i (1999) sodalis gen. Nov. And sodalis glossinidius sp. Nov., A microaerophilic secondary endosymbiont of the tsetse fly glossina morsitans morsitans. Int.J.Syst.Bacteriol., 49 pt 1, 267-275. herbeck jt, degnan ph, wernegreen jj (2005) nonhomogeneous model of sequence evolution indicates independent origins of primary endosymbionts within the enterobacteriales (gamma-proteobacteria). Mol.Biol.Evol., 22, 520-532. lawrence jg, hendrickson h (2003) lateral gene transfer: when will adolescence end? Mol.Microbiol., 50, 739-749. li l, stoeckert cj, jr., Roos ds (2003) orthomcl: identification of ortholog groups for eukaryotic genomes. Genome res., 13, 2178-2189. moran na, mccutcheon jp, nakabachi a (2008) genomics and evolution of heritable bacterial symbionts. Annu.Rev.Genet., 42, 165-190. moran na, munson ma, baumann p, ishikawa h (1993) a molecular clock in endosymbiotic bacteia is calibrated using the insect hosts. Proc.R.Soc.Lond.B, 253, 167-171. moran na, plague gr (2004) genomic changes following host restriction in bacteria. Curr.Opin.Genet.Dev., 14, 627-633. moya a, pereto j, gil r, latorre a (2008) learning how to live together: genomic insights into prokaryote-animal symbioses. Nat.Rev.Genet., 9, 218-229. reed jl, vo td, schilling ch, palsson bo (2003) an expanded genome-scale model of escherichia coli k-12 (ijr904 gsm/gpr). Genome biol., 4, r54. schmidt ha, strimmer k, vingron m, von ha (2002) tree-puzzle: maximum likelihood phylogenetic analysis using quartets and parallel computing. Bioinformatics., 18, 502-504. silva fj, latorre a, moya a (2001) genome size reduction through multiple events of gene disintegration in buchnera aps. Trends genet., 17, 615-618. silva fj, latorre a, moya a (2003) why are the genomes of endosymbiotic bacteria so stable? Trends genet., 19, 176-180. tamas i, klasson l, canback b et al. (2002) 50 million years of genomic stasis in endosymbiotic bacteria. Science, 296, 2376-2379. tesler g (2002) grimm: genome rearrangements web server. Bioinformatics., 18, 492-493. toh h, weiss bl, perkin sa et al. (2006) massive genome erosion and functional adaptations provide insights into the symbiotic lifestyle of sodalis glossinidius in the tsetse host. Genome res., 16, 149-156.

 

Datos académicos de la tesis doctoral «Genome evolution and systems biology in bacterial endosymbionts of insects«

  • Título de la tesis:  Genome evolution and systems biology in bacterial endosymbionts of insects
  • Autor:  Eugeni Belda Cuesta
  • Universidad:  Universitat de valéncia (estudi general)
  • Fecha de lectura de la tesis:  29/10/2010

 

Dirección y tribunal

  • Director de la tesis
    • Andres Moya Simarro
  • Tribunal
    • Presidente del tribunal: amparo Latorre castillo
    • abdelaziz Heddi (vocal)
    • hernán Dopazo (vocal)
    • mario ali Fares riaño (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio