Loading...
edu-logo

2023-1-BG01-KA220-HED-000155777 – DigiOmica

Modulo 7 – Transcritos génicos microbianos en muestras ambientales

1. INTRODUCCIÓN

La transcriptómica se ocupa de los transcritos de ARN, es decir, las partes del genoma que se transcriben en una célula, tejido u organismo concreto en determinadas condiciones. La transcriptómica es el estudio que revela los patrones de expresión génica y su regulación, aportando así conocimientos sobre los mecanismos moleculares de los procesos celulares.

La transcriptómica ambiental recupera transcriptomas (ARNm) de conjuntos microbianos del medio ambiente, tratando de comprender mejor sus interacciones y la interacción de estas comunidades con el medio circundante. Vincula el potencial genético microbiano con su actividad biogeoquímica. La transcriptómica ambiental va más allá y prospecta la investigación centrada en rasgos o funciones de interés aportados por consorcios microbianos, pero también por especies individuales.

La transcriptómica ambiental lo está consiguiendo al carecer de información sobre los tipos de genes que se expresan a nivel comunitario. Este enfoque permite seguir la dinámica de la comunidad microbiana sin cultivar a sus miembros; sólo requiere la extracción del ARN, su secuenciación, el ensamblaje del transcriptoma y la anotación funcional. Sin embargo, la visión de utilizar este enfoque para diversas aplicaciones en ciencias medioambientales a nivel molecular se ve obstaculizada por las dificultades técnicas de trabajar con ARNm. Como es bien sabido, los transcritos procariotas carecen de un mecanismo de poliadenilación y el aislamiento del ARN no es tan sencillo como en el caso de los eucariotas. Los ARNm tienen una vida media muy corta (unos 30 segundos) y su abundancia relativa dentro del conjunto total de ARN en la célula microbiana es muy baja, lo que da lugar a señales de detección pobres.

Se han desarrollado protocolos para superar estas dificultades y facilitar el análisis de transcriptomas ambientales parciales. Entre ellos, cabe citar la extracción directa de ARN de una muestra ambiental (metatranscriptómica), la extracción de ARN de una muestra ambiental preservando las relaciones espaciales entre las lecturas de ARN (transcriptómica espacial), la extracción de ARN de una muestra ambiental preservando las relaciones subpoblacionales (transcriptómica ordenada). También hay estudios prometedores que exploran la recuperación de secuencias específicas de la comunidad de genes funcionales esenciales para los estudios ecológicos cuantitativos, la generación de nuevas hipótesis para procesos microbianos conocidos o la evaluación (con ayuda de la genómica ambiental) del potencial genético y los patrones de actividad de los conjuntos microbianos naturales.

2. HALLAZGOS

2.1. Protocolo de análisis de transcriptomas ambientales parciales

El protocolo principal para el análisis de transcriptomas ambientales parciales comprende los siguientes pasos principales (Fig. 7.1):

  • Extracción de ARN total de una muestra ambiental;
  • Enriquecimiento en ARNm para la reducción de los transcritos de ARNr;
  • Síntesis de la población molde de ADNc mediante transcripción inversa cebada al azar;
  • Amplificación de las plantillas por PCR para generar bibliotecas de clones de ADNc;
  • Secuenciación de los clones de ADNc;
  • Anotación de los transcritos: ensamblaje de las construcciones mediante mapeo frente a genomas de referencia o ensamblaje de novo;
  • Asignación de especies utilizando las construcciones de transcritos y realización de la representación taxonómica;
  • (opcional) Traducción y análisis funcional para revelar la presencia y las funciones de las proteínas resultantes.

Dado que la naturaleza de las muestras medioambientales es muy compleja, es necesario elegir cuidadosamente los parámetros de recogida y posterior tratamiento de las muestras. Deben tenerse en cuenta dos consideraciones: 1) el número desconocido de especies en la muestra y 2) la proporción relativa desconocida de especies individuales (y potencialmente novedosas). Por lo tanto, las precauciones esenciales que hay que tener en cuenta incluyen

  • Elección del tamaño de la muestra;
  • Elección del método de procesamiento
  • Optimización de la técnica de extracción del ARN en cuanto a técnicas de lisis, tampones de lisis, almacenamiento de la muestra, tratamiento con ADNse, etc;
  • Enriquecimiento del ARN, ya sea por disminución del contenido de ARNr (por ejemplo, mediante hibridación sustractiva) o por aislamiento del ARNm.
  • Elección del método de secuenciación adecuado en función de la longitud de las lecturas y de la molécula diana (ADNc o ARN): ADNc de lectura corta, ADNc de lectura larga y ARN directo de lectura larga;
  • Ensamblaje del transcriptoma (de novo): elija las bases de datos de referencia disponibles;
  • Practicar el binning (agrupar los transcritos ensamblados y anotados en conjuntos que representen (aunque sea aproximadamente) una especie (taxón) de origen. Realice búsquedas de similitud de secuencias para identificar homólogos entre secuencias bien estudiadas y realice anotaciones funcionales de las proteínas generadas para permitir su agrupación.

Figura 7.1. Flujo de trabajo del análisis de transcriptomas ambientales parciales (Source: Mante et al., 2024).


Aprende: Cómo extraer eficazmente el ARN (vídeo) y cuáles son los problemas del ARN (vídeo)

Aprende: Cómo hacer bibliotecas de ADNc (vídeo)

Aprende: Secuenciación de ADNc de lectura corta ALLUMINA (video)


3. ALTERNATIVAS (DEBATE)

3.1. Enfoques para superar las dificultades de la heterogeneidad transcripcional

Los consorcios microbianos de los hábitats ambientales constituyen un sistema complejo y dinámico y, como tal, entrañan todas las dificultades para la generación e interpretación de sus datos transcriptómicos. Las bacterias responden a los cambios ambientales a través de sus programas transcripcionales específicos que dan lugar a una heterogeneidad transcripcional. En realidad, esta heterogeneidad es mucho más compleja, ya que incluso en poblaciones genéticamente idénticas, los perfiles transcripcionales de los individuos pueden ser únicos. Es el caso, por ejemplo, de las bacterias individuales que resisten el tratamiento con antibióticos o de las células metabólicamente especializadas que pueden surgir en condiciones de inanición de sustrato. La heterogeneidad transcripcional heredada de las muestras ambientales hace que la elaboración de perfiles de estados transcripcionales en comunidades microbianas sea una tarea laboriosa. Un enfoque racional para superar este obstáculo es el desarrollo de metodologías de secuenciación que permitan la caracterización simultánea de miles de células en un sistema complejo.

En la actualidad, se dispone de varias metodologías de alto rendimiento, todas ellas basadas en la secuenciación del ARN unicelular. La mayoría de ellas incluyen el código de barras del ARNm celular en una fase tan temprana del proceso de secuenciación como la etapa de transcripción inversa y la ayuda de perlas de captura de ARNm. Estas técnicas apoyan la capacidad de resolución unicelular del proceso de secuenciación.

MATQ-seq

MATQ-seq aísla células individuales en pocillos separados de placas de múltiples pocillos y realiza reacciones de indexación individuales para generar bibliotecas de secuenciación. Este esquema de «indexación» es un método cuantitativo altamente sensible para la secuenciación del ARN total. Supera la baja sensibilidad inherente y el alto «ruido» técnico de la mayoría de los ensayos de secuenciación de ARN unicelular, ya que permite capturar las pequeñas variaciones genéticas entre los transcriptomas completos de células individuales. El procedimiento MATQ-seq se representa en la Fig. 7.2.

Figura 7.2. El proceso MATQ-seq (Source: Sheng and Zong, 2019).

par-SeqFISH

La hibridación in situ fluorescente secuencial paralela (par-SeqFISH) es un enfoque de obtención de imágenes del transcriptoma que revela la expresión génica en un contexto espacial con una alta resolución. El protocolo se probó con el patógeno oportunista Pseudomonas aeruginosa en un cultivo planctónico y de biopelícula en diversas condiciones e identificó transcritos que corresponden a diversos estados metabólicos y relacionados con la virulencia del cultivo planctónico. Las técnicas también demostraron la coexistencia de diferentes estados fisiológicos en el cultivo en biopelícula dependiendo de la posición espacial de la célula diana (Fig. 7.3). Estos resultados enfatizan la compleja dinámica de las poblaciones microbianas y la importancia de su estudio con alta precisión.

Figura 7.3. Principio del método par-SeqFISH (Source: Dar et al., 2021).

PETRI-seq

PETRI-seq es una técnica que permite elaborar perfiles de expresión procariótica mediante el marcado de ARN in situ seguido de secuenciación. Se trata de un protocolo rentable y de alto rendimiento que explota la indexación combinatoria para el código de barras simultáneo de decenas de miles de células bacterianas individuales. Es apto tanto para representantes Gram-negativos como Gram-positivos y muestra altos valores discriminativos para varios estados metabólicos bacterianos/fases de crecimiento. La técnica es adecuada para evaluar la dinámica celular en comunidades microbianas complejas.

3.2. Aplicaciones prometedoras de los transcritos de genes microbianos en muestras ambientales

Los estudios ecológicos cuantitativos utilizan herramientas matemáticas y estadísticas avanzadas para afrontar los problemas ambientales. La transcriptómica ambiental puede contribuir en este sentido gracias a su capacidad para recuperar secuencias de genes funcionales específicos de una comunidad. El descubrimiento de genes funcionales en entornos naturales exige el diseño de cebadores a partir de la información disponible en las bases de datos. Sin embargo, este enfoque sólo funciona para microorganismos cultivados. La transcriptómica ambiental, es decir, las bibliotecas de transcritos, pueden ayudar a resolver este problema porque proporcionan secuencias de genes funcionales específicas de un lugar a partir de células activas sin conocimiento previo de la información de su secuencia. Además, la transcriptómica ambiental proporciona secuencias génicas de varios genes expresados activamente en determinadas condiciones. Entre ellos, se pueden encontrar secuencias de genes de interés biogeoquímico y explotarlas para objetivos biotecnológicos específicos.

La proteómica ambiental posee también potencial para generar hipótesis innovadoras sobre los procesos microbianos. Es posible estudiar la expresión génica microbiana de distintos tipos de comunidades mediante el protocolo de transcriptómica ambiental sin necesidad de especificar determinados organismos, grupos filogénicos concretos o patrones metabólicos. Las potentes herramientas de anotación automática pueden acoplar este enfoque de investigación multifocal con el potencial genético y los patrones de actividad de la evaluación de consorcios microbianos naturales.

Otra aplicación prometedora de las transcripciones de genes microbianos ambientales es la creación de bases de datos de referencia específicas de cada ecosistema. Ya se han creado pequeñas bases de datos que incluyen las secuencias de un determinado ecosistema: la base de datos MiDAS 2.0 para la microflora de una EDAR y la base de datos de referencia para el intestino de los dictiópteros, DictDb. Algunos ejemplos de bases de datos específicas de ecosistemas son:

  • Base de datos taxonómica 16S del tracto intestinal humano (HITdb);
  • Base de datos del microbioma bucal humano (HOMD)
  • La base de datos específica de agua dulce (FreshTrain)
  • Base de datos sobre la microbiota intestinal de las abejas melíferas
  • Base de datos de metanógenosruminales e intestinales

Aunque estas bases de datos de referencia contribuyen a clasificar los amplicones de forma rápida y adecuada, por regla general contienen un número limitado de secuencias. Este obstáculo se supera con el desarrollo de un algoritmo específico capaz de clasificar amplicones utilizando simultáneamente dos bases de datos de referencia. La primera es una base de datos universal y la segunda es una base de datos de un pequeño ecosistema. El algoritmo, denominado TaxAss, es gratuito y de código abierto. Según él, el protocolo comienza con la amplificación y el mapeo contra la base de datos específica del ecosistema para determinar una retención de basura para las secuencias con un porcentaje definido de identidad, y después de eso, las que superan la retención de basura se clasifican hacia la base de datos universal. Aplicando este algoritmo se consigue un alto índice de clasificación. Sin embargo, las secuencias estrechamente relacionadas pueden caer a ambos lados del umbral y, por tanto, asignárseles taxonomías muy diferentes.

Las bases de datos de referencia actuales abarcan millones de secuencias de referencia de alta calidad. Estas bases de datos se caracterizan por una elevada identidad y una amplia cobertura de la diversidad real en un hábitat. Una tarea pendiente es la mejora de las asignaciones taxonómicas para los taxones no cultivados. Existe una herramienta informática, AutoTax, que permite crear taxonomías específicas para cada ecosistema que cubren el conjunto completo de los siete rangos taxonómicos. Este software proporciona nombres para los taxones sin clasificar utilizando la agrupación de novo de secuencias para definir las basuras de cada rango taxonómico. La agrupación de novo está simplificada, por lo que los nombres de los marcadores de posición se mantienen, incluso en los casos de ampliación de la base de datos con secuencias de referencia adicionales.


Explorar las bases de datos TaxAss y AutoTax


4. SOLUCIONES

4.1. Transcriptómica unicelular con código de barras combinatorio

Uno de estos métodos es el Seq-Well, diseñado para ofrecer rentabilidad, portabilidad de rendimiento y buena escalabilidad, todo ello atribuido a los métodos que exploran la captura celular y el código de barras basados en gotitas. En este método, las células se cargan en los pocillos de una matriz de dimensiones «pico», por gravitación, y sus correspondientes transcripciones se codifican con un código de barras único. A continuación, la matriz de picopocillos se sella con una membrana semipermeable que permite un fácil intercambio de fluidos a lo largo de la lisis celular, al tiempo que limita la fuga de ARN (Fig. 7.4). Desarrollado originalmente para aplicaciones clínicas, este método puede utilizarse para el análisis del transcriptoma de cualquier comunidad unicelular compleja, como los consorcios microbianos ambientales.

 Figure 7.4. The Seq-Well technique (Source: Gierahn etal., 2017)

Recientemente, se ha desarrollado una versión mejorada del método Seq-Well, Seq-Well3, que incluye el paso de síntesis de segunda cadena [3 para síntesis de segunda cadena] tras la transcripción inversa para generar un segundo sitio de cebado de PCR. Como resultado, se recupera ADNc transcrito inversamente, pero sin la realización de la reacción de cambio de molde. De este modo, la captura de transcritos esenciales, por ejemplo, factores transcripcionales y moléculas de señalización, aumenta hasta 10 veces.


Siga el protocolo Seq-Well3 paso a paso aquí


4.2. Secuenciación de ARN unicelular independiente del poli(A)

La secuenciación de ARN unicelular independiente del poli(A) es un protocolo de secuenciación de ARN unicelular que permite revelar patrones de expresión génica independientes del crecimiento en bacterias operables para todas las clases y regiones genómicas de ARN. El protocolo se ha probado con bacterias individuales de Salmonella y Pseudomonas, y los prometedores resultados pueden servir como punto de referencia para otras especies bacterianas y/o consorcios microbianos ambientales.


Más información sobre la secuenciación de ARN unicelular independiente del poli(A) aquí


4.3. Secuenciación de ARN unicelular bacteriano basada en sondas

La secuenciación de ARN unicelular bacteriano basada en sondas (ProBac-seq) está diseñada para revelar la heterogeneidad transcripcional de poblaciones bacterianas isogénicas a nivel unicelular. El protocolo está basado en sondas y explota bibliotecas de sondas de ADN y plataformas comerciales de microfluidos para realizar la secuenciación de ARN unicelular. Permite la secuenciación de miles de transcriptomas de bacterias individuales durante un único experimento, independientemente del estado Gram de las bacterias.

Figura 7.5. Principio de la técnica ProBac-seq (Source: McNulty et al., 2024).

El método está aprobado para Escherichia coli y B. subtilis. También se ha ensayado con Clostridium perfringens para estudiar la heterogeneidad de la expresión de toxinas en varias subpoblaciones sometidas a diferentes condiciones ambientales y ha demostrado su utilidad en la detección de perturbaciones metabólicas asociadas a la patogenicidad.


Más información sobre la secuenciación de ARN unicelular bacteriano basada en sondas aquí


4.4. Indexación combinatoria in situ para la secuenciación de ARN unicelular bacteriano

La transcriptómica microbiana de ligadura de pool dividido (microSPLiT) es una técnica aplicable tanto a bacterias Gram negativas como Gram positivas y puede resolver diferentes estados transcripcionales. La técnica se aprobó con células de Bacillus subtilis cultivadas hasta diferentes estadios y reveló un conjunto de patrones metabólicos correspondientes a diversos cambios metabólicos durante la vida bacteriana (Fig. 7.6).

Figura 7.6. Principio del método de secuenciación unicelular microSPLiT. (Source; Gaisser et al., 2024)

Durante este estudio, se identificaron varios perfiles de expresión correspondientes a estados conocidos, pero poco frecuentes (competencia celular e inducción de profagos). Además, se identificaron estados de expresión génica inesperados, entre los que destaca la activación de vías metabólicas de forma heterogénea (en determinadas subpoblaciones celulares). Así pues, microSPLiT es una buena decisión para la detección de subpoblaciones fenotípicamente distintas.


Más información sobre el método de secuenciación de ARN microSPLiT aquí


5. REFERENCES

Blattman, S.B., Jiang, W., Oikonomou, P. et al. Prokaryotic single-cell RNA sequencing by in situ combinatorial indexing. Nat Microbiol 5, 1192–1201 (2020). https://doi.org/10.1038/s41564-020-0729-6

Dar, D., Dar N., Cai L., and Newman D.K. Spatial transcriptomics of planktonic and sessile bacterial populations at single-cell resolution (2021) Science, 373, 6556, DOI: 10.1126/science.abi4882

Gaisser, K.D., Skloss, S.N., Brettner, L.M. et al. High-throughput single-cell transcriptomics of bacteria using combinatorial barcoding. Nat Protoc (2024). https://doi.org/10.1038/s41596-024-01007-w

Gierahn, T., Wadsworth, M., Hughes, T. et al. Seq-Well: portable, low-cost RNA sequencing of single cells at high throughput. Nat Methods 14, 395–398 (2017). https://doi.org/10.1038/nmeth.4179

Imdahl, F., Vafadarnejad, E., Homberger, C. et al. Single-cell RNA-sequencing reports growth-condition-specific global transcriptomes of individual bacteria. Nat Microbiol 5, 1202–1206 (2020). https://doi.org/10.1038/s41564-020-0774-1

McNulty, R., Sritharan, D., Pahng, S.H. et al. Probe-based bacterial single-cell RNA sequencing predicts toxin regulation. Nat Microbiol 8, 934–945 (2023). https://doi.org/10.1038/s41564-023-01348-4

Mante J. Groover, K. E., Pullen R. M. Environmental community transcriptomics: strategies and struggles. (2024) Briefings in Functional Genomics, 1–15, https://doi.org/10.1093/bfgp/elae033

Page, T. M. and Lawley J. W. (2022) Front. Mar. Sci., Sec. Marine Molecular Biology and Ecology, 9 – 2022 https://doi.org/10.3389/fmars.2022.757921

Poretsky R.S, N. Bano, A. Buchan, G. LeCleir, J. Kleikemper, M. Pickering, W.M. Pate, M.A. Moran, J.T. Hollibaugh. Analysis of microbial gene transcripts in environmental samples. Appl Environ Microbiol. 2005 71(7):4121-6. doi: 10.1128/AEM.71.7.4121-4126.2005.

Wang, B., Lin, A.E., Yuan, J. et al. Single-cell massively-parallel multiplexed microbial sequencing (M3-seq) identifies rare bacterial populations and profiles phage infection. Nat Microbiol 8, 1846–1862 (2023). https://doi.org/10.1038/s41564-023-01462-3.