Loading...
edu-logo

2023-1-BG01-KA220-HED-000155777 – DigiOmica

Модул 7 – Микробни генни транскрипти в проби от околната среда

1. ВЪВЕДЕНИЕ

Транскриптомиката изучава РНК транскриптите – тези части от генома, които се транскрибират в определена клетка, тъкан или организъм при определени условия. Транскриптомиката е подход, който разкрива моделите на генна експресия и тяхната регулация, като по този начин внася прозрение в молекулярните механизми на клетъчните процеси.

Екологичната транскриптомика извлича транскриптоми (мРНК) на микробни съобщества от околната среда, като се опитва да разбере по-добре техните взаимодействия и взаимодействието на тези съобщества със заобикалящата ги среда. Тя свързва генетичния потенциал на микробите с тяхната биогеохимична активност. Екологичната транскриптомика отива по-далеч, като търси изследвания, насочени към признаци или функции от интерес, които носят не само микробните консорциуми, но и отделните видове.

Екологичната транскриптомика прави това, като не разполага с информация за видовете гени, експресирани на ниво съобщество. Този подход позволява да се проследи динамиката на микробната общност, без да се култивират нейните членове; необходимо е само извличане на РНК, нейното секвениране, сглобяване на транскриптома и функционално анотиране. Въпреки това визията за използване на този подход за различни приложения в науката за околната среда на молекулярно ниво е възпрепятствана от технически трудности при работата с мРНК. Както е добре известно, прокариотните транскрипти нямат механизъм за полиаденилиране и изолирането на РНК не е толкова просто, колкото при еукариотните. мРНК има много кратък период на полуразпад (около 30 сек) и относителното й количество на общия фон РНК в микробната клетка е много ниско, което води до слаби сигнали за откриване.

Разработени са протоколи за преодоляване на тези трудности и за улесняване на анализите на частични транскриптоми на околната среда. Сред тях могат да се изброят прякото извличане на РНК от проба от околната среда (метатранскриптомика), извличането на РНК от проба от околната среда, като се запазват пространствените връзки между РНК прочитите (пространствена транскриптомика), извличането на РНК от проба от околната среда, като се запазват връзките между субпопулациите (сортирана транскриптомика). Съществуват и обещаващи проучвания, които изследват извличането на специфични за съобществото последователности от функционални гени, които са от съществено значение за количествените екологични проучвания, генерирането на нови хипотези за известни микробни процеси или оценката (с помощта на геномиката на околната среда) на генетичния потенциал и моделите на активност на естествените микробни съобщества.

2. КОНСТАТАЦИИ

2.1. Протокол за анализ на частични транскриптоми на околната среда

Основният протокол за анализ на частични транскриптоми на околната среда се състои от следните основни стъпки (Фиг. 7.1):

  • Екстракция на обща РНК от проба от околната среда;
  • Обогатяване с мРНК за намаляване на транскриптите на рРНК;
  • Синтез на популация от кДНК матрици чрез случайна обратна транскрипция;
  • Амплификация на матриците чрез PCR за генериране на библиотеки от кДНК клонове;
  • Секвениране на кДНК клоновете;
  • Анотиране на транскриптите: сглобяване на конструктите, като се използва съпоставяне с референтни геноми или сглобяване de novo;
  • Определяне на видовете, като се използват конструктите на транскриптите и изготвяне на таксономично представяне;
  • (по избор) Транслация и функционални анализи за разкриване на наличието и функциите на получените протеини.

Тъй като естеството на пробите от околната среда е много сложно, е необходимо внимателно да се изберат параметрите на събирането и по-нататъшната им обработка. Трябва да се вземат предвид две съображения: 1) неизвестният брой видове в пробата и 2) неизвестният относителен дял на отделните (и потенциално нови) видове. Следователно основните предпазни мерки, които трябва да се вземат, включват

  • Избор на размера на извадката;
  • Избор на метод за обработка;
  • Оптимизиране на техниката за извличане на РНК по отношение на техниките за лизис, буферите за лизис, съхранението на пробата, обработката с ДНК и др.;
  • Обогатяване на РНК чрез понижаване на съдържанието на рРНК (например чрез субтрактивна хибридизация) или чрез изолиране на мРНК;
  • Избор на подходящ метод за секвениране въз основа на дължината на прочетените данни и целевата молекула (кДНК или РНК): кДНК с кратък прочит, кДНК с дълъг прочит и директна РНК с дълъг прочит;
  • (de novo) сглобяване на транскриптом – избор на налични референтни бази данни;
  • Практикуване на биниране (групиране на сглобените и анотирани транскрипти в набори, които представляват (макар и приблизително) даден вид (таксон) по произход). Търсене на сходство на последователностите, за да се идентифицират хомолози сред добре проучени последователности и да се направят функционални анотации на генерираните протеини, за да може да се групират.

3. АЛТЕРНАТИВИ (ОБСЪЖДАНЕ)

3.1. Преодоляване на трудностите, свързани с транскрипционната хетерогенност

Микробните консорциуми в екологичните местообитания представляват сложна и динамична система и като такава, те носят всички трудности при генерирането и интерпретирането на транскриптомните данни. Бактериите реагират на промените в околната среда чрез своите специфични транскрипционни програми, които водят до транскрипционна хетерогенност. Всъщност тази хетерогенност е много по-сложна, тъй като дори в популации, които са генетично идентични, транскрипционните профили на индивидите могат да бъдат уникални. Такъв е случаят например с онези индивидуални бактерии, които са устойчиви на лечение с антибиотици, или с онези метаболитно специализирани клетки, които могат да се появят в условията на субстратен глад. Наследената транскрипционна хетерогенност на пробите от околната среда превръща профилирането на транскрипционните състояния в микробните съобщества в трудоемка задача. Рационален подход за преодоляване на това препятствие е разработването на методики за секвениране, които позволяват едновременното характеризиране на хиляди клетки в една сложна система.

Фигура 7.1. Работен процес за анализ на частични транскриптоми на околната среда (Източник: Mante et al., 2024).


Научете: Как ефективно да извлечете РНК (video) и какви са начините за отстраняване на проблеми с РНК (video)

Научете: Как да създавате библиотеки с кДНК (video) 

Научете: ALLUMINA секвениране на къси прочити на кДНК (video)


Понастоящем са налични няколко високопроизводителни методологии, всички основани на секвениране на едноклетъчна РНК. Повечето от тях включват баркодиране на клетъчната мРНК още на етапа на обратната транскрипция и помощта на перли за улавяне на мРНК. Тези техники подпомагат възможността за разрешаване на проблемите при секвениране в една клетка.

MATQ-seq

MATQ-seq изолира единични клетки в отделни ямки на многоямкови плаки и извършва индивидуални реакции на индексиране за генериране на библиотеки за секвениране. Тази схема на „индексиране“ е високочувствителен количествен метод за секвениране на обща РНК. Той преодолява присъщата ниска чувствителност и високия технически „шум“ на повечето анализи за секвениране на РНК от единични клетки, тъй като позволява улавянето на малките генетични вариации между целите транскриптоми на единичните клетки. Процедурата MATQ-seq е представена на фиг. 7.2.

par-SeqFISH

Паралелната секвенциална флуоресцентна in situ хибридизация (par-SeqFISH) е подход за представяне на транскриптома, който разкрива генната експресия в пространствен контекст с висока разделителна способност. Протоколът е тестван с опортюнистичния патоген Pseudomonas aeruginosa в планктонна и биофилмова култура при различни условия и са идентифицирани транскрипти, които съответстват на различни състояния, свързани с метаболизма и вирулентността на планктонната култура. Техниките демонстрират също така съвместното съществуване на различни физиологични състояния в биофилмовата култура в зависимост от пространственото положение на целевата клетка (Фиг. 7.3). Тези резултати подчертават сложната динамика на микробните популации и важността на тяхното изследване с висока прецизност.

Фигура 7.2. Конвейерът MATQ-seq (Източник: Sheng and Zong, 2019).

PETRI-seq

PETRI-seq е техника, която позволява профилиране на експресията на прокариоти чрез маркиране на РНК in situ, последвано от секвениране. Това е икономически ефективен и високопроизводителен протокол, който използва комбинаторно индексиране за едновременно баркодиране на десетки хиляди отделни бактериални клетки. Той е апробиран както с Грам-отрицателни, така и с Грам-положителни представители и показва високи дискриминационни стойности за различни метаболитни състояния/фази на растеж на бактериите. Техниката е подходяща за оценка на клетъчната динамика в сложни микробни общности.

Фигура 7.3. Принцип на метода par-SeqFISH (Източник: Dar et al., 2021).

 

3.2. Обещаващи приложения на микробни генни транскрипти в проби от околната среда

Количествените екологични изследвания използват усъвършенствани математически и статистически инструменти, за да се справят с проблемите на околната среда. Екологичната транскриптомика може да допринесе в този смисъл благодарение на способността си да извлича специфични за съобществото функционални генни последователности. Откриването на функционални гени в естествена среда изисква дизайн на праймери въз основа на наличната информация в базите данни. Този подход обаче работи само за култивируеми микроорганизми. Екологичната транскриптомика, т.е. библиотеките от транскрипти, могат да помогнат за решаването на този проблем, тъй като предоставят специфични за мястото функционални генни последователности от активни клетки без предварителни познания за тяхната последователност. Освен това транскриптомиката на околната среда предоставя генни последователности за различни гени, които се експресират активно при дадени условия. Сред тях могат да бъдат открити генни последователности от биогеохимичен интерес, които да бъдат допълнително използвани за целеви биотехнологични цели.

Екологичната протеомика притежава и потенциал за генериране на иновативни хипотези за микробните процеси. Различни видове съобщества могат да бъдат изследвани за микробна генна експресия с помощта на протокол за транскриптомика на околната среда, без да е необходимо да се определят определени организми, специфични филогенични групи или метаболитни модели. Мощните инструменти на автоматичното анотиране могат да свържат този многоцелеви изследователски подход с генетичния потенциал и моделите на активност за оценка на естествените микробни консорциуми.

Друго обещаващо приложение на микробните генни транскрипти от околната среда е създаването на референтни бази данни, специфични за екосистемите. Такива малки бази данни, които обхващат секвенциите на определена екосистема, вече са създадени – базата данни MiDAS 2.0 за микрофлората в пречиствателна станция за отпадъчни води и референтната база данни за червата на диктиоптерите – DictDb. Примерите за база данни, специфични за дадена екосистема, включват:

  • Таксономичната база данни за 16S рРНК на човешкия чревен тракт (HITdb);
  • База данни за човешкия орален микробиом (HOMD);
  • Специфичната база данни за сладководни басейни (FreshTrain);
  • База данни за чревната микрофлора на медоносната пчела;
  • База данни за метаногени в търбуха и червата.

Въпреки че тези референтни бази данни допринасят за бързото и правилно класифициране на ампликоните, като правило те съдържат ограничен брой последователности. Това препятствие се преодолява с разработването на специален алгоритъм, който е в състояние да класифицира ампликони, използвайки едновременно две референтни бази данни. Първата е универсална база данни, а втората е база данни на малка екосистема. Алгоритъмът, наречен TaxAss, е безплатен и с отворен код. Според него протоколът започва с амплификация и картографиране спрямо специфичната за екосистемата база данни, за да се определи „фон“ за секвенциите с определен процент идентичност, а след това тези над фоновия праг се класифицират към универсалната база данни. Чрез прилагането на този алгоритъм се постига висока степен на класификация. Въпреки това близкородствените секвенции могат да попаднат от двете страни на прага и по този начин да им бъдат определени съвсем различни таксономии.

Настоящите референтни бази данни обхващат милиони висококачествени референтни последователности. Тези бази данни се характеризират с висока идентичност и широко покритие на действителното разнообразие в дадено местообитание. Предстояща задача е подобряването на таксономичните назначения за некултивируеми таксони. Съществува софтуерен инструмент, AutoTax, който позволява създаването на специфични за екосистемите таксономии, покриващи пълния набор от седем таксономични ранга. Този софтуер предоставя имена за некласифицираните таксони, като използва de novo клъстеризация на последователностите за определяне на фоновияпраг за всеки таксономичен ранг. Клъстеризацията de novo е опростена; по този начин се запазват имената на заместителите, също и в случаите на разширяване на базата данни с допълнителни референтни секвенции.


Опознай база данните TaxAss и AutoTax


4. РЕШЕНИЯ

4.1. Едноклетъчна транскриптомика с комбинаторно баркодиране

Един от тези методи е методът Seq-Well, разработен така, че да предлага рентабилност, преносимост на работата и добра мащабируемост, които се приписват на методите, които изследват улавянето и баркодирането на клетки на базата на капки. При този метод клетките се зареждат в ямките на масив с размери „пико“, следвайки гравитацията, и съответните им транскрипти се кодират по уникален баркод. След това масивът с натоварените ямки се запечатва с полупропусклива мембрана, която позволява лесен обмен на течности по време на клетъчния лизис, като същевременно ограничава изтичането на РНК (Фиг. 7.4). Първоначално разработен за клинично приложение, този метод може да се използва за транскриптомен анализ на всяка сложна едноклетъчна общност, като например микробните консорциуми в околната среда.

Фигура 7.4. Техниката Seq-Well (Източник: Gierahn etal., 2017)

Неотдавна беше разработена подобрена версия на метода Seq-Well – Seq-Well3, която включва етапа на синтез на втора верига [3 за синтез на втора верига] след обратната транскрипция за генериране на втори PCR прайминг сайт. В резултат на това се изолира кДНК, която е обратно транскрибирана, но без да се извършва реакцията за смяна на матрицата. По този начин улавянето на съществени транскрипти, напр. транскрипционни фактори и сигнални молекули, се увеличава до 10 пъти.


Следвайте стъпка по стъпка протокола на Seq-Well3 тук


4.2. Поли(А)-независимо секвениране на РНК в една клетка

Поли(А)-независимото секвениране на едноклетъчна РНК е протокол за секвениране на едноклетъчна РНК, който позволява разкриването на независими от растежа модели на генна експресия в бактерии, работещи за всички класове и геномни области на РНК. Протоколът е тестван за отделни бактерии Salmonella и Pseudomonas, а обещаващите резултати могат да послужат като отправна точка за други бактериални видове и/или микробни консорциуми от околната среда.

4.3. Базирано на сонда бактериално секвениране на едноклетъчна РНК

Базираното на сонда бактериално секвениране на едноклетъчна РНК (ProBac-seq) е предназначено за разкриване на транскрипционната хетерогенност на изогенни бактериални популации на едноклетъчно ниво. Протоколът е базиран на сонди и използва библиотеки от ДНК сонди и микрофлуидни търговски платформи за извършване на секвениране на едноклетъчна РНК. Той позволява секвенирането на хиляди индивидуални бактериални транскриптоми по време на един експеримент, независимо от грам-статуса на бактериите.

Методът е одобрен за E. coli и B. subtilis. Той е тестван и с Clostridium perfringens, за да се изследва хетерогенността на експресията на токсини в различни субпопулации, подложени на различни условия на околната среда, и се оказва полезен при откриването на метаболитни смущения, свързани с патогенността.


Научете повече за базираното на сонда бактериално секвениране на едноклетъчна РНК here


Фигура 7.5. Принцип на техниката ProBac-seq (Източник: McNulty et al., 2024).

 

4.4. Комбинаторно индексиране in situ за секвениране на бактериална едноклетъчна РНК

Микробиологичната транскриптомика с разделно лигиране на пулове (microSPLiT) е техника, приложима както за грам-отрицателни, така и за грам-положителни бактерии, и може да разкрие различни транскрипционни състояния. Техниката е апробирана с клетки Bacillus subtilis, култивирани до различни етапи, и разкрива куп метаболитни модели, съответстващи на различни метаболитни промени по време на живота на бактериите (Фиг. 7.6).

Фигура 7.6. Принцип на метода за секвениране на единични клетки microSPLiT (Източник: Gaisser et al., 2024)

По време на това проучване са идентифицирани различни профили на експресия, съответстващи на известни, но редки състояния (клетъчна компетентност и индукция на профаги). Освен това са идентифицирани неочаквани състояния на генна експресия, сред които активиране на метаболитни пътища по хетерогенен начин (в определени клетъчни субпопулации). По този начин микроSPLiT е добро решение за откриване на фенотипно различни субпопулации.


Научете повече за метода за секвениране на РНК microSPLiT here


5. ЛИТЕРАТУРА

Blattman, S.B., Jiang, W., Oikonomou, P. et al. Prokaryotic single-cell RNA sequencing by in situ combinatorial indexing. Nat Microbiol 5, 1192–1201 (2020). https://doi.org/10.1038/s41564-020-0729-6

Dar, D., Dar N., Cai L., and Newman D.K. Spatial transcriptomics of planktonic and sessile bacterial populations at single-cell resolution (2021) Science, 373, 6556, DOI: 10.1126/science.abi4882

Gaisser, K.D., Skloss, S.N., Brettner, L.M. et al. High-throughput single-cell transcriptomics of bacteria using combinatorial barcoding. Nat Protoc (2024). https://doi.org/10.1038/s41596-024-01007-w

Gierahn, T., Wadsworth, M., Hughes, T. et al. Seq-Well: portable, low-cost RNA sequencing of single cells at high throughput. Nat Methods 14, 395–398 (2017). https://doi.org/10.1038/nmeth.4179

Imdahl, F., Vafadarnejad, E., Homberger, C. et al. Single-cell RNA-sequencing reports growth-condition-specific global transcriptomes of individual bacteria. Nat Microbiol 5, 1202–1206 (2020). https://doi.org/10.1038/s41564-020-0774-1

McNulty, R., Sritharan, D., Pahng, S.H. et al. Probe-based bacterial single-cell RNA sequencing predicts toxin regulation. Nat Microbiol 8, 934–945 (2023). https://doi.org/10.1038/s41564-023-01348-4

Mante J. Groover, K. E., Pullen R. M. Environmental community transcriptomics: strategies and struggles. (2024) Briefings in Functional Genomics, 1–15, https://doi.org/10.1093/bfgp/elae033

Page, T. M. and Lawley J. W. (2022) Front. Mar. Sci., Sec. Marine Molecular Biology and Ecology, 9 – 2022 https://doi.org/10.3389/fmars.2022.757921

Poretsky R.S, N. Bano, A. Buchan, G. LeCleir, J. Kleikemper, M. Pickering, W.M. Pate, M.A. Moran, J.T. Hollibaugh. Analysis of microbial gene transcripts in environmental samples. Appl Environ Microbiol. 2005 71(7):4121-6. doi: 10.1128/AEM.71.7.4121-4126.2005.

Wang, B., Lin, A.E., Yuan, J. et al. Single-cell massively-parallel multiplexed microbial sequencing (M3-seq) identifies rare bacterial populations and profiles phage infection. Nat Microbiol 8, 1846–1862 (2023). https://doi.org/10.1038/s41564-023-01462-3.