STARR-seq
STARR-Seq (англ. self-transcribing active regulatory region sequencing) — метод анализа энхансерной активности одновременно миллионов последовательностей ДНК из геномов произвольных организмов. STARR-seq обладает высокой производительностью и может служить для полногеномного поиска и количественной оценки активности энхансеров[1].
Описание метода
У эукариот транскрипция регулируется транскрипционными факторами — белками, связывающимися со специфичными участками ДНК в промоторах генов, а также с участками, не располагающимися в непосредственной близости к генами, в том числе энхансерами. Энхансеры представляют собой некодирующие участки ДНК, содержащие определённые сайты связывания для различных транскрипционных факторов[2]. Энхансеры привлекают транскрипционные факторы, которые активируют РНК-полимеразу II и общие факторы транскрипции вблизи промотора, что ведёт к транскрибированию генов. Энхансеры могут регулировать транскрипцию генов-мишеней тканеспецифично[1], независимо от локализации в ДНК и расстояния от промотора гена. В некоторых случаях они могут регулировать транскрипцию генов, расположенных в другой хромосоме[3]. Однако до настоящего момента информация ограничивалась исследованием небольшого числа энхансеров в связи со сложностью их полногеномного поиска[2]. Кроме того, многие регуляторные элементы функционируют исключительно в специфических типах клеток и при определенных условиях[4].
Определение энхансеров
Для определение энхансеров у Drosophila применяется методика с использованием случайной вставки транспозона, кодирующего минимальный промотор с репортёрным белком. Этот метод позволяет получить информацию о регуляции энхансерами генов, находящихся рядом с местом вставки[5].
В последние несколько лет различные особенности активных и неактивных энхансеров удалось изучить при помощи пост-геномных технологий. Развитие новых методов, таких как DNase-seq, FAIRE-Seq, ChIP-seq, позволили предсказывать положение энхансеов в геноме. Однако DNase-seq и FAIRE-seq не позволяют напрямую определить энхансер и его активность. Кроме того, с помощью этих методов нельзя протестировать большое количество последовательностей-кандидатов на наличие у них энхансерной активности. Разработка STARR-seq позволяет производить полногеномный поиск энхансеров и получать количественную оценку их активности[1].
Идея метода
Идея STARR-seq предложена в лаборатории А. Штарка (A. Stark, Институт молекулярной патологии, Вена, Австрия) для полногеномного поиска энхансеров произвольных организмов, а также количественного определения их активности. Метод основывается на том факте, что энхансеры могут работать независимо от их относительного расположения на ДНК. Суть метода заключается в расположении потенциального энхансера после минимального промотора, что позволяет активному энхансеру активировать транскрипцию ДНК, содержащей его же последовательность. Активность каждого энхансера при этом характеризуется степенью обогащения РНК с последовательностью энхансера среди всей клеточной РНК. С помощью такого подхода возможна одновременная проверка миллионов участков ДНК из произвольного источника[1].
Принцип метода
Геномная ДНК случайным образом разбивается на мелкие фрагменты. Фрагменты определенной длины отбираются, к ним лигирут адаптеры. Затем фрагменты ДНК с адаптерами амплифицируются. Продукты ПЦР очищают и встраивают в плазмиду после минимального промотора в 3'-нетранслируемую область репортёрного гена, позволяя активному энхансеру активировать транскрипцию РНК-полимеразой участка ДНК, содержащего после точки начала транскрипции последовательность самого энхансера. Далее клетки трансфецируют полученной репортерной библиотекой и культивируют. Полиаденилированную РНК выделяют из тотальной РНК и с помощью обратной транскрипции получают кДНК, которую амплифицируют, после чего узнают последовательность фрагментов с помощью секвенирования спаренных концов. Секвенированные фрагменты картируются на референсный геном и данные отправляются на компьютерную обработку[1].
Результаты применения метода
Определение энхансеров в Drosophila
Изначально метод STARR-seq был применен к геному Drosophila. Было обнаружено, что большая часть (55,6 %) энхансеров располагается в интронах, в частности в первом интроне, и межгенных областях. Интересно, что небольшая часть (4,5 %) энхансеров располагаются в сайтах старта транскрипции, в связи с чем можно предположить, что эти энхансеры могут и запускать транскрипцию в данном месте, и воздействовать на транскрипцию других генов. Наиболее активные энхансеры располагаются вблизи конститутивных генов, например, кодирующих белки цитоскелета, и некоторых регуляторов развития, например, транскрипционных факторов. Авторы показали, что множество генов регулируются несколькими независимыми активными энхансерами. Кроме того, оказалось, что уровни экспрессии генов в среднем коррелируют с суммарной энхансерной активностью в пересчёте на ген, что обеспечивает прямую связь между уровнем экспрессии и энхансерной активностью[1].
Описание регуляторных вариантов аллелей
Используя STARR-seq для поиска и описания регуляторных вариантов аллелей, Vockey и др. обнаружили эффекты генетической изменчивости человека на функции некодирующих регуляторных элементов, измеряя активность 100 предположительных энхансеров из геномов 95 человек. Такой подход позволяет идентифицировать регуляторные варианты (в том числе ОНП), которые находятся в геномных локусах, способствующих изменению уровней экспрессии различных мРНК (eQTL), а также вносящих вклад в сложные фенотипы[7].
Преимущества метода
Метод STARR-seq обладает следующими преимуществами:
- Полногеномноное и количественное определение энхансеров, по производительности превосходящее методы, основанные на изучении модификаций хроматина.
- Скрининг фрагментов ДНК из произвольных источников и в любом типе клеток и тканей.
- Применение секвенирования спаренных концов обеспечивает высокую чувствительность метода: транскрипты обнаруживаются даже при наличии в них дестабилизирующих элементов.
- Результаты по количественному определению энхансерной активности высоко воспроизводимы.
- Возможна идентификация энхансеров, даже если их активность подавляется эндогенными стимулами[1].
Направления развития
STARR-seq за счёт сочетания классических методов молекулярной биологии с высокоспециализированными биоинформатическими методами позволяет детектировать и количественно оценивать энхансерную активность. К настоящему моменту STARR-seq был применен в клетках мыши и человека, и его эффективность была подтверждена[8]. Применение STARR-seq к множеству типов клеток различных организмов позволит сделать существенный шаг в изучении регуляции генов и ответственных за неё сигнальных путей в ходе развития и при дифференциации клеток, в норме и при патологии[6].
Примечания
- Arnold C. D., Gerlach D., Stelzer C., Boryń M., Rath M., Stark A. Genome-wide quantitative enhancer activity maps identified by STARR-seq. (англ.) // Science (New York, N.Y.). — 2013. — Vol. 339, no. 6123. — P. 1074—1077. — doi:10.1126/science.1232542. — PMID 23328393.
- Xu J., Smale S. T. Designing an enhancer landscape. (англ.) // Cell. — 2012. — Vol. 151, no. 5. — P. 929—931. — doi:10.1016/j.cell.2012.11.007. — PMID 23178114.
- Ong C. T., Corces V. G. Enhancer function: new insights into the regulation of tissue-specific gene expression. (англ.) // Nature reviews. Genetics. — 2011. — Vol. 12, no. 4. — P. 283—293. — doi:10.1038/nrg2957. — PMID 21358745.
- Baker M. Highlighting enhancers. (англ.) // Nature methods. — 2011. — Vol. 8, no. 5. — P. 373. — PMID 21678620.
- Bellen H. J. Ten years of enhancer detection: lessons from the fly. (англ.) // The Plant cell. — 1999. — Vol. 11, no. 12. — P. 2271—2281. — PMID 10590157.
- Muerdter F., Boryń M., Arnold C. D. STARR-seq - principles and applications. (англ.) // Genomics. — 2015. — Vol. 106, no. 3. — P. 145—150. — doi:10.1016/j.ygeno.2015.06.001. — PMID 26072434.
- Vockley C. M., Guo C., Majoros W. H., Nodzenski M., Scholtens D. M., Hayes M. G., Lowe W. L. Jr., Reddy T. E. Massively parallel quantification of the regulatory effects of noncoding genetic variation in a human cohort. (англ.) // Genome research. — 2015. — Vol. 25, no. 8. — P. 1206—1214. — doi:10.1101/gr.190090.115. — PMID 26084464.
- Vanhille L., Griffon A., Maqbool M. A., Zacarias-Cabeza J., Dao L. T., Fernandez N., Ballester B., Andrau J. C., Spicuglia S. High-throughput and quantitative assessment of enhancer activity in mammals by CapStarr-seq. (англ.) // Nature communications. — 2015. — Vol. 6. — P. 6905. — doi:10.1038/ncomms7905. — PMID 25872643.