Гены-сироты
Гены-сироты (англ. Orphan gene или ORFans, главным образом, в литературе по микробиологии)[1][2] — это гены без обнаруженных гомологов в других эволюционных ветвях[2]. Сироты — подгруппа таксономически ограниченных генов (TRG), которые являются уникальными для определённого таксономического уровня (например, для конкретного растения)[3]. В отличие от несиротных TRG, сироты обычно считаются уникальными для очень узкого таксона, в основном вида.
Классическая модель эволюции базируется на дупликации, перестройке и мутации генов с идеей общего происхождения[4][5]. Гены-сироты отличаются тем, что они специфичны по происхождению без известной истории общей дупликации и перестановки вне их специфических видов или клады[6]. Гены-сироты могут возникать с помощью различных механизмов, таких как горизонтальный перенос генов, дупликация и быстрая дивергенция, а также появление гена de novo из некодирующей последовательности[2]. Эти процессы могут действовать с разной скоростью у насекомых, приматов и растений[7]. Несмотря на их относительно недавнее происхождение, гены-сироты могут кодировать функционально важные белки[8][9].
История изучения генов-сирот
Гены-сироты были впервые обнаружены после начала проекта по секвенированию генома дрожжей в 1996[2]. На гены сироты приходилось примерно 26 % генома дрожжей, но считалось, что эти гены можно классифицировать по гомологам, если секвенировать большее количество геномов[3]. В то время дупликация генов считалась единственной серьёзной моделью эволюции генов[2][4][10], тогда было секвенировано только несколько геномов для сравнения, таким образом, отсутствие поддающихся обнаружению гомологов считалось наиболее вероятным из-за отсутствия данных секвенирования, а не из-за истинного отсутствия гомологии[3]. Однако гены-сироты продолжали существовать по мере роста количества секвенированных геномов[3][11], что в конечном итоге привело к выводу, что гены-сироты распространены повсеместно во всех геномах[2]. Оценки процента генов, оставшихся сиротами, сильно различаются между видами и исследованиями; 10-30 % — обычно цитируемая цифра[3].
Изучение генов-сирот возникло в значительной степени на рубеже веков. В 2003 году в исследовании Caenorhabditis briggsae и родственных ему видов сравнивалось более 2000 генов[3]. Они предположили, что эти гены должны эволюционировать слишком быстро, чтобы их можно было обнаружить, и, следовательно, являются участками очень быстрой эволюции[3]. В 2005 году Уилсон исследовал 122 вида бактерий, чтобы попытаться выяснить, является ли большое количество генов-сирот у многих видов действительно генами-сиротами[11]. Исследование показало, что это было верным предположением и сыграло роль в адаптации бактерий. Определение таксономически ограниченных генов было введено в литературу, чтобы гены-сироты казались менее «загадочными»[11].
В 2008 году было обнаружено, что дрожжевой белок с установленной функциональностью, BSC4, произошел de novo из некодирующих последовательностей, гомология которых всё ещё обнаруживалась у сестринских видов[12].
В 2009 году был обнаружен ген-сирота, регулирующий внутреннюю биологическую сеть: сиротский ген QQS из Arabidopsis thaliana влияет на метаболизм крахмала[13]. Белок-сирота QQS взаимодействует с консервативным фактором транскрипции NF-YC4, это объясняет увеличение продукции белка, которое вызывается, когда ген QQS внедряют при помощи генетической инженерии в другие виды растений[14].
В 2011 году на модельном растении «Arabidopsis thaliana» было проведено всестороннее геномное исследование распространения и эволюционного происхождения генов-сирот у растений[15].
Как определить гены-сироты
Гены можно условно классифицировать как сиротские, если у близлежащих видов не обнаруживаются ортологичные белки[7].
Одним из методов, используемых для оценки сходства нуклеотидных или белковых последовательностей, указывающих на гомологию (то есть сходство из-за общего происхождения), является инструмент поиска базового локального выравнивания (BLAST). BLAST позволяет быстро искать последовательности в больших базах данных[16][17]. Моделирование предполагает, что при определённых условиях BLAST подходит для обнаружения дальних родственников гена[18]. Однако BLAST может легко пропустить, короткие и быстро эволюционирующие гены[19].
Систематическое обнаружение гомологии для аннотирования генов-сирот называется филостратиграфией[20]. Филостратиграфия генерирует филогенетическое дерево, в котором вычисляется гомология между всеми генами основного вида и генами других видов. Самый ранний общий предок гена определяет возраст или филогенетический слой гена. Термин «сирота» иногда используется только для самого молодого филогенетического слоя, содержащего только один вид, но при широком толковании как таксономически ограниченный ген, он может относиться ко всем филогенетическим слоям, кроме самого старого, с осиротевшим геном в более крупной кладе.
Откуда берутся гены-сироты?
Гены-сироты возникают из множества источников, преимущественно в результате возникновения de novo, дупликации и быстрой дивергенции, а также горизонтального переноса генов[2].
Появление de novo
Новые сиротские гены постоянно возникают de novo из некодирующих последовательностей[21]. Эти новые гены могут быть достаточно полезными, чтобы их можно было зафиксировать путем отбора. Или, что более вероятно, они снова отойдут на негенный фон. Последний вариант подтверждается исследованиями на дрозофилах, показывающими, что молодые гены с большей вероятностью вымирают[22].
Когда-то считалось, что появление генов de novo практически невозможно из-за сложных и потенциально хрупких тонкостей создания и поддержания функциональных полипептидов[10], но исследования приблизительно последних лет 10, обнаружили несколько примеров генов de novo, некоторые из них связаны с важными биологическими процессами, особенно функции яичек у животных. Гены de novo были также обнаружены у грибов и растений[12][23][24][5][25][26][27].
Для молодых генов-сирот иногда можно найти гомологичные некодирующие последовательности ДНК в сестринских таксонах, что обычно считается убедительным доказательством происхождения de novo. Однако вклад происхождения de novo в таксономически ограниченные гены более древнего происхождения, особенно в отношении традиционной теории дупликационной эволюции генов, остается спорным[28][29].
Дупликация и дивергенция
Модель дупликации и дивергенции для генов-сирот предполагает, что новый ген создается в результате некоторого события дупликации или дивергенции, и проходит период быстрой эволюции, когда всё обнаруживаемое сходство с первоначально дублированным геном теряется[2]. Хотя это объяснение согласуется с текущим пониманием механизмов дублирования[2], количество мутаций, необходимых для потери обнаруживаемого сходства, достаточно велико, чтобы быть редким событием[2][18], а эволюционный механизм, с помощью которого дубликат гена может быть изолирован и так быстро расходиться, остается неясным[2][30].
Горизонтальный перенос генов
Другое объяснение того, как возникают гены-сироты, связано с механизмом дуплицирования, называемым горизонтальным переносом генов, когда исходный дублицированный ген происходит от отдельной, неизвестной линии[2]. Это объяснение происхождения генов-сирот особенно актуально для бактерий и архей, где горизонтальный перенос генов обычен.
Характеристики белка
Гены-сироты, как правило, очень короткие (примерно в 6 раз короче зрелых генов), а некоторые слабо экспрессируются, тканеспецифичны и более просты в использовании кодонов и аминокислотном составе[31]. Гены-сироты имеют тенденцию кодировать внутренне неупорядоченные белки[32][33][34], хотя некоторая структура была обнаружена в одном из наиболее охарактеризованных генов-сирот[35]. Из десятков тысяч ферментов первичного или специализированного метаболизма, которые были охарактеризованы на сегодняшний день, ни один не является сиротским или даже ограниченным по происхождению; очевидно, для катализа требуются сотни миллионов лет эволюции[31].
Биологические функции
Несмотря на то, что распространенность генов-сирот признана, эволюционная роль сирот и, как следствие, её важность все ещё обсуждаются. Одна из теорий состоит в том, что многие сироты не играют эволюционной роли; геномы содержат нефункциональные открытые рамки считывания (ORF), которые создают ложные полипептидные продукты, не поддерживаемые селекцией, а это означает, что они вряд ли сохранятся между видами и, вероятно, будут обнаружены как гены-сироты[3]. Однако множество других исследований показали, что по крайней мере некоторые сироты функционально важны и могут помочь объяснить появление новых фенотипов[2][3][11][13][14][15].
Примечания
- Fischer, D.; Eisenberg, D. Finding families for genomic ORFans // Bioinformatics. — 1999. — 1 сентября (т. 15, № 9). — С. 759—762. — doi:10.1093/bioinformatics/15.9.759. — PMID 10498776.
- Tautz, D.; Domazet-Lošo, T. The evolutionary origin of orphan genes (англ.) // Nature Reviews Genetics. — 2011. — Vol. 12, no. 10. — P. 692—702. — doi:10.1038/nrg3053. — PMID 21878963.
- Khalturin, K; Hemmrich, G; Fraune, S; Augustin, R; Bosch, T. C. More than just orphans: are taxonomically-restricted genes important in evolution? (англ.) // Trends in Genetics : journal. — Cell Press, 2009. — Vol. 25, no. 9. — P. 404—413. — doi:10.1016/j.tig.2009.07.006. — PMID 19716618.
- Ohno, Susumu. Evolution by Gene Duplication. — Springer Science & Business Media, 2013. — ISBN 978-3-642-86659-3.
- Zhou, Qi; Zhang, Guojie; Zhang, Yue; Xu, Shiyu; Zhao, Ruoping; Zhan, Zubing; Li, Xin; Ding, Yun; Yang, Shuang. On the origin of new genes in Drosophila (англ.) // Genome Research. — 2008. — 1 September (vol. 18, no. 9). — P. 1446—1455. — doi:10.1101/gr.076588.108. — PMID 18550802.
- Toll-Riera, M.; Bosch, N.; Bellora, N.; Castelo, R.; Armengol, L.; Estivill, X.; Alba, M. M. Origin of primate orphan genes: a comparative genomics approach (англ.) // Molecular Biology and Evolution : journal. — Oxford University Press, 2009. — Vol. 26, no. 3. — P. 603—612. — doi:10.1093/molbev/msn281. — PMID 19064677.
- Wissler, L.; Gadau, J.; Simola, D. F.; Helmkampf, M.; Bornberg-Bauer, E. Mechanisms and Dynamics of Orphan Gene Emergence in Insect Genomes (англ.) // Genome Biology and Evolution : journal. — 2013. — Vol. 5, no. 2. — P. 439—455. — doi:10.1093/gbe/evt009. — PMID 23348040.
- Reinhardt, Josephine A.; Wanjiru, Betty M.; Brant, Alicia T.; Saelao, Perot; Begun, David J.; Jones, Corbin D. De Novo ORFs in Drosophila Are Important to Organismal Fitness and Evolved Rapidly from Previously Non-coding Sequences (англ.) // PLoS Genet : journal. — 2013. — 17 October (vol. 9, no. 10). — P. e1003860. — doi:10.1371/journal.pgen.1003860. — PMID 24146629.
- Suenaga, Yusuke; Islam, S. M. Rafiqul; Alagu, Jennifer; Kaneko, Yoshiki; Kato, Mamoru; Tanaka, Yukichi; Kawana, Hidetada; Hossain, Shamim; Matsumoto, Daisuke. NCYM, a Cis-Antisense Gene of MYCN, Encodes a De Novo Evolved Protein That Inhibits GSK3β Resulting in the Stabilization of MYCN in Human Neuroblastomas (англ.) // PLoS Genet : journal. — 2014. — 2 January (vol. 10, no. 1). — P. e1003996. — doi:10.1371/journal.pgen.1003996. — PMID 24391509.
- Jacob, F. Evolution and tinkering (англ.) // Science : journal. — 1977. — 10 June (vol. 196, no. 4295). — P. 1161—1166. — doi:10.1126/science.860134. — . — PMID 860134.
- Wilson, G. A.; Bertrand, N.; Patel, Y.; Hughes, J. B.; Feil, E. J.; Field, D. Orphans as taxonomically restricted and ecologically important genes (англ.) // Microbiology : journal. — 2005. — Vol. 151, no. 8. — P. 2499—2501. — doi:10.1099/mic.0.28146-0. — PMID 16079329.
- Cai, Jing; Zhao, Ruoping; Jiang, Huifeng; Wang, Wen. De Novo Origination of a New Protein-Coding Gene in Saccharomyces cerevisiae (англ.) // Genetics : journal. — 2008. — 1 May (vol. 179, no. 1). — P. 487—496. — doi:10.1534/genetics.107.084491. — PMID 18493065.
- Li, L.; Foster, C. M.; Gan, Q.; Nettleton, D.; James, M. G.; Myers, A. M.; Wurtele, E. S. Identification of the novel protein QQS as a component of the starch metabolic network in Arabidopsis leaves (англ.) // The Plant Journal : journal. — 2009. — Vol. 58, no. 3. — P. 485—498. — doi:10.1111/j.1365-313X.2009.03793.x. — PMID 19154206.
- Li, L; Zheng, W; Zhu, Y; Ye, H; Tang, B; Arendsee, Z; Jones, D; Li, R; Ortiz, D; Zhao, X; Du, C; Nettleton, D; Scott, P; Salas-Fernandez, M; Yin, Y; Wurtele, E. S. The QQS orphan gene regulates carbon and nitrogen partitioning across species via NF-YC interactions (англ.) // Proceedings of the National Academy of Sciences of the United States of America : journal. — 2015. — Vol. 112, no. 47. — P. 14734—14739. — doi:10.1073/pnas.1514670112. — . — PMID 26554020.
- Donoghue, M.T.A; Keshavaiah, C.; Swamidatta, S.H.; Spillane, C. Evolutionary origins of Brassicaceae specific genes in Arabidopsis thaliana (англ.) // BioMed Central : journal. — 2011. — Vol. 11, no. 1. — P. 47. — doi:10.1186/1471-2148-11-47. — PMID 21332978.
- Altschul, S. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs (англ.) // Nucleic Acids Research : journal. — 1997. — 1 September (vol. 25, no. 17). — P. 3389—3402. — doi:10.1093/nar/25.17.3389. — PMID 9254694.
- NCBI BLAST homepage .
- Alba, M; Castresana, J. On homology searches by protein BLAST and the characterization of the age of genes (англ.) // BioMed Central : journal. — 2007. — Vol. 7. — P. 53. — doi:10.1186/1471-2148-7-53. — PMID 17408474.
- Moyers, B. A.; Zhang, J. Phylostratigraphic Bias Creates Spurious Patterns of Genome Evolution (англ.) // Molecular Biology and Evolution : journal. — Oxford University Press, 2014. — 13 October (vol. 32, no. 1). — P. 258—267. — doi:10.1093/molbev/msu286. — PMID 25312911.
- Domazet-Lošo, Tomislav; Brajković, Josip; Tautz, Diethard. A phylostratigraphy approach to uncover the genomic history of major adaptations in metazoan lineages (англ.) // Trends in Genetics : journal. — Cell Press, 2007. — 11 January (vol. 23, no. 11). — P. 533—539. — doi:10.1016/j.tig.2007.08.014. — PMID 18029048.
- McLysaght, Aoife; Guerzoni, Daniele. New genes from non-coding sequence: the role of de novo protein-coding genes in eukaryotic evolutionary innovation (англ.) // Philosophical Transactions of the Royal Society B : journal. — 2015. — 31 August (vol. 370, no. 1678). — P. 20140332. — doi:10.1098/rstb.2014.0332. — PMID 26323763.
- Palmieri, Nicola; Kosiol, Carolin; Schlötterer, Christian. The life cycle of orphan genes (англ.) // eLife : journal. — 2014. — 19 February (vol. 3). — P. e01311. — doi:10.7554/eLife.01311. — PMID 24554240.
- Zhao, Li; Saelao, Perot; Jones, Corbin D.; Begun, David J. Origin and Spread of de Novo Genes in Drosophila melanogaster Populations (англ.) // Science : journal. — 2014. — 14 February (vol. 343, no. 6172). — P. 769—772. — doi:10.1126/science.1248286. — . — PMID 24457212.
- Levine, Mia T.; Jones, Corbin D.; Kern, Andrew D.; Lindfors, Heather A.; Begun, David J. Novel genes derived from noncoding DNA in Drosophila melanogaster are frequently X-linked and exhibit testis-biased expression (англ.) // Proceedings of the National Academy of Sciences of the United States of America : journal. — 2006. — 27 June (vol. 103, no. 26). — P. 9935—9939. — doi:10.1073/pnas.0509809103. — . — PMID 16777968.
- Heinen, Tobias J. A. J.; Staubach, Fabian; Häming, Daniela; Tautz, Diethard. Emergence of a New Gene from an Intergenic Region (англ.) // Current Biology : journal. — Cell Press, 2009. — 29 September (vol. 19, no. 18). — P. 1527—1531. — doi:10.1016/j.cub.2009.07.049. — PMID 19733073.
- Chen, Sidi; Zhang, Yong E.; Long, Manyuan. New Genes in Drosophila Quickly Become Essential (англ.) // Science : journal. — 2010. — 17 December (vol. 330, no. 6011). — P. 1682—1685. — doi:10.1126/science.1196380. — . — PMID 21164016.
- Silveira A. B., Trontin C., Cortijo S., Barau J., Del-Bem L. E., Loudet O., Colot V., Vincentz M. Extensive Natural Epigenetic Variation at a De Novo Originated Gene (англ.) // PLoS Genetics : journal. — 2013. — Vol. 9, no. 4. — P. e1003437. — doi:10.1371/journal.pgen.1003437. — PMID 23593031.
- Neme, Rafik; Tautz, Diethard. Evolution: Dynamics of De Novo Gene Emergence (англ.) // Current Biology : journal. — Cell Press, 2014. — 17 March (vol. 24, no. 6). — P. R238–R240. — doi:10.1016/j.cub.2014.02.016. — PMID 24650912.
- Moyers, Bryan A.; Zhang, Jianzhi. Evaluating phylostratigraphic evidence for widespread de novo gene birth in genome evolution (англ.) // Molecular Biology and Evolution : journal. — Oxford University Press, 2016. — 11 January (vol. 33, no. 5). — P. 1245—1256. — doi:10.1093/molbev/msw008. — PMID 26758516.
- Lynch, Michael; Katju, Vaishali. The altered evolutionary trajectories of gene duplicates (англ.) // Trends in Genetics : journal. — Cell Press, 2004. — 1 November (vol. 20, no. 11). — P. 544—549. — doi:10.1016/j.tig.2004.09.001. — PMID 15475113.
- Arendsee, Zebulun W.; Li, Ling; Wurtele, Eve Syrkin. Coming of age: orphan genes in plants (англ.) // Trends in Plant Science : journal. — Cell Press, 2014. — November (vol. 19, no. 11). — P. 698—708. — doi:10.1016/j.tplants.2014.07.003. — PMID 25151064.
- Mukherjee, S.; Panda, A.; Ghosh, T.C. Elucidating evolutionary features and functional implications of orphan genes in Leishmania major (англ.) // Infection, Genetics and Evolution : journal. — 2015. — June (vol. 32). — P. 330—337. — doi:10.1016/j.meegid.2015.03.031. — PMID 25843649.
- Wilson, Benjamin A.; Foy, Scott G.; Neme, Rafik; Masel, Joanna. Young genes are highly disordered as predicted by the preadaptation hypothesis of de novo gene birth (англ.) // Nature Ecology & Evolution : journal. — 2017. — 24 April (vol. 1, no. 6). — P. 0146—0146. — doi:10.1038/s41559-017-0146. — PMID 28642936.
- Willis, Sara; Masel, Joanna. Gene Birth Contributes to Structural Disorder Encoded by Overlapping Genes (англ.) // Genetics : journal. — 2018. — 19 July (vol. 210, no. 1). — P. 303—313. — doi:10.1534/genetics.118.301249. — PMID 30026186.
- Bungard, Dixie; Copple, Jacob S.; Yan, Jing; Chhun, Jimmy J.; Kumirov, Vlad K.; Foy, Scott G.; Masel, Joanna; Wysocki, Vicki H.; Cordes, Matthew H.J. Foldability of a Natural De Novo Evolved Protein // Structure. — 2017. — Ноябрь (т. 25, № 11). — С. 1687–1696.e4. — doi:10.1016/j.str.2017.09.006. — PMID 29033289.