Геном человека
Геном человека — совокупность наследственного материала, заключённого в клетке человека[1]. Согласно этому определению человеческий геном состоит из 23 пар хромосом, находящихся в ядре, а также множества копий митохондриальной ДНК. Существует и другое определение генома, в котором под геномом подразумевают совокупность генетического материала гаплоидного набора хромосом[2][3]. Когда говорят о размере генома человека, то имеют в виду данный вариант определения генома. Так, двадцать две аутосомы, две половые хромосомы Х и Y, а также митохондриальная ДНК человека содержат вместе примерно 3,055 млрд пар оснований[4].
В ходе выполнения проекта «Геном человека» была определена последовательность ДНК всех хромосом и митохондриальной ДНК. В настоящее время эти данные активно используются по всему миру в биомедицинских исследованиях. Полное секвенирование выявило, что человеческий геном содержит 20—25 тыс. активных генов[5] (по последним данным[4] их точное количество 19,969), что значительно меньше, чем ожидалось в начале проекта (порядка 100 тыс.) — то есть только 1,5 % всего генетического материала кодирует белки или функциональные РНК. Остальная часть является некодирующей ДНК, которую часто называют мусорной ДНК[6], но которая, как оказалось, играет важную роль в регуляции активности генов[7][8].
Особенности
Хромосомы
В геноме присутствует 23 пары хромосом: 22 пары аутосомных хромосом, а также пара половых хромосом X и Y. У человека мужской пол является гетерогаметным и определяется наличием Y-хромосомы. Нормальные диплоидные соматические клетки имеют 46 хромосом[9][10].
Гены
Предварительные оценки предполагали наличие в геноме человека более 100 тысяч генов. По результатам проекта «Геном человека» количество генов, а точнее открытых рамок считывания, составило около 23 000 генов. В связи с усовершенствованием методов поиска (предсказания) генов предполагается дальнейшее уменьшение числа генов.
Число генов у человека лишь ненамного больше, чем у более простых организмов, например, круглого червя Caenorhabditis elegans или мухи Drosophila melanogaster. Так происходит из-за того, что в человеческом геноме широко представлен альтернативный сплайсинг. Альтернативный сплайсинг позволяет получить несколько различных белковых цепочек с одного гена. В результате человеческий протеом оказывается значительно больше протеома рассмотренных организмов. Большинство человеческих генов имеют множественные экзоны, и интроны часто оказываются значительно более длинными, чем граничные экзоны в гене.
Гены неравномерно распределены по хромосомам. Каждая хромосома содержит богатые и бедные генами участки. Эти участки коррелируют с хромосомными бендами (полосы поперёк хромосомы, которые видно в микроскоп) и с CG-богатыми участками. В настоящий момент значимость такого неравномерного распределения генов не вполне изучена.
Кроме генов, кодирующих белки, человеческий геном содержит тысячи РНК-генов, кодирующих транспортные РНК (tRNA), рибосомные РНК, микроРНК и прочие РНК, не кодирующие белок.
Регуляторные последовательности
В человеческом геноме найдено множество различных последовательностей, отвечающих за регуляцию генов. Под регуляцией понимается контроль экспрессии гена (процесс построения матричной РНК по участку молекулы ДНК). Обычно это короткие последовательности, находящиеся либо рядом с геном, либо внутри гена. Иногда они находятся на значительном расстоянии от гена (энхансеры). Систематизация этих последовательностей, понимание механизмов работы, а также вопросы взаимной регуляции группы генов группой соответствующих ферментов на текущий момент находятся только на начальной стадии изучения. Взаимная регуляция групп генов описывается с помощью сетей регуляции генов. Изучение этих вопросов находится на стыке нескольких дисциплин: прикладной математики, высокопроизводительных вычислений и молекулярной биологии. Знания появляются из сравнений геномов различных организмов и благодаря достижениям в области организации искусственной транскрипции гена в лабораторных условиях.
Идентификация регуляторных последовательностей в человеческом геноме частично была произведена на основе эволюционной консервативности (свойства сохранения важных фрагментов хромосомной последовательности, которые отвечают примерно одной и той же функции). Согласно данным молекулярных часов, эволюционные линии человека и мыши разделились около 100 миллионов лет назад[11]. Для двух геномов компьютерными методами были выявлены консервативные последовательности (последовательности, идентичные или очень слабо отличающиеся в сравниваемых геномах) в некодирующей части и оказалось, что они активно участвуют в механизмах регуляции генов у обоих организмов[12].
Другой подход получения регуляторных последовательностей основан на сравнении генов человека и рыбы фугу. Последовательности генов и регуляторные последовательности у человека и рыбы фугу существенно схожи, однако геном рыбы фугу содержит в 8 раз меньший объём «мусорной ДНК». Такая «компактность» рыбьего генома позволяет значительно легче искать регуляторные последовательности для генов[13].
Прочие объекты в геноме
Кодирующие белок последовательности (множество последовательностей составляющих экзоны) составляют менее чем 1,5 % генома[6]. Не учитывая известные регуляторные последовательности, в человеческом геноме содержится масса объектов, которые выглядят как нечто важное, но функция которых, если она вообще существует, пока не выяснена. Эти объекты занимают до 97 % всего объёма человеческого генома. К таким объектам относятся:
- повторы
- транспозоны
- ретротранспозоны
- LTR-ы (long terminal repeat)
- Ty1-copia
- Ty3-gypsy
- Не-LTR-ы
- LTR-ы (long terminal repeat)
- ДНК-транспозоны
- ретротранспозоны
- псевдогены
Представленная классификация не является исчерпывающей. Большая часть объектов вообще не классифицирована мировой научной общественностью на текущий момент[когда?].
Соответствующие последовательности, скорее всего, являются эволюционным артефактом. В современной версии генома их функция выключена, и эти участки генома многие называют мусорной ДНК. Однако есть масса свидетельств в пользу того, что эти объекты обладают некоторой функцией, которая пока неясна.
Псевдогены
Эксперименты с ДНК-микрочипами показали, что много участков генома, не являющихся генами, вовлечены в процесс транскрипции[14].
Вирусы
Около 1 % в геноме человека занимают встроенные гены ретровирусов (эндогенные ретровирусы). Эти гены обычно не приносят пользы хозяину, но существуют и исключения. Так, около 43 млн лет назад в геном предков обезьян и человека попали ретровирусные гены, служившие для построения оболочки вируса. У человека и обезьян эти гены участвуют в работе плаценты[15]. Большинство ретровирусов встроились в геном предков человека свыше 25 млн лет назад. Среди более молодых человеческих эндогенных ретровирусов полезных на настоящий момент не обнаружено[16][17].
Информационное содержание генома человека
Азотистые основания в ДНК (аденин, тимин, гуанин, цитозин) соответствуют 4 различным логическим состояниям, что эквивалентно 2 битам информации[18]. Таким образом, геном человека содержит более 6 гигабит информации в каждой цепи, что эквивалентно 800 мегабайтам и сопоставимо с количеством информации на компакт-диске[19]. Логика хранения данных в парных основаниях аналогична системе виртуализации данных RAID 1.
См. также
Примечания
- Talking glossary of genetic terms: genome (англ.). National Human Genome Research Institute. Дата обращения: 1 ноября 2012. Архивировано 4 ноября 2012 года.
- A Dictionary of genetics (англ.) / R.C.King, W.D.Stansfield, P.K.Mulligan. — 7th. — Oxford University Press, 2006. — ISBN 13978-0-19-530762-7.
- Генетика: энциклопедический словарь / Картель Н. А., Макеева Е. Н., Мезенко А. М.. — Минск: Тэхналогія, 1999. — 448 с.
- The complete sequence of a human genome | bioRxiv
- International Human Genome Sequencing Consortium. Finishing the euchromatic sequence of the human genome. (англ.) // Nature. — 2004. — Vol. 431, no. 7011. — P. 931—945. — doi:10.1038/nature03001. — PMID 15496913.
- International Human Genome Sequencing Consortium. Initial sequencing and analysis of the human genome. (англ.) // Nature. — 2001. — Vol. 409, no. 6822. — P. 860—921. — doi:10.1038/35057062. — PMID 11237011.
- «Мусорная» ДНК помогает включать гены .
- «Мусорная» ДНК играет важнейшую роль в поддержании целостности генома .
- Tjio J. H., Levan A. The chromosome number of man (англ.) // Hereditas. — 1956. — Vol. 42. — P. 1—6. — doi:10.1111/j.1601-5223.1956.tb03010.x. — PMID 345813. Первая работа с точно установленным числом хромосом у человека.
- Human Chromosome Number, здесь рассказана история подсчёта хромосом у человека
- Nei M., Xu P., Glazko G. Estimation of divergence times from multiprotein sequences for a few mammalian species and several distantly related organisms. (англ.) // Proceedings of the National Academy of Sciences of the United States of America. — 2001. — Vol. 98, no. 5. — P. 2497—2502. — doi:10.1073/pnas.051611498. — PMID 11226267.
- Loots G., Locksley R., Blankespoor C., Wang Z., Miller W., Rubin E., Frazer K. Identification of a coordinate regulator of interleukins 4, 13, and 5 by cross-species sequence comparisons. (англ.) // Science. — 2000. — Vol. 288, no. 5463. — P. 136—140. — doi:10.1126/science.288.5463.136. — PMID 10753117. Summary
- Meunier, Monique Genoscope and Whitehead announce a high sequence coverage of the Tetraodon nigroviridis genome (англ.) (недоступная ссылка). Genoscope. Дата обращения: 12 сентября 2006. Архивировано 20 августа 2002 года.
- Claverie J. Fewer genes, more noncoding RNA. (англ.) // Science. — 2005. — Vol. 309, no. 5740. — P. 1529—1530. — doi:10.1126/science.1116800. — PMID 16141064.
- Предки человека заимствовали полезные гены у вирусов
- Eugene D. Sverdlov. Retroviruses and primate evolution // BioEssays. — Vol. 22, № 2. — P. 161—171. — doi:10.1002/(SICI)1521-1878(200002)22:2<161::AID-BIES7>3.0.CO;2-X. — PMID 10655035.
- Anders L Kjeldbjerg, Palle Villesen, Lars Aagaard, Finn Skou Pedersen. Gene conversion and purifying selection of a placenta-specific ERV-V envelope gene during simian evolution // BMC Evolutionary Biology. — 2008. — Vol. 8. — P. 266. — doi:10.1186/1471-2148-8-266. — PMID 18826608.
- Деньгуб В. М., Смирнов В. Г. Единицы величин. Словарь-справочник. — М.: Издательство стандартов, 1990. — С. 25. — 240 с. — ISBN 5-7050-0118-5.
- How much information does human DNA store? - Quora
Список литературы
- Тарантул В. З. Геном человека. Энциклопедия, написанная четырьмя буквами. — Языки славянской культуры, 2003. — 396 с. — ISBN 5-94457-108-X.
- Ридли Мэтт. Геном: автобиография вида в 23 главах. — М.: Эксмо, 2008. — 432 с. — ISBN 5-699-30682-4
Ссылки
- Всеобщая декларация о геноме человека и правах человека ЮНЕСКО, 1997
- Lindblad-Toh K. et al. Genome sequence, comparative analysis and haplotype structure of the domestic dog. (англ.) // Nature. — 2005. — Vol. 438, no. 7069. — P. 803—819. — doi:10.1038/nature04338. — PMID 16341006.
- The National Human Genome Research Institute
- The National Office of Public Health Genomics