Вычислительная геномика

Вычисли́тельная гено́мика использует вычислительный анализ, чтобы расшифровать последовательности генома и связанные с ними данные[1], включая последовательности ДНК и РНК. Также вычислительная геномика может быть определена как раздел биоинформатики, но с тем отличием, что внимание уделяется анализу полных геномов (а не отдельных генов), чтобы понять принципы того, как различные ДНК управляют организмом на молекулярном уровне[2].

История

Вычислительная геномика начала своё развитие одновременно с биоинформатикой. В 1960-х годах Маргарет Дейхофф и другие в Национальном Биомедицинском Исследовательский фонде создали базы данных различных последовательностей белков для эволюционного исследования [3]. В их исследовании строилось филогенетическое дерево, которое определило изменения, требующиеся для определенного белка, чтобы эволюционировать в другой белок. Это привело к созданию матрицы замен, которая оценивает вероятность связи одного белка с другим.

Начиная с 1980-х годов, стали появляться базы данных с геномными последовательностями, но при этом возникли новые проблемы при поиске и сравнении данных об отдельных генах. В отличие от алгоритмов поиска текстов, которые используются на веб-сайтах, при поиске генетического сходства необходимо выявлять последовательности, которые не обязательно идентичны, но и просто схожи. Это привело к появлению алгоритма Нидлмана — Вунша, который является алгоритмом динамического программирования для того, чтобы сравнить наборы последовательностей аминокислот друг с другом при использовании матриц замен, полученных в более раннем исследовании М.Дейхофф. Позже появился алгоритм BLAST, который позволяет осуществлять быстрый и оптимизированный поиск в базах данных последовательностей генов. BLAST и его модификации - одни из наиболее широко используемых алгоритмов для этой цели [4].

Появление фразы "вычислительная геномика" совпадает с появлением полных аннотированных геномов во второй половине 1990-х годов. Первая ежегодная конференции по вопросам вычислительной геномики была организована учеными из Института геномных исследований (TIGR) в 1998, обеспечивая форум для этой специальности и эффективно отличая эту область науки от более общих областей геномики или вычислительной биологии [5][6]. Впервые в научной литературе этот термин, согласно MEDLINE, был использован одним годом ранее (в журнале Nucleic Acids Research [7]).

Примечания

  1. Koonin EV (2001) Computational Genomics, National Center for Biotechnology Information, National Library of Medicine, NIH (PubMed ID: 11267880)
  2. Computational Genomics and Proteomics at MIT (недоступная ссылка). Дата обращения: 13 декабря 2010. Архивировано 22 марта 2018 года.
  3. David Mount (2000), Bioinformatics, Sequence and Genome Analysis, pp. 2-3, Cold Spring Harbor Laboratory Press, ISBN 0-87969-597-8
  4. T.A. Brown (1999), Genomes, John Wiley & Sons, ISBN 0-471-31618-0
  5. [backPid]=67&cHash=fd69079f5e Архивная копия от 7 января 2017 на Wayback Machine The 7th Annual Conference on Computational Genomics (2004)
  6. The 9th Annual Conference on Computational Genomics (2006) Архивировано 12 февраля 2007 года.
  7. A. Wagner (1997), A computational genomics approach to the identification of gene networks, Nucleic Acids Res., Sep 15;25(18):3594-604, ISSN 0305-1048
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.