Clustal

Clustal (англ. Cluster alignment) — одна из самых широко используемых компьютерных программ для множественного выравнивания нуклеотидных и аминокислотных последовательностей[1].

Clustal Omega
Тип Биоинформатика
Автор Desmond G. Higgins[d]
Разработчик Des Higgins, Fabian Sievers, David Dineen и Andreas Wilm (Conway Institute, UCD)
Написана на C++
Операционная система UNIX, Linux, Mac, Windows
Последняя версия 1.2.2 (1.07.2016)
Лицензия GNU GPL 2
Сайт clustal.org/omega/
ClustalW/ClustalX
Тип Биоинформатика
Автор Desmond G. Higgins[d]
Разработчик Gibson T. (EMBL), Thompson J. (CNRS), Higgins D. (UCD)
Написана на C++
Операционная система UNIX, Linux, Mac, Windows
Последняя версия 2.1 (17.11.2010)
Лицензия GNU GPL 2
Сайт clustal.org

Clustal использует метод попарного прогрессивного выравнивания.

Программа представлена в трех версиях:

  • ClustalW — с интерфейсом командной строки[2].
  • ClustalX — с графическим интерфейсом[3].
  • Clustal Omega — более современная версия программы, позволяющая выравнивать сотни последовательностей в течение нескольких часов и являющаяся одной из наиболее эффективных программ для множественного выравнивания по данным тестов производительности[4]. В этой разновидности используется только интерфейс командной строки.

Несмотря на то что ClustalW и ClustalX не были первыми инструментами для множественного выравнивания, они получили широкое распространение благодаря своей широкой доступности для персональных компьютеров и интуитивно понятному пользовательскому интерфейсу.

Clustal Omega

Все современные версии Clustal базируются на Clustal Omega (ClustalΩ). Clustal Omega предоставила новую систему оценки нуклеотидных последовательностей: сначала программа выравнивает наиболее схожие последовательности, постепенно переходя к наименее схожим, тем самым создавая глобальное выравнивание. Для проведения глобального выравнивания в этой программе необходимо иметь минимум три последовательности, для парного выравнивания можно использовать EMBOSS или LALIGN[5].

Алгоритм

Сначала ClustalΩ рассчитывает приблизительную матрицу расстояний одним из двух методов:

  • быстрый метод, который считает совпадение пар аминокислотных остатков или коротких нуклеотидных фрагментов (2-4 основания);
  • классический алгоритм попарного выравнивания последовательностей с аффинными штрафами за пропуски.

Затем методом присоединения соседей строится направляющее дерево, на котором и будет построена глобальная сеть выравниваний. Дерево укореняется методом средней точки (mid-point)[6].

Хотя другие программы для множественного выравнивания, основанные на методе согласованности (Probcons, T-Coffee, Probalign и MAFFT), превосходят по точности Clustal Omega, они используют больше оперативной памяти и медленнее чем Clustal[7].

Clustal 2 (ClustalW/ ClustalX)

ClustalX — это версия ClustalW с графическим интерфейсом. В данном обновлении не было новых функций, однако были обновлены и улучшены старые версии, описанные выше.

ClustalX используется для следующих функций[8]:

  • выполнить множественное выравнивание последовательностей;
  • посмотреть на результаты выравнивания;
  • внести правки, если это необходимо.

ClustalX, как и ClustalW, скомпилирована для загрузки на всех операционных системах: Linux, Mac OS X, Windows (как XP, так и Vista). Предыдущие версии по-прежнему доступны для загрузки на сайте.

Примечания

  1. Frédéric Dardel, François Képès. Bioinformatics: Genomics and Post-Genomics. Wiley. 2006. p.54
  2. Larkin M.A., Blackshields G., Brown N.P., Chenna R., McGettigan P.A., McWilliam H., Valentin F., Wallace I.M., Wilm A., Lopez R., Thompson J.D., Gibson T.J., Higgins D.G. ClustalW and ClustalX version 2 (неопр.) // Bioinformatics. — 2007. Т. 23, № 21. С. 2947—2948. doi:10.1093/bioinformatics/btm404. PMID 17846036.
  3. Thompson J.D., Gibson T.J., Plewniak F., Jeanmougin F., Higgins D.G. The CLUSTAL_X windows interface: flexible strategies for multiple sequence alignment aided by quality analysis tools (англ.) // Nucleic Acids Research : journal. — 1997. Vol. 25, no. 24. P. 4876—4882. doi:10.1093/nar/25.24.4876. PMID 9396791.
  4. Sievers F., Wilm A., Dineen D.G., Gibson T.J., Karplus K., Li W., Lopez R., McWilliam H., Remmert M., Söding J., Thompson J.D., Higgins D.G. Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega (англ.) // Mol Syst Biol 7 : journal. — 2011. Vol. 7, no. 539. doi:10.1038/msb.2011.75.
  5. LALIGN
  6. Григорий Мавропуло-Столяренко, Александр Тулуб, Василий Стефанов. Биоинформатика. Учебник для академического бакалавриата. — Litres, 2021-04-01. — 253 с. — ISBN 978-5-04-028650-8.
  7. Fabiano Sviatopolk-Mirsky Pais, Patrícia de Cássia Ruy, Guilherme Oliveira, Roney Santos Coimbra. Assessing the efficiency of multiple sequence alignment programs // Algorithms for Molecular Biology : AMB. — 2014-03-06. Т. 9. С. 4. ISSN 1748-7188. doi:10.1186/1748-7188-9-4.
  8. Clustal X (англ.) ?. Evolution and Genomics. Дата обращения: 6 июня 2021.

Ссылки

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.