Clustal
Clustal (англ. Cluster alignment) — одна из самых широко используемых компьютерных программ для множественного выравнивания нуклеотидных и аминокислотных последовательностей[1].
Clustal Omega | |
---|---|
Тип | Биоинформатика |
Автор | Desmond G. Higgins[d] |
Разработчик | Des Higgins, Fabian Sievers, David Dineen и Andreas Wilm (Conway Institute, UCD) |
Написана на | C++ |
Операционная система | UNIX, Linux, Mac, Windows |
Последняя версия | 1.2.2 (1.07.2016) |
Лицензия | GNU GPL 2 |
Сайт | clustal.org/omega/ |
ClustalW/ClustalX | |
---|---|
Тип | Биоинформатика |
Автор | Desmond G. Higgins[d] |
Разработчик | Gibson T. (EMBL), Thompson J. (CNRS), Higgins D. (UCD) |
Написана на | C++ |
Операционная система | UNIX, Linux, Mac, Windows |
Последняя версия | 2.1 (17.11.2010) |
Лицензия | GNU GPL 2 |
Сайт | clustal.org |
Clustal использует метод попарного прогрессивного выравнивания.
Программа представлена в трех версиях:
- ClustalW — с интерфейсом командной строки[2].
- ClustalX — с графическим интерфейсом[3].
- Clustal Omega — более современная версия программы, позволяющая выравнивать сотни последовательностей в течение нескольких часов и являющаяся одной из наиболее эффективных программ для множественного выравнивания по данным тестов производительности[4]. В этой разновидности используется только интерфейс командной строки.
Несмотря на то что ClustalW и ClustalX не были первыми инструментами для множественного выравнивания, они получили широкое распространение благодаря своей широкой доступности для персональных компьютеров и интуитивно понятному пользовательскому интерфейсу.
Clustal Omega
Все современные версии Clustal базируются на Clustal Omega (ClustalΩ). Clustal Omega предоставила новую систему оценки нуклеотидных последовательностей: сначала программа выравнивает наиболее схожие последовательности, постепенно переходя к наименее схожим, тем самым создавая глобальное выравнивание. Для проведения глобального выравнивания в этой программе необходимо иметь минимум три последовательности, для парного выравнивания можно использовать EMBOSS или LALIGN[5].
Алгоритм
Сначала ClustalΩ рассчитывает приблизительную матрицу расстояний одним из двух методов:
- быстрый метод, который считает совпадение пар аминокислотных остатков или коротких нуклеотидных фрагментов (2-4 основания);
- классический алгоритм попарного выравнивания последовательностей с аффинными штрафами за пропуски.
Затем методом присоединения соседей строится направляющее дерево, на котором и будет построена глобальная сеть выравниваний. Дерево укореняется методом средней точки (mid-point)[6].
Хотя другие программы для множественного выравнивания, основанные на методе согласованности (Probcons, T-Coffee, Probalign и MAFFT), превосходят по точности Clustal Omega, они используют больше оперативной памяти и медленнее чем Clustal[7].
Clustal 2 (ClustalW/ ClustalX)
ClustalX — это версия ClustalW с графическим интерфейсом. В данном обновлении не было новых функций, однако были обновлены и улучшены старые версии, описанные выше.
ClustalX используется для следующих функций[8]:
- выполнить множественное выравнивание последовательностей;
- посмотреть на результаты выравнивания;
- внести правки, если это необходимо.
ClustalX, как и ClustalW, скомпилирована для загрузки на всех операционных системах: Linux, Mac OS X, Windows (как XP, так и Vista). Предыдущие версии по-прежнему доступны для загрузки на сайте.
Примечания
- Frédéric Dardel, François Képès. Bioinformatics: Genomics and Post-Genomics. Wiley. 2006. p.54
- Larkin M.A., Blackshields G., Brown N.P., Chenna R., McGettigan P.A., McWilliam H., Valentin F., Wallace I.M., Wilm A., Lopez R., Thompson J.D., Gibson T.J., Higgins D.G. ClustalW and ClustalX version 2 (неопр.) // Bioinformatics. — 2007. — Т. 23, № 21. — С. 2947—2948. — doi:10.1093/bioinformatics/btm404. — PMID 17846036.
- Thompson J.D., Gibson T.J., Plewniak F., Jeanmougin F., Higgins D.G. The CLUSTAL_X windows interface: flexible strategies for multiple sequence alignment aided by quality analysis tools (англ.) // Nucleic Acids Research : journal. — 1997. — Vol. 25, no. 24. — P. 4876—4882. — doi:10.1093/nar/25.24.4876. — PMID 9396791.
- Sievers F., Wilm A., Dineen D.G., Gibson T.J., Karplus K., Li W., Lopez R., McWilliam H., Remmert M., Söding J., Thompson J.D., Higgins D.G. Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega (англ.) // Mol Syst Biol 7 : journal. — 2011. — Vol. 7, no. 539. — doi:10.1038/msb.2011.75.
- LALIGN
- Григорий Мавропуло-Столяренко, Александр Тулуб, Василий Стефанов. Биоинформатика. Учебник для академического бакалавриата. — Litres, 2021-04-01. — 253 с. — ISBN 978-5-04-028650-8.
- Fabiano Sviatopolk-Mirsky Pais, Patrícia de Cássia Ruy, Guilherme Oliveira, Roney Santos Coimbra. Assessing the efficiency of multiple sequence alignment programs // Algorithms for Molecular Biology : AMB. — 2014-03-06. — Т. 9. — С. 4. — ISSN 1748-7188. — doi:10.1186/1748-7188-9-4.
- Clustal X (англ.) ?. Evolution and Genomics. Дата обращения: 6 июня 2021.
Ссылки
- Clustal Homepage (free Unix/Linux, Mac, and Windows download)
- Clustal Omega mirror at the EBI (free Unix/Linux, Mac, and Windows download)