Макромолекулярный докинг
Макромолекулярный докинг — это метод молекулярного моделирования четвертичной структуры комплексов, образованных двумя или более взаимодействующими биологическими макромолекулами. Чаще всего исследуются белок-белковые комплексы, реже — белок-нуклеиновые.
Конечной целью докинга является предсказание трёхмерной структуры изучаемого макромолекулярного комплекса в естественной среде. Результатом докинга является набор моделей комплекса (структур). Они могут быть ранжированы различными методами, такими как оценочная (скоровая, скоринг, скор-) функция для отбора наиболее правдоподобных (с большей долей вероятности встречающихся в организме).
Термин «докинг» или «стыковка» появился в конце 1970-х в значении моделирования стыковки двух молекул, при котором ориентация последних не менялась (менялось только положение). С увеличением компьютерных мощностей стало возможно разрешить изменение ориентации партнёров, такой вариант докинга называется «rigid docking» или докинг жёстких тел («rigid body»). Следующим шагом стал переход к «гибкому докингу» («flexible docking»), при котором изменяется внутренняя геометрия (конформация) партнёров.
Введение
Биологические роли большинства белков, описываемые тем, с какими молекулами они могут взаимодействовать известны в лучшем случае по меньшей мере неполностью. Даже белки, участвующие в хорошо изученных биологических процессах (напр. ЦТК) могут иметь неожиданных интерактантов или новые биологические функции.
В случае белок-белковых взаимодействий возникают дополнительные вопросы. Считается, что генетические заболевания (напр. муковисцидоз) вызываются неправильно свернутыми (мутированными) белками и возникает желание понять какие аномальные белок-белковые взаимодействия могут быть вызваны той или иной мутацией. Если в будущем появится возможность дизайна белков для проведения биологических функций, важно будет определить круг их возможных взаимодействий.
Для некоторого набора белков может решаться следующий спектр задач:
- Связываются ли белки in vivo?
Если связываются,
- Какую конформацию имеет белок в связанном состоянии?
- Насколько сильным можно считать их взаимодействие?
Если не связываются,
- Можно ли получить связывание путём внедрение мутаций в белки?
Для решения этих проблем может применяться белок-белковый докинг.
Более того докинг может помочь в исследовании белков с неизвестной функцией (относительно мало изученная сфера). Если нет модели пространственной структуры, её можно моделировать (см. предсказание структуры белка).
Белок-нуклеиновые взаимодействия играют важную роль в живой клетке. Транскрипционные факторы регулируют экспрессию генов, а полимеразы, которые осуществляют репликацию суть белковые комплексы, а генетический материал, с которым они связываются состоят из нуклеиновых кислот. Моделирование белок-нуклеиновых взаимодействий имеет некоторые сложности, описанные далее.
История
В 1970-х годах сложное моделирование заключалось в ручной идентификации элементов на поверхностях интерактантов (партнёров) и интерпретации последствий для связывания, функции и активности; любые компьютерные программы обычно использовались в конце процесса моделирования чтобы различать относительно немногочисленные конфигурации, которые остались после того, как были наложены все эвристические ограничения. Впервые компьютеры были использованы в исследовании взаимодействия гемоглобина в серповидно-клеточных волокнах.[1] Затем в 1978 году появилась работа с комплексом трипсин-Апротинин.[2] Компьютеры использовались для отличия «плохих» и «хороших» моделей, посредством оценочной функции. «Вознаграждалась» большая площадь интерфейса (поверхность связывания), а за перекрывающиеся участки накладывались штрафы. Компьютер использовал упрощённое представление взаимодействующих белков: каждый остаток представлялся в виде одного центра связывания. Электростатические взаимодействия, такие как водородные связи, анализировались вручную.
К началу 1990-х годов было определено больше структур комплексов, тогда как доступные вычислительные мощности значительно возросли. С появлением биоинформатики основное внимание уделялось разработке методов, применимых к произвольным интерактантам при приемлемых вычислительных затратах и в отсутствие дополнительных филогенетических или экспериментальных данных.
В 1992 году был опубликован метод[3], в котором использовалось быстрое преобразование Фурье. В этом методе имело место «грубое» представление партнёров докинга: в виде трёхмерных матриц, числа в которых соответствовали положениям атомов. Быстрое преобразование Фурье помогало находить расположение этих матриц, соответствующее контакту партнёров гораздо быстрее других методов докинга. В 1997 в этот метод стал учитывать электростатические взаимодействия.
В 1996 году были опубликованы результаты первого исследования[4], в котором шесть исследовательских групп пытались предсказать структуру комплекса бета-лактамазы TEM-1 с белком-ингибитором бета-лактамазы (BLIP). В исследовании была отмечена необходимость учёта конформационных изменений и трудности различения конформеров.
Методы
Основной механизм докинга схож с молекулярным докингом. Также применяются методы типа Монте-Карло, в которых в ходе итеративных изменений набора параметров уточняется исходная конфигурация. На каждом шаге конфигурация принимается или отвергается, исходя из значения оценочной функции.
Переход в обратное пространство
Каждый из белков может быть представлен в виде простой кубической решётки. Для моделей комплекса, переводимых друг в друга путём изменения положения белка может быть практически мгновенно вычислена некая оценочная функция применением теоремы свёртки. Можно построить осмысленные, хотя и приблизительные, «сверточные» скоринговые функции, учитывающие как стереохимические, так и электростатические взаимодействия.
Методы обратного пространства широко использовались благодаря их способности оценивать огромное количество структур. Они теряют преимущество в скорости, если имеют место торсионные изменения. Другой недостаток заключается в том, что невозможно эффективно использовать накопленные знания. Остается также вопрос, не являются ли этот метод достаточно точным для надёжного выявления структуры лучшего комплекса.
Оценочные функции (скоринг-функции)
Для поиска скора (некоторого показателя), позволяющего отличить лучшие модели была разработана специальная тестовая выборка (Benchmark, см. Ниже) белок-белковых структур. Скоры оцениваются по рангу, который они присваивают наилучшей структуре (в идеале ранжирование по скору должно вывести «экспериментально» лучшую структуру на первое место), и по их покрытию (доля контрольных случаев, для которых они достигают приемлемого результата). Скоры разделяют на несколько категорий, включающих:
- Эвристические скор-функции, основанные на экспериментальных данных о контактах аминокислотных остатков.
- Комплиментарность формы молекулярных поверхностей взаимодействующих партнёров.
- Свободные энергии, оцененные с использованием параметров из молекулярно механических силовых полей, таких как CHARMM или AMBER.
- Филогенетические подтверждение взаимодействующих областей.
- Коэффициенты кластеризации.
Обычно гибридные оценки (собственно скор-функции) создаются путём объединения одной или нескольких вышеупомянутых категорий (далее «термы» скор-функции) в взвешенную сумму, веса которой оптимизируются используя тестовые выборки (т. н. Бенчмарки). Чтобы избежать статистических искажений (biases) тестовые модели, используемые для оптимизации весов, не должны пересекаться с тестовыми моделями, используемыми для финальной проверки гибридной оценки.
В задаче белок-белкового докинга важно найти скоровую функцию, достоверно отражающую информацию об аффинности партнеров. Такая функция значительно ускорила бы развитие in silico белковой инженерии, разработку лекарств а также высокопроизводительную аннотацию интерактома (то есть какие белки связываются, а какие нет). Для оценки аффинности связывания / свободной энергии было предложено много оценочных функций.[5][6][7][8][9] Однако корреляция между экспериментально установленным сродством связывания и предсказаниями девяти популярных скор-функций оказалась почти ортогональной (R 2 ~ 0).[10][11] Было также замечено, что некоторые термы лучше коррелируют с экспериментальными энергиями связи, чем полная оценка, что позволяет предположить, что можно найти и улучшить скор-функцию, пересмотрев веса её компонентов (термов). Среди экспериментальных методов определения аффинности связывания выделяют поверхностный плазмонный резонанс (SPR), передачу энергии резонанса Фёрстера, методы с применением радиолигандов, калориметрия изотермического титрования (ITC), микроскопический термофорез (MST) или спектроскопические измерения и другие методы флуоресценции. Информация из научных статей также может служить хорошим источником для улучшения скоринга.[12]
Тестовые выборки (Бенчмарки)
Для тестирования методов докинга была сделана тестовая выборка (Бенчмарк) из 84 структур белок-белковых комплексов.[13] Структуры в тестовой выборке специально подобраны так, что охватывают широкий спектр типов взаимодействий, и максимально разнородны (содержат как можно меньше повторяющихся особенностей, таких как профили семейств партнёров в базе данных SCOP). Тестовые элементы подразделяются на три уровня сложности (самый сложный содержит наибольшее изменение конформации остова). Примерами тестовых моделей для белок-белкового докинга могут служить структуры фермент-ингибитор, антиген-антитело и гомомультимерные комплексы.
Новейшая версия бенчмарка для белок-белкового докинга состоит из 230 комплексов,[14] а для ДНК-белкового — из 47.[15] Новейшая тестовая выборка на РНК-белковый докинг включает 126 элементов.[16] Существуют объединенные тестовые выборки, насчитывающие 209 комплексов.[17]
Тестовая выборка для оценки аффинности была основана на тестовой выбоке для белок-белкового докинга.[10] В неё были включены 81 белок-белковых комплекса с экспериментально измеренной аффинностью. Эти комплексы охватывают 11 порядков по значению аффинности.
Эта выборка была в дальнейшем подвергнута экспертной оценке и значительно расширена.[18] Новая тестовая выборка включает белки с различными биологическими функциями. В её состав входят G-белки и внеклеточные домены рецепторов, а также комплексы антиген / антитело, фермент / ингибитор и фермент / субстрат. Она также разнообразна с точки зрения аффинности партнёров друг к другу, с K d в диапазоне от 10 −5 до 10 −14 M. Девять элементов представляют собой близкородственные комплексы, которые имеют сходную структуру, но очень различную аффинность. Поскольку известны структуры компонентов комплекса по отдельности, можно оценить изменения конформации партнёров при его образовании. В большинстве комплексов они весьма значительны. Данная тестовая выбока может применяться и для биофизических моделей, направленных на установление связи аффинности со структурой в белок-белковых взаимодействиях, учитывая данные о реагентах и их конформационных изменениях, а не только о продукте (комплексе).[18]
CAPRI
CAPRI (англ. Critical Assessment of PRediction of Interactions, критическая оценка предсказания взаимодействий)[19] — это регулярно проводимые мероприятия, в ходе которых исследователям по всему миру предлагается получить структуру белок-белкового комплекса если даны только структуры реагентов методом докинга. Мероприятия (раунды) проходят примерно каждые 6 месяцев. Во время каждого тура участником даются структуры реагентов комплекса, структура которого была недавно определена экспериментально. Координаты комплекса хранятся в тайне. Оценка CAPRI является двойным слепым методом, так как участники не знают структуры комплекса, а организаторы не знают кто из участников предложил конкретную модель комплекса.
В настоящее время CAPRI обретает популярность (37 групп приняли участие во всем мире в седьмом раунде). Несмотря на то, что результаты CAPRI имеют небольшое статистическое значение из-за небольшого количества целей в каждом раунде, роль CAPRI является весьма значительной. Оценка CASP является аналогичным упражнением в области предсказания структуры белка.
См. также
- Молекулярный докинг — докинг небольших молекул
Примечания
- C. Levinthal, S. J. Wodak, P. Kahn, A. K. Dadivanian. Hemoglobin interaction in sickle cell fibers. I: Theoretical approaches to the molecular contacts. (англ.) // Proceedings of the National Academy of Sciences. — National Academy of Sciences, 1975-04-01. — Vol. 72, iss. 4. — P. 1330—1334. — ISSN 1091-6490 0027-8424, 1091-6490. — doi:10.1073/pnas.72.4.1330.
- Shoshana J. Wodak, Joël Janin. Computer analysis of protein-protein interaction // Journal of Molecular Biology. — 1978-09. — Т. 124, вып. 2. — С. 323—342. — ISSN 0022-2836. — doi:10.1016/0022-2836(78)90302-9.
- E. Katchalski-Katzir, I. Shariv, M. Eisenstein, A. A. Friesem, C. Aflalo. Molecular surface recognition: determination of geometric fit between proteins and their ligands by correlation techniques. (англ.) // Proceedings of the National Academy of Sciences. — National Academy of Sciences, 1992-03-15. — Vol. 89, iss. 6. — P. 2195—2199. — ISSN 1091-6490 0027-8424, 1091-6490. — doi:10.1073/pnas.89.6.2195.
- N.C.J. Strynadka, M. Eisenstein, E. Katchalski-Katzir, B.K. Shoichet, I.D. Kuntz. Molecular docking programs successfully predict the binding of a β-lactamase inhibitory protein to TEM-1 β-lactamase // Nature Structural Biology. — 1996-03. — Т. 3, вып. 3. — С. 233—239. — ISSN 1072-8368. — doi:10.1038/nsb0396-233.
- Gray JJ, Moughon S, Wang C, Schueler-Furman O, Kuhlman B, Rohl CA, Baker D (2003). “Protein–protein docking with simultaneous optimization of rigid-body displacement and side-chain conformations”. J. Mol. Biol. 331 (1): 281—299. DOI:10.1016/S0022-2836(03)00670-3. PMID 12875852.
- Camacho C. J., Vajda S. Protein docking along smooth association pathways (англ.) // Proceedings of the National Academy of Sciences of the United States of America : journal. — 2008. — Vol. 98, no. 19. — P. 10636—10641. — doi:10.1073/pnas.181147798. — PMID 11517309.
- Camacho C. J., Vajda S. In silico screening of mutational effects on enzyme-proteic inhibitor affinity: a docking-based approach (англ.) // BMC Structural Biology : journal. — 2007. — Vol. 7. — P. 37. — doi:10.1186/1472-6807-7-37. — PMID 17559675.
- Zhang C., Liu S., Zhu Q., Zhou Y. A knowledge-based energy function for protein–ligand, protein–protein, and protein–DNA complexes (англ.) // Journal of Medicinal Chemistry : journal. — 2005. — Vol. 48, no. 7. — P. 2325—2335. — doi:10.1021/jm049314d. — PMID 15801826.
- Esmaielbeiki R., Nebel J. C. Scoring docking conformations using predicted protein interfaces (англ.) // BMC Bioinformatics : journal. — 2014. — Vol. 15. — P. 171. — doi:10.1186/1471-2105-15-171. — PMID 24906633.
- Kastritis P. L., Bonvin A. M. Are scoring functions in protein–protein docking ready to predict interactomes? Clues from a novel binding affinity benchmark (англ.) // J. Proteome Res. : journal. — 2010. — May (vol. 9, no. 5). — P. 2216—2225. — doi:10.1021/pr9009854. — PMID 20329755.
- Rosato A., Fuentes G., Verma C. Faculty of 1000 Biology: evaluations for Kastritis PL & Bonvin AM J Proteome Res 2010 May 7 9 (5) :2216-25 (англ.) // Faculty of 1000 Biology : journal. — 2010. — Vol. 9, no. 5. — P. 2216—2225. — doi:10.1021/pr9009854. — PMID 20329755.
- Badal, V. D., Kundrotas, P. J., Vakser, I. A. Natural language processing in text mining for structural modeling of protein complexes (англ.) // BMC Bioinformatics : journal. — 2018. — Vol. 19, no. 1. — P. 84. — doi:10.1186/s12859-018-2079-4. — PMID 29506465.
- Mintseris J., Wiehe K., Pierce B., Anderson R., Chen R., Janin J., Weng Z. Protein-Protein Docking Benchmark 2.0: an update (неопр.) // Proteins. — 2005. — Т. 60, № 2. — С. 214—216. — doi:10.1002/prot.20560. — PMID 15981264.
- Vreven T., Moal I. H., Vangone A., Pierce B. G., Kastritis P. L., Torchala M., Chaleil R., Jiménez-García B., Bates P. A., Fernandez-Recio J., Bonvin A. M., Weng Z. Updates to the Integrated Protein-Protein Interaction Benchmarks: Docking Benchmark Version 5 and Affinity Benchmark Version 2 (англ.) // Journal of Molecular Biology : journal. — 2015. — September (vol. 427, no. 19). — P. 3031—3041. — doi:10.1016/j.jmb.2015.07.016. — PMID 26231283.
- van Dijk M., Bonvin A. M. A protein-DNA docking benchmark (англ.) // Nucleic Acids Research : journal. — 2008. — August (vol. 36, no. 14). — P. e88. — doi:10.1093/nar/gkn386. — PMID 18583363.
- Nithin C., Mukherjee S., Bahadur R. P. A non-redundant protein-RNA docking benchmark version 2.0 (англ.) // Proteins : journal. — 2016. — November (vol. 85, no. 2). — P. 256—267. — doi:10.1002/prot.25211. — PMID 27862282.
- Nithin, Chandran; Ghosh, Pritha; Bujnicki, Janusz; Nithin, Chandran; Ghosh, Pritha; Bujnicki, Janusz M. Bioinformatics Tools and Benchmarks for Computational Docking and 3D Structure Prediction of RNA-Protein Complexes (англ.) // Genes : journal. — 2018. — 25 August (vol. 9, no. 9). — P. 432. — doi:10.3390/genes9090432. — PMID 30149645.
- Kastritis P. L., Moal I. H., Hwang H., Weng Z., Bates P. A., Bonvin A. M., Janin J. A structure-based benchmark for protein-protein binding affinity (англ.) // Protein Science : journal. — 2011. — March (vol. 20, no. 3). — P. 482—491. — doi:10.1002/pro.580. — PMID 21213247.
- Janin J., Henrick K., Moult J., Eyck L. T., Sternberg M. J., Vajda S., Vakser I., Wodak S. J. CAPRI: a Critical Assessment of PRedicted Interactions (англ.) // Proteins : journal. — 2003. — Vol. 52, no. 1. — P. 2—9. — doi:10.1002/prot.10381. — PMID 12784359.