Макромолекулярный стыковка
Макромолекулярный докинг — это компьютерное моделирование четвертичной структуры комплексов, образованных двумя или более взаимодействующими биологическими макромолекулами . белок Наиболее часто объектами такого моделирования являются -белковые комплексы, за которыми следуют комплексы белок- нуклеиновая кислота .
Конечная цель докинга — предсказание трехмерной структуры интересующего макромолекулярного комплекса, какой она будет в живом организме. Сама по себе стыковка создает только правдоподобные структуры-кандидаты. Этих кандидатов необходимо ранжировать с использованием таких методов, как оценочные функции , чтобы идентифицировать структуры, которые с наибольшей вероятностью встречаются в природе.
Термин «стыковка» возник в конце 1970-х годов и имел более ограниченное значение; затем «стыковка» означала уточнение модели сложной структуры путем оптимизации разделения между взаимодействующими сторонами, но с сохранением их относительной ориентации фиксированной. Позже относительную ориентацию взаимодействующих партнеров при моделировании разрешили варьировать, но внутренняя геометрия каждого из партнеров сохранялась фиксированной. Этот тип моделирования иногда называют «жесткой стыковкой». При дальнейшем увеличении вычислительной мощности стало возможным моделировать изменения внутренней геометрии взаимодействующих партнеров, которые могут произойти при формировании комплекса. Этот тип моделирования называется «гибкой стыковкой».
Фон
[ редактировать ]Биологическая макромолекулами роль большинства белков, характеризуемая тем, с какими другими они взаимодействуют , известна в лучшем случае неполно. Даже те белки, которые участвуют в хорошо изученном биологическом процессе (например, цикле Кребса ), могут иметь неожиданных партнеров по взаимодействию или функции , не связанные с этим процессом.
В случаях известных белок-белковых взаимодействий возникают другие вопросы. Известно, что генетические заболевания (например, муковисцидоз ) вызываются неправильно свернутыми или мутировавшими белками, и существует желание понять, какие аномальные белок-белковые взаимодействия, если таковые имеются, может вызвать данная мутация. В отдаленном будущем белки могут быть созданы для выполнения биологических функций, и определение потенциальных взаимодействий таких белков будет иметь важное значение.
Для любого данного набора белков с точки зрения технологии или естествознания могут представлять интерес следующие вопросы:
- Связываются ли эти белки in vivo ?
Если они связывают,
- Какую пространственную конфигурацию они принимают в связанном состоянии ?
- Насколько сильно или слабо их взаимодействие?
Если они не связывают,
- Можно ли заставить их связываться, вызывая мутацию?
В конечном итоге предполагается, что стыковка белков с белками решит все эти проблемы. Более того, поскольку методы докинга могут быть основаны на чисто физических принципах, можно докингировать даже белки с неизвестной функцией (или которые изучены относительно мало). Единственным условием является то, чтобы их молекулярная структура была либо определена экспериментально, либо могла быть оценена с помощью метода прогнозирования структуры белка .
Взаимодействия белок-нуклеиновая кислота играют важную роль в живой клетке. Факторы транскрипции , регулирующие экспрессию генов , и полимеразы , катализирующие репликацию , состоят из белков, а генетический материал, с которым они взаимодействуют, состоит из нуклеиновых кислот. Моделирование комплексов белок-нуклеиновая кислота представляет собой ряд уникальных задач, описанных ниже.
История
[ редактировать ]В 1970-х годах сложное моделирование вращалось вокруг ручного определения особенностей на поверхностях взаимодействий и интерпретации последствий для связывания, функций и активности; любые компьютерные программы обычно использовались в конце процесса моделирования, чтобы различать относительно небольшое количество конфигураций, оставшихся после наложения всех эвристических ограничений. Первое использование компьютеров было связано с исследованием взаимодействия гемоглобина в серповидноклеточных волокнах. [1] За этим последовала в 1978 году работа над комплексом трипсин - BPTI . [2] Компьютеры различали хорошие и плохие модели, используя функцию оценки, которая вознаграждала большую площадь интерфейса и пары молекул, находящихся в контакте, но не занимающих одно и то же пространство. Компьютер использовал упрощенное представление взаимодействующих белков с одним центром взаимодействия для каждого остатка. Благоприятные электростатические взаимодействия, включая водородные связи , были выявлены вручную. [3]
В начале 1990-х годов было определено больше структур комплексов, и доступная вычислительная мощность существенно возросла. С появлением биоинформатики акцент сместился на разработку обобщенных методов, которые можно было бы применять к произвольному набору комплексов при приемлемых вычислительных затратах. Предполагалось, что новые методы будут применяться даже при отсутствии филогенетических или экспериментальных данных; любое конкретное предварительное знание все еще может быть введено на этапе выбора между выходными моделями самого высокого ранга или оформлено как входные данные, если алгоритм это учитывает.В 1992 году был опубликован корреляционный метод. [4] алгоритм, который использовал быстрое преобразование Фурье , чтобы обеспечить значительно улучшенную масштабируемость для оценки грубой дополнительности форм в моделях твердого тела. В 1997 году оно было расширено и теперь охватывает грубую электростатику. [5]
В 1996 году были опубликованы результаты первого слепого исследования. [6] в котором шесть исследовательских групп попытались предсказать сложную структуру бета-лактамазы TEM-1 с белком-ингибитором бета-лактамазы (BLIP). Это упражнение привлекло внимание к необходимости учета конформационных изменений и сложности различения конформеров. Он также послужил прототипом серии оценок CAPRI, которая дебютировала в 2001 году. [ нужна ссылка ]
Стыковка твердого тела против . гибкая стыковка
[ редактировать ]Если валентные углы, длины связей и углы кручения компонентов не изменяются ни на одном этапе комплексного образования, это называется стыковкой твердого тела . Предметом спекуляций является вопрос о том, достаточно ли хороша стыковка твердого тела для большинства стыковок. Когда во время образования комплекса происходят существенные конформационные изменения внутри компонентов, стыковка твердого тела недостаточна. Однако оценка всех возможных конформационных изменений является непомерно дорогостоящей с точки зрения компьютерного времени. Процедуры стыковки, которые допускают конформационные изменения, или гибкие процедуры стыковки , должны разумно выбирать для рассмотрения небольшое подмножество возможных конформационных изменений.
Методы
[ редактировать ]Для успешной стыковки необходимы два критерия:
- Формирование набора конфигураций, который достоверно включает хотя бы одну почти правильную.
- Надежное различение почти правильных конфигураций от остальных.
Для многих взаимодействий сайт связывания известен на одном или нескольких белках, подлежащих стыковке. Это относится и к антителам , и к конкурентным ингибиторам . В других случаях место связывания может быть убедительно подтверждено мутагенными или филогенетическими данными. Конфигурации, в которых белки сильно проникают друг в друга, также могут быть исключены априори .
После исключения на основе предварительных знаний или стереохимического столкновения оставшееся пространство возможных сложных структур должно быть отобрано исчерпывающе, равномерно и с достаточным охватом, чтобы гарантировать близкое совпадение. Каждая конфигурация должна быть оценена по показателю, позволяющему поставить почти правильную структуру выше как минимум 100 000 альтернатив. Это трудоемкая вычислительная задача, и для ее решения было разработано множество стратегий.
Методы обратного пространства
[ редактировать ]Каждый из белков можно представить в виде простой кубической решетки. Тогда для класса оценок, которые являются дискретными свертками , конфигурации, связанные друг с другом путем трансляции одного белка точным вектором решетки, могут быть оценены почти одновременно, применяя теорему о свертке . [4] Можно построить разумные, хотя и приблизительные, оценочные функции, подобные свертке, представляющие как стереохимическую, так и электростатическую пригодность.
Методы обратного пространства широко использовались благодаря их способности оценивать огромное количество конфигураций. Они теряют свое преимущество в скорости, если вводятся изменения в кручении. Еще одним недостатком является невозможность эффективного использования предшествующих знаний. Остается также вопрос, являются ли свертки слишком ограниченным классом оценочных функций, чтобы надежно идентифицировать лучший комплекс.
Методы Монте-Карло
[ редактировать ]В Монте-Карло первоначальная конфигурация уточняется путем выполнения случайных шагов, которые принимаются или отклоняются в зависимости от вызванного ими улучшения оценки (см. критерий Метрополиса ), пока не будет опробовано определенное количество шагов. Предполагается, что сходимость к лучшей структуре должна происходить из большого класса начальных конфигураций, из которых необходимо учитывать только одну. Первоначальные конфигурации могут быть выбраны грубо, что позволяет сэкономить много времени на вычисления. Из-за сложности нахождения оценочной функции, которая одновременно хорошо различает правильную конфигурацию и сходится к правильной конфигурации на расстоянии, было предложено использовать два уровня уточнения с разными оценочными функциями. [7] Кручение может быть естественным образом введено в метод Монте-Карло как дополнительное свойство каждого случайного хода.
Методы Монте-Карло не гарантируют исчерпывающего поиска, поэтому лучшая конфигурация может быть упущена даже при использовании оценочной функции, которая теоретически ее идентифицирует. Насколько серьезна эта проблема для стыковки, точно не установлено.
Оценка
[ редактировать ]Функции оценки
[ редактировать ]Чтобы найти оценку, которая формирует устойчивую основу для выбора лучшей конфигурации, проводятся исследования по стандартному эталону (см. Ниже) случаев белок-белкового взаимодействия. Функции оценки оцениваются по рангу, который они присваивают лучшей структуре (в идеале лучшая структура должна иметь рейтинг 1), и по их охвату (доля эталонных случаев, для которых они достигают приемлемого результата).Типы изучаемых оценок включают в себя:
- Эвристические оценки, основанные на контактах остатков .
- Дополнительность формы молекулярных поверхностей («стереохимия»).
- Свободные энергии, оцененные с использованием параметров молекулярной механики, силовых полей таких как CHARMM или AMBER .
- Филогенетическая желательность взаимодействующих регионов.
- Коэффициенты кластеризации.
- Информационные сигналы.
Обычно гибридные оценки создаются путем объединения одной или нескольких категорий, указанных выше, во взвешенную сумму, веса которой оптимизированы для случаев из эталонного теста. Чтобы избежать систематической ошибки, контрольные случаи, используемые для оптимизации весов, не должны пересекаться со случаями, используемыми для окончательной проверки оценки.
Конечная цель докинга между белками — выбрать идеальное решение для ранжирования в соответствии со схемой оценки, которая также даст представление о сродстве комплекса. Такая разработка будет способствовать развитию кремниевой белковой инженерии , компьютерному дизайну лекарств и/или высокопроизводительному аннотированию того, какие белки связываются, а какие нет (аннотация интерактома ) . Для прогнозирования сродства связывания/свободной энергии было предложено несколько оценочных функций. [7] [8] [9] [10] [11] Однако корреляция между экспериментально определенной аффинностью связывания и предсказаниями девяти часто используемых оценочных функций оказалась почти ортогональной (R 2 ~ 0). [12] Было также замечено, что некоторые компоненты алгоритмов оценки могут демонстрировать лучшую корреляцию с экспериментальными энергиями связи, чем полная оценка, что позволяет предположить, что значительно лучшая производительность может быть получена путем объединения соответствующих вкладов от различных алгоритмов оценки. Экспериментальными методами определения сродства связывания являются: поверхностный плазмонный резонанс (SPR), резонансный перенос энергии Фёрстера , методы на основе радиолигандов , изотермическая титровальная калориметрия (ITC), микромасштабный термофорез (MST) или спектроскопические измерения и другие методы флуоресценции. Текстовая информация из научных статей может дать полезные подсказки для оценки. [13]
Тесты
[ редактировать ]Для тестирования методов стыковки был разработан эталон из 84 белок-белковых взаимодействий с известными комплексными структурами. [14] Набор выбран так, чтобы охватить широкий спектр типов взаимодействий и избежать повторения функций, таких как профиль структурных семейств интеракторов по базе данных SCOP . Контрольные элементы подразделяются на три уровня сложности (наиболее сложный, содержащий наибольшее изменение конформации остова). Тест белок-белкового стыковки содержит примеры комплексов фермент-ингибитор, антиген-антитело и гомомультимерных комплексов.
Последняя версия бенчмарка белок-белкового докинга состоит из 230 комплексов. [15] Тест стыковки белка и ДНК состоит из 47 тестовых случаев. [16] Эталон стыковки белка и РНК был составлен как набор данных из 45 неповторяющихся тестовых случаев. [17] с комплексами, решенными только с помощью рентгеновской кристаллографии , а также расширенным набором данных из 71 тестового примера со структурами, полученными в результате моделирования гомологии . также [18] Тест белок-РНК был обновлен и теперь включает в себя больше структур, решенных с помощью рентгеновской кристаллографии , и теперь он состоит из 126 тестовых случаев. [19] Тесты имеют объединенный набор данных из 209 комплексов. [20]
Тест на аффинность связывания был основан на тесте стыковки белок-белок. [12] Включен 81 белок-белковый комплекс с известным экспериментальным сродством; эти комплексы охватывают более 11 порядков сродства. Каждая запись эталонного теста включает несколько биохимических параметров, связанных с экспериментальными данными, а также метод, используемый для определения сродства. Этот критерий использовался для оценки степени, в которой оценочные функции могут также предсказывать сродство макромолекулярных комплексов.
Этот эталонный показатель был подвергнут экспертной оценке и значительно расширен. [21] Новый набор разнообразен с точки зрения выполняемых им биологических функций: в него входят комплексы, включающие G-белки и внеклеточные домены рецепторов, а также комплексы антиген/антитело, фермент/ингибитор и фермент/субстрат. Он также разнообразен по степени близости партнеров друг к другу: K d колеблется от 10 −5 и 10 −14 М. Девять пар записей представляют собой близкородственные комплексы, имеющие сходную структуру, но совершенно разное родство, причем каждая пара включает родственную и неродственную сборку. При наличии несвязанных структур составляющих белков можно оценить конформационные изменения. Они значительны в большинстве комплексов, часто наблюдаются большие перемещения или переходы из беспорядка в порядок. Набор можно использовать для сравнения биофизических моделей, стремящихся связать сродство со структурой в межбелковых взаимодействиях, принимая во внимание реагенты и конформационные изменения, которые сопровождают реакцию ассоциации, а не только конечный продукт. [21]
Оценка CAPRI
[ редактировать ]Критическая оценка прогнозирования взаимодействий [22] представляет собой непрерывную серию мероприятий, в которых исследователи всего сообщества пытаются стыковать одни и те же белки, предоставленные экспертами. Раунды проводятся примерно каждые 6 месяцев. Каждый раунд содержит от одного до шести целевых белок-белковых комплексов, структура которых недавно определена экспериментально. Координаты и хранятся в частном порядке у экспертов при содействии структурных биологов, которые их определили. Оценка представленных материалов является двойной слепой .
CAPRI привлекает высокий уровень участия (37 групп со всего мира приняли участие в седьмом раунде) и высокий уровень интереса со стороны биологического сообщества в целом. Хотя результаты CAPRI имеют небольшую статистическую значимость из-за небольшого количества целей в каждом раунде, роль CAPRI в стимулировании дискурса значительна. ( Оценка CASP представляет собой аналогичное мероприятие в области прогнозирования структуры белка).
См. также
[ редактировать ]- Биомолекулярный комплекс – любой биологический комплекс белка, РНК, ДНК (иногда содержит липиды и углеводы).
- Докинг (молекулярный) - стыковка небольших молекул с белками.
Ссылки
[ редактировать ]- ^ Левинталь С., Водак С.Дж., Кан П., Дадиванян А.К. (1975). «Взаимодействия гемоглобина в серповидноклеточных волокнах: I. Теоретические подходы к молекулярным контактам» . Труды Национальной академии наук . 72 (4): 1330–1334. Бибкод : 1975PNAS...72.1330L . дои : 10.1073/pnas.72.4.1330 . ПМЦ 432527 . ПМИД 1055409 .
- ^ Водак С.Дж., Джанин Дж. (1978). «Компьютерный анализ белок-белковых взаимодействий». Журнал молекулярной биологии . 124 (2): 323–342. дои : 10.1016/0022-2836(78)90302-9 . ПМИД 712840 .
- ^ Водак С.Дж., Де Кромбрюг М., Джанин Дж. (1987). «Компьютерные исследования взаимодействий между макромолекулами» . Прогресс биофизики и молекулярной биологии . 49 (1): 29–63. дои : 10.1016/0079-6107(87)90008-3 . ПМИД 3310103 .
- ^ Jump up to: а б Качальски-Кацир Е, Шарив И, Эйзенштейн М, Фризем А.А., Афлало С, Ваксер И.А. (1992). «Распознавание молекулярной поверхности: определение геометрического соответствия между белками и их лигандами с помощью методов корреляции» . Учеб. Натл. акад. наук. США . 89 (6): 2195–2199. Бибкод : 1992PNAS...89.2195K . дои : 10.1073/pnas.89.6.2195 . ПМК 48623 . ПМИД 1549581 .
- ^ Габб Х.А., Джексон Р.М., Штернберг М.Дж. (сентябрь 1997 г.). «Моделирование стыковки белков с использованием комплементарности формы, электростатики и биохимической информации». Дж. Мол. Биол . 272 (1): 106–120. дои : 10.1006/jmbi.1997.1203 . ПМИД 9299341 .
- ^ Стринадка Н.К., Эйзенштейн М., Качальски-Кацир Е., Шойхет Б.К., Кунц И.Д., Абагян Р., Тотров М., Джанин Дж., Черфилс Дж., Циммерман Ф., Олсон А., Дункан Б., Рао М., Джексон Р., Штернберг М., Джеймс М.Н. ( 1996). «Программы молекулярного стыковки успешно прогнозируют связывание белка, ингибирующего бета-лактамазу, с бета-лактамазой TEM-1». Структурная и молекулярная биология природы . 3 (3): 233–239. дои : 10.1038/nsb0396-233 . ПМИД 8605624 . S2CID 40212654 .
- ^ Jump up to: а б Грей Джей-Джей, Мугон С., Ван С., Шуелер-Фурман О, Кульман Б., Рол К.А., Бейкер Д. (2003). «Стыковка белков с белками с одновременной оптимизацией смещения твердого тела и конформации боковой цепи». Дж. Мол. Биол . 331 (1): 281–299. дои : 10.1016/S0022-2836(03)00670-3 . ПМИД 12875852 .
- ^ Камачо CJ, Вайда С (2008). «Стыковка белков по плавным путям ассоциации» . Труды Национальной академии наук . 98 (19): 10636–10641. дои : 10.1073/pnas.181147798 . ПМК 58518 . ПМИД 11517309 .
- ^ Камачо CJ, Вайда С (2007). «In silico скрининг мутационных эффектов на сродство фермент-протеинового ингибитора: подход, основанный на докинге» . BMC Структурная биология . 7:37 . дои : 10.1186/1472-6807-7-37 . ЧВК 1913526 . ПМИД 17559675 .
- ^ Чжан С., Лю С., Чжу Ц., Чжоу Ю. (2005). «Обоснованная на знаниях энергетическая функция для комплексов белок-лиганд, белок-белок и белок-ДНК». Журнал медицинской химии . 48 (7): 2325–2335. дои : 10.1021/jm049314d . ПМИД 15801826 .
- ^ Эсмаэльбейки Р., Небель Дж.К. (2014). «Оценка конформаций стыковки с использованием предсказанных интерфейсов белков» . БМК Биоинформатика . 15 : 171. дои : 10.1186/1471-2105-15-171 . ПМК 4057934 . ПМИД 24906633 .
- ^ Jump up to: а б Кастритис П.Л., Бонвин А.М. (май 2010 г.). «Готовы ли оценочные функции при стыковке белков с белками предсказать интерактомы? Подсказки из нового теста аффинности связывания». J. Протеом Рез . 9 (5): 2216–2225. дои : 10.1021/pr9009854 . hdl : 1874/202590 . ПМИД 20329755 .
- ^ Бадал В.Д., Кундротас П.Я., Ваксер И.А. (2018). «Обработка естественного языка при интеллектуальном анализе текста для структурного моделирования белковых комплексов» . БМК Биоинформатика . 19 (1): 84. дои : 10.1186/s12859-018-2079-4 . ПМЦ 5838950 . ПМИД 29506465 .
- ^ Минцерис Дж., Вие К., Пирс Б., Андерсон Р., Чен Р., Джанин Дж., Венг З. (2005). «Бенчмарк стыковки белков и белков 2.0: обновление». Белки . 60 (2): 214–216. дои : 10.1002/прот.20560 . ПМИД 15981264 . S2CID 24049376 .
- ^ Вревен Т., Моал И.Х., Вангоне А., Пирс Б.Г., Кастритис П.Л., Торчала М., Чалейл Р., Хименес-Гарсиа Б., Бейтс П.А., Фернандес-Ресио Дж., Бонвин А.М., Венг З. (сентябрь 2015 г.). «Обновления интегрированных тестов белок-белкового взаимодействия: тест стыковки версии 5 и тест аффинности версии 2» . Журнал молекулярной биологии . 427 (19): 3031–41. дои : 10.1016/j.jmb.2015.07.016 . ПМЦ 4677049 . ПМИД 26231283 .
- ^ ван Дейк М., Бонвин А.М. (август 2008 г.). «Эталон стыковки белка и ДНК» . Исследования нуклеиновых кислот . 36 (14): е88. дои : 10.1093/нар/gkn386 . ПМК 2504314 . ПМИД 18583363 .
- ^ Барик А., CN, премьер-министр, Бахадур Р.П. (июль 2012 г.). «Эталон стыковки белка и РНК (I): неизбыточные случаи». Белки . 80 (7): 1866–71. дои : 10.1002/прот.24083 . ПМИД 22488669 . S2CID 437472 .
- ^ Перес-Кано Л., Хименес-Гарсия Б., Фернандес-Ресио Х. (июль 2012 г.). «Эталон стыковки белка и РНК (II): расширенный набор экспериментальных данных и данных моделирования гомологии». Белки . 80 (7): 1872–82. дои : 10.1002/прот.24075 . ПМИД 22488990 . S2CID 20322388 .
- ^ Нитин С., Мукерджи С., Бахадур Р.П. (ноябрь 2016 г.). «Неизбыточный эталон стыковки белка и РНК, версия 2.0». Белки . 85 (2): 256–267. дои : 10.1002/прот.25211 . ПМИД 27862282 . S2CID 26814049 .
- ^ Нитин, Чандран; Гош, Прита; Буйницкий, Януш; Нитин, Чандран; Гош, Прита; Буйницкий, Януш М. (25 августа 2018 г.). «Инструменты и тесты биоинформатики для вычислительного стыковки и прогнозирования трехмерной структуры РНК-белковых комплексов» . Гены . 9 (9): 432. doi : 10.3390/genes9090432 . ПМК 6162694 . ПМИД 30149645 .
- ^ Jump up to: а б Кастритис П.Л., Моал И.Х., Хван Х., Венг З., Бейтс П.А., Бонвин А.М., Джанин Дж. (март 2011 г.). «Структурный критерий сродства связывания белок-белок» . Белковая наука . 20 (3): 482–491. дои : 10.1002/pro.580 . ПМК 3064828 . ПМИД 21213247 .
- ^ Джанин Дж., Хенрик К., Моулт Дж., Эйк Л.Т., Штернберг М.Дж., Вайда С., Ваксер И., Водак С.Дж. (2003). «CAPRI: критическая оценка предсказанных взаимодействий». Белки . 52 (1): 2–9. CiteSeerX 10.1.1.461.3355 . дои : 10.1002/прот.10381 . ПМИД 12784359 . S2CID 31489448 .