Jump to content

Графические модели структуры белка

Графические модели стали мощной основой для предсказания структуры белка , межбелкового взаимодействия и расчета свободной энергии белковых структур. Использование графической модели для представления структуры белка позволяет решать многие проблемы, включая предсказание вторичной структуры, взаимодействие белок-белок, взаимодействие белок-лекарство и расчеты свободной энергии.

Существует два основных подхода к использованию графических моделей при моделировании структуры белков. Первый подход использует дискретные переменные для представления координат или двугранных углов структуры белка. Изначально все переменные представляют собой непрерывные значения, и для их преобразования в дискретные значения обычно применяется процесс дискретизации. Второй подход использует непрерывные переменные для координат или двугранных углов.

Дискретные графические модели структуры белка

[ редактировать ]

Марковские случайные поля , также известные как неориентированные графические модели, являются распространенным представлением этой проблемы. Учитывая неориентированный граф G = ( V , E ), набор случайных величин X = ( X v ) v V , индексированных V , образуют марковское случайное поле относительно G, если они удовлетворяют попарному марковскому свойству:

В дискретной модели непрерывные переменные дискретизируются в набор подходящих дискретных значений. Если выбранными переменными являются двугранные углы , дискретизация обычно выполняется путем сопоставления каждого значения с соответствующей конформацией ротамера .

Пусть X = { X b , X s } — случайные величины, представляющие всю структуру белка. X b может быть представлен набором трехмерных координат атомов основной цепи или, что то же самое, последовательностью длин связей и двугранных углов . Тогда вероятность конкретной конформации x можно записать как:

где представляет любые параметры, используемые для описания этой модели, включая информацию о последовательности, температуру и т. д. Часто предполагается, что основная цепь жесткая с известной конформацией, и затем проблема трансформируется в проблему размещения боковой цепи. Структура графа также закодирована в . Эта структура показывает, какие две переменные являются условно независимыми. Например, углы боковых цепей двух остатков, находящихся далеко друг от друга, могут быть независимыми, учитывая все остальные углы в белке. Чтобы извлечь эту структуру, исследователи используют порог расстояния, и только пара остатков, находящихся в пределах этого порога, считаются связанными (т.е. имеющими ребро между собой).

Учитывая это представление, вероятность конкретной конформации боковой цепи x s с учетом конформации основной цепи x b может быть выражена как

где C ( G ) — множество всех клик в G , потенциальная функция, определенная над переменными, а Z статистическая сумма .

Чтобы полностью охарактеризовать МПС, необходимо определить потенциальную функцию . Для упрощения клики графа обычно ограничиваются только кликами размера 2, что означает, что потенциальная функция определяется только над парами переменных. В системе Goblin эти парные функции определяются как

где – энергия взаимодействия состояния ротамера p остатка и состояние ротамера q остатка и постоянная Больцмана .

Используя файл PDB, эту модель можно построить на основе структуры белка. С помощью этой модели можно рассчитать свободную энергию.

Расчет свободной энергии: распространение убеждений

[ редактировать ]

Было показано, что свободная энергия системы рассчитывается как

где E — энтальпия системы, T — температура и S — энтропия. Теперь, если мы свяжем вероятность с каждым состоянием системы (p(x) для каждого значения конформации x), G можно переписать как

Вычисление p(x) на дискретных графах выполняется с помощью обобщенного алгоритма распространения доверия . Этот алгоритм вычисляет приближение к вероятностям, и его сходимость к окончательному набору значений не гарантируется. Однако на практике было показано, что во многих случаях он успешно сходится.

Непрерывные графические модели белковых структур

[ редактировать ]

Графические модели по-прежнему можно использовать, если выбранные переменные непрерывны. В этих случаях распределение вероятностей представляется как многомерное распределение вероятностей по непрерывным переменным. Каждое семейство распределений затем накладывает определенные свойства на графическую модель. Многомерное распределение Гаусса является одним из наиболее удобных распределений в этой задаче. Простая форма вероятности и прямая связь с соответствующей графической моделью делают ее популярным выбором среди исследователей.

Гауссовы графические модели белковых структур

[ редактировать ]

Гауссовы графические модели представляют собой многомерные распределения вероятностей, кодирующие сеть зависимостей между переменными. Позволять быть набором переменные, такие как двугранные углы , и пусть быть значением функции плотности вероятности при определенном значении D . Многомерная гауссовая графическая модель определяет эту вероятность следующим образом:

Где – закрытая форма статистической суммы . Параметры этого распределения: и . - вектор средних значений каждой переменной, а , обратная матрица ковариации , также известная как матрица точности . Матрица точности содержит попарные зависимости между переменными. Нулевое значение в означает, что в зависимости от значений других переменных две соответствующие переменные независимы друг от друга.

Чтобы изучить структуру графа как многомерной гауссовской графической модели, мы можем использовать либо регуляризацию L-1 , либо выбора окрестностей алгоритмы . Эти алгоритмы одновременно изучают структуру графа и силу ребер связанных узлов. Сила ребра соответствует потенциальной функции, определенной на соответствующей двухузловой клике . Мы используем обучающий набор из нескольких структур PDB, чтобы изучить и .

Как только модель изучена, мы можем повторить тот же шаг, что и в дискретном случае, чтобы получить функции плотности в каждом узле и использовать аналитическую форму для расчета свободной энергии. Здесь статистическая сумма уже имеет замкнутую форму , поэтому вывод , по крайней мере для гауссовых графических моделей, тривиален. Если аналитическая форма статистической суммы недоступна, фильтрацию частиц или математическое ожидание можно использовать для аппроксимации Z , а затем выполнить вывод и вычислить свободную энергию.

  • Изменяющиеся во времени неориентированные графы, Шухэн Чжоу, Джон Д. Лафферти и Ларри А. Вассерман, COLT, 2008 г.
  • Оценки свободной энергии полноатомных белковых структур с использованием обобщенного распространения убеждений, Хетунандан Камисетти Эрик П. Син Кристофер Дж. Лэнгмид, RECOMB 2008
[ редактировать ]
  • http://www.liebertonline.com/doi/pdf/10.1089/cmb.2007.0131
  • https://web.archive.org/web/20110724225908/http://www.learningtheory.org/colt2008/81-Zhou.pdf
  • Лю Ю; Карбонелл Дж; Гопалакришнан В (2009). «Условные графические модели распознавания структурных мотивов белков». Дж. Компьютер. Биол . 16 (5): 639–57. дои : 10.1089/cmb.2008.0176 . hdl : 1721.1/62177 . ПМИД   19432536 . S2CID   7035106 .
  • Прогнозирование складок белка с помощью структурных повторов с использованием модели цепного графа
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 70a75aebffbcabf1fd507937fe60a9a4__1669019640
URL1:https://arc.ask3.ru/arc/aa/70/a4/70a75aebffbcabf1fd507937fe60a9a4.html
Заголовок, (Title) документа по адресу, URL1:
Graphical models for protein structure - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)