Jump to content

Библиотека белковых фрагментов

Библиотеки фрагментов белкового остова успешно используются в различных приложениях структурной биологии , включая моделирование гомологии , [1] снова предсказание структуры , [2] [3] [4] и определение структуры . [5] Уменьшая сложность пространства поиска, эти библиотеки фрагментов обеспечивают более быстрый поиск конформационного пространства , что приводит к более эффективным и точным моделям.

Мотивация

[ редактировать ]

Белки могут принимать экспоненциальное число состояний при дискретном моделировании. Обычно конформации белка представляются как наборы двугранных углов , длин связей и валентных углов между всеми связанными атомами. Наиболее распространенным упрощением является предположение об идеальных длинах связей и валентных углах. Однако при этом по-прежнему остаются углы фи-пси основной цепи и до четырех двугранных углов для каждой боковой цепи , что приводит к сложности в худшем случае, равной k. 6* н возможные состояния белка, где n — количество остатков, а k — количество дискретных состояний, смоделированных для каждого двугранного угла. Чтобы уменьшить конформационное пространство, можно использовать библиотеки фрагментов белков, а не явно моделировать каждый угол фи-пси.

Фрагменты представляют собой короткие сегменты пептидного остова, обычно длиной от 5 до 15 остатков и не включают боковые цепи. Они могут указывать расположение только атомов C-альфа, если это сокращенное представление атома, или всех тяжелых атомов основной цепи (N, C-альфа, C-карбонил, O). Обратите внимание, что боковые цепи обычно не моделируются с использованием подхода библиотеки фрагментов. Для моделирования дискретных состояний боковой цепи можно использовать подход библиотеки ротамеров . [6]

Этот подход основан на предположении, что локальные взаимодействия играют большую роль в стабилизации общей конформации белка. В любой короткой последовательности молекулярные силы сдерживают структуру, что приводит к появлению лишь небольшого числа возможных конформаций, которые можно смоделировать фрагментами. Действительно, согласно парадоксу Левинталя , белок не может испытать все возможные конформации за биологически разумный промежуток времени. Локально стабилизированные структуры уменьшат пространство поиска и позволят белкам сворачиваться за миллисекунды.

Строительство

[ редактировать ]
Кластеризация фрагментов.
Кластеризация похожих фрагментов. Центроид показан синим цветом.

Библиотеки этих фрагментов создаются на основе анализа банка данных белков (PDB). Сначала выбирается репрезентативное подмножество PDB, которое должно охватывать разнообразный набор структур, желательно с хорошим разрешением. Затем для каждой структуры каждый набор из n последовательных остатков принимается в качестве фрагмента выборки. Затем выборки группируются в k групп в зависимости от того, насколько они похожи друг на друга по пространственной конфигурации, с использованием таких алгоритмов, как k кластеризация -средних . Параметры n и k выбираются в соответствии с применением (см. обсуждение сложности ниже). Затем центроиды . кластеров представляют собой фрагмент Дальнейшая оптимизация может быть выполнена, чтобы гарантировать, что центроид обладает идеальной геометрией связи, поскольку она была получена путем усреднения других геометрий. [7]

Поскольку фрагменты происходят из структур, существующих в природе, сегмент магистрали, который они представляют, будет иметь реалистичную геометрию связей. Это помогает избежать необходимости исследовать все пространство конформационных углов, большая часть которых привела бы к нереалистичной геометрии.

Вышеуказанная кластеризация может быть выполнена без учета идентичности остатков или может быть специфичной для остатков. [2] То есть для любой заданной входной последовательности аминокислот кластеризацию можно получить, используя только образцы, найденные в PDB с той же последовательностью в k -мерном фрагменте. Это требует больше вычислительной работы, чем создание независимой от последовательности библиотеки фрагментов, но потенциально может создать более точные модели. И наоборот, требуется больший набор выборок, и полного охвата может не достичь.

Пример использования: моделирование цикла

[ редактировать ]
Петлевая конструкция.
Петля длиной 10 построена из 6 фрагментов, каждый длиной 4. В этой 2D-модели использовались только перекрытия 2. Точки привязки обведены кружком.

При моделировании гомологии обычное применение библиотек фрагментов — моделирование петель структуры. Обычно альфа-спирали и бета-листы связаны с шаблонной структурой, но петли между ними не указаны и их необходимо прогнозировать. Найти контур с оптимальной конфигурацией NP-трудно . Чтобы уменьшить конформационное пространство, которое необходимо исследовать, можно смоделировать петлю как серию перекрывающихся фрагментов. Затем можно выполнить выборку пространства или, если оно теперь достаточно мало, выполнить исчерпывающее перечисление.

Один из подходов к исчерпывающему перебору заключается в следующем. [1] Построение петли начинается с выравнивания всех возможных фрагментов так, чтобы они перекрывались с тремя остатками на N-конце петли (точка привязки). Затем все возможные варианты второго фрагмента выравниваются по (всем возможным вариантам) первого фрагмента, гарантируя, что последние три остатка первого фрагмента перекрываются с первыми тремя остатками второго фрагмента. Это гарантирует, что цепочка фрагментов образует реалистичные углы как внутри фрагмента, так и между фрагментами. Затем это повторяется до тех пор, пока не будет построен цикл с правильной длиной остатков.

Петля должна начинаться у якоря на стороне N и заканчиваться у якоря на стороне C. Поэтому каждую петлю необходимо проверить, чтобы увидеть, перекрываются ли ее последние несколько остатков с якорем С-конца. Очень немногие из этих экспоненциальных чисел циклов-кандидатов закроют цикл. После фильтрации петель, которые не замыкаются, необходимо затем определить, какая петля имеет оптимальную конфигурацию, определяемую по наименьшей энергии с использованием некоторого силового поля молекулярной механики.

Сложность

[ редактировать ]

Сложность пространства состояний по-прежнему экспоненциальна по количеству остатков, даже после использования библиотек фрагментов. Однако степень показателя снижается. Для библиотеки F -мерных фрагментов с L- фрагментами в библиотеке и для моделирования цепочки из N остатков, перекрывающих каждый фрагмент на 3, будет L [ Н /( Ф -3)]+1 возможные цепи. [7] Это намного меньше, чем К. Н возможности, если явно моделировать углы фи-пси как K возможных комбинаций, поскольку сложность возрастает со степенью меньшей, чем N .

Сложность увеличивается с увеличением L — размера библиотеки фрагментов. Однако библиотеки с большим количеством фрагментов будут охватывать большее разнообразие структур фрагментов, поэтому существует компромисс между точностью модели и скоростью исследования пространства поиска. Этот выбор определяет, какой K используется при выполнении кластеризации.

Кроме того, при любом фиксированном L разнообразие структур, которые можно моделировать, уменьшается с увеличением длины фрагментов. Более короткие фрагменты более способны охватить разнообразный набор структур, найденных в PDB, чем более длинные. Недавно было показано, что библиотеки длиной до 15 способны моделировать 91% фрагментов в PDB с точностью до 2,0 ангстрем. [8]

См. также

[ редактировать ]
  1. ^ Jump up to: а б Колодный Р., Гибас Л., Левитт М. и Кёль П. (2005, март). Обратная кинематика в биологии: проблема замыкания белковой петли. Международный журнал исследований робототехники 24 (2-3), 151-163.
  2. ^ Jump up to: а б Саймонс К., Куперберг К., Хуанг Э. и Бейкер Д. (1997). Сборка третичных структур белка из фрагментов со сходными локальными последовательностями с использованием моделирования отжига и байесовских функций оценки. J Мол Биол 268, 209-225.
  3. ^ Буйницки, Дж. (2006) Прогнозирование структуры белка путем рекомбинации фрагментов. ХимБиоХим. 7, 19–27.
  4. ^ Ли, С. и др. (2008) Фрагмент-HMM: новый подход к прогнозированию структуры белка. Белковая наука. 17, 1925–1934.
  5. ^ ДиМайо, Ф., Шавлик, Дж., Филлипс, Г. Вероятностный подход к отслеживанию основной цепи белка на картах электронной плотности (2006). Биоинформатика 22(14), 81-89.
  6. ^ Канутеску А., Шеленков А. и Данбрэк Р. (2003). Алгоритм теории графов для прогнозирования боковой цепи белка. Белковая наука. 12, 2001–2014.
  7. ^ Jump up to: а б Колодный Р., Кёль П., Гибас Л. и Левитт М. (2005). Небольшие библиотеки белковых фрагментов точно моделируют нативные белковые структуры. J Мол Биол 323, 297-307.
  8. ^ Ду П., Андрек М. и Леви Р. Видели ли мы все структуры, соответствующие коротким белковым фрагментам, в банке данных белков? Обновление. Белковая инженерия. 2003, 16(6) 407-414.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: ff5872a80f71a8860dbd6350caf7fff5__1618877700
URL1:https://arc.ask3.ru/arc/aa/ff/f5/ff5872a80f71a8860dbd6350caf7fff5.html
Заголовок, (Title) документа по адресу, URL1:
Protein fragment library - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)