Гомологическое моделирование

Моделирование гомологии , также известное как сравнительное моделирование белка, относится к построению модели « мишени » белка с атомным разрешением на основе его аминокислотной последовательности и экспериментальной трехмерной структуры родственного гомологичного белка (« матрицы »). Моделирование гомологии основано на идентификации одной или нескольких известных белковых структур, которые могут напоминать структуру запрашиваемой последовательности, а также на создании выравнивания , которое сопоставляет остатки в запрашиваемой последовательности с остатками в матричной последовательности. Было замечено, что структуры белков более консервативны, чем последовательности белков среди гомологов, но последовательности, идентичность которых ниже 20%, могут иметь совершенно другую структуру. ^{[ 1 ]}

Эволюционно родственные белки имеют сходные последовательности, а встречающиеся в природе гомологичные белки имеют сходную белковую структуру. Было показано, что трехмерная структура белка эволюционно более консервативна, чем можно было бы ожидать, исходя только из сохранения последовательности. ^{[ 2 ]}

Выравнивание последовательностей и структура шаблона затем используются для создания структурной модели мишени. Потому что структуры белков более консервативны , чем последовательности ДНК, и обнаруживаемые уровни сходства последовательностей обычно подразумевают значительное структурное сходство. ^{[ 3 ]}

Качество модели гомологии зависит от качества выравнивания последовательностей и структуры матрицы. Подход может быть осложнен наличием пробелов в выравнивании (обычно называемых инделами), которые указывают на структурную область, присутствующую в мишени, но не в шаблоне, а также из-за структурных пробелов в шаблоне, которые возникают из-за плохого разрешения в экспериментальной процедуре (обычно X -лучевая кристаллография ), используемая для решения структуры. Качество модели снижается с уменьшением идентичности последовательностей ; типичная модель имеет ~ 1–2 Å среднеквадратическое отклонение между согласованными C ^а атомы при 70% идентичности последовательностей, но согласие только на 2–4 Å при 25% идентичности последовательностей. Однако ошибки существенно выше в петлевых участках, где аминокислотные последовательности белков-мишеней и матричных белков могут совершенно различаться.

Области модели, построенные без шаблона, обычно с помощью петлевого моделирования , обычно гораздо менее точны, чем остальная часть модели. Ошибки в упаковке и положении боковой цепи также увеличиваются с уменьшением идентичности, и вариации в этих конфигурациях упаковки были предложены как основная причина плохого качества модели при низкой идентичности. ^{[ 4 ]} В совокупности эти различные ошибки положения атомов являются значительными и препятствуют использованию моделей гомологии для целей, требующих данных с атомным разрешением, таких как разработка лекарств и белок-белковых взаимодействий прогнозирование ; даже четвертичную структуру белка может быть трудно предсказать на основе моделей гомологии его субъединицы (субъединиц). Тем не менее, модели гомологии могут быть полезны для получения качественных выводов о биохимии запрашиваемой последовательности, особенно при формулировании гипотез о том, почему определенные остатки консервативны, что, в свою очередь, может привести к экспериментам для проверки этих гипотез. Например, пространственное расположение консервативных остатков может указывать на то, консервативен ли конкретный остаток для стабилизации сворачивания, для участия в связывании какой-либо небольшой молекулы или для содействия ассоциации с другим белком или нуклеиновой кислотой.

Моделирование гомологии может создавать высококачественные структурные модели, когда мишень и матрица тесно связаны, что вдохновило на создание консорциума структурной геномики, занимающегося созданием репрезентативных экспериментальных структур для всех классов белковых складок. ^{[ 5 ]} Основные неточности в моделировании гомологии, которые ухудшаются при более низкой идентичности последовательностей , происходят из-за ошибок в первоначальном выравнивании последовательностей и неправильного выбора матрицы. ^{[ 6 ]} Как и другие методы прогнозирования структуры, текущая практика моделирования гомологии оценивается в ходе крупномасштабного эксперимента, проводимого раз в два года, известного как Критическая оценка методов прогнозирования структуры белка или CASP .

Мотив

Метод моделирования гомологии основан на наблюдении, что третичная структура белка более консервативна, чем аминокислотная последовательность . ^{[ 3 ]} Таким образом, даже белки, которые значительно различаются по последовательности, но все еще имеют обнаруживаемое сходство, также будут иметь общие структурные свойства, особенно общую складку. для каждого интересующего белка сложно и требует много времени Поскольку получение экспериментальных структур с помощью таких методов, как рентгеновская кристаллография и ЯМР белков, , моделирование гомологии может предоставить полезные структурные модели для создания гипотез о функции белка и направления дальнейшей экспериментальной работы.

Существуют исключения из общего правила, согласно которому белки, имеющие значительную идентичность последовательностей, будут иметь общую складку. Например, разумно выбранный набор мутаций, составляющий менее 50% белка, может привести к тому, что белок примет совершенно другую складку. ^{[ 7 ]}^{[ 8 ]} Однако такая массивная структурная перестройка вряд ли произойдет в ходе эволюции , тем более что белок обычно находится под ограничением: он должен правильно сворачиваться и выполнять свою функцию в клетке. Следовательно, грубо свернутая структура белка (его «топология») сохраняется дольше, чем его аминокислотная последовательность, и намного дольше, чем соответствующая последовательность ДНК; другими словами, два белка могут иметь схожую структуру, даже если их эволюционное родство настолько далеко, что его невозможно надежно различить. Для сравнения: функция белка консервативна гораздо меньше, чем последовательность белка, поскольку для выполнения соответствующей функции требуется относительно небольшое количество изменений в аминокислотной последовательности.

Этапы изготовления модели

Процедуру моделирования гомологии можно разбить на четыре последовательных этапа: выбор шаблона, выравнивание целевого шаблона, построение модели и оценка модели. ^{[ 3 ]} Первые два шага часто выполняются вместе, поскольку наиболее распространенные методы идентификации шаблонов основаны на выравнивании последовательностей; однако качество этого выравнивания может быть недостаточным, поскольку методы поиска в базе данных отдают приоритет скорости, а не качеству выравнивания. Эти процессы можно выполнять итеративно для улучшения качества окончательной модели, хотя оценки качества, не зависящие от истинной целевой структуры, все еще находятся в стадии разработки.

Оптимизация скорости и точности этих шагов для использования в крупномасштабном автоматизированном прогнозировании структуры является ключевым компонентом инициатив в области структурной геномики, отчасти потому, что полученный объем данных будет слишком большим для обработки вручную, а отчасти потому, что цель структурной геномики требует предоставления модели приемлемого качества для исследователей, которые сами не являются экспертами по предсказанию структур. ^{[ 3 ]}

Выбор шаблона и выравнивание последовательности

Важнейшим первым шагом в моделировании гомологии является идентификация лучшей структуры шаблона, если таковая вообще существует. Самый простой метод идентификации шаблона основан на последовательном парном выравнивании последовательностей с помощью методов поиска в базе данных, таких как FASTA и BLAST . Более чувствительные методы, основанные на множественном выравнивании последовательностей которых является PSI-BLAST , наиболее распространенным примером , итеративно обновляют свою оценочную матрицу для конкретной позиции, чтобы последовательно идентифицировать более отдаленно родственные гомологи. Было показано, что это семейство методов создает большее количество потенциальных шаблонов и идентифицирует лучшие шаблоны для последовательностей, которые имеют лишь отдаленное отношение к любой решенной структуре. Белковая нить , ^{[ 9 ]} также известный как распознавание складок или выравнивание 3D-1D, также может использоваться в качестве метода поиска для идентификации шаблонов, которые будут использоваться в традиционных методах моделирования гомологии. ^{[ 3 ]} Недавние эксперименты CASP показывают, что некоторые методы нарезки белков, такие как RaptorX, действительно более чувствительны, чем методы, основанные исключительно на последовательностях (профилях), когда для прогнозируемых белков доступны только отдаленно связанные матрицы. При выполнении поиска BLAST надежным первым подходом является идентификация совпадений с достаточно низким значением E , которые считаются достаточно близкими в эволюции, чтобы создать надежную модель гомологии. Другие факторы могут склонить чашу весов в крайних случаях; например, шаблон может иметь функцию, аналогичную функции последовательности запроса, или может принадлежать гомологическому оперону . Однако шаблон с плохим значением E обычно не следует выбирать, даже если он единственный доступный, поскольку он вполне может иметь неправильную структуру, что приведет к созданию ошибочной модели. Лучший подход — отправить первичную последовательность на серверы распознавания складок. ^{[ 9 ]} или, что еще лучше, консенсусные метасерверы, которые улучшают отдельные серверы распознавания сверток за счет выявления сходства (консенсуса) между независимыми предсказаниями.

Часто с помощью этих подходов выявляются несколько структур-кандидатов шаблонов. Хотя некоторые методы позволяют генерировать гибридные модели с большей точностью на основе нескольких шаблонов, ^{[ 9 ]}^{[ 10 ]} большинство методов основаны на одном шаблоне. Таким образом, выбор лучшего шаблона среди кандидатов является ключевым шагом и может существенно повлиять на конечную точность структуры. Этот выбор определяется несколькими факторами, такими как сходство последовательностей запроса и шаблона, их функций, а также прогнозируемого запроса и наблюдаемых вторичных структур шаблона . Возможно, наиболее важным является охват выровненных регионов: доля структуры последовательности запроса, которую можно предсказать на основе шаблона, и правдоподобие полученной модели. Таким образом, иногда для одной последовательности запроса создается несколько моделей гомологии, при этом наиболее вероятный кандидат выбирается только на последнем этапе.

Можно использовать выравнивание последовательностей, полученное с помощью метода поиска в базе данных, в качестве основы для последующего создания модели; однако были изучены и более сложные подходы. Одно из предложений генерирует ансамбль стохастически определенных парных выравниваний между целевой последовательностью и единственной идентифицированной матрицей как средство исследования «пространства выравнивания» в областях последовательности с низким локальным сходством. ^{[ 11 ]} Выравнивания «профиль-профиль», которые сначала генерируют профиль последовательности мишени и систематически сравнивают его с профилями последовательностей решенных структур; Считается, что крупнозернистость, присущая конструкции профиля, снижает шум, вносимый дрейфом последовательности в несущественных областях последовательности. ^{[ 12 ]}

Генерация модели

Учитывая шаблон и выравнивание, содержащаяся в нем информация должна использоваться для создания трехмерной структурной модели мишени, представленной как набор декартовых координат для каждого атома в белке. Были предложены три основных класса методов генерации моделей. ^{[ 13 ]}^{[ 14 ]}

Сборка фрагментов

Оригинальный метод моделирования гомологии основывался на сборке полной модели из консервативных структурных фрагментов, идентифицированных в близкородственных решенных структурах. Например, моделирование сериновых протеаз у млекопитающих выявило резкое различие между «основными» структурными областями, консервативными во всех экспериментальных структурах класса, и вариабельными областями, обычно расположенными в петлях , где локализовано большинство различий последовательностей. Таким образом, нерешенные белки можно было смоделировать, сначала построив консервативное ядро, а затем заменив вариабельные области других белков в наборе решенных структур. ^{[ 15 ]} Текущие реализации этого метода различаются главным образом тем, как они работают с несохраняемыми областями или без шаблона. ^{[ 16 ]} Переменные регионы часто создаются с помощью библиотек фрагментов .

Сопоставление сегментов

Метод сопоставления сегментов делит цель на серию коротких сегментов, каждый из которых сопоставляется со своим собственным шаблоном, взятым из банка данных белков . Таким образом, выравнивание последовательностей осуществляется по сегментам, а не по всему белку. Выбор матрицы для каждого сегмента основан на сходстве последовательностей, сравнении координат альфа-углерода и предсказанных стерических конфликтах, возникающих из-за ван-дер-ваальсовых радиусов расходящихся атомов между мишенью и матрицей. ^{[ 17 ]}

Удовлетворение пространственных ограничений

Наиболее распространенный современный метод моделирования гомологии основан на расчетах, необходимых для построения трехмерной структуры на основе данных, полученных с помощью ЯМР-спектроскопии . Одно или несколько выравниваний целевого шаблона используются для построения набора геометрических критериев, которые затем преобразуются в функции плотности вероятности для каждого ограничения. Ограничения, применяемые к основным внутренним координатам белка — расстояниям между остовами белка и двугранным углам — служат основой для процедуры глобальной оптимизации , которая первоначально использовала минимизацию энергии сопряженного градиента для итеративного уточнения положений всех тяжелых атомов в белке. ^{[ 18 ]}

Этот метод был значительно расширен и стал применяться специально для моделирования петель, что может быть чрезвычайно сложно из-за высокой гибкости петель в белках в водном растворе. ^{[ 19 ]} Более позднее расширение применяет модель пространственных ограничений к электронной плотности картам , полученным в результате исследований криоэлектронной микроскопии , которые предоставляют информацию с низким разрешением, которая сама по себе обычно недостаточна для создания структурных моделей атомного разрешения. ^{[ 20 ]} Чтобы решить проблему неточностей в первоначальном выравнивании последовательностей целевой матрицы, была также введена итерационная процедура для уточнения выравнивания на основе первоначального структурного соответствия. ^{[ 21 ]} Наиболее часто используемым программным обеспечением для моделирования на основе пространственных ограничений является MODELLER база данных ModBase . , и для надежных моделей, созданных с его помощью, создана ^{[ 22 ]}

Моделирование цикла

Области целевой последовательности, которые не совпадают с матрицей, моделируются с помощью петлевого моделирования ; они наиболее подвержены серьезным ошибкам моделирования и возникают с большей частотой, когда мишень и матрица имеют низкую идентичность последовательностей. Координаты несовпадающих участков, определенные с помощью программ моделирования петель, обычно гораздо менее точны, чем координаты, полученные путем простого копирования координат известной структуры, особенно если длина петли превышает 10 остатков. Первые два двугранных угла боковой цепи (χ ₁ и χ ₂ ) обычно можно оценить в пределах 30° для точной структуры основной цепи; однако более поздние двугранные углы, обнаруженные в более длинных боковых цепях, таких как лизин и аргинин, как известно, трудно предсказать. Более того, небольшие ошибки в χ ₁ (и, в меньшей степени, в χ ₂ ) могут вызывать относительно большие ошибки в положениях атомов на конце боковой цепи; такие атомы часто имеют функциональное значение, особенно когда они расположены вблизи активного центра .

Оценка модели

Разработано большое количество методов выбора нативной структуры из набора моделей. Функции оценки были основаны как на энергетических функциях молекулярной механики (Лазаридис и Карплюс, 1999; Петри и Хониг, 2000; Фейг и Брукс, 2002; Фелтс и др., 2002; Ли и Дуан, 2004), так и на статистических потенциалах (Сиппл, 1995; Мело и Фейтманс, 1998; Самудрала и Моулт, 1998 г.; Ройнукарин и Субраманиам, 1999 г.; Уоллквист и др., 2002 г.; Чжоу и Чжоу, 2002 г.), остаточная среда (Лути и др., 1992 г.; Эйзенберг и др., 1997 г.; Парк и др., 1997 г.; Сумма и др., 2005 г.). локальные взаимодействия боковой цепи и магистральной цепи (Фанг и Шортл 2005), свойства, зависящие от ориентации (Buchete et al. 2004a,b; Hamelryck 2005), оценки упаковки (Berglund et al. 2004), энергия сольватации (Petrey and Honig 2000; McConkey et al. 2003; Wallner and Elofsson 2003; Berglund) и др. 2004), водородные связи (Kortemme et. др., 2003) и геометрические свойства (Коловос и Йейтс, 1993; Клейвегт, 2000; Ловелл и др., 2003; Михалек и др., 2003). Ряд методов объединяют различные потенциалы в глобальную оценку, обычно используя линейную комбинацию терминов (Kortemme et al. 2003; Tosatto 2005) или с помощью методов машинного обучения, таких как нейронные сети (Wallner and Elofsson 2003) и машины опорных векторов (SVM) (Eramian et al. 2006). Сравнение различных программ оценки качества глобальных моделей можно найти в недавних статьях Pettitt et al. (2005), Тосатто (2005) и Эрамиан и др. (2006).

Сообщается о меньшей работе по местной оценке качества моделей. Локальные оценки важны в контексте моделирования, поскольку они могут дать оценку надежности различных областей прогнозируемой структуры. Эту информацию, в свою очередь, можно использовать для определения того, какие регионы следует уточнить, какие следует учитывать при моделировании с помощью нескольких шаблонов, а какие следует прогнозировать ab initio. Информация о качестве локальной модели также может быть использована для уменьшения комбинаторной проблемы при рассмотрении альтернативных выравниваний; например, если оценивать различные локальные модели отдельно, потребуется построить меньше моделей (при условии, что взаимодействия между отдельными регионами незначительны или могут быть оценены отдельно).

Одним из наиболее широко используемых методов локальной оценки является Verify3D (Luthy et al. 1992; Eisenberg et al. 1997), который сочетает в себе вторичную структуру, доступность растворителя и полярность окружения остатков. ProsaII (Sippl 1993), основанный на сочетании парного статистического потенциала и сольватационного члена, также широко применяется при оценке моделей. Другие методы включают программу Errat (Коловос и Йейтс, 1993), которая учитывает распределение несвязанных атомов в зависимости от типа атома и расстояния, и метод энергетической деформации (Майоров и Абагян, 1998), который использует различия от средних энергий остатков в различных средах для определения какие части белковой структуры могут быть проблематичными. Мело и Фейтманс (1998) используют парный атомный потенциал и потенциал сольватации на основе поверхности (оба основаны на знаниях) для оценки белковых структур. За исключением метода энергетической деформации, который представляет собой полуэмпирический подход, основанный на силовом поле ECEPP3 (Немети и др., 1992), все перечисленные выше локальные методы основаны на статистических потенциалах. Концептуально отличным подходом является метод ProQres, который совсем недавно был предложен Уолнером и Элофссоном (2006). ProQres основан на нейронной сети, которая объединяет структурные особенности, позволяющие отличать правильные области от неправильных. Было показано, что ProQres превосходит более ранние методологии, основанные на статистических подходах (Verify3D, ProsaII и Errat). Данные, представленные в исследовании Уолнера и Элофссона, показывают, что их подход к машинному обучению, основанный на структурных особенностях, действительно превосходит методы, основанные на статистике. Однако методы, основанные на знаниях, рассмотренные в их работе, Verify3D (Luthy et al. 1992; Eisenberg et al. 1997), Prosa (Sippl 1993) и Errat (Colovos and Yeates 1993), не основаны на новых статистических возможностях.

Бенчмаркинг

несколько крупномасштабных попыток сравнительного анализа Было предпринято для оценки относительного качества различных современных методов моделирования гомологии. CASP — это эксперимент по прогнозированию в масштабах всего сообщества, который проводится каждые два года в летние месяцы и требует от групп прогнозистов представить структурные модели для ряда последовательностей, структуры которых недавно были решены экспериментально, но еще не опубликованы. Ее партнер CAFASP работает параллельно с CASP, но оценивает только модели, созданные с помощью полностью автоматизированных серверов. Постоянно проводимые эксперименты, в которых нет прогнозируемых «сезонов», сосредоточены главным образом на сравнительном тестировании общедоступных веб-серверов. LiveBench и EVA работают непрерывно для оценки производительности участвующих серверов при прогнозировании скорого выпуска структур из PDB. CASP и CAFASP служат главным образом для оценки современного уровня моделирования, в то время как непрерывные оценки направлены на оценку качества модели, которое может быть получено пользователем, не являющимся экспертом, с использованием общедоступных инструментов.

Точность

Точность структур, полученных с помощью моделирования гомологии, сильно зависит от идентичности последовательностей между мишенью и матрицей. При идентичности последовательностей выше 50% модели, как правило, надежны, с незначительными ошибками в упаковке боковой цепи и ротамерном состоянии, а общее среднеквадратическое отклонение между смоделированной и экспериментальной структурой составляет около 1 Å . Эта ошибка сравнима с типичным разрешением структуры, решенной методом ЯМР. В диапазоне идентичности 30–50% ошибки могут быть более серьезными и часто располагаются в циклах. При идентичности ниже 30% возникают серьезные ошибки, иногда приводящие к неправильному прогнозированию базовой складки. ^{[ 13 ]} Эту область с низкой идентичностью часто называют «сумеречной зоной», внутри которой моделирование гомологии чрезвычайно затруднено и для которой оно, возможно, менее подходит, чем методы распознавания складок . ^{[ 23 ]}

При высокой идентичности последовательностей основным источником ошибок при моделировании гомологии является выбор матрицы или матриц, на которых основана модель, тогда как при более низкой идентичности возникают серьезные ошибки в выравнивании последовательностей, которые препятствуют созданию высококачественных моделей. ^{[ 6 ]} Было высказано предположение, что основным препятствием для создания качественной модели является неадекватность выравнивания последовательностей, поскольку «оптимальное» структурное выравнивание между двумя белками известной структуры может использоваться в качестве входных данных для современных методов моделирования для получения довольно точного воспроизведения исходной экспериментальной структуры. ^{[ 24 ]}

Были предприняты попытки повысить точность моделей гомологии, построенных с использованием существующих методов, подвергая их молекулярно-динамическому моделированию с целью улучшить их среднеквадратическое отклонение в соответствии с экспериментальной структурой. Однако текущие параметризации силового поля могут быть недостаточно точными для этой задачи, поскольку модели гомологии, используемые в качестве исходных структур для молекулярной динамики, имеют тенденцию создавать немного худшие структуры. ^{[ 25 ]} Небольшие улучшения наблюдались в тех случаях, когда во время моделирования использовались значительные ограничения. ^{[ 26 ]}

Источники ошибок

Двумя наиболее распространенными и крупномасштабными источниками ошибок при моделировании гомологии являются плохой выбор матрицы и неточности в выравнивании последовательностей целевой матрицы. ^{[ 6 ]}^{[ 27 ]} Контроль этих двух факторов с помощью структурного выравнивания или выравнивания последовательностей, полученного на основе сравнения двух решенных структур, значительно снижает ошибки в окончательных моделях; эти выравнивания «золотого стандарта» можно использовать в качестве входных данных для современных методов моделирования для получения довольно точного воспроизведения исходной экспериментальной структуры. ^{[ 24 ]} Результаты самого последнего эксперимента CASP показывают, что «консенсусные» методы, собирающие результаты многократного распознавания складок и поиска множественных выравниваний, повышают вероятность идентификации правильного шаблона; Аналогичным образом, использование нескольких шаблонов на этапе построения модели может быть хуже, чем использование одного правильного шаблона, но лучше, чем использование одного неоптимального. ^{[ 27 ]} Ошибки выравнивания можно свести к минимуму за счет использования множественного выравнивания, даже если используется только один шаблон, а также за счет итеративного уточнения локальных областей с низким сходством. ^{[ 3 ]}^{[ 11 ]} Меньшим источником ошибок модели являются ошибки в структуре шаблона. PDBREPORT , заархивированный 31 мая 2007 г. в базе данных Wayback Machine , перечисляет несколько миллионов, в основном очень мелких, но иногда серьезных ошибок в экспериментальных (шаблонных) структурах, хранящихся в PDB .

Серьезные локальные ошибки могут возникнуть в моделях гомологии, где мутация вставки или делеции или пробел в решенной структуре приводят к образованию области целевой последовательности, для которой нет соответствующей матрицы. Эту проблему можно свести к минимуму за счет использования нескольких матриц, но метод усложняется из-за различных локальных структур матриц вокруг разрыва и из-за вероятности того, что недостающая область в одной экспериментальной структуре также отсутствует в других структурах того же семейства белков. . Отсутствующие области чаще всего встречаются в циклах , где высокая локальная гибкость увеличивает сложность определения региона методами определения структуры. Несмотря на то, что даже для одного шаблона некоторые рекомендации предоставляются путем расположения концов отсутствующей области, чем длиннее зазор, тем сложнее его моделировать. В некоторых случаях петли, содержащие примерно до 9 остатков, можно смоделировать с умеренной точностью, если локальное выравнивание правильное. ^{[ 3 ]} Более крупные регионы часто моделируются индивидуально с использованием методов предсказания структуры ab initio , хотя этот подход имел лишь единичный успех. ^{[ 28 ]}

Ротамерные состояния боковых цепей и их внутреннее расположение упаковки также представляют трудности при моделировании гомологии даже в мишенях , структуру основной цепи которых относительно легко предсказать. Частично это связано с тем, что многие боковые цепи в кристаллических структурах не находятся в своем «оптимальном» ротамерном состоянии из-за энергетических факторов в гидрофобном ядре и упаковки отдельных молекул в белковом кристалле. ^{[ 29 ]} Один из методов решения этой проблемы требует поиска в ротамерной библиотеке для идентификации локально низкоэнергетических комбинаций состояний упаковки. ^{[ 30 ]} Было высказано предположение, что основная причина того, что моделирование гомологии настолько сложно, когда идентичность последовательностей-мишени-матрицы составляет менее 30%, заключается в том, что такие белки имеют в целом схожие складки, но сильно расходящиеся механизмы упаковки боковых цепей. ^{[ 4 ]}

Утилита

Использование структурных моделей включает прогнозирование белок-белкового взаимодействия , стыковку белок-белок , молекулярную стыковку и функциональную аннотацию генов, организма идентифицированных в геноме . ^{[ 31 ]} Даже модели гомологии с низкой точностью могут быть полезны для этих целей, поскольку их неточности, как правило, локализуются в петлях на поверхности белка, которые обычно более вариабельны даже между близкородственными белками. Функциональные области белка, особенно его активный центр , имеют тенденцию быть более консервативными и, следовательно, более точно моделироваться. ^{[ 13 ]}

Модели гомологии также можно использовать для выявления тонких различий между родственными белками, которые не все структурно решены. Например, метод был использован для идентификации катионов сайтов связывания на Na. ⁺/К ⁺ АТФазы и предложить гипотезы об аффинности связывания различных АТФаз. ^{[ 32 ]} Используемые в сочетании с моделированием молекулярной динамики модели гомологии также могут генерировать гипотезы о кинетике и динамике белка, как, например, в исследованиях ионной селективности калиевого канала . ^{[ 33 ]} крупномасштабного автоматического моделирования всех идентифицированных областей, кодирующих белок, в геноме была предпринята попытка Для дрожжей Saccharomyces cerevisiae , в результате чего было создано около 1000 качественных моделей для белков, структура которых еще не была определена на момент исследования, и выявлены новые взаимосвязи. между 236 дрожжевыми белками и другими ранее решенными структурами. ^{[ 34 ]}

См. также

Ссылки

^ Чотия, К; Леск, AM (1986). «Связь между различием последовательности и структуры белков» . ЭМБО Дж . 5 (4): 823–6. дои : 10.1002/j.1460-2075.1986.tb04288.x . ПМК 1166865 . ПМИД 3709526 .
^ Качановский, С; Зеленкевич, П. (2010). «Почему схожие белковые последовательности кодируют схожие трехмерные структуры?» (PDF) . Теоретическая химия . 125 (3–6): 643–50. дои : 10.1007/s00214-009-0656-3 . S2CID 95593331 .
^ Jump up to: ^а ^б ^с ^д ^и ^ж ^г Марти-Реном, Массачусетс; Стюарт, AC; Физер, А; Санчес, Р; Мело, Ф; Сали, А. (2000). «Сравнительное моделирование белковой структуры генов и геномов» . Annu Rev Biophys Biomol Struct . 29 : 291–325. doi : 10.1146/annurev.biophys.29.1.291 . ПМИД 10940251 . S2CID 11498685 .
^ Jump up to: ^а ^б Чунг С.Ю., Суббиа С. (1996). Структурное объяснение сумеречной зоны гомологии белковых последовательностей. Структура 4: 1123–27.
^ Уильямсон А.Р. (2000). «Создание консорциума структурной геномики» . Нат Структ Биол . 7 (S1(11с)): 953. doi : 10.1038/80726 . ПМИД 11103997 . S2CID 35185565 .
^ Jump up to: ^а ^б ^с Венцловас С., Маргелевичиус М. (2005). «Сравнительное моделирование в CASP6 с использованием консенсусного подхода к выбору матрицы, выравниванию структуры последовательности и оценке структуры». Белки . 61 (С7): 99–105. дои : 10.1002/прот.20725 . ПМИД 16187350 . S2CID 45345271 .
^ Далал, С; Баласубраманян, С; Риган, Л. (1997). «Преобразование альфа-спиралей и бета-листов». Сложите Дес . 2 (5): Р71–9. дои : 10.1016/s1359-0278(97)00036-9 . ПМИД 9377709 .
^ Далал, С; Баласубраманян, С; Риган, Л. (1997). «Белковая алхимия: превращение бета-листа в альфа-спираль». Нат Структ Биол . 4 (7): 548–52. дои : 10.1038/nsb0797-548 . ПМИД 9228947 . S2CID 5608132 .
^ Jump up to: ^а ^б ^с Пэн, Цзянь; Цзиньбо Сюй (2011). «RaptorX: использование структурной информации для выравнивания белков путем статистического вывода» . Белки . 79 (Приложение 10): 161–71. дои : 10.1002/прот.23175 . ПМК 3226909 . ПМИД 21987485 .
^ Пэн, Цзянь; Цзиньбо Сюй (апрель 2011 г.). «Множественный подход к объединению белков» . Белки . 79 (6): 1930–1939. дои : 10.1002/prot.23016 . ПМЦ 3092796 . ПМИД 21465564 .
^ Jump up to: ^а ^б Макштейн, Ю; Хофакер, Иллинойс; Стадлер, ПФ (2002). «Стохастические парные выравнивания» . Биоинформатика . 18 (Приложение 2): С153–60. doi : 10.1093/биоинформатика/18.suppl_2.S153 . ПМИД 12385998 .
^ Рыхлевский, Л; Чжан, Б; Годзик, А. (1998). «Прогнозирование складки и функции белков Mycoplasmaogenicium». Сложите Дес . 3 (4): 229–38. дои : 10.1016/S1359-0278(98)00034-0 . ПМИД 9710568 .
^ Jump up to: ^а ^б ^с Бейкер, Д; Сали, А (2001). «Предсказание структуры белка и структурная геномика». Наука . 294 (5540): 93–96. Бибкод : 2001Sci...294...93B . дои : 10.1126/science.1065659 . ПМИД 11588250 . S2CID 7193705 .
^ Чжан Ю (2008). «Прогресс и проблемы в предсказании структуры белков» . Curr Opin Struct Biol . 18 (3): 342–348. дои : 10.1016/j.sbi.2008.02.004 . ПМК 2680823 . ПМИД 18436442 .
^ Грир, Дж. (1981). «Сравнительное построение моделей сериновых протеаз млекопитающих». Журнал молекулярной биологии . 153 (4): 1027–42. дои : 10.1016/0022-2836(81)90465-4 . ПМИД 7045378 .
^ Валлнер, Б; Элофссон, А (2005). «Все не равны: эталон различных программ моделирования гомологии» . Белковая наука . 14 (5): 1315–1327. дои : 10.1110/ps.041253405 . ПМК 2253266 . ПМИД 15840834 .
^ Левитт, М. (1992). «Точное моделирование конформации белка путем автоматического сопоставления сегментов» . Дж Мол Биол . 226 (2): 507–33. дои : 10.1016/0022-2836(92)90964-L . ПМИД 1640463 .
^ Сали, А; Бланделл, TL. (1993). «Сравнительное моделирование белков путем удовлетворения пространственных ограничений». Дж Мол Биол . 234 (3): 779–815. дои : 10.1006/jmbi.1993.1626 . ПМИД 8254673 .
^ Физер, А; Сали, А. (2003). «ModLoop: автоматизированное моделирование петель в белковых структурах» . Биоинформатика . 19 (18): 2500–1. doi : 10.1093/биоинформатика/btg362 . PMID 14668246 .
^ Топф, М; Бейкер, ML; Марти-Реном, Массачусетс; Чиу, Вт; Сали, А. (2006). «Уточнение белковых структур путем итеративного сравнительного моделирования и подбора плотности CryoEM». Дж Мол Биол . 357 (5): 1655–68. дои : 10.1016/j.jmb.2006.01.062 . ПМИД 16490207 .
^ Джон, Б; Сали, А. (2003). «Сравнительное моделирование структуры белков путем итеративного выравнивания, построения моделей и оценки моделей» . Нуклеиновые кислоты Рез . 31 (14): 3982–92. дои : 10.1093/нар/gkg460 . ПМК 165975 . ПМИД 12853614 .
^ Урсула Пипер, Нараянан Эсвар, Ханнес Браберг, М.С. Мадхусудхан, Фред Дэвис, Эшли С. Стюарт, Небойша Миркович, Андреа Росси, Марк А. Марти-Реном, Андрас Физер, Бен Уэбб, Дэниел Гринблатт, Конрад Хуанг, Том Феррин, Андрей Сали. MODBASE, база данных аннотированных сравнительных моделей структуры белков и связанных ресурсов. Нуклеиновые кислоты Res 32, D217-D222, 2004.
^ Блейк, доктор юридических наук; Коэн, Ф.Е. (2001). «Попарное выравнивание последовательностей ниже сумеречной зоны». Дж Мол Биол . 307 (2): 721–35. дои : 10.1006/jmbi.2001.4495 . ПМИД 11254392 .
^ Jump up to: ^а ^б Чжан, Ю; Сколник, Дж. (2005). «Проблема предсказания структуры белка может быть решена с использованием текущей библиотеки PDB» . Учеб. Натл. акад. наук. США . 102 (4): 1029–34. Бибкод : 2005PNAS..102.1029Z . дои : 10.1073/pnas.0407152101 . ПМЦ 545829 . ПМИД 15653774 .
^ Кёль, П; Левитт, М. (1999). «Светлое будущее предсказания структуры белка». Нат Структ Биол . 6 (2): 108–11. дои : 10.1038/5794 . ПМИД 10048917 . S2CID 3162636 .
^ Флохил, Дж.А.; Вренд, Г; Берендсен, Х.Дж. (2002). «Завершение и уточнение трехмерных моделей гомологии с ограниченной молекулярной динамикой: применение к целям 47, 58 и 111 в конкурсе моделирования CASP и апостериорном анализе». Белки . 48 (4): 593–604. дои : 10.1002/прот.10105 . ПМИД 12211026 . S2CID 11280977 .
^ Jump up to: ^а ^б Гинальски, К. (2006). «Сравнительное моделирование для предсказания структуры белка». Curr Opin Struct Biol . 16 (2): 172–7. дои : 10.1016/j.sbi.2006.02.003 . ПМИД 16510277 .
^ Крыштафович А, Венцловас С, Фиделис К, Моулт Дж. (2005). Прогресс за первое десятилетие экспериментов CASP. Белки 61(S7): 225–36.
^ Васкес, М. (1996). «Моделирование конформации боковой цепи». Curr Opin Struct Biol . 6 (2): 217–21. дои : 10.1016/S0959-440X(96)80077-7 . ПМИД 8728654 .
^ Уилсон, К; Грегорет, LM; Агард, Д.А. (1993). «Моделирование конформации боковой цепи гомологичных белков с использованием энергетического поиска ротамеров». Дж Мол Биол . 229 (4): 996–1006. дои : 10.1006/jmbi.1993.1100 . ПМИД 8445659 .
^ Гопал, С; Шредер, М; Пипер, Ю; Щирба, А; Айтекин-Курбан, Г; Бекиранов С; Фахардо, Дж. Э.; Эсвар, Н; Санчес, Р; и др. (2001). «Аннотация на основе гомологии дает 1042 новых гена-кандидата в геноме Drosophila melanogaster». Нат Жене . 27 (3): 337–40. дои : 10.1038/85922 . ПМИД 11242120 . S2CID 2144435 .
^ Огава, Х; Тоёсима, К. (2002). «Моделирование гомологии катион-связывающих сайтов Na+K+-АТФазы» . Proc Natl Acad Sci США . 99 (25): 15977–15982. Бибкод : 2002PNAS...9915977O . дои : 10.1073/pnas.202622299 . ПМЦ 138550 . ПМИД 12461183 .
^ Капенер, CE; Шривастава, И.Х.; Ранатунга, КМ; Форрест, ЛР; Смит, Греция; Сансом, MSP (2000). «Гомологическое моделирование и молекулярно-динамическое моделирование внутреннего калиевого канала выпрямителя» . Биофиз Дж . 78 (6): 2929–2942. Бибкод : 2000BpJ....78.2929C . дои : 10.1016/S0006-3495(00)76833-0 . ПМК 1300878 . ПМИД 10827973 .
^ Санчес, Р; Сали, А. (1998). «Крупномасштабное моделирование белковой структуры генома Saccharomyces cerevisiae» . Proc Natl Acad Sci США . 95 (23): 13597–13602. Бибкод : 1998PNAS...9513597S . дои : 10.1073/pnas.95.23.13597 . ПМК 24864 . ПМИД 9811845 .

[LeskChothia-1] Чотия, К; Леск, AM (1986). «Связь между различием последовательности и структуры белков» . ЭМБО Дж . 5 (4): 823–6. дои : 10.1002/j.1460-2075.1986.tb04288.x . ПМК 1166865 . ПМИД 3709526 .

[kora-2] Качановский, С; Зеленкевич, П. (2010). «Почему схожие белковые последовательности кодируют схожие трехмерные структуры?» (PDF) . Теоретическая химия . 125 (3–6): 643–50. дои : 10.1007/s00214-009-0656-3 . S2CID 95593331 .

[Marti-3] Jump up to: ^а ^б ^с ^д ^и ^ж ^г Марти-Реном, Массачусетс; Стюарт, AC; Физер, А; Санчес, Р; Мело, Ф; Сали, А. (2000). «Сравнительное моделирование белковой структуры генов и геномов» . Annu Rev Biophys Biomol Struct . 29 : 291–325. doi : 10.1146/annurev.biophys.29.1.291 . ПМИД 10940251 . S2CID 11498685 .

[Chung-4] Jump up to: ^а ^б Чунг С.Ю., Суббиа С. (1996). Структурное объяснение сумеречной зоны гомологии белковых последовательностей. Структура 4: 1123–27.

[Williamson-5] Уильямсон А.Р. (2000). «Создание консорциума структурной геномики» . Нат Структ Биол . 7 (S1(11с)): 953. doi : 10.1038/80726 . ПМИД 11103997 . S2CID 35185565 .

[Venclovas-6] Jump up to: ^а ^б ^с Венцловас С., Маргелевичиус М. (2005). «Сравнительное моделирование в CASP6 с использованием консенсусного подхода к выбору матрицы, выравниванию структуры последовательности и оценке структуры». Белки . 61 (С7): 99–105. дои : 10.1002/прот.20725 . ПМИД 16187350 . S2CID 45345271 .

[Dalal1-7] Далал, С; Баласубраманян, С; Риган, Л. (1997). «Преобразование альфа-спиралей и бета-листов». Сложите Дес . 2 (5): Р71–9. дои : 10.1016/s1359-0278(97)00036-9 . ПМИД 9377709 .

[Dalal2-8] Далал, С; Баласубраманян, С; Риган, Л. (1997). «Белковая алхимия: превращение бета-листа в альфа-спираль». Нат Структ Биол . 4 (7): 548–52. дои : 10.1038/nsb0797-548 . ПМИД 9228947 . S2CID 5608132 .

[RaptorX-9] Jump up to: ^а ^б ^с Пэн, Цзянь; Цзиньбо Сюй (2011). «RaptorX: использование структурной информации для выравнивания белков путем статистического вывода» . Белки . 79 (Приложение 10): 161–71. дои : 10.1002/прот.23175 . ПМК 3226909 . ПМИД 21987485 .

[PengMultiTemplate-10] Пэн, Цзянь; Цзиньбо Сюй (апрель 2011 г.). «Множественный подход к объединению белков» . Белки . 79 (6): 1930–1939. дои : 10.1002/prot.23016 . ПМЦ 3092796 . ПМИД 21465564 .

[Muckstein-11] Jump up to: ^а ^б Макштейн, Ю; Хофакер, Иллинойс; Стадлер, ПФ (2002). «Стохастические парные выравнивания» . Биоинформатика . 18 (Приложение 2): С153–60. doi : 10.1093/биоинформатика/18.suppl_2.S153 . ПМИД 12385998 .

[Rychlewski-12] Рыхлевский, Л; Чжан, Б; Годзик, А. (1998). «Прогнозирование складки и функции белков Mycoplasmaogenicium». Сложите Дес . 3 (4): 229–38. дои : 10.1016/S1359-0278(98)00034-0 . ПМИД 9710568 .

[Baker-13] Jump up to: ^а ^б ^с Бейкер, Д; Сали, А (2001). «Предсказание структуры белка и структурная геномика». Наука . 294 (5540): 93–96. Бибкод : 2001Sci...294...93B . дои : 10.1126/science.1065659 . ПМИД 11588250 . S2CID 7193705 .

[zhang2008-14] Чжан Ю (2008). «Прогресс и проблемы в предсказании структуры белков» . Curr Opin Struct Biol . 18 (3): 342–348. дои : 10.1016/j.sbi.2008.02.004 . ПМК 2680823 . ПМИД 18436442 .

[Greer-15] Грир, Дж. (1981). «Сравнительное построение моделей сериновых протеаз млекопитающих». Журнал молекулярной биологии . 153 (4): 1027–42. дои : 10.1016/0022-2836(81)90465-4 . ПМИД 7045378 .

[Wallner-16] Валлнер, Б; Элофссон, А (2005). «Все не равны: эталон различных программ моделирования гомологии» . Белковая наука . 14 (5): 1315–1327. дои : 10.1110/ps.041253405 . ПМК 2253266 . ПМИД 15840834 .

[Levitt-17] Левитт, М. (1992). «Точное моделирование конформации белка путем автоматического сопоставления сегментов» . Дж Мол Биол . 226 (2): 507–33. дои : 10.1016/0022-2836(92)90964-L . ПМИД 1640463 .

[Sali-18] Сали, А; Бланделл, TL. (1993). «Сравнительное моделирование белков путем удовлетворения пространственных ограничений». Дж Мол Биол . 234 (3): 779–815. дои : 10.1006/jmbi.1993.1626 . ПМИД 8254673 .

[Fiser-19] Физер, А; Сали, А. (2003). «ModLoop: автоматизированное моделирование петель в белковых структурах» . Биоинформатика . 19 (18): 2500–1. doi : 10.1093/биоинформатика/btg362 . PMID 14668246 .

[Topf-20] Топф, М; Бейкер, ML; Марти-Реном, Массачусетс; Чиу, Вт; Сали, А. (2006). «Уточнение белковых структур путем итеративного сравнительного моделирования и подбора плотности CryoEM». Дж Мол Биол . 357 (5): 1655–68. дои : 10.1016/j.jmb.2006.01.062 . ПМИД 16490207 .

[John-21] Джон, Б; Сали, А. (2003). «Сравнительное моделирование структуры белков путем итеративного выравнивания, построения моделей и оценки моделей» . Нуклеиновые кислоты Рез . 31 (14): 3982–92. дои : 10.1093/нар/gkg460 . ПМК 165975 . ПМИД 12853614 .

[Pieper-22] Урсула Пипер, Нараянан Эсвар, Ханнес Браберг, М.С. Мадхусудхан, Фред Дэвис, Эшли С. Стюарт, Небойша Миркович, Андреа Росси, Марк А. Марти-Реном, Андрас Физер, Бен Уэбб, Дэниел Гринблатт, Конрад Хуанг, Том Феррин, Андрей Сали. MODBASE, база данных аннотированных сравнительных моделей структуры белков и связанных ресурсов. Нуклеиновые кислоты Res 32, D217-D222, 2004.

[Blake-23] Блейк, доктор юридических наук; Коэн, Ф.Е. (2001). «Попарное выравнивание последовательностей ниже сумеречной зоны». Дж Мол Биол . 307 (2): 721–35. дои : 10.1006/jmbi.2001.4495 . ПМИД 11254392 .

[Zhang-24] Jump up to: ^а ^б Чжан, Ю; Сколник, Дж. (2005). «Проблема предсказания структуры белка может быть решена с использованием текущей библиотеки PDB» . Учеб. Натл. акад. наук. США . 102 (4): 1029–34. Бибкод : 2005PNAS..102.1029Z . дои : 10.1073/pnas.0407152101 . ПМЦ 545829 . ПМИД 15653774 .

[Koehl-25] Кёль, П; Левитт, М. (1999). «Светлое будущее предсказания структуры белка». Нат Структ Биол . 6 (2): 108–11. дои : 10.1038/5794 . ПМИД 10048917 . S2CID 3162636 .

[Flohil-26] Флохил, Дж.А.; Вренд, Г; Берендсен, Х.Дж. (2002). «Завершение и уточнение трехмерных моделей гомологии с ограниченной молекулярной динамикой: применение к целям 47, 58 и 111 в конкурсе моделирования CASP и апостериорном анализе». Белки . 48 (4): 593–604. дои : 10.1002/прот.10105 . ПМИД 12211026 . S2CID 11280977 .

[Ginalski-27] Jump up to: ^а ^б Гинальски, К. (2006). «Сравнительное моделирование для предсказания структуры белка». Curr Opin Struct Biol . 16 (2): 172–7. дои : 10.1016/j.sbi.2006.02.003 . ПМИД 16510277 .

[Kryshtafovych-28] Крыштафович А, Венцловас С, Фиделис К, Моулт Дж. (2005). Прогресс за первое десятилетие экспериментов CASP. Белки 61(S7): 225–36.

[Vasquez-29] Васкес, М. (1996). «Моделирование конформации боковой цепи». Curr Opin Struct Biol . 6 (2): 217–21. дои : 10.1016/S0959-440X(96)80077-7 . ПМИД 8728654 .

[Wilson-30] Уилсон, К; Грегорет, LM; Агард, Д.А. (1993). «Моделирование конформации боковой цепи гомологичных белков с использованием энергетического поиска ротамеров». Дж Мол Биол . 229 (4): 996–1006. дои : 10.1006/jmbi.1993.1100 . ПМИД 8445659 .

[Gopal-31] Гопал, С; Шредер, М; Пипер, Ю; Щирба, А; Айтекин-Курбан, Г; Бекиранов С; Фахардо, Дж. Э.; Эсвар, Н; Санчес, Р; и др. (2001). «Аннотация на основе гомологии дает 1042 новых гена-кандидата в геноме Drosophila melanogaster». Нат Жене . 27 (3): 337–40. дои : 10.1038/85922 . ПМИД 11242120 . S2CID 2144435 .

[Ogawa-32] Огава, Х; Тоёсима, К. (2002). «Моделирование гомологии катион-связывающих сайтов Na+K+-АТФазы» . Proc Natl Acad Sci США . 99 (25): 15977–15982. Бибкод : 2002PNAS...9915977O . дои : 10.1073/pnas.202622299 . ПМЦ 138550 . ПМИД 12461183 .

[Capener-33] Капенер, CE; Шривастава, И.Х.; Ранатунга, КМ; Форрест, ЛР; Смит, Греция; Сансом, MSP (2000). «Гомологическое моделирование и молекулярно-динамическое моделирование внутреннего калиевого канала выпрямителя» . Биофиз Дж . 78 (6): 2929–2942. Бибкод : 2000BpJ....78.2929C . дои : 10.1016/S0006-3495(00)76833-0 . ПМК 1300878 . ПМИД 10827973 .

[Sanchez-34] Санчес, Р; Сали, А. (1998). «Крупномасштабное моделирование белковой структуры генома Saccharomyces cerevisiae» . Proc Natl Acad Sci США . 95 (23): 13597–13602. Бибкод : 1998PNAS...9513597S . дои : 10.1073/pnas.95.23.13597 . ПМК 24864 . ПМИД 9811845 .

[ 1 ]

[ 2 ]

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]

[ 9 ]

[ 10 ]

[ 11 ]

[ 12 ]

[ 13 ]

[ 14 ]

[ 15 ]

[ 16 ]

[ 17 ]

[ 18 ]

[ 19 ]

[ 20 ]

[ 21 ]

[ 22 ]

[ 23 ]

[ 24 ]

[ 25 ]

[ 26 ]

[ 27 ]

[ 28 ]

[ 29 ]

[ 30 ]

[ 31 ]

[ 32 ]

[ 33 ]

[ 34 ]