Среднеквадратичное отклонение позиций атомов
В биоинформатике среднеквадратическое отклонение положений атомов , или просто среднеквадратичное отклонение (RMSD) , является мерой среднего расстояния между атомами (обычно атомами основной цепи) наложенных друг на друга молекул. [1] При изучении конформаций глобулярных белков обычно измеряют сходство в трехмерной структуре по СКО координат атомов Cα после оптимальной суперпозиции твердого тела.
Когда динамическая система колеблется вокруг некоторого четко определенного среднего положения, RMSD от среднего значения во времени можно назвать RMSF или среднеквадратическим колебанием . Размер этого колебания можно измерить, например, с помощью мессбауэровской спектроскопии или ядерного магнитного резонанса , и он может предоставить важную физическую информацию. Индекс Линдеманна — это метод размещения RMSF в контексте параметров системы.
Широко используемый способ сравнения структур биомолекул или твердых тел — это перемещение и поворот одной структуры относительно другой, чтобы минимизировать RMSD. Кусиас и др. представил простой вывод, основанный на кватернионах , для оптимального преобразования твердого тела (вращение-перенос), которое минимизирует RMSD между двумя наборами векторов. [2] Они доказали, что метод кватернионов эквивалентен известному алгоритму Кабша . [3] Решение, данное Кабшем, является примером решения d -мерной проблемы, предложенной Херли и Кеттеллом. [4] Кватернионное . решение для вычисления оптимального вращения было опубликовано в приложении к статье Петижана [5] Это кватернионное решение и вычисление оптимальной изометрии в d -мерном случае были распространены как на бесконечные множества, так и на непрерывный случай в приложении А к другой статье Петижана. [6]
Уравнение
[ редактировать ]где δ i — расстояние между атомом i и эталонной структурой, или среднее положение N эквивалентных атомов. Это часто рассчитывается для тяжелых атомов основной цепи , N , O и Cα , а иногда только для атомов Cα C .
Обычно выполняется жесткая суперпозиция, которая минимизирует RMSD, и возвращается этот минимум. Учитывая два набора очки и RMSD определяется следующим образом:
Значение RMSD выражается в единицах длины. Наиболее часто используемой единицей в структурной биологии является ангстрем (Å), который равен 10. −10 м.
Использование
[ редактировать ]Обычно RMSD используется как количественная мера сходства между двумя или более белковыми структурами. Например, CASP конкурс по предсказанию структуры белка использует RMSD в качестве одной из оценок того, насколько хорошо представленная структура соответствует известной целевой структуре. Таким образом, чем ниже RMSD, тем лучше модель по сравнению с целевой структурой.
Кроме того, некоторые ученые, изучающие сворачивание белка с помощью компьютерного моделирования, используют RMSD в качестве координаты реакции , чтобы количественно определить, где белок находится между свернутым и развернутым состояниями.
Изучение RMSD для небольших органических молекул (обычно называемых лигандами , когда изучается их связывание с макромолекулами, такими как белки) является обычным явлением в контексте стыковки . [1] а также в других методах изучения конфигурации лигандов при связывании с макромолекулами. Обратите внимание, что в случае лигандов (в отличие от белков, как описано выше) их структуры чаще всего не накладываются до расчета RMSD.
RMSD также является одним из нескольких показателей, предложенных для количественной оценки эволюционного сходства между белками, а также качества выравнивания последовательностей. [7] [8]
См. также
[ редактировать ]- Среднеквадратичное отклонение
- Среднеквадратическое отклонение
- Кватернион – используется для оптимизации вычислений RMSD.
- Алгоритм Кабша - алгоритм, используемый для минимизации RMSD путем сначала нахождения наилучшего вращения. [3]
- GDT - другая мера сравнения структур.
- TM-score – другой показатель сравнения структур.
- Самый длинный непрерывный сегмент (LCS) — другая мера сравнения структур.
- Расчет глобального расстояния (GDC_sc, GDC_all) — меры сравнения структур, которые используют информацию полной модели (а не только α-углерода) для оценки сходства.
- Локальное глобальное выравнивание (LGA) — программа выравнивания структуры белка и мера сравнения структур.
Ссылки
[ редактировать ]- ^ Перейти обратно: а б «Молекулярная стыковка, оценка свободных энергий связи и полуэмпирическое силовое поле AutoDock» . Сайт Себастьяна Рашки . 26 июня 2014 г. Проверено 7 июня 2016 г.
- ^ Кусиас Э.А., Сок С., Дилл К.А. (2004). «Использование кватернионов для расчета RMSD». J Comput Chem . 25 (15): 1849–1857. дои : 10.1002/jcc.20110 . ПМИД 15376254 . S2CID 18224579 .
- ^ Перейти обратно: а б Кабш В. (1976). «Решение для наилучшего вращения, чтобы связать два набора векторов». Акта Кристаллографика . 32 (5): 922–923. Бибкод : 1976AcCrA..32..922K . дои : 10.1107/S0567739476001873 .
- ^ Херли-младший, Кеттелл Р.Б. (1962). «Программа Прокруста: создание прямого вращения для проверки гипотетической факторной структуры». Поведенческая наука . 7 (2): 258–262. дои : 10.1002/bs.3830070216 .
- ^ Петижан М (1999). «О среднеквадратических количественных мерах киральности и количественной симметрии» (PDF) . Журнал математической физики . 40 (9): 4587–4595. Бибкод : 1999JMP....40.4587P . дои : 10.1063/1.532988 .
- ^ Петижан М (2002). «Хиральные смеси» (PDF) . Журнал математической физики . 43 (8): 185–192. Бибкод : 2002JMP....43.4147P . дои : 10.1063/1.1484559 .
- ^ Джеветт А.И., Хуан К.С., Феррин Т.Е. (2003). «MINRMS: эффективный алгоритм определения сходства структуры белков с использованием среднеквадратического расстояния» (PDF) . Биоинформатика . 19 (5): 625–634. doi : 10.1093/биоинформатика/btg035 . ПМИД 12651721 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Армугом Ф., Моретти С., Кедуас В., Нотредам С. (2006). «iRMSD: локальная мера точности выравнивания последовательностей с использованием структурной информации» (PDF) . Биоинформатика . 22 (14): с35–39. doi : 10.1093/биоинформатика/btl218 . ПМИД 16873492 .
Дальнейшее чтение
[ редактировать ]- Сибуя Т. (2009). «Поиск трехмерных структур белка в линейном времени». Учеб. 13-я ежегодная международная конференция по исследованиям в области вычислительной молекулярной биологии (RECOMB 2009), LNCS 5541: 1–15.
- Дамм К.Л., Карлсон Х.А. (2006). «Гауссово-взвешенная RMSD-суперпозиция белков: структурное сравнение гибких белков и прогнозируемых белковых структур» . Биофиз Дж . 90 (12): 4558–4573. Бибкод : 2006BpJ....90.4558D . дои : 10.1529/biophysj.105.066654 . ПМК 1471868 . ПМИД 16565070 .
- Кнеллер Г.Р. (2005). «Комментарий к статье «Использование кватернионов для расчета RMSD» [ J. Comp. Chem. 25, 1849 (2004)]» . J Comput Chem . 26 (15): 1660–1662. дои : 10.1002/jcc.20296 . ПМИД 16175580 . S2CID 27004373 .
- Теобальд Д.Л. (2005). «Быстрый расчет среднеквадратичных значений с использованием характеристического полинома на основе кватернионов» . Акта Кристаллогр А. 61 (Часть 4): 478–480. Бибкод : 2005AcCrA..61..478T . дои : 10.1107/S0108767305015266 . ПМИД 15973002 .
- Майоров В.Н., Криппен Г.М. (1994). «Значение среднеквадратического отклонения при сравнении трехмерных структур глобулярных белков» (PDF) . Дж Мол Биол . 235 (2): 625–634. дои : 10.1006/jmbi.1994.1017 . hdl : 2027.42/31835 . ПМИД 8289285 .
Внешние ссылки
[ редактировать ]- Молекулярные меры расстояния — учебное пособие по расчету RMSD.
- RMSD — еще одно руководство по расчету RMSD на примере кода.
- Secondary Structure Matching (SSM) — инструмент для сравнения структуры белков. Использует RMSD.
- GDT, LCS и LGA — разные меры сравнения структур. Описание и услуги.
- SuperPose — сервер суперпозиции белков. Использует RMSD.
- суперпозиция — структурное выравнивание на основе сопоставления вторичных структур. Проект CCP4. Использует RMSD.
- Сценарий Python доступен по адресу https://github.com/charnley/rmsd.
- Альтернативный скрипт Python доступен по адресу https://github.com/jewettaij/superpose3d.