Оценка моделирования шаблонов
В биоинформатике показатель шаблонного моделирования или TM-показатель является мерой сходства между двумя белковыми структурами . Показатель TM предназначен для более точной меры глобального сходства полноразмерных белковых структур, чем часто используемый показатель RMSD . TM-оценка указывает на сходство между двумя структурами по шкале между , где 1 указывает на идеальное совпадение между двумя структурами (таким образом, чем выше, тем лучше). [1] Обычно баллы ниже 0,20 соответствуют случайно выбранным несвязанным белкам, тогда как структуры с баллом выше 0,5 предполагают примерно такую же кратность. [2] Количественное исследование [3] показывает, что белки с TM-score = 0,5 имеют апостериорную вероятность 37% в том же семействе топологии CATH и 13% в том же семействе складок SCOP . Вероятности быстро возрастают, когда TM-показатель > 0,5. Показатель TM разработан таким образом, чтобы не зависеть от длины белка.
Уравнение TM-оценки
[ редактировать ]TM-показатель между двумя белковыми структурами (например, матричной структурой и целевой структурой) определяется формулой
где – длина аминокислотной последовательности целевого белка, и — это количество остатков, которые появляются как в матричной, так и в целевой структурах. это расстояние между пара остатков в матричной и целевой структурах, и — это шкала расстояний, нормирующая расстояния.
При сравнении двух белковых структур, имеющих одинаковый порядок остатков, считывает порядковый номер C-альфа файлов структуры (т.е. столбец 23-26 в банке данных белков (формат файла) ). При сравнении двух белковых структур, которые имеют разные последовательности и/или разные порядки остатков, сначала обычно выполняется структурное выравнивание , а затем рассчитывается TM-показатель для обычно выровненных остатков на основе структурного выравнивания.
Другие меры
[ редактировать ]Часто используемой мерой структурного сходства является среднеквадратичное отклонение (RMSD). Потому что РМСР рассчитывается как среднее значение ошибки расстояния ( ) с одинаковым весом по всем парам остатков, большая локальная ошибка в нескольких парах остатков может привести к довольно большому СКО. С другой стороны, поставив В знаменателе TM-оценка, естественно, более весомо учитывает меньшие ошибки расстояния, чем большие ошибки расстояния. Следовательно, значение TM-оценки более чувствительно к глобальному структурному сходству, а не к локальным структурным ошибкам, по сравнению с RMSD. Еще одним преимуществом TM-score является введение шкалы что делает величину TM-оценки независимой от длины для пар случайных структур, в то время как RMSD и большинство других показателей являются метриками, зависящими от длины.
Алгоритм глобального дистанционного теста (GDT) и его показатель GDT TS, представляющий «общий балл», являются еще одной мерой сходства между двумя белковыми структурами с известными аминокислотными соответствиями (например, идентичными аминокислотными последовательностями ), но различными третичными структурами . [4] Оценка GDT имеет ту же проблему зависимости от длины, что и RMSD, поскольку средняя оценка GDT для пар случайных структур имеет степенную зависимость от размера белка. [1]
См. также
[ редактировать ]- RMSD — другая мера сравнения структур.
- GDT — другая мера сравнения структур.
- Самый длинный непрерывный сегмент (LCS) — другая мера сравнения структур.
- Расчет глобального расстояния (GDC_sc, GDC_all) — меры сравнения структур, которые используют информацию полной модели (а не только α-углерода) для оценки сходства.
- Локальное глобальное выравнивание (LGA) — программа выравнивания структуры белка и мера сравнения структур.
Ссылки
[ редактировать ]- ^ Перейти обратно: а б Чжан Ю и Сколник Дж (2004). «Функция оценки для автоматической оценки качества шаблона структуры белка». Белки . 57 (4): 702–710. дои : 10.1002/прот.20264 . ПМИД 15476259 . S2CID 7954787 .
- ^ Чжан Ю и Сколник Дж (2005). «TM-align: алгоритм выравнивания структуры белка, основанный на TM-оценке» . Нуклеиновые кислоты Рез . 33 (7): 2302–2309. дои : 10.1093/nar/gki524 . ПМЦ 1084323 . ПМИД 15849316 .
- ^ Сюй Дж и Чжан Ю (2010). «Насколько значимым является сходство структуры белка с TM-оценкой = 0,5?» . Биоинформатика . 26 (7): 889–895. doi : 10.1093/биоинформатика/btq066 . ПМК 2913670 . ПМИД 20164152 .
- ^ Земля А (2003). «LGA: метод поиска трехмерных сходств в белковых структурах» . Исследования нуклеиновых кислот . 31 (13): 3370–3374. дои : 10.1093/nar/gkg571 . ПМК 168977 . ПМИД 12824330 .
Внешние ссылки
[ редактировать ]- Веб-сервер TM-score — создан исследовательской группой Ян Чжан. Вычисляет TM-оценку и предоставляет исходный код.
- Службы описания GDT и LGA и документация по сравнению структур и мерам сходства.