Глобальный дистанционный тест
Тест глобального расстояния ( GDT ), также обозначаемый как GDT_TS и обозначающий «общий балл», является мерой сходства между двумя белковыми структурами с известными аминокислотными соответствиями (например, идентичными аминокислотными последовательностями ), но разными третичными структурами . Чаще всего он используется для сравнения результатов предсказания структуры белка с экспериментально определенной структурой, измеренной с помощью рентгеновской кристаллографии , ЯМР белка или, все чаще, криоэлектронной микроскопии . Метрика была разработана Адамом Землой в Ливерморской национальной лаборатории Лоуренса и первоначально реализована в программе Local-Global Alignment ( LGA ). [1] [2] Он задуман как более точное измерение, чем общий показатель среднеквадратического отклонения (RMSD), который чувствителен к областям выбросов , созданным, например, из-за плохого моделирования отдельных областей контура в структуре, которая в остальном достаточно точна. [1] Обычный показатель GDT_TS рассчитывается по альфа-атомам углерода и указывается в процентах в диапазоне от 0 до 100. Как правило, чем выше показатель GDT_TS, тем точнее модель аппроксимирует заданную эталонную структуру.
Измерения GDT_TS используются в качестве основных критериев оценки при получении результатов Критической оценки прогнозирования структур (CASP), крупномасштабного эксперимента в сообществе прогнозистов структур, посвященного оценке текущих методов моделирования. [1] [3] [4] Этот показатель был впервые введен в качестве стандарта оценки в третьей итерации двухгодичного эксперимента (CASP3) в 1998 году. [3] Были разработаны различные расширения исходного метода; вариации, учитывающие положения боковых цепей , известны как вычисления глобального расстояния ( GDC ). [5]
Расчет
[ редактировать ]Оценка GDT рассчитывается как наибольший набор аминокислотных остатков альфа-атомов углерода в модельной структуре, попадающих в пределах определенного расстояния от их положения в экспериментальной структуре, после итеративного наложения двух структур. Согласно оригинальной конструкции алгоритм GDT вычисляет 20 оценок GDT, т.е. для каждого из 20 последовательных отсечек расстояний (0,5 Å , 1,0 Å, 1,5 Å, ... 10,0 Å). [2] Для оценки сходства структур предполагается использовать оценки GDT для нескольких дистанций отсечки, причем оценки обычно увеличиваются с увеличением границы. Плато в этом увеличении может указывать на сильное расхождение между экспериментальными и предсказанными структурами, так что никакие дополнительные атомы не попадают в какое-либо отсечение на разумном расстоянии. Обычный общий балл GDT_TS в CASP представляет собой средний результат отсечек на 1, 2, 4 и 8 Å. [1] [6] [7]
Вариации и расширения
[ редактировать ]Исходный GDT_TS рассчитывается на основе наложений и оценок GDT, полученных программой Local-Global Alignment (LGA). [1] Версия с «высокой точностью», называемая GDT_HA, вычисляется путем выбора меньших предельных расстояний (половина размера GDT_TS) и, таким образом, более строго наказывается за большие отклонения от эталонной структуры. Он использовался в категории высокой точности CASP7. [8] CASP8 определил новую «оценку TR», которая равна GDT_TS минус штраф за остатки, сгруппированные слишком близко, что предназначено для наказания за стерические столкновения в предсказанной структуре, а иногда и для обмана меры отсечения GDT. [9] [10]
При первичной оценке GDT используются только альфа-атомы углерода . Чтобы применить оценку на основе суперпозиции к аминокислотных остатков боковым цепям , в рамках программы LGA в 2008 году была разработана и реализована подобная GDT оценка, называемая «вычислением глобального расстояния для боковых цепей» (GDC_sc). [1] [5] Вместо сравнения положений остатков на основе альфа-углеродов GDC_sc использует заранее определенный «характеристический атом» рядом с концом каждого остатка для оценки отклонений расстояния между остатками. Вариант оценки GDC «все атомы» (GDC_all) рассчитывается с использованием полной информации модели и является одним из стандартных показателей, используемых организаторами и экспертами CASP для оценки точности прогнозируемых структурных моделей. [5] [7] [11]
Оценки GDT обычно рассчитываются по отношению к одной эталонной структуре. В некоторых случаях структурные модели с более низкими показателями GDT по сравнению с эталонной структурой, определенной с помощью ЯМР белка, тем не менее, лучше соответствуют основным экспериментальным данным. [12] Были разработаны методы оценки неопределенности оценок GDT из-за гибкости белка и неопределенности эталонной структуры. [13]
См. также
[ редактировать ]- Среднеквадратичное отклонение (биоинформатика) — другая мера сравнения структур.
- TM-показатель — другой показатель сравнения структур.
Ссылки
[ редактировать ]- ^ Jump up to: а б с д и ж Земля А (2003). «LGA: метод поиска трехмерных сходств в белковых структурах» . Исследования нуклеиновых кислот . 31 (13): 3370–3374. дои : 10.1093/nar/gkg571 . ПМК 168977 . ПМИД 12824330 .
- ^ Jump up to: а б Патент США 8024127 B2 , Адам Земла, «Локальное-глобальное выравнивание для поиска трехмерных сходств в белковых структурах», выданный 20 сентября 2011 г., передан Лоуренсу Ливермору, компания National Security, LLC.
- ^ Jump up to: а б Земла А., Венцловас С., Моулт Дж., Фиделис К. (1999). «Обработка и анализ предсказаний структуры белка CASP3». Белки . С3 (С3): 22–29. doi : 10.1002/(SICI)1097-0134(1999)37:3+<22::AID-PROT5>3.0.CO;2-W . ПМИД 10526349 . S2CID 29803757 .
- ^ Земла А., Венцловас С., Моулт Дж., Фиделис К. (2001). «Обработка и оценка прогнозов в CASP4». Белки . 45 (С5): 13–21. дои : 10.1002/прот.10052 . ПМИД 11835478 . S2CID 28166260 .
- ^ Jump up to: а б с Киди, Д.А.; Уильямс, CJ; Хедд, Джей-Джей; Арендал, ВБ; Чен, В.Б.; Капрал, Дж.Дж.; Гиллеспи, РА; Блок, Дж. Н.; Земля, А; Ричардсон, округ Колумбия; Ричардсон, Дж. С. (2009). «Другие 90% белка: оценка за пределами α-углерода для моделей высокой точности на основе матрицы CASP8» . Белки . 77 (Приложение 9): 29–49. дои : 10.1002/прот.22551 . ПМЦ 2877634 . ПМИД 19731372 .
- ^ Крыштафович А; Прлич, А; Дмитров З; Данилюк, П; Милостан, М; Эйрих, В; Хаббард, Т; Фиделис, К. (2007). «Новые инструменты и расширенные возможности анализа данных в Центре прогнозирования структуры белка» . Белки . 69 Приложение 8: 19–26. дои : 10.1002/прот.21653 . ПМЦ 2656758 . ПМИД 17705273 .
- ^ Jump up to: а б «Справка по таблице результатов» . 14-й эксперимент сообщества по критической оценке методов прогнозирования структуры белка . Проверено 27 декабря 2020 г.
- ^ Прочтите, Рэнди Дж.; Чавали, Гаятри (2007). «Оценка прогнозов CASP7 в категории высокоточного моделирования на основе шаблонов» . Белки . 69 (С8): 27–37. дои : 10.1002/прот.21662 . ПМИД 17894351 . S2CID 33172629 .
- ^ Ши, С; Пей, Дж; Садреев Р.И.; Кинч, Л.Н.; Маджумдар, я; Тонг, Дж; Ченг, Х; Ким, Б.Х.; Гришин Н.В. (2009). «Анализ целей CASP8, прогнозов и методов оценки» . База данных: Журнал биологических баз данных и курирования . 2009 : bap003. дои : 10.1093/база данных/bap003 . ПМЦ 2794793 . ПМИД 20157476 . . Связанная страница
- ^ Садреев Р.И.; Ши, С; Бейкер, Д; Гришин, Н.В. (15 мая 2009 г.). «Мера структурного сходства со штрафом за близкие неэквивалентные остатки» . Биоинформатика . 25 (10): 1259–63. doi : 10.1093/биоинформатика/btp148 . ПМЦ 2677741 . ПМИД 19321733 .
- ^ Моди В., Сюй Ч.Ф., Адхикари С., Данбрэк Р.Л. (2016). «Оценка моделирования структуры белка на основе шаблонов в CASP11» . Белки . 84 : 200–220. дои : 10.1002/прот.25049 . ПМК 5030193 . ПМИД 27081927 .
- ^ МакКаллум, Джастин Л.; Хуа, Лан; Шнидерс, Майкл Дж.; Панде, Виджай С.; Джейкобсон, Мэтью П.; Дилл, Кен А. (2009). «Оценка категории уточнения структуры белка в CASP8» . Белки: структура, функции и биоинформатика . 77 (С9): 66–80. дои : 10.1002/прот.22538 . ПМК 2801025 . ПМИД 19714776 .
- ^ Ли, Вэньлинь; Шеффер, Р. Дастин; Отвиновский, Збышек; Гришин, Ник В. (5 мая 2016 г.). «Оценка неопределенностей в глобальном дистанционном тесте (GDT_TS) для моделей CASP» . ПЛОС ОДИН . 11 (5): e0154786. Бибкод : 2016PLoSO..1154786L . дои : 10.1371/journal.pone.0154786 . ПМЦ 4858170 . ПМИД 27149620 .
Внешние ссылки
[ редактировать ]- Результаты CASP14 — сводные таблицы последнего эксперимента CASP, проведенного в 2020 году, включая примеры графиков оценки GDT в зависимости от предельного расстояния.
- Службы описания GDT, GDC, LCS и LGA, а также документация по сравнению структур и мерам сходства.