КАСП
Критическая оценка прогнозирования структуры ( CASP ), [1] Иногда называемый критической оценкой прогнозирования структуры белка рамках всего сообщества каждые два года, начиная с 1994 года. , это всемирный эксперимент по прогнозированию структуры белка , проводимый в [2] CASP предоставляет исследовательским группам возможность объективно протестировать свои методы прогнозирования структуры и предоставляет исследовательскому сообществу и пользователям программного обеспечения независимую оценку современного состояния моделирования структуры белков. Несмотря на то, что основной целью CASP является содействие развитию методов идентификации белка трехмерной структуры по его аминокислотной последовательности, многие рассматривают эксперимент скорее как «чемпионат мира» в этой области науки. Более 100 исследовательских групп со всего мира регулярно участвуют в CASP, и нередко целые группы приостанавливают другие исследования на месяцы, сосредоточившись на подготовке своих серверов к эксперименту и выполнении подробных прогнозов.
Выбор целевых белков
[ редактировать ]Чтобы гарантировать, что ни один предиктор не сможет иметь предварительную информацию о структуре белка, которая давала бы ему преимущество, важно, чтобы эксперимент проводился двойным слепым способом: ни предсказатели, ни организаторы и эксперты не знают структуры белка. целевые белки в то время, когда делаются прогнозы. Целями для предсказания структуры являются либо структуры, которые вскоре будут решены с помощью рентгеновской кристаллографии или ЯМР-спектроскопии, либо структуры, которые только что были решены (в основном одним из центров структурной геномики ) и хранятся в Банке данных белков . Если окажется, что данная последовательность связана общим происхождением с белковой последовательностью известной структуры (называемой матрицей), сравнительное моделирование белков можно использовать для предсказания третичной структуры . Шаблоны можно найти с помощью методов выравнивания последовательностей (например, BLAST или HHsearch ) или методов белковой нити , которые лучше подходят для поиска отдаленно связанных шаблонов. В противном случае de novo предсказание структуры белка необходимо применять (например, Rosetta), который гораздо менее надежен, но иногда может дать модели с правильной укладкой (обычно для белков, содержащих менее 100-150 аминокислот). По-настоящему новые складки среди целей становятся довольно редкими, [3] [4] делая эту категорию меньшей, чем хотелось бы.
Оценка
[ редактировать ]Основной метод оценки [5] представляет собой сравнение предсказанных модельных положений α-углерода с позициями в целевой структуре. Сравнение показано визуально совокупными графиками расстояний между парами эквивалентов α-углерода при совмещении модели и структуры, например, как показано на рисунке (идеальная модель оставалась бы на нуле на всем протяжении), и присваивается числовая оценка GDT-TS (Глобальный дистанционный тест — общая оценка), описывающая процент хорошо смоделированных остатков в модели по отношению к целевому значению. [6] Свободное моделирование (без шаблонов или de novo ) также оценивается экспертами визуально, поскольку числовые оценки не подходят для обнаружения случайных сходств в наиболее сложных случаях. [7] Высокоточные прогнозы на основе шаблонов оценивались в CASP7 по тому, работают ли они для фазового замещения молекул целевой кристаллической структуры. [8] успехи последовали позже, [9] а также по качеству модели полной модели (а не только α-углерода ) и ее соответствия целевому показателю CASP8. [10]
Оценка результатов осуществляется по следующим категориям прогнозирования:
- прогноз третичной структуры (все CASP)
- прогноз вторичной структуры (отменен после CASP5)
- предсказание структурных комплексов (только CASP2; отдельный эксперимент CAPRI посвящен этой теме)
- прогнозирование контакта остатков с остатками (начиная с CASP4)
- прогноз неупорядоченных регионов (начиная с CASP5)
- прогнозирование границ домена (CASP6 – CASP8)
- функции (начиная с CASP6) прогнозирование
- оценка качества модели (начиная с CASP7)
- уточнение модели (начиная с CASP7)
- высокоточное прогнозирование на основе шаблонов (начиная с CASP7)
Категория прогнозирования третичной структуры была дополнительно подразделена на:
- моделирование гомологии
- распознавание складок (также называемое белковой нитью ; обратите внимание, что это название неверно, поскольку нитью является метод)
- предсказание структуры de novo , теперь называемое «новым сгибом», поскольку многие методы применяют оценку или подсчет очков, функции, которые смещены в зависимости от знаний о нативных белковых структурах, таких как искусственная нейронная сеть .
Начиная с CASP7, категории были переопределены, чтобы отразить развитие методов. Категория «Моделирование на основе шаблонов» включает в себя все прежние сравнительные модели, гомологичные модели на основе складок и некоторые аналогичные модели на основе складок. Категория «моделирование без шаблонов (FM)» включает модели белков с ранее невидимыми складками и модели, основанные на жестких аналогичных складках. Из-за ограниченного количества свободных от шаблонов целей (они довольно редки) в 2011 году был введен так называемый CASP ROLL. Этот непрерывный (постоянный) эксперимент CASP направлен на более строгую оценку методов прогнозирования без шаблонов посредством оценки большего числа целей вне обычного сезона прогнозирования CASP. В отличие от LiveBench и EVA , этот эксперимент выполнен в духе CASP слепого прогнозирования, то есть все прогнозы делаются на еще неизвестных структурах. [11]
Результаты CASP публикуются в специальных выпусках научных приложений к научному журналу Proteins , все из которых доступны на веб-сайте CASP. [12] В передовой статье каждого из этих приложений описываются особенности эксперимента. [13] [14] а в заключительной статье оценивается прогресс в этой области. [15] [16]
АльфаФолд
[ редактировать ]В декабре 2018 года CASP13 попал в заголовки газет, когда его выиграла AlphaFold , программа искусственного интеллекта, созданная DeepMind . [17] В ноябре 2020 года улучшенная версия 2 AlphaFold выиграла CASP1. [18] По словам одного из соучредителей CASP Джона Моулта, AlphaFold набрал около 90 баллов по 100-балльной шкале точности прогнозирования для умеренно сложных белковых целей. [19] AlphaFold был сделан с открытым исходным кодом в 2021 году, а в CASP15 в 2022 году, пока DeepMind не вошел, практически все высокопоставленные команды использовали AlphaFold или модификации AlphaFold. [20]
См. также
[ редактировать ]- Критическая оценка прогнозирования взаимодействий (CAPRI)
- Критическая оценка аннотации функций (CAFA)
- Критическая оценка интерпретации генома (CAGI)
Ссылки
[ редактировать ]- ^ «Дом – CASP15» . Precisioncenter.org . Проверено 14 декабря 2022 г.
- ^ Моулт Дж., Педерсен Дж.Т., Джадсон Р., Фиделис К. (ноябрь 1995 г.). «Масштабный эксперимент по оценке методов прогнозирования структуры белка» . Белки . 23 (3): ii – v. дои : 10.1002/прот.340230303 . ПМИД 8710822 . S2CID 11216440 .
- ^ Тресс М.Л., Эзкурдия И, Ричардсон Дж.С. (2009). «Определение и классификация целевого домена в CASP8» . Белки . 77 Приложение 9 (Приложение 9): 10–7. дои : 10.1002/прот.22497 . ПМК 2805415 . ПМИД 19603487 .
- ^ Чжан Ю, Сколник Дж (январь 2005 г.). «Проблема предсказания структуры белка может быть решена с использованием текущей библиотеки PDB» . Труды Национальной академии наук Соединенных Штатов Америки . 102 (4): 1029–34. Бибкод : 2005PNAS..102.1029Z . дои : 10.1073/pnas.0407152101 . ПМЦ 545829 . ПМИД 15653774 .
- ^ Коццетто Д., Криштафович А., Фиделис К., Моулт Дж., Рост Б., Трамонтано А. (2009). «Оценка моделей на основе шаблонов в CASP8 с помощью стандартных мер» . Белки . 77 Приложение 9 (Приложение 9): 18–28. дои : 10.1002/прот.22561 . ПМЦ 4589151 . ПМИД 19731382 .
- ^ Земля А (июль 2003 г.). «LGA: метод поиска трехмерных сходств в белковых структурах» . Исследования нуклеиновых кислот . 31 (13): 3370–4. дои : 10.1093/nar/gkg571 . ПМК 168977 . ПМИД 12824330 .
- ^ Бен-Дэвид М., Нойвирт-Брик О., Пас А., Прилуски Дж., Сассман Дж.Л., Леви Ю. (2009). «Оценка прогнозов структуры CASP8 для целей без шаблонов». Белки . 77 Приложение 9 (Приложение 9): 50–65. дои : 10.1002/прот.22591 . ПМИД 19774550 . S2CID 16517118 .
- ^ Прочтите RJ, Chavali G (2007). «Оценка прогнозов CASP7 в категории высокоточного моделирования на основе шаблонов» . Белки . 69 Приложение 8 (Приложение 8): 27–37. дои : 10.1002/prot.21662 . ПМИД 17894351 . S2CID 33172629 .
- ^ Цянь Б., Раман С., Дас Р., Брэдли П., Маккой А.Дж., Рид Р.Дж., Бейкер Д. (ноябрь 2007 г.). «Предсказание структуры высокого разрешения и проблема кристаллографической фазы» . Природа . 450 (7167): 259–64. Бибкод : 2007Natur.450..259Q . дои : 10.1038/nature06249 . ПМК 2504711 . ПМИД 17934447 .
- ^ Киди Д.А., Уильямс С.Дж., Хедд Дж.Дж., Арендалл В.Б., Чен В.Б., Капрал Г.Дж. и др. (2009). «Остальные 90% белка: оценка за пределами Calphas для моделей высокой точности на основе матрицы CASP8» . Белки . 77 Приложение 9 (Приложение 9): 29–49. дои : 10.1002/прот.22551 . ПМЦ 2877634 . ПМИД 19731372 .
- ^ Крыштафович А, Монастырский Б, Фиделис К (февраль 2014 г.). «Инфраструктура центра прогнозирования CASP и меры оценки в рамках CASP10 и CASP ROLL» . Белки . 82 Приложение 2 (2): 7–13. дои : 10.1002/прот.24399 . ПМК 4396618 . ПМИД 24038551 .
- ^ «Процедуры КАСП» .
- ^ Моулт Дж., Фиделис К., Крыштафович А., Рост Б., Хаббард Т., Трамонтано А. (2007). «Критическая оценка методов предсказания структуры белков. VII Раунд» . Белки . 69 Приложение 8 (Приложение 8): 3–9. дои : 10.1002/прот.21767 . ПМЦ 2653632 . ПМИД 17918729 .
- ^ Моулт Дж., Фиделис К., Крыштафович А., Рост Б., Трамонтано А. (2009). «Критическая оценка методов прогнозирования структуры белков – VIII раунд» . Белки . 77 Приложение 9 (Приложение 9): 1–4. дои : 10.1002/прот.22589 . ПМИД 19774620 . S2CID 9704851 .
- ^ Крыштафович А, Фиделис К, Моулт Дж (2007). «Прогресс от CASP6 к CASP7» . Белки . 69 Приложение 8 (Приложение 8): 194–207. дои : 10.1002/прот.21769 . ПМИД 17918728 . S2CID 40200832 .
- ^ Крыштафович А, Фиделис К, Моулт Дж (2009). «Результаты CASP8 в контексте предыдущих экспериментов» . Белки . 77 Приложение 9 (Приложение 9): 217–28. дои : 10.1002/прот.22562 . ПМК 5479686 . ПМИД 19722266 .
- ^ Сэмпл, Ян (2 декабря 2018 г.). «DeepMind от Google предсказывает трехмерные формы белков» . Хранитель . Проверено 19 июля 2019 г.
- ^ «ИИ компании DeepMind, сворачивающий белки, решил грандиозную проблему биологии, возникшую 50 лет назад» . Обзор технологий Массачусетского технологического института . Проверено 30 ноября 2020 г. .
- ^ Каллауэй, Юэн (2020). « Это изменит всё»: искусственный интеллект DeepMind совершает гигантский скачок в решении белковых структур» . Природа . 588 (7837): 203–204. дои : 10.1038/d41586-020-03348-4 . ПМИД 33257889 . S2CID 227243204 .
- ^ Шрайнер, Максимилиан (14 декабря 2022 г.). «CASP15: успех AlphaFold ставит новые задачи в предсказании структуры белков» . Декодер . Проверено 13 февраля 2023 г.
Внешние ссылки
[ редактировать ]Рейтинг результатов
[ редактировать ]Автоматизированные оценки для CASP15 (2022 г.)
Автоматизированные оценки для CASP14 (2020 г.)
Автоматизированные оценки для CASP13 (2018 г.)
Автоматизированные оценки для CASP12 (2016 г.)
Автоматизированные оценки для CASP11 (2014 г.)
- Официальный рейтинг только для серверов (126 целей)
- Официальный рейтинг для людей и серверов (78 целей)
- Рейтинг Zhang Lab
Автоматизированные оценки для CASP10 (2012 г.)
- Официальный рейтинг только для серверов (127 целей)
- Официальный рейтинг для людей и серверов (71 цель)
- Рейтинг Zhang Lab
Автоматизированные оценки для CASP9 (2010 г.)
- Официальный рейтинг только для серверов (147 целей)
- Официальный рейтинг для людей и серверов (78 целей)
- Ranking by Grishin Lab (for server only)
- Рейтинг Grishin Lab (для людей и серверов)
- Рейтинг Zhang Lab
- Рейтинг Cheng Lab
Автоматизированные оценки для CASP8 (2008 г.)
- Официальный рейтинг только для серверов
- Официальный рейтинг для людей и серверов
- Рейтинг Zhang Lab
- Ranking by Grishin Lab
- Рейтинг лаборатории Макгаффина
- Рейтинг Cheng Lab
Автоматизированные оценки для CASP7 (2006 г.)