База данных структурной классификации белков
![]() | |
Содержание | |
---|---|
Описание | Классификация структуры белка |
Контакт | |
Исследовательский центр | Лаборатория молекулярной биологии |
Авторы | Алексей Г. Мурзин, Стивен Э. Бреннер, Тим Дж. П. Хаббард и Сайрус Чотиа |
Первичное цитирование | ПМИД 7723011 |
Дата выпуска | 1994 |
Доступ | |
Веб-сайт | http://scop.mrc-lmb.cam.ac.uk/scop/ |
Разнообразный | |
Версия | 1,75 (июнь 2009 г.; 110 800 доменов в 38 221 структуре, классифицированных как 3902 семейства) [1] |
Политика курирования | руководство |
Содержание | |
---|---|
Описание | SCOP - расширенный |
Контакт | |
Авторы | Наоми К. Фокс, Стивен Э. Бреннер и Джон-Марк Чандония |
Первичное цитирование | ПМИД 24304899 |
Доступ | |
Веб-сайт | https://scop.berkeley.edu |
Разнообразный | |
Версия | 2.07 (март 2018 г.; 276 231 домен в 87 224 структурах, отнесенных к 4 919 семействам) [2] |
Политика курирования | ручное (новые классификации) и автоматизированное (новые структуры, BLAST ) |
База данных Структурной классификации белков (SCOP) представляет собой в основном ручную классификацию структурных доменов белков , основанную на сходстве их структур и аминокислотных последовательностей . Мотивом для этой классификации является определение эволюционных взаимоотношений между белками. Белки одинаковой формы, но имеющие небольшое сходство последовательности или функциональное сходство, относят к разным суперсемействам и, как предполагается, имеют лишь очень отдаленного общего предка. Белки, имеющие одинаковую форму и некоторое сходство последовательности и/или функции, относят к «семействам» и предполагают, что они имеют более близкого общего предка.
Подобно базам данных CATH и Pfam , SCOP обеспечивает классификацию отдельных структурных доменов белков, а не классификацию всех белков , которые могут включать значительное количество различных доменов.
База данных SCOP находится в свободном доступе в Интернете. SCOP был создан в 1994 году на базе Центра белковой инженерии и лаборатории молекулярной биологии . [3] Его поддерживали Алексей Мурзин и его коллеги в Центре белковой инженерии до его закрытия в 2010 году, а затем в Лаборатории молекулярной биологии в Кембридже, Англия. [4] [5] [6] [1]
Работа над SCOP 1.75 была прекращена в 2014 году. С тех пор команда SCOPe из Калифорнийского университета в Беркли отвечает за обновление базы данных совместимым образом, используя сочетание автоматизированных и ручных методов. По состоянию на апрель 2019 г. [update], последняя версия — SCOPe 2.07 (март 2018 г.). [2]
Новая база данных Структурной классификации белков версии 2 (SCOP2) была выпущена в начале 2020 года. В новом обновлении улучшена схема базы данных, новый API и модернизированный веб-интерфейс. Это было самое значительное обновление, сделанное кембриджской группой со времен SCOP 1.75, и оно основано на достижениях в схеме прототипа SCOP 2. [7]
Иерархическая организация
[ редактировать ]Источником белковых структур является Банк данных белков . Единицей классификации структуры в SCOP является белковый домен . То, что авторы SCOP подразумевают под «доменом», можно предположить из их утверждения о том, что малые белки и большинство белков среднего размера имеют только один домен. [8] и наблюдением, что человеческий гемоглобин, [9] который имеет структуру α2β2 . β , назначается два домена SCOP, один для α и один для субъединицы
Формы доменов в SCOP называются «складками». Домены, принадлежащие одной складке, имеют одинаковые основные вторичные структуры, одинаковое расположение и одинаковые топологические связи. В SCOP версии 1.75 дано 1195 складок. Даются краткие описания каждой створки. Например, «глобиноподобная» складка описывается как ядро: 6 спиралей; сложенный лист, частично раскрытый . Группа, к которой принадлежит домен, определяется проверкой, а не программным обеспечением.
Уровни SCOP версии 1.75 следующие.
- Класс : Типы складок, например бета-листы.
- Сгиб: различные формы доменов внутри класса.
- Суперсемейство : Домены в сгибе сгруппированы в суперсемейства, которые имеют по крайней мере отдаленного общего предка.
- Семья : Домены в суперсемействе группируются в семейства, имеющие более недавнего общего предка.
- Белковый домен: Домены в семействах сгруппированы в белковые домены, которые по сути представляют собой один и тот же белок.
- Виды: Домены в «белковых доменах» сгруппированы по видам.
- Домен: часть белка. Для простых белков это может быть весь белок.
Классы
[ редактировать ]Самыми широкими группами в SCOP версии 1.75 являются классы белковых складок . Эти классы группируют структуры со схожим составом вторичной структуры, но разными общими третичными структурами и эволюционным происхождением. Это «корень» верхнего уровня иерархической классификации SCOP.
- Все альфа-белки [46456] (284): Домены, состоящие из α-спиралей.
- Все бета-белки [48724] (174): Домены, состоящие из β-листов.
- Альфа- и бета-белки (a/b) [51349] (147): В основном параллельные бета-листы (бета-альфа-бета-единицы)
- Альфа- и бета-белки (a+b) [53931] (376): в основном антипараллельные бета-листы (отдельные альфа- и бета-области)
- Мультидоменные белки (альфа и бета) [56572] (66): складки, состоящие из двух или более доменов, принадлежащих к разным классам.
- мембран и клеточной поверхности белки и пептиды [56835] (58): Не включают белки иммунной системы.
- Малые белки [56992] (90): Обычно в них преобладают металлические лиганды , кофакторы и/или дисульфидные мостики.
- белки со спиральной спиралью [57942] (7): не относятся к истинному классу
- Белковые структуры низкого разрешения [58117] (26): Пептиды и фрагменты. Не настоящий класс
- Пептиды [58231] (121): пептиды и фрагменты. Не настоящий класс.
- Разработанные белки [58788] (44): Экспериментальные структуры белков с существенно неприродными последовательностями. Не настоящий класс
Число в скобках, называемое «sunid», представляет собой S COP уникальный целочисленный идентификатор для каждого узла в иерархии SCOP. Число в скобках указывает, сколько элементов находится в каждой категории. Например, в классе «Все альфа-белки» 284 складки. Каждый член иерархии является ссылкой на следующий уровень иерархии.
Складки
[ редактировать ]Каждый класс содержит несколько различных складок. Этот уровень классификации указывает на схожую третичную структуру, но не обязательно на эволюционное родство. Например, класс «All-α-белки» содержит >280 различных складок, в том числе: глобин -подобные (ядро: 6 спиралей; складчатый лист, частично раскрытый), длинную альфа-шпильку (2 спирали; антипараллельная шпилька, левостороннее закручивание). ) и домены докерина типа I (тандемный повтор двух кальций-связывающих петлево-спиральных мотивов, отличающихся от EF-руки).
Суперсемьи
[ редактировать ]Домены внутри складки далее классифицируются на суперсемейства . Это крупнейшая группа белков, структурное сходство которых достаточно, чтобы указать на эволюционное родство и, следовательно, иметь общего предка. Однако предполагается, что этот предок является далеким, поскольку разные члены суперсемейства имеют низкую идентичность последовательностей . Например, двумя суперсемействами «глобиноподобной» складки являются: суперсемейство глобинов и суперсемейство альфа-спиральных ферредоксинов (содержит два кластера Fe4-S4).
Семьи
[ редактировать ]Семейства белков более тесно связаны, чем суперсемейства. Домены относятся к одному семейству, если они имеют:
- >30% идентичности последовательностей
- некоторая идентичность последовательностей (например, 15%) и выполняют ту же функцию
Сходство последовательности и структуры свидетельствует о том, что эти белки имеют более близкое эволюционное родство, чем белки одного и того же суперсемейства. Инструменты секвенирования, такие как BLAST , используются для помощи в размещении доменов в суперсемействах и семействах. Например, четыре семейства в «глобиноподобном» суперсемействе «глобиноподобной» складки представляют собой усеченный гемоглобин (отсутствует первая спираль), мини-гемоглобин нервной ткани (отсутствует первая спираль, но в остальном он больше похож на обычные глобины). чем укороченные), глобины (гем-связывающий белок) и фикоцианин -подобные белки фикобилисомы (олигомеры двух разных типов глобин-подобных субъединиц, содержащие две дополнительные спирали на N-конце, связывающие билина хромофор ). Каждому семейству в SCOP назначается краткая классификационная строка sccs , где буква идентифицирует класс, к которому принадлежит домен; следующие целые числа идентифицируют складку, суперсемейство и семейство соответственно (например, a.1.1.2 для семейства «Глобин»). [10]
Входные домены PDB
[ редактировать ]«TaxId» — это идентификационный номер таксономии и ссылка на браузер таксономии NCBI , который предоставляет дополнительную информацию о видах, к которым принадлежит белок. При нажатии на вид или изоформу открывается список доменов. Например, белок «Гемоглобин, альфа-цепь человека (Homo sapiens)» имеет > 190 решенных белковых структур, таких как 2dn3 (в комплексе с cmo) и 2dn1 (в комплексе с hem, mbn, oxy). При нажатии на номера PDB должна отображаться структура молекулы, но на данный момент ссылки не работают (ссылки работают в pre-SCOP).
Пример
[ редактировать ]Большинство страниц в SCOP содержат поле поиска. Ввод «трипсин +человек» позволяет получить несколько белков, включая белок трипсиноген человека. При выборе этой записи отображается страница, содержащая «родословную», которая находится вверху большинства страниц SCOP.
- Человеческий трипсоноген [ проверьте орфографию ] родословная
- Корень: область видимости
- Класс: Все бета-белки [48724]
- Складка: трипсиноподобные сериновые протеазы [50493]
- бочка закрытая; п=6, С=8; греческий ключ
- дупликация: состоит из двух доменов одной складки
- Суперсемейство: трипсиноподобные сериновые протеазы [50494]
- Семейство: эукариотические протеазы [50514]
- Белок: Трипсин(оген) [50515]
- Вид: Человек (Homo sapiens) [TaxId: 9606] [50519]
Поиск по запросу «Субтилизин» возвращает белок «Субтилизин из Bacillus subtilis, Carlsberg» следующего происхождения.
- Субтилизин из Bacillus subtilis линии Carlsberg.
- Корень: область видимости
- Класс: Альфа- и бета-белки (a/b) [51349]
- В основном параллельные бета-листы (бета-альфа-бета-единицы)
- Складка: субтилизиноподобная [52742]
- 3 слоя: а/б/а, параллельный бета-лист из 7 нитей, заказ 2314567; левостороннее перекрестное соединение между нитями 2 и 3
- Надсемейство: субтилизиноподобные [52743]
- Семейство: субтилазы [52744]
- Белок: субтилизин [52745]
- Виды: Bacillus subtilis, Carlsberg [TaxId: 1423] [52746]
Хотя оба эти белка являются протеазами, они даже не принадлежат к одной и той же складке, что согласуется с тем, что они являются примером конвергентной эволюции .
Сравнение с другими системами классификации
[ редактировать ]Классификация SCOP в большей степени зависит от ручных решений, чем полуавтоматическая классификация CATH , ее главного конкурента. Человеческий опыт используется для того, чтобы решить, являются ли определенные белки эволюционно связанными и, следовательно, их следует отнести к одному и тому же суперсемейству , или же их сходство является результатом структурных ограничений и, следовательно, они принадлежат к одному и тому же участку . Другая база данных, FSSP , создается чисто автоматически (включая регулярные автоматические обновления), но не предлагает никакой классификации, что позволяет пользователю сделать собственный вывод о значимости структурных связей на основе парных сравнений отдельных белковых структур.
Преемники SCOP
[ редактировать ]К 2009 году исходная база данных SCOP вручную классифицировала 38 000 записей PDB в строго иерархическую структуру. С ускоряющимися темпами публикаций о структуре белков ограниченная автоматизация классификации не успевала за ними, что приводило к неполному набору данных. База данных расширенной структурной классификации белков (SCOPe) была выпущена в 2012 году с гораздо большей автоматизацией той же иерархической системы и полностью обратно совместима с SCOP версии 1.75. В 2014 году в SCOPe было вновь введено ручное курирование для обеспечения точного назначения структуры. По состоянию на февраль 2015 года SCOPe 2.05 классифицировал 71 000 из 110 000 записей PDB. [11]
Прототип SCOP2 представлял собой бета-версию Структурной классификации белков и системы классификации, целью которой было увеличение эволюционной сложности, присущей эволюции структуры белков. [12] Таким образом, это не простая иерархия, а направленная ациклическая графовая сеть, соединяющая суперсемейства белков, представляющие структурные и эволюционные отношения, такие как круговые перестановки , слияние доменов и распад доменов. Следовательно, домены не разделены строгими фиксированными границами, а определяются их отношениями к наиболее похожим другим структурам. Прототип использовался для разработки базы данных SCOP версии 2. [7] Версия SCOP 2, выпущенная в январе 2020 года, содержит 5134 семейства и 2485 суперсемейств по сравнению с 3902 семействами и 1962 суперсемействами в SCOP 1.75. Уровни классификации организуют более 41 000 неизбыточных доменов, которые представляют более 504 000 белковых структур.
База данных Эволюционной классификации белковых доменов (ECOD), выпущенная в 2014 году, аналогична расширению SCOPe версии SCOP 1.75. В отличие от совместимого SCOPe, он переименовывает иерархию класс-складка-суперсемейство-семейство в группировку архитектура-X-гомология-топология-семейство (A-XHTF), при этом последний уровень в основном определяется Pfam и дополняется кластеризацией HHsearch для неклассифицированных последовательностей. . [13] ECOD имеет лучшее покрытие PDB среди всех трех преемников: он охватывает каждую структуру PDB и обновляется раз в две недели. [14] Прямое сопоставление с Pfam оказалось полезным для кураторов Pfam, которые используют категорию уровня гомологии для дополнения своей «клановой» группировки. [15]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б Андреева А., Ховорт Д., Чандония Дж.М., Бреннер С.Е., Хаббард Т.Дж., Чотия С., Мурзин А.Г. (январь 2008 г.). «Рост данных и его влияние на базу данных SCOP: новые разработки» . Исследования нуклеиновых кислот . 36 (Проблема с базой данных): D419-25. дои : 10.1093/нар/gkm993 . ПМК 2238974 . ПМИД 18000004 .
- ^ Jump up to: а б Чандония Дж. М., Фокс Н. К., Бреннер С. Е. (январь 2019 г.). «SCOPe: классификация крупных макромолекулярных структур в расширенной базе данных структурной классификации белков» . Исследования нуклеиновых кислот . 47 (Д1): Д475–Д481. дои : 10.1093/нар/gky1134 . ПМК 6323910 . ПМИД 30500919 .
- ^ Мурзин А.Г., Бреннер С.Е., Хаббард Т., Чотия С. (апрель 1995 г.). «SCOP: база данных структурной классификации белков для исследования последовательностей и структур». Журнал молекулярной биологии . 247 (4): 536–40. дои : 10.1016/S0022-2836(05)80134-2 . ПМИД 7723011 .
- ^ Хаббард Т.Дж. , Эйли Б., Бреннер С.Е. , Мурзин А.Г., Чотия С. (январь 1999 г.). «SCOP: база данных структурной классификации белков» . Исследования нуклеиновых кислот . 27 (1): 254–6. дои : 10.1093/нар/27.1.254 . ПМЦ 148149 . ПМИД 9847194 .
- ^ Ло Конте Л., Эйли Б., Хаббард Т.Дж., Бреннер С.Е., Мурзин А.Г., Чотия С. (январь 2000 г.). «SCOP: база данных структурной классификации белков» . Исследования нуклеиновых кислот . 28 (1): 257–9. дои : 10.1093/нар/28.1.257 . ПМЦ 102479 . ПМИД 10592240 .
- ^ Андреева А., Ховорт Д., Бреннер С.Е., Хаббард Т.Дж., Чотия С., Мурзин А.Г. (январь 2004 г.). «База данных SCOP в 2004 году: уточнения объединяют данные о структуре и семействе последовательностей» . Исследования нуклеиновых кислот . 32 (Проблема с базой данных): D226-9. дои : 10.1093/nar/gkh039 . ПМК 308773 . ПМИД 14681400 .
- ^ Jump up to: а б Андреева А., Кулеша Е., Гоф Дж., Мурзин А.Г. (январь 2020 г.). «База данных SCOP в 2020 году: расширенная классификация репрезентативных доменов семейства и суперсемейства известных белковых структур» . Исследования нуклеиновых кислот . 48 (Проблема с базой данных): D376–D382. дои : 10.1093/nar/gkz1064 . ПМК 7139981 . ПМИД 31724711 .
- ^ Мурзин А.Г., Бреннер С.Е. , Хаббард Т. , Чотия С. (апрель 1995 г.). «SCOP: база данных структурной классификации белков для исследования последовательностей и структур» (PDF) . Журнал молекулярной биологии . 247 (4): 536–40. дои : 10.1016/S0022-2836(05)80134-2 . ПМИД 7723011 . Архивировано из оригинала (PDF) 26 апреля 2012 г.
- ^ ВВП : 2DN1 ; Пак С.Ю., Ёкояма Т., Сибаяма Н., Сиро Ю., Таме-младший (июль 2006 г.). «1,25 Разрешение кристаллических структур гемоглобина человека в окси-, дезокси- и углеродмонокси-формах». Журнал молекулярной биологии . 360 (3): 690–701. дои : 10.1016/j.jmb.2006.05.036 . ПМИД 16765986 .
- ^ Ло Конте Л., Бреннер С.Э., Хаббард Т.Дж., Чотия С., Мурзин А.Г. (январь 2002 г.). «База данных SCOP в 2002 году: уточнения, касающиеся структурной геномики» . Исследования нуклеиновых кислот . 30 (1): 264–7. дои : 10.1093/нар/30.1.264 . ЧВК 99154 . ПМИД 11752311 .
- ^ «Какова связь между SCOP, SCOPe и SCOP2» . scop.berkeley.edu . Проверено 22 августа 2015 г.
- ^ Андреева А., Ховорт Д., Чотия С., Кулеша Е., Мурзин А.Г. (январь 2014 г.). «Прототип SCOP2: новый подход к анализу структуры белка» . Исследования нуклеиновых кислот . 42 (Проблема с базой данных): D310-4. дои : 10.1093/нар/gkt1242 . ПМЦ 3964979 . ПМИД 24293656 .
- ^ Ченг Х., Шеффер Р.Д., Ляо Ю., Кинч Л.Н., Пей Дж., Ши С., Ким Б.Х., Гришин Н.В. (декабрь 2014 г.). «ECOD: эволюционная классификация белковых доменов» . PLOS Вычислительная биология . 10 (12): e1003926. Бибкод : 2014PLSCB..10E3926C . дои : 10.1371/journal.pcbi.1003926 . ПМК 4256011 . ПМИД 25474468 .
- ^ «Эволюционная классификация белковых доменов» . prodata.swmed.edu . Проверено 18 мая 2019 г.
- ^ Эль-Гебали С., Мистри Дж., Бейтман А., Эдди С.Р., Лучани А., Поттер СК, Куреши М., Ричардсон Л.Дж., Салазар Г.А., Смарт А., Зоннхаммер Э.Л., Хирш Л., Паладин Л., Пиовесан Д., Тосатто СК, Финн Р.Д. ( январь 2019 г.). «База данных семейств белков Pfam в 2019 году» . Исследования нуклеиновых кислот . 47 (Д1): Д427–Д432. дои : 10.1093/nar/gky995 . ПМК 6324024 . ПМИД 30357350 .
Внешние ссылки
[ редактировать ]- Структурная классификация белков (SCOP 2) — ручная классификация репрезентативных доменов, регулярно обновляемая авторами SCOP.
- Структурная классификация белков (SCOP 1.75) — устаревший сайт SCOP 1.75, больше не обновляется.
- Расширенная структурная классификация белков (SCOPe) — более автоматизированный преемник SCOP версии 1.75.
- Эволюционная классификация белковых доменов (ECOD) — Эволюционная классификация, основанная на SCOP версии 1.75 и Pfam.
- Структурная классификация белков 2 (прототип SCOP2) — устаревший сайт прототипа SCOP 2, больше не обновляется.
- СУПЕРСЕМЕЙСТВО - Библиотека HMM, представляющая суперсемейства SCOP, и база данных аннотаций (суперсемейства и семейства) для всех полностью секвенированных организмов.
- Классификация структуры белков — глава книги, в которой подробно обсуждаются различные классификации белков.