Jump to content

База данных структурной классификации белков

ОБЪЕМ
Содержание
Описание Классификация структуры белка
Контакт
Исследовательский центр Лаборатория молекулярной биологии
Авторы Алексей Г. Мурзин, Стивен Э. Бреннер, Тим Дж. П. Хаббард и Сайрус Чотиа
Первичное цитирование ПМИД   7723011
Дата выпуска 1994
Доступ
Веб-сайт http://scop.mrc-lmb.cam.ac.uk/scop/
Разнообразный
Версия 1,75 (июнь 2009 г.; 110 800 доменов в 38 221 структуре, классифицированных как 3902 семейства) [1]
Политика курирования руководство
Объем
Содержание
Описание SCOP - расширенный
Контакт
Авторы Наоми К. Фокс, Стивен Э. Бреннер и Джон-Марк Чандония
Первичное цитирование ПМИД   24304899
Доступ
Веб-сайт https://scop.berkeley.edu
Разнообразный
Версия 2.07 (март 2018 г.; 276 231 домен в 87 224 структурах, отнесенных к 4 919 семействам) [2]
Политика курирования ручное (новые классификации) и автоматизированное (новые структуры, BLAST )

База данных Структурной классификации белков (SCOP) представляет собой в основном ручную классификацию структурных доменов белков , основанную на сходстве их структур и аминокислотных последовательностей . Мотивом для этой классификации является определение эволюционных взаимоотношений между белками. Белки одинаковой формы, но имеющие небольшое сходство последовательности или функциональное сходство, относят к разным суперсемействам и, как предполагается, имеют лишь очень отдаленного общего предка. Белки, имеющие одинаковую форму и некоторое сходство последовательности и/или функции, относят к «семействам» и предполагают, что они имеют более близкого общего предка.

Подобно базам данных CATH и Pfam , SCOP обеспечивает классификацию отдельных структурных доменов белков, а не классификацию всех белков , которые могут включать значительное количество различных доменов.

База данных SCOP находится в свободном доступе в Интернете. SCOP был создан в 1994 году на базе Центра белковой инженерии и лаборатории молекулярной биологии . [3] Его поддерживали Алексей Мурзин и его коллеги в Центре белковой инженерии до его закрытия в 2010 году, а затем в Лаборатории молекулярной биологии в Кембридже, Англия. [4] [5] [6] [1]

Работа над SCOP 1.75 была прекращена в 2014 году. С тех пор команда SCOPe из Калифорнийского университета в Беркли отвечает за обновление базы данных совместимым образом, используя сочетание автоматизированных и ручных методов. По состоянию на апрель 2019 г. , последняя версия — SCOPe 2.07 (март 2018 г.). [2]

Новая база данных Структурной классификации белков версии 2 (SCOP2) была выпущена в начале 2020 года. В новом обновлении улучшена схема базы данных, новый API и модернизированный веб-интерфейс. Это было самое значительное обновление, сделанное кембриджской группой со времен SCOP 1.75, и оно основано на достижениях в схеме прототипа SCOP 2. [7]

Иерархическая организация

[ редактировать ]

Источником белковых структур является Банк данных белков . Единицей классификации структуры в SCOP является белковый домен . То, что авторы SCOP подразумевают под «доменом», можно предположить из их утверждения о том, что малые белки и большинство белков среднего размера имеют только один домен. [8] и наблюдением, что человеческий гемоглобин, [9] который имеет структуру α2β2 . β , назначается два домена SCOP, один для α и один для субъединицы

Формы доменов в SCOP называются «складками». Домены, принадлежащие одной складке, имеют одинаковые основные вторичные структуры, одинаковое расположение и одинаковые топологические связи. В SCOP версии 1.75 дано 1195 складок. Даются краткие описания каждой створки. Например, «глобиноподобная» складка описывается как ядро: 6 спиралей; сложенный лист, частично раскрытый . Группа, к которой принадлежит домен, определяется проверкой, а не программным обеспечением.

Уровни SCOP версии 1.75 следующие.

  1. Класс : Типы складок, например бета-листы.
  2. Сгиб: различные формы доменов внутри класса.
  3. Суперсемейство : Домены в сгибе сгруппированы в суперсемейства, которые имеют по крайней мере отдаленного общего предка.
  4. Семья : Домены в суперсемействе группируются в семейства, имеющие более недавнего общего предка.
  5. Белковый домен: Домены в семействах сгруппированы в белковые домены, которые по сути представляют собой один и тот же белок.
  6. Виды: Домены в «белковых доменах» сгруппированы по видам.
  7. Домен: часть белка. Для простых белков это может быть весь белок.

Самыми широкими группами в SCOP версии 1.75 являются классы белковых складок . Эти классы группируют структуры со схожим составом вторичной структуры, но разными общими третичными структурами и эволюционным происхождением. Это «корень» верхнего уровня иерархической классификации SCOP.

  1. Все альфа-белки [46456] (284): Домены, состоящие из α-спиралей.
  2. Все бета-белки [48724] (174): Домены, состоящие из β-листов.
  3. Альфа- и бета-белки (a/b) [51349] (147): В основном параллельные бета-листы (бета-альфа-бета-единицы)
  4. Альфа- и бета-белки (a+b) [53931] (376): в основном антипараллельные бета-листы (отдельные альфа- и бета-области)
  5. Мультидоменные белки (альфа и бета) [56572] (66): складки, состоящие из двух или более доменов, принадлежащих к разным классам.
  6. мембран и клеточной поверхности белки и пептиды [56835] (58): Не включают белки иммунной системы.
  7. Малые белки [56992] (90): Обычно в них преобладают металлические лиганды , кофакторы и/или дисульфидные мостики.
  8. белки со спиральной спиралью [57942] (7): не относятся к истинному классу
  9. Белковые структуры низкого разрешения [58117] (26): Пептиды и фрагменты. Не настоящий класс
  10. Пептиды [58231] (121): пептиды и фрагменты. Не настоящий класс.
  11. Разработанные белки [58788] (44): Экспериментальные структуры белков с существенно неприродными последовательностями. Не настоящий класс

Число в скобках, называемое «sunid», представляет собой S COP уникальный целочисленный идентификатор для каждого узла в иерархии SCOP. Число в скобках указывает, сколько элементов находится в каждой категории. Например, в классе «Все альфа-белки» 284 складки. Каждый член иерархии является ссылкой на следующий уровень иерархии.

Каждый класс содержит несколько различных складок. Этот уровень классификации указывает на схожую третичную структуру, но не обязательно на эволюционное родство. Например, класс «All-α-белки» содержит >280 различных складок, в том числе: глобин -подобные (ядро: 6 спиралей; складчатый лист, частично раскрытый), длинную альфа-шпильку (2 спирали; антипараллельная шпилька, левостороннее закручивание). ) и домены докерина типа I (тандемный повтор двух кальций-связывающих петлево-спиральных мотивов, отличающихся от EF-руки).

Суперсемьи

[ редактировать ]

Домены внутри складки далее классифицируются на суперсемейства . Это крупнейшая группа белков, структурное сходство которых достаточно, чтобы указать на эволюционное родство и, следовательно, иметь общего предка. Однако предполагается, что этот предок является далеким, поскольку разные члены суперсемейства имеют низкую идентичность последовательностей . Например, двумя суперсемействами «глобиноподобной» складки являются: суперсемейство глобинов и суперсемейство альфа-спиральных ферредоксинов (содержит два кластера Fe4-S4).

Семейства белков более тесно связаны, чем суперсемейства. Домены относятся к одному семейству, если они имеют:

  1. >30% идентичности последовательностей
  2. некоторая идентичность последовательностей (например, 15%) и выполняют ту же функцию

Сходство последовательности и структуры свидетельствует о том, что эти белки имеют более близкое эволюционное родство, чем белки одного и того же суперсемейства. Инструменты секвенирования, такие как BLAST , используются для помощи в размещении доменов в суперсемействах и семействах. Например, четыре семейства в «глобиноподобном» суперсемействе «глобиноподобной» складки представляют собой усеченный гемоглобин (отсутствует первая спираль), мини-гемоглобин нервной ткани (отсутствует первая спираль, но в остальном он больше похож на обычные глобины). чем укороченные), глобины (гем-связывающий белок) и фикоцианин -подобные белки фикобилисомы (олигомеры двух разных типов глобин-подобных субъединиц, содержащие две дополнительные спирали на N-конце, связывающие билина хромофор ). Каждому семейству в SCOP назначается краткая классификационная строка sccs , где буква идентифицирует класс, к которому принадлежит домен; следующие целые числа идентифицируют складку, суперсемейство и семейство соответственно (например, a.1.1.2 для семейства «Глобин»). [10]

Входные домены PDB

[ редактировать ]

«TaxId» — это идентификационный номер таксономии и ссылка на браузер таксономии NCBI , который предоставляет дополнительную информацию о видах, к которым принадлежит белок. При нажатии на вид или изоформу открывается список доменов. Например, белок «Гемоглобин, альфа-цепь человека (Homo sapiens)» имеет > 190 решенных белковых структур, таких как 2dn3 (в комплексе с cmo) и 2dn1 (в комплексе с hem, mbn, oxy). При нажатии на номера PDB должна отображаться структура молекулы, но на данный момент ссылки не работают (ссылки работают в pre-SCOP).

Большинство страниц в SCOP содержат поле поиска. Ввод «трипсин +человек» позволяет получить несколько белков, включая белок трипсиноген человека. При выборе этой записи отображается страница, содержащая «родословную», которая находится вверху большинства страниц SCOP.

Человеческий трипсоноген [ проверьте орфографию ] родословная
  1. Корень: область видимости
  2. Класс: Все бета-белки [48724]
  3. Складка: трипсиноподобные сериновые протеазы [50493]
    бочка закрытая; п=6, С=8; греческий ключ
    дупликация: состоит из двух доменов одной складки
  4. Суперсемейство: трипсиноподобные сериновые протеазы [50494]
  5. Семейство: эукариотические протеазы [50514]
  6. Белок: Трипсин(оген) [50515]
  7. Вид: Человек (Homo sapiens) [TaxId: 9606] [50519]

Поиск по запросу «Субтилизин» возвращает белок «Субтилизин из Bacillus subtilis, Carlsberg» следующего происхождения.

Субтилизин из Bacillus subtilis линии Carlsberg.
  1. Корень: область видимости
  2. Класс: Альфа- и бета-белки (a/b) [51349]
    В основном параллельные бета-листы (бета-альфа-бета-единицы)
  3. Складка: субтилизиноподобная [52742]
    3 слоя: а/б/а, параллельный бета-лист из 7 нитей, заказ 2314567; левостороннее перекрестное соединение между нитями 2 и 3
  4. Надсемейство: субтилизиноподобные [52743]
  5. Семейство: субтилазы [52744]
  6. Белок: субтилизин [52745]
  7. Виды: Bacillus subtilis, Carlsberg [TaxId: 1423] [52746]

Хотя оба эти белка являются протеазами, они даже не принадлежат к одной и той же складке, что согласуется с тем, что они являются примером конвергентной эволюции .

Сравнение с другими системами классификации

[ редактировать ]

Классификация SCOP в большей степени зависит от ручных решений, чем полуавтоматическая классификация CATH , ее главного конкурента. Человеческий опыт используется для того, чтобы решить, являются ли определенные белки эволюционно связанными и, следовательно, их следует отнести к одному и тому же суперсемейству , или же их сходство является результатом структурных ограничений и, следовательно, они принадлежат к одному и тому же участку . Другая база данных, FSSP , создается чисто автоматически (включая регулярные автоматические обновления), но не предлагает никакой классификации, что позволяет пользователю сделать собственный вывод о значимости структурных связей на основе парных сравнений отдельных белковых структур.

Преемники SCOP

[ редактировать ]

К 2009 году исходная база данных SCOP вручную классифицировала 38 000 записей PDB в строго иерархическую структуру. С ускоряющимися темпами публикаций о структуре белков ограниченная автоматизация классификации не успевала за ними, что приводило к неполному набору данных. База данных расширенной структурной классификации белков (SCOPe) была выпущена в 2012 году с гораздо большей автоматизацией той же иерархической системы и полностью обратно совместима с SCOP версии 1.75. В 2014 году в SCOPe было вновь введено ручное курирование для обеспечения точного назначения структуры. По состоянию на февраль 2015 года SCOPe 2.05 классифицировал 71 000 из 110 000 записей PDB. [11]

Прототип SCOP2 представлял собой бета-версию Структурной классификации белков и системы классификации, целью которой было увеличение эволюционной сложности, присущей эволюции структуры белков. [12] Таким образом, это не простая иерархия, а направленная ациклическая графовая сеть, соединяющая суперсемейства белков, представляющие структурные и эволюционные отношения, такие как круговые перестановки , слияние доменов и распад доменов. Следовательно, домены не разделены строгими фиксированными границами, а определяются их отношениями к наиболее похожим другим структурам. Прототип использовался для разработки базы данных SCOP версии 2. [7] Версия SCOP 2, выпущенная в январе 2020 года, содержит 5134 семейства и 2485 суперсемейств по сравнению с 3902 семействами и 1962 суперсемействами в SCOP 1.75. Уровни классификации организуют более 41 000 неизбыточных доменов, которые представляют более 504 000 белковых структур.

База данных Эволюционной классификации белковых доменов (ECOD), выпущенная в 2014 году, аналогична расширению SCOPe версии SCOP 1.75. В отличие от совместимого SCOPe, он переименовывает иерархию класс-складка-суперсемейство-семейство в группировку архитектура-X-гомология-топология-семейство (A-XHTF), при этом последний уровень в основном определяется Pfam и дополняется кластеризацией HHsearch для неклассифицированных последовательностей. . [13] ECOD имеет лучшее покрытие PDB среди всех трех преемников: он охватывает каждую структуру PDB и обновляется раз в две недели. [14] Прямое сопоставление с Pfam оказалось полезным для кураторов Pfam, которые используют категорию уровня гомологии для дополнения своей «клановой» группировки. [15]

См. также

[ редактировать ]
  1. ^ Jump up to: а б Андреева А., Ховорт Д., Чандония Дж.М., Бреннер С.Е., Хаббард Т.Дж., Чотия С., Мурзин А.Г. (январь 2008 г.). «Рост данных и его влияние на базу данных SCOP: новые разработки» . Исследования нуклеиновых кислот . 36 (Проблема с базой данных): D419-25. дои : 10.1093/нар/gkm993 . ПМК   2238974 . ПМИД   18000004 .
  2. ^ Jump up to: а б Чандония Дж. М., Фокс Н. К., Бреннер С. Е. (январь 2019 г.). «SCOPe: классификация крупных макромолекулярных структур в расширенной базе данных структурной классификации белков» . Исследования нуклеиновых кислот . 47 (Д1): Д475–Д481. дои : 10.1093/нар/gky1134 . ПМК   6323910 . ПМИД   30500919 .
  3. ^ Мурзин А.Г., Бреннер С.Е., Хаббард Т., Чотия С. (апрель 1995 г.). «SCOP: база данных структурной классификации белков для исследования последовательностей и структур». Журнал молекулярной биологии . 247 (4): 536–40. дои : 10.1016/S0022-2836(05)80134-2 . ПМИД   7723011 .
  4. ^ Хаббард Т.Дж. , Эйли Б., Бреннер С.Е. , Мурзин А.Г., Чотия С. (январь 1999 г.). «SCOP: база данных структурной классификации белков» . Исследования нуклеиновых кислот . 27 (1): 254–6. дои : 10.1093/нар/27.1.254 . ПМЦ   148149 . ПМИД   9847194 .
  5. ^ Ло Конте Л., Эйли Б., Хаббард Т.Дж., Бреннер С.Е., Мурзин А.Г., Чотия С. (январь 2000 г.). «SCOP: база данных структурной классификации белков» . Исследования нуклеиновых кислот . 28 (1): 257–9. дои : 10.1093/нар/28.1.257 . ПМЦ   102479 . ПМИД   10592240 .
  6. ^ Андреева А., Ховорт Д., Бреннер С.Е., Хаббард Т.Дж., Чотия С., Мурзин А.Г. (январь 2004 г.). «База данных SCOP в 2004 году: уточнения объединяют данные о структуре и семействе последовательностей» . Исследования нуклеиновых кислот . 32 (Проблема с базой данных): D226-9. дои : 10.1093/nar/gkh039 . ПМК   308773 . ПМИД   14681400 .
  7. ^ Jump up to: а б Андреева А., Кулеша Е., Гоф Дж., Мурзин А.Г. (январь 2020 г.). «База данных SCOP в 2020 году: расширенная классификация репрезентативных доменов семейства и суперсемейства известных белковых структур» . Исследования нуклеиновых кислот . 48 (Проблема с базой данных): D376–D382. дои : 10.1093/nar/gkz1064 . ПМК   7139981 . ПМИД   31724711 .
  8. ^ Мурзин А.Г., Бреннер С.Е. , Хаббард Т. , Чотия С. (апрель 1995 г.). «SCOP: база данных структурной классификации белков для исследования последовательностей и структур» (PDF) . Журнал молекулярной биологии . 247 (4): 536–40. дои : 10.1016/S0022-2836(05)80134-2 . ПМИД   7723011 . Архивировано из оригинала (PDF) 26 апреля 2012 г.
  9. ^ ВВП : 2DN1 ; Пак С.Ю., Ёкояма Т., Сибаяма Н., Сиро Ю., Таме-младший (июль 2006 г.). «1,25 Разрешение кристаллических структур гемоглобина человека в окси-, дезокси- и углеродмонокси-формах». Журнал молекулярной биологии . 360 (3): 690–701. дои : 10.1016/j.jmb.2006.05.036 . ПМИД   16765986 .
  10. ^ Ло Конте Л., Бреннер С.Э., Хаббард Т.Дж., Чотия С., Мурзин А.Г. (январь 2002 г.). «База данных SCOP в 2002 году: уточнения, касающиеся структурной геномики» . Исследования нуклеиновых кислот . 30 (1): 264–7. дои : 10.1093/нар/30.1.264 . ЧВК   99154 . ПМИД   11752311 .
  11. ^ «Какова связь между SCOP, SCOPe и SCOP2» . scop.berkeley.edu . Проверено 22 августа 2015 г.
  12. ^ Андреева А., Ховорт Д., Чотия С., Кулеша Е., Мурзин А.Г. (январь 2014 г.). «Прототип SCOP2: новый подход к анализу структуры белка» . Исследования нуклеиновых кислот . 42 (Проблема с базой данных): D310-4. дои : 10.1093/нар/gkt1242 . ПМЦ   3964979 . ПМИД   24293656 .
  13. ^ Ченг Х., Шеффер Р.Д., Ляо Ю., Кинч Л.Н., Пей Дж., Ши С., Ким Б.Х., Гришин Н.В. (декабрь 2014 г.). «ECOD: эволюционная классификация белковых доменов» . PLOS Вычислительная биология . 10 (12): e1003926. Бибкод : 2014PLSCB..10E3926C . дои : 10.1371/journal.pcbi.1003926 . ПМК   4256011 . ПМИД   25474468 .
  14. ^ «Эволюционная классификация белковых доменов» . prodata.swmed.edu . Проверено 18 мая 2019 г.
  15. ^ Эль-Гебали С., Мистри Дж., Бейтман А., Эдди С.Р., Лучани А., Поттер СК, Куреши М., Ричардсон Л.Дж., Салазар Г.А., Смарт А., Зоннхаммер Э.Л., Хирш Л., Паладин Л., Пиовесан Д., Тосатто СК, Финн Р.Д. ( январь 2019 г.). «База данных семейств белков Pfam в 2019 году» . Исследования нуклеиновых кислот . 47 (Д1): Д427–Д432. дои : 10.1093/nar/gky995 . ПМК   6324024 . ПМИД   30357350 .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 653316a1afaafaea2a90bf789e605a9e__1702308240
URL1:https://arc.ask3.ru/arc/aa/65/9e/653316a1afaafaea2a90bf789e605a9e.html
Заголовок, (Title) документа по адресу, URL1:
Structural Classification of Proteins database - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)