Банк данных по белкам
Содержание | |
---|---|
Описание | |
Контакт | |
Первичное цитирование | ПМИД 30357364 |
Доступ | |
Формат данных | ммКИФ , PDB |
Веб-сайт |
Банк данных по белкам ( PDB ) [1] представляет собой базу данных трехмерных структурных данных крупных биологических молекул, таких как белки и нуклеиновые кислоты , которая контролируется Всемирным банком данных белков (wwPDB). Эти структурные данные получены и сохранены биологами и биохимиками во всем мире с помощью экспериментальных методологий, таких как рентгеновская кристаллография , ЯМР-спектроскопия и, все чаще, криоэлектронная микроскопия . Все представленные данные проверяются экспертами -биокураторами и после утверждения размещаются в свободном доступе в Интернете под лицензией CC0 Public Domain. [2] Глобальный доступ к данным обеспечивается сайтами организаций-членов wwPDB (PDBe, [3] ПДБдж, [4] РЦСБ ПДБ, [5] и БРМБ [6] ).
PDB является ключевой в областях структурной биологии , таких как структурная геномика . Большинство крупных научных журналов и некоторые финансирующие агентства теперь требуют от ученых предоставления данных о своей структуре в PDB. Многие другие базы данных используют белковые структуры, хранящиеся в PDB. Например, SCOP и CATH классифицируют белковые структуры, а PDBsum предоставляет графический обзор записей PDB, используя информацию из других источников, таких как Gene Ontology . [7] [8]
История [ править ]
Две силы сошлись, чтобы инициировать PDB: небольшая, но растущая коллекция наборов данных о структуре белков, определенных с помощью дифракции рентгеновских лучей; и недавно появившийся (1968 г.) дисплей молекулярной графики Brookhaven RAster Display (BRAD) для визуализации этих белковых структур в 3-D. В 1969 году при спонсорской поддержке Уолтера Гамильтона из Брукхейвенской национальной лаборатории Эдгар Мейер ( Техасский университет A&M ) начал писать программное обеспечение для хранения файлов координат атомов в общем формате, чтобы сделать их доступными для геометрической и графической оценки. К 1971 году одна из программ Мейера, SEARCH, позволила исследователям получить удаленный доступ к информации из базы данных для изучения белковых структур в автономном режиме. [9] ПОИСК сыграл важную роль в создании сети, положив тем самым функциональное начало PDB.
Банк данных о белках был анонсирован в октябре 1971 года в журнале Nature New Biology. [10] как совместное предприятие Кембриджского центра кристаллографических данных (Великобритания) и Брукхейвенской национальной лаборатории (США).
После смерти Гамильтона в 1973 году Том Кетцл взял на себя руководство PDB на последующие 20 лет. В январе 1994 года Джоэл Суссман из израильского Института науки Вейцмана главой PDB был назначен . В октябре 1998 года [11] PDB был передан в Исследовательскую лабораторию структурной биоинформатики (RCSB); [12] передача была завершена в июне 1999 года. Новым директором стала Хелен М. Берман из Университета Рутгерса (одно из управляющих учреждений RCSB, другое - Суперкомпьютерный центр Сан-Диего в Калифорнийском университете в Сан-Диего ). [13] В 2003 году с образованием wwPDB PDB стала международной организацией. Членами-учредителями являются PDBe (Европа), [3] RCSB (США) и PDBj (Япония). [4] БРМБ [6] присоединился в 2006 году. Каждый из четырех членов wwPDB может выступать в качестве центров хранения, обработки и распространения данных PDB. Обработка данных означает, что сотрудники wwPDB просматривают и комментируют каждую отправленную запись. [14] Затем данные автоматически проверяются на достоверность (исходный код [15] для этой проверки программное обеспечение было бесплатно доступно публике).
Содержание [ править ]
База данных PDB обновляется еженедельно ( UTC +0 среда) вместе со списком активов. [17] По состоянию на 10 января 2023 г. [update]в состав PDB вошли:
Экспериментальный Метод | белки Только | Белки с олигосахаридами | Белок/Нуклеиновая кислота комплексы | нуклеиновые кислоты Только | Другой | Только олигосахариды | Общий |
---|---|---|---|---|---|---|---|
Рентгеновская дифракция | 152277 | 8969 | 8027 | 2566 | 163 | 11 | 172013 |
ЯМР | 12104 | 32 | 281 | 1433 | 31 | 6 | 13887 |
Электронная микроскопия | 9226 | 1633 | 2898 | 77 | 8 | 0 | 13842 |
Гибридный | 189 | 7 | 6 | 12 | 0 | 1 | 215 |
Нейтрон | 72 | 1 | 0 | 2 | 0 | 0 | 75 |
Другой | 32 | 0 | 0 | 1 | 0 | 4 | 309 |
Общий: | 173900 | 10642 | 11212 | 4091 | 202 | 22 | 200069 |
- 162 041 структура в PDB имеет файл структурных коэффициентов .
- 11 242 структуры имеют файл ограничений ЯМР.
- 5774 структуры в PDB имеют файл химических сдвигов .
- 13 388 структур в PDB имеют файл карты 3DEM, хранящийся в банке данных EM.
Большинство структур определяется методом рентгеновской дифракции, но около 7% структур определяются методом ЯМР белков . При использовании дифракции рентгеновских лучей получают приближения координат атомов белка, тогда как с помощью ЯМР оценивают расстояние между парами атомов белка. Окончательная конформация белка получается с помощью ЯМР путем решения задачи геометрии расстояния . После 2013 года всё большее количество белков определяют с помощью криоэлектронной микроскопии .
Для структур PDB, определенных методом рентгеновской дифракции и имеющих файл структурных коэффициентов, можно просмотреть их карту электронной плотности. Данные таких структур можно просмотреть на трех сайтах PDB.
Исторически количество структур в PDB росло примерно по экспоненте: 100 структур было зарегистрировано в 1982 году, 1000 структур в 1993 году, 10 000 в 1999 году, 100 000 в 2014 году и 200 000 в январе 2023 года. [18] [19]
Формат файла [ править ]
Формат файла, первоначально используемый PDB, назывался форматом файла PDB. Исходный формат был ограничен шириной компьютерных перфокарт до 80 символов в строке. Примерно в 1996 году был введен в эксплуатацию формат «файла макромолекулярной кристаллографической информации», mmCIF, который является расширением формата CIF . В 2014 году mmCIF стал стандартным форматом для архива PDB. [20] В 2019 году WWPDB объявил, что данные по кристаллографическим методам будут приниматься только в формате mmCIF. [21]
версия XML- PDB, названная PDBML, была описана в 2005 году. [22] Файлы структур можно загрузить в любом из этих трех форматов, хотя все большее число структур не соответствует устаревшему формату PDB. Отдельные файлы легко загружаются в графические пакеты по URL-адресам Интернета :
- Для файлов формата PDB используйте, например,
http://www.pdb.org/pdb/files/4hhb.pdb.gz
илиhttp://pdbe.org/download/4hhb
- Для файлов PDBML (XML) используйте, например,
http://www.pdb.org/pdb/files/4hhb.xml.gz
илиhttp://pdbe.org/pdbml/4hhb
" 4hhb
" — это идентификатор PDB. Каждая структура, опубликованная в PDB, получает четырехзначный буквенно-цифровой идентификатор, ее идентификатор PDB. (Это не уникальный идентификатор для биомолекул, поскольку несколько структур для одной и той же молекулы — в разных средах или конформациях — могут содержаться в PDB с разными идентификаторами PDB.)
Просмотр данных [ править ]
Файлы структуры можно просмотреть с помощью одной из нескольких бесплатных компьютерных программ с открытым исходным кодом , включая Jmol , Pymol , VMD , Molstar и Rasmol . Другие несвободные условно- бесплатные программы включают ICM-Browser, [23] MDL Chime , UCSF Chimera , Swiss-PDB Viewer, [24] СтарБиохим [25] (интерактивная программа просмотра молекулярных данных на основе Java со встроенным поиском в банке данных белков), Sirius и VisProt3DS. [26] (инструмент для визуализации белков в 3D стереоскопическом представлении в анаглифном и других режимах) и Discovery Studio . Веб-сайт RCSB PDB содержит обширный список как бесплатных, так и коммерческих программ визуализации молекул, а также плагинов для веб-браузера.
См. также [ править ]
- Кристаллографическая база данных
- Структура белка
- Прогнозирование структуры белка
- База данных структуры белков
- PDBREPORT перечисляет все аномалии (а также ошибки) в структурах PDB.
- PDBsum — извлекает данные из других баз данных о структурах PDB.
- Proteopedia — совместная 3D-энциклопедия белков и других молекул.
Ссылки [ править ]
- ^ wwPDB, Консорциум (2019). «Банк данных белков: единый глобальный архив трехмерных данных о структуре макромолекул» . Нуклеиновые кислоты Рез . 47 (Д1): 520–528. дои : 10.1093/nar/gky949 . ПМК 6324056 . ПМИД 30357364 .
- ^ wwwPDB.org. «wwPDB: Политики использования» . www.wwpdb.org . Проверено 16 апреля 2024 г.
- ↑ Перейти обратно: Перейти обратно: а б «PDBe home < Node < EMBL-EBI» . pdbe.org .
- ↑ Перейти обратно: Перейти обратно: а б «Банк данных по белкам Японии – PDB Japan – PDBj» . pdbj.org .
- ^ Банк, Данные о белках RCSB. «RCSB PDB: Домашняя страница» . rcsb.org .
- ↑ Перейти обратно: Перейти обратно: а б «Биологический магнитно-резонансный банк» . bmrb.wisc.edu .
- ^ Берман, Ее Величество (январь 2008 г.). «Банк данных о белках: историческая перспектива» (PDF) . Acta Crystallographica Раздел А. А64 (1): 88–95. дои : 10.1107/S0108767307035623 . ПМИД 18156675 .
- ^ Ласковски Р.А., Хатчинсон Э.Г., Мичи А.Д., Уоллес А.К., Джонс М.Л., Торнтон Дж.М. (декабрь 1997 г.). «PDBsum: веб-база данных сводок и анализа всех структур PDB». Тенденции биохимии. Наука . 22 (12): 488–90. дои : 10.1016/S0968-0004(97)01140-7 . ПМИД 9433130 .
- ^ Мейер Э.Ф. (1997). «Первые годы Белкового банка данных» . Белковая наука . 6 (7). Издательство Кембриджского университета: 1591–1597. дои : 10.1002/pro.5560060724 . ПМК 2143743 . ПМИД 9232661 .
- ^ «Банк данных о белках» . Новая биология природы . 233 . 1971. doi : 10.1038/newbio233223b0 .
- ^ Берман Х.М., Уэстбрук Дж., Фенг З., Гиллиланд Дж., Бхат Т.Н., Вайсиг Х., Шиндьялов И.Н., Борн П.Е. (январь 2000 г.). «Банк данных о белках» . Нуклеиновые кислоты Рез . 28 (1): 235–242. дои : 10.1093/нар/28.1.235 . ПМЦ 102472 . ПМИД 10592235 .
- ^ «Научно-исследовательский коллектив структурной биоинформатики» . RCSB.org . Исследовательский коллектив структурной биоинформатики. Архивировано из оригинала 5 февраля 2007 г.
- ^ «Архив информационных бюллетеней RCSB PDB» . Банк данных белков RCSB.
- ^ Карри Э., Фрейтас А., О'Риайн С. (2010). «Роль управления данными, управляемого сообществом, для предприятий» . В Д. Вуде (ред.). Связывание корпоративных данных . Бостон: Springer США. стр. 25–47. ISBN 978-1-441-97664-2 .
- ^ «Пакет проверки PDB» . sw-tools.pdb.org .
- ^ Берли С.К., Берман Х.М., Бхикадия С., Би С., Чен Л., Костанцо Л.Д. и др. (консорциум wwPDB) (январь 2019 г.). «Банк данных белков: единый глобальный архив трехмерных данных о структуре макромолекул» . Исследования нуклеиновых кислот . 47 (Д1): Д520–Д528. дои : 10.1093/nar/gky949 . ПМК 6324056 . ПМИД 30357364 .
- ^ «Распределение текущих активов PDB» . РЦСБ. Архивировано из оригинала 4 июля 2007 г. Проверено 2 июля 2007 г.
- ^ Анон (2014). «Твердые данные: для банка данных о белках было немалым достижением оставаться актуальным для 100 000 структур» . Природа . 509 (7500): 260. дои : 10.1038/509260a . ПМИД 24834514 .
- ^ Банк данных по белкам. «Статистика PDB: общий рост выпущенных структур в год» . www.rcsb.org . Проверено 12 января 2023 г.
- ^ «wwPDB: форматы файлов и PDB» . wwwpdb.org . Проверено 1 апреля 2020 г.
- ^ wwwPDB.org. «wwPDB: Новости 2019 года» . wwwpdb.org .
- ^ Уэстбрук Дж., Ито Н., Накамура Х., Хенрик К., Берман Х.М. (апрель 2005 г.). «PDBML: представление архивных данных о структуре макромолекул в XML» . Биоинформатика . 21 (7): 988–992. doi : 10.1093/биоинформатика/bti082 . ПМИД 15509603 .
- ^ «ICM-Браузер» . ООО Молсофт . Проверено 6 апреля 2013 г.
- ^ «Швейцарский просмотрщик PDB» . Швейцарский институт биоинформатики . Проверено 6 апреля 2013 г.
- ^ «СТАР: Биохим - Дом» . web.mit.edu .
- ^ «ВисПрот3ДС» . ООО "Молекулярные системы" . Проверено 6 апреля 2013 г.
Внешние ссылки [ править ]
- Всемирный банк данных о белках (wwPDB) — родительский сайт для региональных хостов (ниже).
- Банк данных белков RCSB (США)
- ПДБе (Европа)
- PDBj (Япония)
- BMRB, Банк данных биологического магнитного резонанса (США)
- Документация wwPDB — документация по форматам файлов PDB и PDBML.
- Взгляд на структуры. Архивировано 24 марта 2011 г. в Wayback Machine - Введение RCSB в кристаллографию.
- Домашняя страница PDBsum — извлекает данные из других баз данных о структурах PDB.
- База данных нуклеиновых кислот, NDB — зеркало PDB, специально предназначенное для поиска нуклеиновых кислот.
- Вводное руководство по PDB, спонсируемое PDB
- PDBe: краткий тур по поезду EBI Online