Jump to content

Банк данных по белкам

Банк данных по белкам
Содержание
Описание
Контакт
Первичное цитирование ПМИД   30357364
Доступ
Формат данных ммКИФ , PDB
Веб-сайт

Банк данных по белкам ( PDB ) [1] представляет собой базу данных трехмерных структурных данных крупных биологических молекул, таких как белки и нуклеиновые кислоты , которая контролируется Всемирным банком данных белков (wwPDB). Эти структурные данные получены и сохранены биологами и биохимиками во всем мире с помощью экспериментальных методологий, таких как рентгеновская кристаллография , ЯМР-спектроскопия и, все чаще, криоэлектронная микроскопия . Все представленные данные проверяются экспертами -биокураторами и после утверждения размещаются в свободном доступе в Интернете под лицензией CC0 Public Domain. [2] Глобальный доступ к данным обеспечивается сайтами организаций-членов wwPDB (PDBe, [3] ПДБдж, [4] РЦСБ ПДБ, [5] и БРМБ [6] ).

PDB является ключевой в областях структурной биологии , таких как структурная геномика . Большинство крупных научных журналов и некоторые финансирующие агентства теперь требуют от ученых предоставления данных о своей структуре в PDB. Многие другие базы данных используют белковые структуры, хранящиеся в PDB. Например, SCOP и CATH классифицируют белковые структуры, а PDBsum предоставляет графический обзор записей PDB, используя информацию из других источников, таких как Gene Ontology . [7] [8]

История [ править ]

Две силы сошлись, чтобы инициировать PDB: небольшая, но растущая коллекция наборов данных о структуре белков, определенных с помощью дифракции рентгеновских лучей; и недавно появившийся (1968 г.) дисплей молекулярной графики Brookhaven RAster Display (BRAD) для визуализации этих белковых структур в 3-D. В 1969 году при спонсорской поддержке Уолтера Гамильтона из Брукхейвенской национальной лаборатории Эдгар Мейер ( Техасский университет A&M ) начал писать программное обеспечение для хранения файлов координат атомов в общем формате, чтобы сделать их доступными для геометрической и графической оценки. К 1971 году одна из программ Мейера, SEARCH, позволила исследователям получить удаленный доступ к информации из базы данных для изучения белковых структур в автономном режиме. [9] ПОИСК сыграл важную роль в создании сети, положив тем самым функциональное начало PDB.

Банк данных о белках был анонсирован в октябре 1971 года в журнале Nature New Biology. [10] как совместное предприятие Кембриджского центра кристаллографических данных (Великобритания) и Брукхейвенской национальной лаборатории (США).

После смерти Гамильтона в 1973 году Том Кетцл взял на себя руководство PDB на последующие 20 лет. В январе 1994 года Джоэл Суссман из израильского Института науки Вейцмана главой PDB был назначен . В октябре 1998 года [11] PDB был передан в Исследовательскую лабораторию структурной биоинформатики (RCSB); [12] передача была завершена в июне 1999 года. Новым директором стала Хелен М. Берман из Университета Рутгерса (одно из управляющих учреждений RCSB, другое - Суперкомпьютерный центр Сан-Диего в Калифорнийском университете в Сан-Диего ). [13] В 2003 году с образованием wwPDB PDB стала международной организацией. Членами-учредителями являются PDBe (Европа), [3] RCSB (США) и PDBj (Япония). [4] БРМБ [6] присоединился в 2006 году. Каждый из четырех членов wwPDB может выступать в качестве центров хранения, обработки и распространения данных PDB. Обработка данных означает, что сотрудники wwPDB просматривают и комментируют каждую отправленную запись. [14] Затем данные автоматически проверяются на достоверность (исходный код [15] для этой проверки программное обеспечение было бесплатно доступно публике).

Содержание [ править ]

Примеры белковых структур из PDB (созданного с помощью UCSF Chimera)
Скорость определения структуры белка по методу и году. MX = макромолекулярная кристаллография , 3DEM = 3D электронная микроскопия . [16]

База данных PDB обновляется еженедельно ( UTC +0 среда) вместе со списком активов. [17] По состоянию на 10 января 2023 г. в состав PDB вошли:

Экспериментальный
Метод
белки Только Белки с олигосахаридами Белок/Нуклеиновая кислота
комплексы
нуклеиновые кислоты Только Другой Только олигосахариды Общий
Рентгеновская дифракция 152277 8969 8027 2566 163 11 172013
ЯМР 12104 32 281 1433 31 6 13887
Электронная микроскопия 9226 1633 2898 77 8 0 13842
Гибридный 189 7 6 12 0 1 215
Нейтрон 72 1 0 2 0 0 75
Другой 32 0 0 1 0 4 309
Общий: 173900 10642 11212 4091 202 22 200069
162 041 структура в PDB имеет файл структурных коэффициентов .
11 242 структуры имеют файл ограничений ЯМР.
5774 структуры в PDB имеют файл химических сдвигов .
13 388 структур в PDB имеют файл карты 3DEM, хранящийся в банке данных EM.

Большинство структур определяется методом рентгеновской дифракции, но около 7% структур определяются методом ЯМР белков . При использовании дифракции рентгеновских лучей получают приближения координат атомов белка, тогда как с помощью ЯМР оценивают расстояние между парами атомов белка. Окончательная конформация белка получается с помощью ЯМР путем решения задачи геометрии расстояния . После 2013 года всё большее количество белков определяют с помощью криоэлектронной микроскопии .

Для структур PDB, определенных методом рентгеновской дифракции и имеющих файл структурных коэффициентов, можно просмотреть их карту электронной плотности. Данные таких структур можно просмотреть на трех сайтах PDB.

Исторически количество структур в PDB росло примерно по экспоненте: 100 структур было зарегистрировано в 1982 году, 1000 структур в 1993 году, 10 000 в 1999 году, 100 000 в 2014 году и 200 000 в январе 2023 года. [18] [19]

Формат файла [ править ]

Формат файла, первоначально используемый PDB, назывался форматом файла PDB. Исходный формат был ограничен шириной компьютерных перфокарт до 80 символов в строке. Примерно в 1996 году был введен в эксплуатацию формат «файла макромолекулярной кристаллографической информации», mmCIF, который является расширением формата CIF . В 2014 году mmCIF стал стандартным форматом для архива PDB. [20] В 2019 году WWPDB объявил, что данные по кристаллографическим методам будут приниматься только в формате mmCIF. [21]

версия XML- PDB, названная PDBML, была описана в 2005 году. [22] Файлы структур можно загрузить в любом из этих трех форматов, хотя все большее число структур не соответствует устаревшему формату PDB. Отдельные файлы легко загружаются в графические пакеты по URL-адресам Интернета :

  • Для файлов формата PDB используйте, например, http://www.pdb.org/pdb/files/4hhb.pdb.gz или http://pdbe.org/download/4hhb
  • Для файлов PDBML (XML) используйте, например, http://www.pdb.org/pdb/files/4hhb.xml.gz или http://pdbe.org/pdbml/4hhb

" 4hhb" — это идентификатор PDB. Каждая структура, опубликованная в PDB, получает четырехзначный буквенно-цифровой идентификатор, ее идентификатор PDB. (Это не уникальный идентификатор для биомолекул, поскольку несколько структур для одной и той же молекулы — в разных средах или конформациях — могут содержаться в PDB с разными идентификаторами PDB.)

Просмотр данных [ править ]

Файлы структуры можно просмотреть с помощью одной из нескольких бесплатных компьютерных программ с открытым исходным кодом , включая Jmol , Pymol , VMD , Molstar и Rasmol . Другие несвободные условно- бесплатные программы включают ICM-Browser, [23] MDL Chime , UCSF Chimera , Swiss-PDB Viewer, [24] СтарБиохим [25] (интерактивная программа просмотра молекулярных данных на основе Java со встроенным поиском в банке данных белков), Sirius и VisProt3DS. [26] (инструмент для визуализации белков в 3D стереоскопическом представлении в анаглифном и других режимах) и Discovery Studio . Веб-сайт RCSB PDB содержит обширный список как бесплатных, так и коммерческих программ визуализации молекул, а также плагинов для веб-браузера.

См. также [ править ]

Ссылки [ править ]

  1. ^ wwPDB, Консорциум (2019). «Банк данных белков: единый глобальный архив трехмерных данных о структуре макромолекул» . Нуклеиновые кислоты Рез . 47 (Д1): 520–528. дои : 10.1093/nar/gky949 . ПМК   6324056 . ПМИД   30357364 .
  2. ^ wwwPDB.org. «wwPDB: Политики использования» . www.wwpdb.org . Проверено 16 апреля 2024 г.
  3. Перейти обратно: Перейти обратно: а б «PDBe home < Node < EMBL-EBI» . pdbe.org .
  4. Перейти обратно: Перейти обратно: а б «Банк данных по белкам Японии – PDB Japan – PDBj» . pdbj.org .
  5. ^ Банк, Данные о белках RCSB. «RCSB PDB: Домашняя страница» . rcsb.org .
  6. Перейти обратно: Перейти обратно: а б «Биологический магнитно-резонансный банк» . bmrb.wisc.edu .
  7. ^ Берман, Ее Величество (январь 2008 г.). «Банк данных о белках: историческая перспектива» (PDF) . Acta Crystallographica Раздел А. А64 (1): 88–95. дои : 10.1107/S0108767307035623 . ПМИД   18156675 .
  8. ^ Ласковски Р.А., Хатчинсон Э.Г., Мичи А.Д., Уоллес А.К., Джонс М.Л., Торнтон Дж.М. (декабрь 1997 г.). «PDBsum: веб-база данных сводок и анализа всех структур PDB». Тенденции биохимии. Наука . 22 (12): 488–90. дои : 10.1016/S0968-0004(97)01140-7 . ПМИД   9433130 .
  9. ^ Мейер Э.Ф. (1997). «Первые годы Белкового банка данных» . Белковая наука . 6 (7). Издательство Кембриджского университета: 1591–1597. дои : 10.1002/pro.5560060724 . ПМК   2143743 . ПМИД   9232661 .
  10. ^ «Банк данных о белках» . Новая биология природы . 233 . 1971. doi : 10.1038/newbio233223b0 .
  11. ^ Берман Х.М., Уэстбрук Дж., Фенг З., Гиллиланд Дж., Бхат Т.Н., Вайсиг Х., Шиндьялов И.Н., Борн П.Е. (январь 2000 г.). «Банк данных о белках» . Нуклеиновые кислоты Рез . 28 (1): 235–242. дои : 10.1093/нар/28.1.235 . ПМЦ   102472 . ПМИД   10592235 .
  12. ^ «Научно-исследовательский коллектив структурной биоинформатики» . RCSB.org . Исследовательский коллектив структурной биоинформатики. Архивировано из оригинала 5 февраля 2007 г.
  13. ^ «Архив информационных бюллетеней RCSB PDB» . Банк данных белков RCSB.
  14. ^ Карри Э., Фрейтас А., О'Риайн С. (2010). «Роль управления данными, управляемого сообществом, для предприятий» . В Д. Вуде (ред.). Связывание корпоративных данных . Бостон: Springer США. стр. 25–47. ISBN  978-1-441-97664-2 .
  15. ^ «Пакет проверки PDB» . sw-tools.pdb.org .
  16. ^ Берли С.К., Берман Х.М., Бхикадия С., Би С., Чен Л., Костанцо Л.Д. и др. (консорциум wwPDB) (январь 2019 г.). «Банк данных белков: единый глобальный архив трехмерных данных о структуре макромолекул» . Исследования нуклеиновых кислот . 47 (Д1): Д520–Д528. дои : 10.1093/nar/gky949 . ПМК   6324056 . ПМИД   30357364 .
  17. ^ «Распределение текущих активов PDB» . РЦСБ. Архивировано из оригинала 4 июля 2007 г. Проверено 2 июля 2007 г.
  18. ^ Анон (2014). «Твердые данные: для банка данных о белках было немалым достижением оставаться актуальным для 100 000 структур» . Природа . 509 (7500): 260. дои : 10.1038/509260a . ПМИД   24834514 .
  19. ^ Банк данных по белкам. «Статистика PDB: общий рост выпущенных структур в год» . www.rcsb.org . Проверено 12 января 2023 г.
  20. ^ «wwPDB: форматы файлов и PDB» . wwwpdb.org . Проверено 1 апреля 2020 г.
  21. ^ wwwPDB.org. «wwPDB: Новости 2019 года» . wwwpdb.org .
  22. ^ Уэстбрук Дж., Ито Н., Накамура Х., Хенрик К., Берман Х.М. (апрель 2005 г.). «PDBML: представление архивных данных о структуре макромолекул в XML» . Биоинформатика . 21 (7): 988–992. doi : 10.1093/биоинформатика/bti082 . ПМИД   15509603 .
  23. ^ «ICM-Браузер» . ООО Молсофт . Проверено 6 апреля 2013 г.
  24. ^ «Швейцарский просмотрщик PDB» . Швейцарский институт биоинформатики . Проверено 6 апреля 2013 г.
  25. ^ «СТАР: Биохим - Дом» . web.mit.edu .
  26. ^ «ВисПрот3ДС» . ООО "Молекулярные системы" . Проверено 6 апреля 2013 г.

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 28eb175407ea7c2dc9d2753372710ab4__1717019640
URL1:https://arc.ask3.ru/arc/aa/28/b4/28eb175407ea7c2dc9d2753372710ab4.html
Заголовок, (Title) документа по адресу, URL1:
Protein Data Bank - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)