Банк данных белков (формат файла)
Расширение имени файла |
.pdb , .ент , .brk |
---|---|
Тип интернет-СМИ |
химикат/x-pdb |
Разработано | Банк данных по белкам |
Тип формата | химический формат файла |
Контейнер для | Трехмерная структура молекулы, третичная структура белка |
Распространено на | ммCIF |
Формат файла Protein Data Bank (PDB) — это текстовый формат файла, описывающий трехмерные структуры молекул, хранящиеся в Protein Data Bank , на смену которому теперь пришел формат mmCIF . Соответственно, формат PDB обеспечивает описание и аннотацию структур белков и нуклеиновых кислот, включая координаты атомов, присвоение вторичных структур, а также связность атомов. Кроме того, сохраняются экспериментальные метаданные. Формат PDB — это устаревший формат файла для банка данных белков , в котором с 2014 года данные о биологических макромолекулах хранятся в новом формате файлов PDBx/mmCIF . [ 1 ]
История
[ редактировать ]Формат файла PDB был изобретен в 1972 году. [ 2 ] [ 3 ] как удобочитаемый файл, который позволит исследователям обмениваться координатами атомов в данном белке через систему баз данных. Формат ширины фиксированных столбцов ограничен 80 или 140. [ 4 ] столбцы, основанные на ширине компьютерных перфокарт, которые ранее использовались для обмена координатами. [ 5 ] За прошедшие годы формат файла претерпел множество изменений и доработок. Последнее обновление формата файла PDB было выпущено в ноябре 2012 года (версия 3.30). [ 6 ]
Пример
[ редактировать ]Типичный PDB-файл, описывающий белок, состоит из сотен и тысяч строк, подобных следующей (взято из файла, описывающего структуру синтетического коллагеноподобного пептида ):
HEADER EXTRACELLULAR MATRIX 22-JAN-98 1A3I TITLE X-RAY CRYSTALLOGRAPHIC DETERMINATION OF A COLLAGEN-LIKE TITLE 2 PEPTIDE WITH THE REPEATING SEQUENCE (PRO-PRO-GLY) ... EXPDTA X-RAY DIFFRACTION AUTHOR R.Z.KRAMER,L.VITAGLIANO,J.BELLA,R.BERISIO,L.MAZZARELLA, AUTHOR 2 B.BRODSKY,A.ZAGARI,H.M.BERMAN ... REMARK 350 BIOMOLECULE: 1 REMARK 350 APPLY THE FOLLOWING TO CHAINS: A, B, C REMARK 350 BIOMT1 1 1.000000 0.000000 0.000000 0.00000 REMARK 350 BIOMT2 1 0.000000 1.000000 0.000000 0.00000 ... SEQRES 1 A 9 PRO PRO GLY PRO PRO GLY PRO PRO GLY SEQRES 1 B 6 PRO PRO GLY PRO PRO GLY SEQRES 1 C 6 PRO PRO GLY PRO PRO GLY ... ATOM 1 N PRO A 1 8.316 21.206 21.530 1.00 17.44 N ATOM 2 CA PRO A 1 7.608 20.729 20.336 1.00 17.44 C ATOM 3 C PRO A 1 8.487 20.707 19.092 1.00 17.44 C ATOM 4 O PRO A 1 9.466 21.457 19.005 1.00 17.44 O ATOM 5 CB PRO A 1 6.460 21.723 20.211 1.00 22.26 C ... HETATM 130 C ACY 401 3.682 22.541 11.236 1.00 21.19 C HETATM 131 O ACY 401 2.807 23.097 10.553 1.00 21.19 O HETATM 132 OXT ACY 401 4.306 23.101 12.291 1.00 21.19 O ...
- Заголовок, НАЗВАНИЕ и АВТОР
- предоставить информацию об исследователях, определивших структуру; Для предоставления других типов информации доступны многочисленные другие типы записей.
- ЗАМЕЧАНИЯ записи
- могут содержать аннотации в произвольной форме, но также содержат стандартизированную информацию; например,
REMARK 350 BIOMT
записи описывают, как вычислить координаты экспериментально наблюдаемого мультимера на основе координат явно заданных координат одной повторяющейся единицы. - SEQRES-записи
- дайте последовательности трех пептидных цепей (названных A, B и C), которые в этом примере очень короткие, но обычно охватывают несколько линий.
- АТОМ-записи
- описать координаты атомов, входящих в состав белка. Например, первая строка ATOM выше описывает атом альфа-N первого остатка пептидной цепи A, который представляет собой остаток пролина; первые три числа с плавающей запятой представляют собой координаты x, y и z и выражаются в единицах ангстремов . [ 7 ] Следующие три столбца — это занятость, температурный коэффициент и имя элемента соответственно.
- HETATM записи
- описывают координаты гетероатомов, то есть тех атомов, которые не входят в состав молекулы белка.
Программное обеспечение молекулярной визуализации, способное отображать файлы PDB.
[ редактировать ]- САМСОН
- Афина
- BALLView
- Биоблендер
- CCP4MG
- (UCSF) Химера
- Cn3D
- Кут
- КьюМол
- КутеМол
- Он засмеялся
- Платформа моделирования материалов и процессов (MAPS)
- Джмол
- Плесень
- Молекель
- Открыть инструмент визуализации (OVITO)
- ПиМОЛ
- РасМол
- ГЕН
- Посещать
- ВМД
- ЧТО, ЕСЛИ
- Это осталось
- Молекулярная визуализация Зевса
- ePMV
- Дискавери Студия
- ПараВью
- ЮнитиМол
Программное обеспечение для 3D-анимации, способное отображать файлы PDB.
[ редактировать ]См. также
[ редактировать ]- Формат химического файла
- ScientificPython — предоставляет интерфейс для Python.
- Программное обеспечение для моделирования молекулярной механики
Ссылки
[ редактировать ]- ^ Берман, Хелен М.; Клейвегт, Джерард Дж.; Накамура, Харуки; Маркли, Джон Л. (1 октября 2014 г.). «Архив Protein Data Bank как открытый ресурс данных» . Журнал компьютерного молекулярного дизайна . 28 (10): 1009–1014. дои : 10.1007/s10822-014-9770-y . ISSN 1573-4951 . ПМК 4196035 . ПМИД 25062767 .
- ^ «wwPDB: Формат файла» . www.wwpdb.org .
- ^ «ФОРМАТЫ ЗАПИСИ ФАЙЛОВ БАЗЫ ДАННЫХ БЕЛКОВ» (PDF) . Проверено 9 июня 2024 г.
- ^ «ФОРМАТЫ ЗАПИСИ ФАЙЛОВ БАЗЫ ДАННЫХ БЕЛКОВ» (PDF) . Проверено 9 июня 2024 г.
- ^ Берман, Хелен М. (2008). «Банк данных о белках: историческая перспектива» . Акта Кристаллографика . 64 (Часть 1): 88–95. дои : 10.1107/S0108767307035623 . ISSN 2053-2733 . ПМИД 18156675 .
- ^ «wwPDB: форматы файлов и PDB» . Банк данных по белкам . Проверено 15 января 2024 г.
- ^ «Формат wwPDB версии 3.3: Координатное сечение» . Архивировано из оригинала 28 февраля 2012 г. Проверено 23 марта 2012 г.
Внешние ссылки
[ редактировать ]- Руководство по формату PDB Это текущая версия (3.3) спецификации формата PDB.
- PDBML Более новый альтернативный формат файлов на основе XML для молекулярных координат.
- Банк данных белков RCSB
- Банк данных по белкам в Европе
- База данных молекулярного моделирования (MMDB) от NCBI
- Проект восстановления wwPDB от wwPDB
- MakeMultimer Онлайн-инструмент для расширения записей BIOMT в файлах PDB.
- Приложение Molecules для iPad/iPhone для отображения файлов PDB
- Макромолекулярная библиотека Python (mmLib) — библиотека Python , способная читать и записывать форматы файлов PDB.