База данных CATH
Содержание | |
---|---|
Описание | Классификация структуры белка |
Контакт | |
Исследовательский центр | Университетский колледж Лондона |
Лаборатория | Институт структурной и молекулярной биологии |
Первичное цитирование | Доусон и др. (2016) [ 1 ] |
Дата выпуска | 1997 |
Доступ | |
Веб-сайт | катдб |
URL-адрес загрузки | катдб |
Разнообразный | |
Выпуск данных частота | CATH-B выпускается ежедневно. Официальные релизы происходят примерно ежегодно. |
Версия | 4.3 |
База данных классификации структур белков CATH — это бесплатный общедоступный онлайн-ресурс, который предоставляет информацию об эволюционных взаимоотношениях белковых доменов . Он был создан в середине 1990-х годов профессором Кристиной Оренго и его коллегами, включая Джанет Торнтон и Дэвида Джонса . [ 2 ] и продолжает разрабатываться группой Orengo в Университетском колледже Лондона . CATH имеет много общих черт с ресурсом SCOP , однако есть также много областей, в которых подробная классификация сильно отличается. [ 3 ] [ 4 ] [ 5 ] [ 6 ]
Иерархическая организация
[ редактировать ]Экспериментально определенные трехмерные структуры белков получают из Банка данных белков и разделяют на последовательные полипептидные цепи , где это применимо. Белковые домены идентифицируются внутри этих цепей с использованием сочетания автоматических методов и ручного курирования. [ нужна ссылка ]
Затем домены классифицируются в рамках структурной иерархии CATH: на уровне класса (C) домены назначаются в соответствии с содержанием их вторичной структуры , т.е. все альфа , все бета , смесь альфа и бета или небольшая вторичная структура; на уровне Архитектуры (А) для задания используется информация о расположении вторичной структуры в трехмерном пространстве; на уровне Топологии/складки (Т) используется информация о том, как соединяются и располагаются элементы вторичной структуры; присваивания производятся на уровне гомологичного суперсемейства (H), если есть веские доказательства того, что домены связаны эволюцией. [ 2 ] т.е. они гомологичны.
# | Уровень | Описание |
---|---|---|
1 | Сорт | общее содержание вторичной структуры домена. (эквивалент SCOP класса ) |
2 | Архитектура | высокое структурное сходство, но нет признаков гомологии . |
3 | Т- топология/складка | крупномасштабная группировка топологий, которые имеют общие структурные особенности (эквивалент уровня «складки» в SCOP) |
4 | Гомологическое надсемейство | указывает на очевидные эволюционные связи. (Эквивалент суперсемейства SCOP ) |
Дополнительные данные о последовательностях для доменов без экспериментально определенных структур предоставлены родственным ресурсом CATH, Gene3D, который используется для заселения гомологичных суперсемейств. Белковые последовательности из UniProtKB и Ensembl сканируются с помощью CATH HMM для прогнозирования границ последовательностей доменов и определения гомологичных суперсемейств.
Релизы
[ редактировать ]Команда CATH стремится предоставлять официальные выпуски классификации CATH каждые 12 месяцев. Этот процесс выпуска важен, поскольку он позволяет обеспечить внутреннюю проверку, дополнительные аннотации и анализ. Однако это может означать, что между появлением новых структур в PDB и последней официальной версией CATH существует задержка. [ нужна ссылка ]
Чтобы решить эту проблему: CATH-B предоставляет ограниченный объем информации для самых последних аннотаций домена (например, границ домена и классификаций суперсемейств).
Последняя версия CATH-Gene3D (v4.3) была выпущена в декабре 2020 года и состоит из:
- 500 238 записей доменов структурных белков [ 1 ]
- 151 миллион записей доменов неструктурных белков [ 1 ]
- 5481 гомологичная запись о суперсемействе [ 1 ]
- 212 872 функциональных семейных записи [ 1 ]
Программное обеспечение с открытым исходным кодом
[ редактировать ]CATH — это проект программного обеспечения с открытым исходным кодом , разработчики которого разрабатывают и поддерживают ряд инструментов с открытым исходным кодом. [ 7 ] CATH ведет список задач на GitHub, чтобы позволить внешним пользователям создавать и отслеживать проблемы, связанные с классификацией структуры белка CATH. [ нужна ссылка ]
Ссылки
[ редактировать ]- ^ Jump up to: а б с д и Доусон Н.Л., Льюис Т.Э., Дас С., Лис Дж.Г., Ли Д., Эшфорд П. и др. (январь 2017 г.). «CATH: расширенный ресурс для прогнозирования функции белка через структуру и последовательность» . Исследования нуклеиновых кислот . 45 (Д1): Д289–Д295. дои : 10.1093/nar/gkw1098 . ПМК 5210570 . ПМИД 27899584 .
- ^ Jump up to: а б с Оренго Калифорния, Мичи А.Д., Джонс С., Джонс Д.Т., Суинделлс М.Б., Торнтон Дж.М. (август 1997 г.). «CATH — иерархическая классификация белковых доменных структур» . Структура . 5 (8). Лондон, Англия: 1093–108. дои : 10.1016/s0969-2126(97)00260-8 . ПМИД 9309224 .
- ^ «CATH: База данных классификации структуры белков в UCL» . Cathdb.info . Проверено 9 марта 2017 г.
- ^ "КАТ" . Cathdb.info . Проверено 9 марта 2017 г.
- ^ «База данных CATH (@CATHDatabase)» . Твиттер . Проверено 9 марта 2017 г.
- ^ Перл Ф.М., Беннетт К.Ф., Брэй Дж.Э., Харрисон А.П., Мартин Н., Шепард А. и др. (январь 2003 г.). «База данных CATH: расширенный ресурс семейства белков для структурной и функциональной геномики» . Исследования нуклеиновых кислот . 31 (1): 452–455. дои : 10.1093/нар/gkg062 . ПМК 165509 . ПМИД 12520050 .
- ^ "Инструменты" . cathdb.info . Проверено 18 декабря 2016 г.