Справочная база данных по белкам человека
Справочная база данных по белкам человека ( HPRD ) представляет собой по белкам , базу данных доступную через Интернет . [1] Он тесно связан с ведущей индийской некоммерческой исследовательской организацией Институтом биоинформатики (IOB), Бангалор , Индия . Эта база данных является результатом совместной работы IOB и лаборатории Панди Университета Джонса Хопкинса .
Обзор
[ редактировать ]HPRD является результатом международного сотрудничества Института биоинформатики в Бангалоре, Индия, и лаборатории Панди в Университете Джонса Хопкинса в Балтиморе, США. HPRD содержит тщательно подобранную научную информацию, касающуюся биологии большинства белков человека. Информация о белках, участвующих в заболеваниях человека, аннотирована и связана с базой данных Online Mendelian Inheritance in Man (OMIM). Национальный центр биотехнологической информации обеспечивает связь с HPRD через свои базы данных по белкам человека (например, Entrez Gene, белок RefSeq, относящийся к генам и белкам).
В этом ресурсе представлена информация о функциях белков человека, включая белок-белковые взаимодействия , посттрансляционные модификации , взаимоотношения фермент-субстрат и ассоциации заболеваний. Информация о аннотациях белков, которая каталогизирована, была получена путем ручного курирования с использованием опубликованной литературы опытными биологами и посредством биоинформатического анализа последовательности белка. Данные о белок-белковом взаимодействии и субклеточной локализации HPRD были использованы для разработки сети взаимодействия белков человека. [2]
Основные характеристики HPRD:
- К концу 2007 года с 10 000 белок-белковых взаимодействий (PPI), аннотированных для 3 000 белков в 2003 году, HPRD выросла до более чем 36 500 уникальных PPI, аннотированных для 25 000 белков, включая 6360 изоформ. [3]
- Более 50% молекул, аннотированных в HPRD, имеют по крайней мере один ИПП, а 10% имеют более 10 ИПП.
- Эксперименты с ИПП в целом сгруппированы в три категории, а именно in vitro, in vivo и двухгибридные дрожжи (Y2H). Шестьдесят процентов ИПП, аннотированных в HPRD, подтверждаются одним экспериментом, тогда как для 26% из них аннотировано два из трех экспериментальных методов.
- HPRD содержит 18 000 вручную обработанных данных PTM, относящихся к 26 различным типам. Фосфорилирование является ведущим типом модификации белка, на долю которого приходится 63% данных PTM, аннотированных в HPRD. События гликозилирования , протеолитического расщепления и образования дисульфидных мостиков являются следующими ведущими источниками данных PTM.
- Данные HPRD доступны для загрузки в с разделителями табуляцией и XML . форматах файлов [4]
HPRD также интегрирует данные из Human Proteinpedia , общественного портала для интеграции данных о белке человека. Данные HPRD могут быть свободно доступны и использованы академическими пользователями, в то время как коммерческие организации должны получить лицензию на использование. Протеинпедия человека [5] контент доступен для скачивания и использования бесплатно.
Поиск фосфомотивов
[ редактировать ]Поиск фосфомотивов [6] содержит известный субстрат киназы/фосфатазы, а также мотивы связывания, взятые из опубликованной литературы. Он сообщает о ПРИСУТСТВИИ любого мотива, полученного из литературы, в последовательности запроса. PhosphoMotif Finder НЕ ПРЕДСКАЗЫВАЕТ какие-либо мотивы в последовательности запрашиваемого белка с использованием каких-либо алгоритмов или других вычислительных стратегий.
Сравнение данных по белкам
[ редактировать ]Существуют и другие базы данных, посвященные протеому человека (например, BioGRID, BIND, DIP, HPRD, IntAct, MINT, MIPS, PDZBase и Reactome). Каждая база данных имеет свой собственный стиль представления данных. Для большинства исследователей является сложной задачей сравнить объемные данные из этих баз данных, чтобы сделать вывод о сильных и слабых сторонах каждой базы данных. Мативанан и коллеги [7] попытался решить эту проблему при анализе данных о белке, задавая различные вопросы. Этот анализ поможет биологам сделать выбор между этими базами данных в соответствии со своими потребностями.
Ссылки
[ редактировать ]- ^ Пери С. и др. (2003). «Разработка справочной базы данных по белкам человека как исходной платформы для подхода к системной биологии человека» . Геномные исследования . 13 (10): 2363–71. дои : 10.1101/гр.1680803 . ПМК 403728 . ПМИД 14525934 .
- ^ Ганди ТКБ; и др. (март 2006 г.). «Анализ интерактома белка человека и сравнение с наборами данных о взаимодействии дрожжей, червей и мух». Природная генетика . 38 (3): 285–293. дои : 10.1038/ng1747 . ПМИД 16501559 . S2CID 1446423 .
- ^ Мативанан С.; и др. (2006). «Оценка общедоступных данных о межбелковом взаимодействии человека» . БМК Биоинформатика . 2006 (7): С19. дои : 10.1186/1471-2105-7-s5-s19 . ПМЦ 1764475 . ПМИД 17254303 .
- ^ Мишра Г.; и др. (2006). «Справочная база данных по белкам человека — обновление 2006 г.» . Исследования нуклеиновых кислот . 34 (выпуск базы данных): 411–414. дои : 10.1093/nar/gkj141 . ПМЦ 1347503 . ПМИД 16381900 .
- ^ Мативанан С.; и др. (2008). «Human Proteinpedia позволяет обмениваться данными о человеческом белке» (PDF) . Природная биотехнология . 26 (2): 164–167. дои : 10.1038/nbt0208-164 . hdl : 10261/60528 . ПМИД 18259167 . S2CID 205265347 .
- ^ Аманчи Р.; и др. (2007). «Сборник тщательно подобранных субстратов на основе фосфорилирования и мотивов связывания». Природная биотехнология . 2007 (25): 285–286. дои : 10.1038/nbt0307-285 . ПМИД 17344875 . S2CID 38824337 .
- ^ Мативанан С., Периасвами Б., Ганди Т.К. и др. (2006). «Оценка данных о белок-белковом взаимодействии человека, находящихся в открытом доступе» . БМК Биоинформатика . 7 (Приложение 5): S19. дои : 10.1186/1471-2105-7-S5-S19 . ПМЦ 1764475 . ПМИД 17254303 .