База данных протеомных идентификаций
PRIDE (база данных PROteomics IDEntifications) представляет собой общедоступное хранилище данных протеомики на основе масс-спектрометрии (МС) и поддерживается Европейским институтом биоинформатики в составе группы протеомики. [1]
Первоначально разработанный Леннартом Мартенсом в 2003 году во время пребывания в Европейском институте биоинформатики в качестве стипендиата Марии Кюри Европейской комиссии в программе «Качество жизни» (номер контракта: QLRI-1999-50595), PRIDE был создан как производственная служба. в 2005 году. [2] Оригинальный документ заявки на грант от июня 2013 года для начала строительства PRIDE был опубликован в обзорной статье. [3] [4] Было создано несколько подобных баз данных по протеомике, в том числе GPMDB, PeptideAtlas , Proteinpedia и NCBI Peptidome. [1]
База данных PRIDE представляет собой структурированное хранилище данных и хранит исходные экспериментальные данные исследователей без редакционного контроля над представленными данными.
В общей сложности PRIDE содержит данные примерно по 60 видам, большая часть которых получена из образцов человека (включая данные двух проектов человеческих протеомов). [5] [6] ), за которым следуют плодовая мушка Drosophila melanogaster и мышь. [1]
Форматы и процесс подачи
[ редактировать ]Поскольку подробные данные по протеомике в настоящее время невозможно получить из существующей литературы, источником данных PRIDE являются исключительно материалы академических исследователей.
PRIDE — это общедоступный репозиторий, соответствующий стандартам. Это означает, что его собственный XML формат обмена данными для отправки данных на основе Инициативы по стандартизации протеомики , PRIDE XML, был построен на основе стандарта mzData для масс-спектрометрии . Недавно PRIDE был адаптирован для работы с современным mzML. [7] и мзидентмл [8] стандарты Инициативы по стандартам протеомики . [9] Дополнительный формат, получивший название mzTab, можно использовать как упрощенный способ подачи количественных данных протеомики. [10]
Поскольку в настоящее время на рынке представлено множество типов различных инструментов масс-спектрометрии и форматов программного обеспечения, у ученых влажных лабораторий, не имеющих сильного опыта в области биоинформатики или поддержки информатики, возникали проблемы с преобразованием своих данных в PRIDE XML. Разработка PRIDE Converter помогла решить эту ситуацию. [11] PRIDE Converter — это инструмент, написанный на языке программирования Java , который преобразует 15 различных форматов входных масс-спектрометрических данных в PRIDE XML с помощью графического пользовательского интерфейса, напоминающего мастер. Он находится в свободном доступе и имеет открытый исходный код под разрешающей лицензией Apache . Новая версия PRIDE Converter была выпущена в 2012 году под названием PRIDE Converter 2. [12] Эта новая версия представляла собой полную переработку, ориентированную на легкую адаптацию к различным (и развивающимся) источникам данных.
Просмотр, поиск и анализ данных PRIDE
[ редактировать ]В настоящее время данные можно запрашивать из PRIDE через веб-интерфейс PRIDE, через автономный Java-клиент PRIDE Inspector, [13] или напрямую связан с несколькими поисковыми системами через PeptideShaker. [14] Более того, новый RESTful API обеспечивает удобный программный доступ к архиву PRIDE. [15]
Широкое использование контролируемых словарей (CV) и онтологий для гибкого, но контекстно-зависимого аннотирования данных, а также возможность выполнять интеллектуальные запросы с помощью этих аннотаций являются ключевыми особенностями PRIDE. [16]
Участие в ProteomeXchange
[ редактировать ]Консорциум ProteomeXchange был создан для обеспечения скоординированной подачи данных протеомики MS в основные существующие репозитории протеомики, а также для поощрения оптимального распространения данных. [17] Консорциум содержит несколько баз данных участников, включая PRIDE и PeptideAtlas . Самая ранняя концепция ProteomeXchange возникла на конференции HUPO 2005 в Мюнхене. [18] где основные репозитории протеомных данных на тот момент в принципе согласились обмениваться своими данными и, таким образом, предоставить пользователю возможность найти общедоступные данные по протеомике в любой из участвующих баз данных. Из-за быстрого развития этой области и необходимости сначала разработать подходящие стандарты для обмена данными, с момента этой встречи потребовалось почти десять лет, чтобы фактически внедрить эту систему. Эти усилия были профинансированы за счет гранта на координационное действие «ProteomeXchange» Седьмая рамочная программа Европейской комиссии. [19]
Восстановление данных после прекращения использования Peptidome
[ редактировать ]База данных NCBI Peptidome была прекращена в 2011 году, однако совместные усилия команд PRIDE и Peptidome привели к передаче всех данных Peptidome в PRIDE. [20] [21] [22]
Ссылки
[ редактировать ]- ^ Jump up to: а б с Вискайно, JA; Коте, Р; Райзингер, Ф; Барснес, Х; Фостер, Дж. М.; Рамседер, Дж; Хермякоб, Х; Мартенс, Л. (2010). «База данных протеомной идентификации: обновление 2010 г.» . Нуклеиновые кислоты Рез . 38 (База данных): D736–42. дои : 10.1093/нар/gkp964 . ПМК 2808904 . ПМИД 19906717 .
- ^ Мартенс, Л; Хермякоб, Х; Джонс, П; Адамски, М; Тейлор, К; Штаты, Д; Геверт, К; Вандекерхове, Дж; Апвейлер, Р. (август 2005 г.). «ПРАЙД: База данных идентификаторов PROteomics» . Протеомика . 5 (13): 3537–45. дои : 10.1002/pmic.200401303 . ПМИД 16041671 . S2CID 28998489 .
- ^ «Заявка на обучение в Учебном центре Марии Кюри EMBL-EBI ЕС» (PDF) .
- ^ Мартенс, Леннарт (март 2016 г.). «Общественные данные по протеомике: как эта область эволюционировала от скептических исследований к перспективам протеомики in silico» . Открытая протеомика EuPA . 11 : 42–44. дои : 10.1016/j.euprot.2016.02.005 . ПМЦ 5988554 . ПМИД 29900110 .
- ^ Вильгельм, М; Шлегль, Дж; Хане, Х; Могаддас Голами, А; Либеренц, М; Савицкий, ММ; Зиглер, Э; Буцманн, Л; Гессулат, С; Маркс, Х; Мэтисон, Т; Лемер, С; Шнатбаум, К; Реймер, Ю; Веншу, Х; Молленхауэр, М; Слотта-Успенина, Дж; Боезе, Дж. Х.; Банщефф, М; Герстмайр, А; Фаербер, Ф; Кустер, Б. (29 мая 2014 г.). «Проект протеома человека на основе масс-спектрометрии». Природа . 509 (7502): 582–7. Бибкод : 2014Natur.509..582W . дои : 10.1038/nature13319 . ПМИД 24870543 . S2CID 4467721 .
- ^ Ким, MS; Пинто, С.М.; Гетнетт, Д; Нируджоги, РС; Манда, СС; Черкадий, Р; Мадугунду, АК; Келкар, Д.С.; Иссерлин, Р; Джайн, С; Томас, Дж. К.; Мутусами, Б; Леаль-Рохас, П; Кумар, П; Сахасрабудде, Северная Каролина; Балакришнан, Л; Адвани, Дж; Джордж, Б; Ренузе, С; Сельван, Л.Д.; Патил, А.Х.; Нанджаппа, В.; Радхакришнан, А; Прасад, С; Суббанная, Т; Раджу, Р; Кумар, М; Шринивасамурти, Словакия; Маримуту, А; Сате, Дж.Дж.; Чаван, С; Датта, К.К.; Суббанная, Ю; Саху, А; Еламанчи, Южная Дакота; Джаярам, С; Раджагопалан, П; Шарма, Дж; Мурти, КР; Сайед, Н; Гоэл, Р; Хан, А.А.; Ахмад, С; Дей, Дж; Мудгал, К; Чаттерджи, А; Хуанг, TC; Чжун, Дж; Ву, Х; Шоу, П.Г.; Фрид, Д; Захари, М.С.; Мукерджи, КК; Шанкар, С; Махадеван, А; Лам, Х; Митчелл, CJ; Шанкар, СК; Сатишчандра, П; Шредер, Дж. Т.; Сирдешмух, Р; Майтра, А; Лич, SD; Дрейк, CG; Галушка, МК; Прасад, Т.С.; Хрубан, Р.Х.; Керр, CL; Бадер, Грузия; Якобузио-Донахью, Калифорния; Гауда, Х; Панди, А. (29 мая 2014 г.). «Проект карты протеома человека» . Природа . 509 (7502): 575–81. Бибкод : 2014Natur.509..575K . дои : 10.1038/nature13302 . ПМЦ 4403737 . ПМИД 24870542 .
- ^ Мартенс, Л; Чемберс, М; Штурм, М; Кесснер, Д; Левандер, Ф; Шофшталь, Дж; Тан, Вашингтон; Рёмпп, А; Нойманн, С; Писарро, AD; Монтекки-Палацци, Л; Тасман, Н.; Коулман, М; Райзингер, Ф; Суда, П; Хермякоб, Х; Бинц, Пенсильвания; Дойч, EW (январь 2011 г.). «mzML — стандарт сообщества для данных масс-спектрометрии» . Молекулярная и клеточная протеомика . 10 (1): 110,000133 рандов. дои : 10.1074/mcp.R110.000133 . ПМК 3013463 . ПМИД 20716697 .
- ^ Джонс, Арканзас; Эйзенахер, М; Майер, Г; Кольбахер, О; Зипен, Дж; Хаббард, С.Дж.; Селли, JN; Сирл, Британская Колумбия; Шофшталь, Дж; Сеймур, СЛ; Джулиан, Р; Бинц, Пенсильвания; Дойч, EW; Хермякоб, Х; Райзингер, Ф; Грисс, Дж; Вискайно, JA; Чемберс, М; Писарро, А; Кризи, Д. (июль 2012 г.). «Стандарт данных mzIdentML для результатов протеомики на основе масс-спектрометрии» . Молекулярная и клеточная протеомика . 11 (7): М111.014381. дои : 10.1074/mcp.M111.014381 . ПМЦ 3394945 . ПМИД 22375074 .
- ^ Дойч, EW; Альбар, JP; Бинц, Пенсильвания; Эйзенахер, М; Джонс, Арканзас; Майер, Г; Оменн, Г.С.; Орчард, С; Вискайно, JA; Хермякоб, Х. (май 2015 г.). «Разработка стандартов представления данных в рамках инициативы по стандартам протеомики организации протеома человека» . Журнал Американской ассоциации медицинской информатики . 22 (3): 495–506. дои : 10.1093/jamia/ocv001 . ПМЦ 4457114 . ПМИД 25726569 .
- ^ Грисс, Дж; Джонс, Арканзас; Заксенберг, Т; Уолцер, М; Гатто, Л; Хартлер, Дж; Таллинджер, Г.Г.; Салек, РМ; Стейнбек, К; Нойхаузер, Н; Кокс, Дж; Нойманн, С; Фан, Дж; Райзингер, Ф; Сюй, QW; Дель Торо, Н.; Перес-Ривероль, Ю; Гали, Ф; Флаг, Н; Сценарии, я; Кольбахер, О; Вискайно, JA; Хермякоб, Х. (октябрь 2014 г.). «Формат обмена данными mzTab: передача результатов экспериментов по протеомике и метаболомике, основанных на масс-спектрометрии, более широкой аудитории» . Молекулярная и клеточная протеомика . 13 (10): 2765–75. дои : 10.1074/mcp.o113.036681 . ПМК 4189001 . ПМИД 24980485 .
- ^ Барснес, Х; Вискайно, JA; Эйдхаммер, я; Мартенс, Л. (2009). «PRIDE Converter: упрощает обмен протеомными данными». Нат Биотехнология . 27 (7): 598–9. дои : 10.1038/nbt0709-598 . ПМИД 19587657 . S2CID 205269351 .
- ^ Коте, RG; Грисс, Дж; Дайанс, Дж.А.; Ван, Р; Райт, Дж. К.; ван ден Тоорн, HW; ван Брекелен, Б; Черт возьми, Эй Джей; Хулстарт, Н.; Мартенс, Л; Райзингер, Ф; Чордас, А; Овелейро, Д; Перес-Ривевол, Ю; Барснес, Х; Хермякоб, Х; Вискайно, JA (декабрь 2012 г.). «Среда PROteomics IDEntification (PRIDE) Converter 2: улучшенный набор инструментов для облегчения отправки данных в базу данных PRIDE и консорциум ProteomeXchange» . Молекулярная и клеточная протеомика . 11 (12): 1682–9. дои : 10.1074/mcp.o112.021543 . ПМЦ 3518121 . ПМИД 22949509 .
- ^ Ван, Р; Фабрегат, А; Риос, Д; Овелейро, Д; Фостер, Дж. М.; Коте, Р.Г.; Грисс, Дж; Чордас, А; Перес-Ривероль, Ю; Райзингер, Ф; Хермякоб, Х; Мартенс, Л; Вискайно, JA (февраль 2012 г.). «PRIDE Inspector: инструмент для визуализации и проверки данных протеомики MS» . Природная биотехнология . 30 (2): 135–7. дои : 10.1038/nbt.2112 . ПМЦ 3277942 . ПМИД 22318026 .
- ^ Водель, М; Беркхарт, Дж. М.; Захеди, РП; Овеленд, Э; Бервен, ФС; Зикманн, А; Мартенс, Л; Барснес, Х. (январь 2015 г.). «PeptideShaker позволяет повторно анализировать наборы протеомных данных, полученные с помощью MS». Природная биотехнология . 33 (1): 22–4. дои : 10.1038/nbt.3109 . ПМИД 25574629 . S2CID 27922651 .
- ^ Райзингер, Ф; Дель-Торо, Н.; Тернент, Т; Хермякоб, Х; Вискайно, JA (22 апреля 2015 г.). «Представляем веб-сервисы RESTful PRIDE Archive» . Исследования нуклеиновых кислот . 43 (П1): W599–604. дои : 10.1093/нар/gkv382 . ПМЦ 4489246 . ПМИД 25904633 .
- ^ Вискайно, JA; Коте, Р; Райзингер, Ф; Мюллер, М; Фостер, Дж. М.; Рамседер, Дж; Хермякоб, Х; Мартенс, Л. (2009). «Руководство по протеомике» . База данных идентификационных данных. Хранилище данных протеомики . 9 (18): 4276–83. дои : 10.1002/pmic.200900402 . ПМК 2970915 . ПМИД 19662629 .
- ^ Вискайно, JA; Дойч, Э.В.; Ван, Р; Чордас, А; Райзингер, Ф; Риос, Д; Дайанс, Дж. А.; Солнце, З; Фарра, Т; Бандейра, Н.; Бинц, Пенсильвания; Ксенарий, я; Эйзенахер, М; Майер, Г; Кот, Л; Кампос, А; Чокли, Р.Дж.; Краус, HJ; Альбар, JP; Мартинес-Бартоломе, С; Апвейлер, Р.; Оменн, Г.С.; Мартенс, Л; Джонс, AR; Хермякоб, Х. (март 2014 г.). «ProteomeXchange обеспечивает глобально скоординированную отправку и распространение протеомных данных» . Природная биотехнология . 32 (3): 223–6. дои : 10.1038/nbt.2839 . ПМЦ 3986813 . ПМИД 24727771 .
- ^ Хермякоб, Х; Апвейлер, Р. (февраль 2006 г.). «База данных протеомной идентификации (PRIDE) и Консорциум ProteomExchange: обеспечение доступности протеомных данных» . Экспертное обозрение по протеомике . 3 (1): 1–3. дои : 10.1586/14789450.3.1.1 . ПМИД 16445344 .
- ^ «Европейская комиссия: CORDIS: Проекты и результаты: Международный обмен данными и стандарты представления данных для протеомики» . Cordis.europa.eu . Проверено 22 сентября 2017 г.
- ^ Чордас, А; Ван, Р; Риос, Д; Райзингер, Ф; Фостер, Дж. М.; Слотта, диджей; Вискайно, JA; Хермякоб, Х. (май 2013 г.). «От Peptidome к PRIDE: публичная миграция данных по протеомике в больших масштабах» . Протеомика . 13 (10–11): 1692–5. дои : 10.1002/pmic.201200514 . ПМЦ 3717177 . ПМИД 23533138 .
- ^ Мартенс, Л. (май 2013 г.). «Устойчивость экосистемы протеомных данных: как эта область заботится о своих данных» . Протеомика . 13 (10–11): 1548–50. дои : 10.1002/pmic.201300118 . hdl : 1854/LU-4166053 . ПМИД 23596016 . S2CID 8041195 .
- ^ «Пептидом — ресурс данных о пептидах NCBI» . www.ncbi.nlm.nih.gov . Архивировано из оригинала 7 июля 2009 г.