ДисПрот
Содержание | |
---|---|
Описание | Создаваемая вручную база данных внутренне нарушенных белков (IDP) и регионов (IDR) |
Типы данных захвачен | Внутренне неупорядоченные белки |
Организмы | все |
Контакт | |
Лаборатория | Лаборатория BioComputing UP (факультет биомедицинских наук, Падуанский университет) |
Первичное цитирование | ПМИД 34850135 |
Доступ | |
Веб-сайт | https://disprot.org/ |
URL-адрес загрузки | https://disprot.org/download |
Разнообразный | |
Лицензия | Лицензия Creative Commons Attribution 4.0 Международная (CC BY 4.0) |
Политика курирования | Ручное курирование от профессиональных и общественных биокураторов |
DisProt — это вручную обновляемая биологическая база данных ( внутренне неупорядоченных белков IDP) и регионов (IDR). [1] [2] [3] Аннотации DisProt охватывают информацию о состоянии белка, а также, если таковые имеются, переходы его состояний, взаимодействия и функциональные аспекты нарушений, обнаруженных конкретными экспериментальными методами. DisProt размещается и поддерживается в лаборатории BioComputing UP (факультет биомедицинских наук Падуанского университета ).
Веб-сайт
[ редактировать ]Последняя версия DisProt, DisProt 9, [3] включает более 2300 записей о белках и более 4500 свидетельств структурного состояния, переходов состояний, взаимодействий и функций, а также более 2500 аннотированных научных публикаций.
Биокурация в DisProt
[ редактировать ]Записи DisProt аннотируются профессиональными и общественными биокураторами на основе экспериментальных данных, опубликованных в научной литературе. На домашней странице DisProt представлены примеры записей DisProt, то есть p53 и катенин бета-1 , а также записи о белках, принадлежащих вирусу SARS-CoV-2 , например, нуклеопротеин .
Тематические наборы данных
[ редактировать ]Начиная с 2020 года DisProt выпускает « тематические наборы данных », описывающие биологические области, в которых ВПЛ участвуют и играют решающую роль. [3] Все записи, принадлежащие этим наборам данных, помечены названием темы .
- Одноклеточные токсины и антитоксины (выпуск DisProt 2020_12)
- Белки внеклеточного матрикса (выпуск DisProt 2021_06)
- Вирусные белки (выпуск DisProt 2021_12)
Записи модельного организма
[ редактировать ]На домашней странице DisProt модельные организмы представлены значком, названием вида и количеством записей DisProt, принадлежащих каждому конкретному организму. Записи о следующих организмах доступны на домашней странице DisProt в разделе « Организмы » и могут быть загружены в виде отдельных файлов: Homo sapiens, Mus musculus, Rattus norvegicus, Saccharomices cerevisiae, Escherichia coli, Arabidopsis thaliana, Drosophila melanogaster, Caenorhabditis elegans .
Версии и выпуски DisProt
[ редактировать ]Версии и выпуски DisProt включают изменения на веб-сайте и в содержимом базы данных, создаваемом вручную.
- ДисПрот 7 [4] (2016): более 800 записей о белках и 1000 аннотированных публикаций. Каждая запись белка в DisProt характеризуется идентификатором DisProt, который принимает форму префикса DP, за которым следует пятизначный идентификатор белка, например DP00016 соответствует белку 1 ингибитора циклин-зависимой киназы . Он отличался новым веб-интерфейсом, основанным на Angular.JS .
- ДисПрот 8 [5] (2019): более 1400 белковых записей и более 3000 неупорядоченных белковых участков. В DisProt 8 также представлена концепция стабильного идентификатора региона DisProt. DisProt широко используется для обучения методам машинного обучения (ML) прогнозированию неупорядоченных областей в белках. Кроме того, DisProt использовался для понимания свойств изначально неструктурированных белков. [6] DisProt 8 имел новый веб-интерфейс, расширенный API, а также новый интерфейс аннотаций, объединяющий технологии интеллектуального анализа текста.
- ДисПрот 9 [3] (2021): более 2300 записей о белках и более 4500 доказательств, аннотированных из более чем 2500 научных статей. DisProt 9 имеет обновленный веб-интерфейс и переработанную онтологию внутренне неупорядоченных белков (IDPO). Улучшенная совместимость обеспечивается за счет принятия Онтологии генов (аннотаций взаимодействий и функций IDP и IDR) и Онтологии доказательств и выводов (аннотаций экспериментальных методов).
Онтологии ДисПрот
[ редактировать ]DisProt использует три различные онтологии для аннотирования неупорядоченных областей: онтологию внутренне неупорядоченных белков (IDPO), онтологию доказательств и заключений (ECO) и онтологию генов (GO) . DisProt имеет специальную страницу для каждого термина IDPO, которая включает идентификатор, имя и определение термина, а также перекрестные ссылки на внешние онтологии, например, генную онтологию. На каждой странице терминов IDPO перечислены все записи DisProt, помеченные этим конкретным термином.
- Онтология внутренне неупорядоченных белков: используется для аннотации следующих типов данных: 1. структурное состояние (т. е. беспорядок, предварительно расплавленная глобула, расплавленная глобула, порядок ), 2. структурный переход (переходы между структурными состояниями) и 3. самофункции. (например, самоингибирование ) и функции, связанные с неструктурированным состоянием белка (например, гибкий линкер/спейсер )
- Онтология доказательств и заключений: используется для аннотации экспериментальных методов, используемых для оценки наличия внутреннего расстройства или одного из его аспектов, например, доказательств кругового дихроизма .
- Онтология генов: используется для аннотации партнеров по связыванию, например, связывания белков , и других функций, например, шаперона сворачивания РНК .
Внешние ссылки
[ редактировать ]Ссылки
[ редактировать ]- ^ Вучетич, Слободан; Обрадович, Зоран; Вачич, Владимир; Радивояц, Предраг; Пэн, Канг; Якучева Лилия Михайловна; Кортезе, Марк С.; Лоусон, Дж. Дэвид; Браун, Селеста Дж. (1 января 2005 г.). «ДисПрот: база данных белковых нарушений» . Биоинформатика . 21 (1): 137–140. doi : 10.1093/биоинформатика/bth476 . ISSN 1367-4803 . ПМИД 15310560 .
- ^ Сикмайер, Меган; Гамильтон, Джастин А.; ЛеГалл, Танги; Вачич, Владимир; Кортезе, Марк С.; Тантос, Агнес; Сабо, Беата; Томпа, Питер; Чен, Джейк (1 января 2007 г.). «DisProt: база данных неупорядоченных белков» . Исследования нуклеиновых кислот . 35 (Проблема с базой данных): D786–793. дои : 10.1093/nar/gkl893 . ISSN 1362-4962 . ПМЦ 1751543 . ПМИД 17145717 .
- ^ Jump up to: а б с д Квалья, Федерика; Месарош, Балинт; Салладини, Эдоардо; Хатос, Андраш; Панча, Рита; Чемес, Люсия Б.; Пайкос, Матиас; Лазарь, Томас; Пенья-Диас, Самуэль; Сантос, Хайме; Акс, Вероника (25 ноября 2021 г.). «DisProt в 2022 году: улучшенное качество и доступность аннотации о внутренних нарушениях белка» . Исследования нуклеиновых кислот . 50 (Д1): Д480–Д487. дои : 10.1093/nar/gkab1082 . ISSN 1362-4962 . ПМЦ 8728214 . ПМИД 34850135 .
- ^ Пиовесан, Дамиано; Табаро, Франческо; Мичетич, Иван; Неччи, Марко; Квалья, Федерика; Олдфилд, Кристофер Дж.; Аспромонте, Мария Кристина; Дэйви, Норман Э.; Давидович, Радослав (28 ноября 2016 г.). «DisProt 7.0: крупное обновление базы данных неупорядоченных белков» . Исследования нуклеиновых кислот . 45 (Д1): Д219–Д227. дои : 10.1093/нар/gkw1056 . ISSN 1362-4962 . ПМК 5210544 . ПМИД 27899601 .
- ^ Хатос, Андрас; Хайду-Солтес, Борбала; Монзон, Александр М.; Палополи, Николас; Альварес, Люсия; Айкач-Фас, Бурку; Бассо, Клаудио; Бенитес, Уильям И.; Бевилаква, Мартина; Часапи, Анастасия; Чемес, Люсия (2019). «DisProt: аннотация о расстройствах внутреннего белка в 2020 году» . Исследования нуклеиновых кислот . 48 (Д1): Д269–Д276. дои : 10.1093/nar/gkz975 . ПМЦ 7145575 . ПМИД 31713636 .
- ^ Ковачевич Дж. Ю. (июнь 2012 г.). «Вычислительный анализ содержания позиционно-зависимых нарушений в базе данных DisProt» . Геномика Протеомика Биоинформатика . 10 (3): 158–65. дои : 10.1016/j.gpb.2012.01.002 . ПМК 5056116 . ПМИД 22917189 .