Предсказывать белок
Оригинальный автор(ы) | Буркхард Рост |
---|---|
Разработчик(и) | Гай Яхдав Ласло Каян |
Первоначальный выпуск | 1992 |
Стабильная версия | 1.0.88
|
Операционная система | на базе UNIX |
Тип | Биоинформатика |
Лицензия | лицензия GPLv2 |
Веб-сайт | www ![]() |
PredictProtein (PP) — это автоматический сервис, который осуществляет поиск в актуальных общедоступных базах данных последовательностей, создает выравнивания и прогнозирует аспекты структуры и функции белка. Пользователи отправляют последовательность белка и получают один файл с результатами сравнения баз данных и методов прогнозирования. ПП был запущен в эксплуатацию в 1992 году в Европейской лаборатории молекулярной биологии ; с 1999 года он действует на базе Колумбийского университета , а в 2009 году переехал в Технический университет Мюнхена . Хотя многие серверы реализовали определенные аспекты, PP остается наиболее широко используемым общедоступным сервером для прогнозирования структуры: было обработано более 1,5 миллионов запросов от пользователей в 104 странах; более 13000 пользователей отправили 10 и более различных запросов. Веб-страницы ПП зеркалированы в 17 странах на 4 континентах. Система оптимизирована для удовлетворения потребностей экспериментаторов, не имеющих опыта в биоинформатике. Это означало, что мы сосредоточились на включении только высококачественных методов и попытались сопоставить результаты, исключив менее надежные или менее важные.
Попытайтесь упростить вывод, включив иерархию пороговых значений.
[ редактировать ]Попытка «предварительно переварить» как можно больше информации, чтобы упростить интерпретацию результатов, является уникальной основой ПП. Например, по умолчанию PP возвращает только те белки, найденные в базе данных, которые с большой вероятностью будут иметь структуру, аналогичную запрашиваемому белку. [ 1 ] Конкретные прогнозы, такие как прогнозы для мембранных спиралей, спиральных областей, сигнальных пептидов и сигналов ядерной локализации, не возвращаются, если обнаружено, что они ниже заданных порогов вероятности.
Каждый запрос запускает применение более 20 различных методов.
[ редактировать ]Пользователи получают один выходной файл со следующими результатами. Поиск в базе данных: аналогичные последовательности выявляются и выравниваются с помощью стандартного парного BLAST, [ 2 ] повторный поиск PSI-BLAST. [ 3 ] Хотя парный поиск BLAST идентичен поиску на сайте NCBI, итерационный PSI-BLAST выполняется в тщательно отфильтрованной базе данных, чтобы избежать накопления ложных срабатываний во время итерации. [ 4 ] [ 5 ] Стандартный поиск функциональных мотивов в базе данных PROSITE. [ 6 ] PP теперь также определяет предполагаемые границы структурных областей с помощью процедуры CHOP. Методы прогнозирования структуры: вторичная структура, доступность растворителя и мембранные спирали, прогнозируемые по программам ПГД и ПРОФ, [ 7 ] [ 8 ] мембранные нити, предсказанные PROFtmb, [ 9 ] спирально-спиральные области по COILS, [ 10 ] и контакты между остатками через PROFcon, [ 11 ] регионы низкой сложности отмечены SEG [ 12 ] длинные участки без регулярной вторичной структуры идентифицируются NORSp. [ 13 ] [ 14 ] Программы PHD/PROF доступны только через PP. Особый способ, которым PP автоматически выполняет поиск PSI-BLAST, и способ, которым мы решаем, что включать в семейства последовательностей, также уникален для PP. Все конкретные аспекты функций, которые в настоящее время явно встроены в PP, каким-то образом связаны с субклеточной локализацией: мы обнаруживаем сигналы ядерной локализации с помощью PredictNLS, [ 15 ] [ 16 ] мы прогнозируем локализацию независимо от сигналов нацеливания через LOCnet; [ 17 ] и гомология аннотаций белкам, участвующим в контроле клеточного цикла. [ 18 ]
Доступность
[ редактировать ]Веб-сервис
[ редактировать ]Веб-сервис PredictProtein доступен на сайте www.predictprotein.org. Пользователи могут отправить аминокислотную последовательность и получить взамен набор автоматических аннотаций для отправленной последовательности. Услуга поддерживается базой данных заранее рассчитанных результатов, что ускоряет время взаимодействия.
Облачное решение [ модное слово ]
[ редактировать ]Облачное решение PredictProtein [ модное слово ] основан на операционной системе с открытым исходным кодом Debian, [ 19 ] и предоставляет свою функциональность в виде набора бесплатных [ 20 ] Пакеты программного обеспечения Debian. Bio-Linux — операционная система для биоинформатики и вычислительной биологии . Его последняя версия 7 содержит более 500 программ по биоинформатике на базе Ubuntu Linux. [ 21 ] Ubuntu — это производная от Debian, операционная система, основанная на Debian со своими дополнениями. Cloud BioLinux — комплексное облачное решение. [ модное слово ] это производное от Bio-Linux и Ubuntu. Производные Debian могут легко обмениваться пакетами друг с другом. Например, пакеты Debian автоматически включаются в Ubuntu. [ 22 ] а также их можно использовать в Cloud BioLinux (процедура описана в [ 23 ] ).
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Рост, Б. (1999). «Сумеречная зона выравнивания белковых последовательностей» . Белковая инженерия . 12 (2): 85–94. дои : 10.1093/протеин/12.2.85 . ПМИД 10195279 .
- ^ Альтшул С.Ф. и Гиш, В. (1996) Статистика местного выравнивания. Methods Enzymol., 266, 460–480.
- ^ Альтшул С., Мэдден Т., Шаффер А., Чжан Дж., Чжан З., Миллер, В. и Липман, Д. (1997 Gapped Blast и PSI-Blast: новое поколение программ поиска в базе данных белков. Nucleic Acids Res., 25, 3389–3402.
- ^ Пшибильски Д. и Рост, Б. (2002) Выравнивания растут, прогнозирование вторичной структуры улучшается. Белки, 46, 195–205.
- ^ Jones DT (1999) Прогнозирование вторичной структуры белка на основе оценочных матриц для конкретных позиций. Дж. Мол. биол., 292, 195–202.
- ^ Хофманн К., Бухер П., Фальке Л. и Байрох, А. (1999) База данных PROSITE, ее статус в 1999 году. Nucleic Acids Res., 27, 215–219.
- ^ Рост Б. (1996) Доктор философии: прогнозирование одномерной структуры белка с помощью нейронных сетей на основе профилей. Методы Энзимол., 266, 525–539.
- ^ Рост Б. (2001) Прогнозы вторичной структуры белка продолжают расти. Дж. Структ. биол., 134, 204–218.
- ^ Бигелоу, Х.; Рост, Б. (2006). «PROFtmb: веб-сервер для прогнозирования бактериальных трансмембранных бета-бочковых белков» . Исследования нуклеиновых кислот . 34 (проблема с веб-сервером): W186–W188. дои : 10.1093/нар/gkl262 . ПМЦ 1538807 . ПМИД 16844988 .
- ^ Лупас А., Ван Дайк, М. и Сток, Дж. (1991) Предсказание спиральных спиралей на основе белковых последовательностей. Наука, 252, 1162–1164.
- ^ Пунта, М.; Рост, Б. (2005). «ПРОФкон: Новое предсказание контактов на большие расстояния» . Биоинформатика . 21 (13): 2960–2968. doi : 10.1093/биоинформатика/bti454 . ПМИД 15890748 .
- ^ Вуттон Дж.К. и Федерхен,С. (1996)Анализ композиционно смещенных регионов в базах данных последовательностей. Methods Enzymol., 266, 554–571.
- ^ Лю Дж., Тан, Х. и Рост, Б. (2002) Петлевые белки, по-видимому, консервативны в эволюции. Дж. Мол. биол., 322, 53–64.
- ^ Лю Дж. и Рост, Б. (2003) NORSp: предсказания длинных регионов без регулярной вторичной структуры. Нуклеиновые кислоты Рез., 31, 3833–3835.
- ^ Кокол М., Наир, Р. и Рост, Б. (2000) Обнаружение сигналов ядерной локализации. Отчет EMBO, 1, 411–415.
- ^ Наир Р., Картер, П. и Рост, Б. (2003) NLSdb: база данных сигналов ядерной локализации. Нуклеиновые кислоты Рез., 31, 397–399.
- ^ Наир Р. и Рост, Б. (2003) Лучшее предсказание внутриклеточной локализации путем объединения эволюционной и структурной информации. Белки, 53, 917–930
- ^ Вжещинский К.О. и Рост, Б. (2004)Каталогизация белков в контроле клеточного цикла. Методы Мол. биол., 241, 219–233.
- ^ Амор, Дж. Дж. и др. От свиней к полоскам: путешествие по Debian. в материалах DebConf5 (Ежегодного собрания разработчиков Debian). 2005. Гражданин.
- ^ Руководство по свободному программному обеспечению Debian (DFSG). Доступно по адресу: http://www.debian.org/social_contract#guidelines.
- ^ Дон Филд, BT, Тим Бут, Стюарт Хаутен, Дэн Свон, Николя Бертран, Майло Терстон. Био-Линукс 7. 2012; Доступно по адресу: http://nebc.nerc.ac.uk/tools/bio-linux/bio-linux-7-info.
- ^ НОВЫЕ пакеты через Debian. Доступно по адресу: https://wiki.ubuntu.com/UbuntuDevelopment/NewPackages#NEW_packages_through_Debian.
- ^ Крампис, К. и др., Cloud BioLinux: предварительно настроенные биоинформатические вычисления и по требованию для сообщества геномиков. БМЦ Биоинформатика, 2012. 13: с. 42