Jump to content

Предсказывать белок

PredictProtein
Оригинальный автор(ы) Буркхард Рост
Разработчик(и) Гай Яхдав Ласло Каян
Первоначальный выпуск 1992
Стабильная версия
1.0.88
Операционная система на базе UNIX
Тип Биоинформатика
Лицензия лицензия GPLv2
Веб-сайт www .predictprotein .org  Edit this on Wikidata

PredictProtein (PP) — это автоматический сервис, который осуществляет поиск в актуальных общедоступных базах данных последовательностей, создает выравнивания и прогнозирует аспекты структуры и функции белка. Пользователи отправляют последовательность белка и получают один файл с результатами сравнения баз данных и методов прогнозирования. ПП был запущен в эксплуатацию в 1992 году в Европейской лаборатории молекулярной биологии ; с 1999 года он действует на базе Колумбийского университета , а в 2009 году переехал в Технический университет Мюнхена . Хотя многие серверы реализовали определенные аспекты, PP остается наиболее широко используемым общедоступным сервером для прогнозирования структуры: было обработано более 1,5 миллионов запросов от пользователей в 104 странах; более 13000 пользователей отправили 10 и более различных запросов. Веб-страницы ПП зеркалированы в 17 странах на 4 континентах. Система оптимизирована для удовлетворения потребностей экспериментаторов, не имеющих опыта в биоинформатике. Это означало, что мы сосредоточились на включении только высококачественных методов и попытались сопоставить результаты, исключив менее надежные или менее важные.

Попытайтесь упростить вывод, включив иерархию пороговых значений.

[ редактировать ]

Попытка «предварительно переварить» как можно больше информации, чтобы упростить интерпретацию результатов, является уникальной основой ПП. Например, по умолчанию PP возвращает только те белки, найденные в базе данных, которые с большой вероятностью будут иметь структуру, аналогичную запрашиваемому белку. [ 1 ] Конкретные прогнозы, такие как прогнозы для мембранных спиралей, спиральных областей, сигнальных пептидов и сигналов ядерной локализации, не возвращаются, если обнаружено, что они ниже заданных порогов вероятности.

Каждый запрос запускает применение более 20 различных методов.

[ редактировать ]

Пользователи получают один выходной файл со следующими результатами. Поиск в базе данных: аналогичные последовательности выявляются и выравниваются с помощью стандартного парного BLAST, [ 2 ] повторный поиск PSI-BLAST. [ 3 ] Хотя парный поиск BLAST идентичен поиску на сайте NCBI, итерационный PSI-BLAST выполняется в тщательно отфильтрованной базе данных, чтобы избежать накопления ложных срабатываний во время итерации. [ 4 ] [ 5 ] Стандартный поиск функциональных мотивов в базе данных PROSITE. [ 6 ] PP теперь также определяет предполагаемые границы структурных областей с помощью процедуры CHOP. Методы прогнозирования структуры: вторичная структура, доступность растворителя и мембранные спирали, прогнозируемые по программам ПГД и ПРОФ, [ 7 ] [ 8 ] мембранные нити, предсказанные PROFtmb, [ 9 ] спирально-спиральные области по COILS, [ 10 ] и контакты между остатками через PROFcon, [ 11 ] регионы низкой сложности отмечены SEG [ 12 ] длинные участки без регулярной вторичной структуры идентифицируются NORSp. [ 13 ] [ 14 ] Программы PHD/PROF доступны только через PP. Особый способ, которым PP автоматически выполняет поиск PSI-BLAST, и способ, которым мы решаем, что включать в семейства последовательностей, также уникален для PP. Все конкретные аспекты функций, которые в настоящее время явно встроены в PP, каким-то образом связаны с субклеточной локализацией: мы обнаруживаем сигналы ядерной локализации с помощью PredictNLS, [ 15 ] [ 16 ] мы прогнозируем локализацию независимо от сигналов нацеливания через LOCnet; [ 17 ] и гомология аннотаций белкам, участвующим в контроле клеточного цикла. [ 18 ]

Доступность

[ редактировать ]

Веб-сервис

[ редактировать ]

Веб-сервис PredictProtein доступен на сайте www.predictprotein.org. Пользователи могут отправить аминокислотную последовательность и получить взамен набор автоматических аннотаций для отправленной последовательности. Услуга поддерживается базой данных заранее рассчитанных результатов, что ускоряет время взаимодействия.

Облачное решение [ модное слово ]

[ редактировать ]

Облачное решение PredictProtein [ модное слово ] основан на операционной системе с открытым исходным кодом Debian, [ 19 ] и предоставляет свою функциональность в виде набора бесплатных [ 20 ] Пакеты программного обеспечения Debian. Bio-Linux — операционная система для биоинформатики и вычислительной биологии . Его последняя версия 7 содержит более 500 программ по биоинформатике на базе Ubuntu Linux. [ 21 ] Ubuntu — это производная от Debian, операционная система, основанная на Debian со своими дополнениями. Cloud BioLinux — комплексное облачное решение. [ модное слово ] это производное от Bio-Linux и Ubuntu. Производные Debian могут легко обмениваться пакетами друг с другом. Например, пакеты Debian автоматически включаются в Ubuntu. [ 22 ] а также их можно использовать в Cloud BioLinux (процедура описана в [ 23 ] ).

См. также

[ редактировать ]
  1. ^ Рост, Б. (1999). «Сумеречная зона выравнивания белковых последовательностей» . Белковая инженерия . 12 (2): 85–94. дои : 10.1093/протеин/12.2.85 . ПМИД   10195279 .
  2. ^ Альтшул С.Ф. и Гиш, В. (1996) Статистика местного выравнивания. Methods Enzymol., 266, 460–480.
  3. ^ Альтшул С., Мэдден Т., Шаффер А., Чжан Дж., Чжан З., Миллер, В. и Липман, Д. (1997 Gapped Blast и PSI-Blast: новое поколение программ поиска в базе данных белков. Nucleic Acids Res., 25, 3389–3402.
  4. ^ Пшибильски Д. и Рост, Б. (2002) Выравнивания растут, прогнозирование вторичной структуры улучшается. Белки, 46, 195–205.
  5. ^ Jones DT (1999) Прогнозирование вторичной структуры белка на основе оценочных матриц для конкретных позиций. Дж. Мол. биол., 292, 195–202.
  6. ^ Хофманн К., Бухер П., Фальке Л. и Байрох, А. (1999) База данных PROSITE, ее статус в 1999 году. Nucleic Acids Res., 27, 215–219.
  7. ^ Рост Б. (1996) Доктор философии: прогнозирование одномерной структуры белка с помощью нейронных сетей на основе профилей. Методы Энзимол., 266, 525–539.
  8. ^ Рост Б. (2001) Прогнозы вторичной структуры белка продолжают расти. Дж. Структ. биол., 134, 204–218.
  9. ^ Бигелоу, Х.; Рост, Б. (2006). «PROFtmb: веб-сервер для прогнозирования бактериальных трансмембранных бета-бочковых белков» . Исследования нуклеиновых кислот . 34 (проблема с веб-сервером): W186–W188. дои : 10.1093/нар/gkl262 . ПМЦ   1538807 . ПМИД   16844988 .
  10. ^ Лупас А., Ван Дайк, М. и Сток, Дж. (1991) Предсказание спиральных спиралей на основе белковых последовательностей. Наука, 252, 1162–1164.
  11. ^ Пунта, М.; Рост, Б. (2005). «ПРОФкон: Новое предсказание контактов на большие расстояния» . Биоинформатика . 21 (13): 2960–2968. doi : 10.1093/биоинформатика/bti454 . ПМИД   15890748 .
  12. ^ Вуттон Дж.К. и Федерхен,С. (1996)Анализ композиционно смещенных регионов в базах данных последовательностей. Methods Enzymol., 266, 554–571.
  13. ^ Лю Дж., Тан, Х. и Рост, Б. (2002) Петлевые белки, по-видимому, консервативны в эволюции. Дж. Мол. биол., 322, 53–64.
  14. ^ Лю Дж. и Рост, Б. (2003) NORSp: предсказания длинных регионов без регулярной вторичной структуры. Нуклеиновые кислоты Рез., 31, 3833–3835.
  15. ^ Кокол М., Наир, Р. и Рост, Б. (2000) Обнаружение сигналов ядерной локализации. Отчет EMBO, 1, 411–415.
  16. ^ Наир Р., Картер, П. и Рост, Б. (2003) NLSdb: база данных сигналов ядерной локализации. Нуклеиновые кислоты Рез., 31, 397–399.
  17. ^ Наир Р. и Рост, Б. (2003) Лучшее предсказание внутриклеточной локализации путем объединения эволюционной и структурной информации. Белки, 53, 917–930
  18. ^ Вжещинский К.О. и Рост, Б. (2004)Каталогизация белков в контроле клеточного цикла. Методы Мол. биол., 241, 219–233.
  19. ^ Амор, Дж. Дж. и др. От свиней к полоскам: путешествие по Debian. в материалах DebConf5 (Ежегодного собрания разработчиков Debian). 2005. Гражданин.
  20. ^ Руководство по свободному программному обеспечению Debian (DFSG). Доступно по адресу: http://www.debian.org/social_contract#guidelines.
  21. ^ Дон Филд, BT, Тим Бут, Стюарт Хаутен, Дэн Свон, Николя Бертран, Майло Терстон. Био-Линукс 7. 2012; Доступно по адресу: http://nebc.nerc.ac.uk/tools/bio-linux/bio-linux-7-info.
  22. ^ НОВЫЕ пакеты через Debian. Доступно по адресу: https://wiki.ubuntu.com/UbuntuDevelopment/NewPackages#NEW_packages_through_Debian.
  23. ^ Крампис, К. и др., Cloud BioLinux: предварительно настроенные биоинформатические вычисления и по требованию для сообщества геномиков. БМЦ Биоинформатика, 2012. 13: с. 42
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 171a56fc561cb7373e9c34468e968641__1686524520
URL1:https://arc.ask3.ru/arc/aa/17/41/171a56fc561cb7373e9c34468e968641.html
Заголовок, (Title) документа по адресу, URL1:
Predictprotein - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)