ПСИПРЕД
Оригинальный автор(ы) |
|
---|---|
Разработчик(и) | Университетский колледж Лондона , Группа биоинформатики |
Первоначальный выпуск | 1999 год |
Стабильная версия | 4.02
/ 26 сентября 2018 г [1] |
Написано в | С |
Операционная система | Windows 2000 , Юникс |
Платформа | x86 , Ява |
Размер | 14 МБ |
Доступно в | Английский |
Тип | биоинформатики вторичной структуры Прогнозирование |
Лицензия | Собственный бесплатный исходный код |
Веб-сайт | биоинф |
Вторичная структура PREDiction на основе PSI-бластов ( PSIPRED ) — это метод, используемый для исследования структуры белка . он использует искусственных нейронных сетей . методы машинного обучения В своем алгоритме [2] [3] [4] Это серверная программа с веб- , сайтом выступающим в качестве внешнего интерфейса, который может предсказать вторичную структуру белка ( бета-листы , альфа-спирали и катушки ) на основе первичной последовательности.
PSIPRED доступен как веб-сервис и как программное обеспечение. Программное обеспечение распространяется в виде исходного кода и технически лицензируется как проприетарное программное обеспечение . Он позволяет модифицировать, но обеспечивает соблюдение положений о свободном программном обеспечении , запрещая коммерческое распространение программного обеспечения и его результатов.
Вторичная структура
[ редактировать ]Вторичная структура — это общая трехмерная форма локальных сегментов биополимеров, таких как белки и нуклеиновые кислоты ( ДНК , РНК ). Однако он не описывает конкретные положения атомов в трехмерном пространстве, которые считаются третичной структурой . Вторичная структура может быть формально определена водородными связями биополимера, как это наблюдается в структуре с атомным разрешением. В белках вторичная структура определяется характером водородных связей между основной цепи амино- и карбоксильными группами . И наоборот, для нуклеиновых кислот вторичная структура состоит из водородных связей между азотистыми основаниями . Характер водородных связей может быть существенно искажен, что затрудняет автоматическое определение вторичной структуры. Попытки использовать компьютеры для прогнозирования вторичных структур белков , основываясь только на заданных последовательностях их первичной структуры , продолжаются с 1970-х годов. [5]
Предсказание вторичной структуры включает в себя набор методов биоинформатики , целью которых является предсказание локальных вторичных структур белков и последовательностей РНК, основываясь только на знании их первичной структуры – аминокислотной или нуклеотидной последовательности соответственно. Для белков предсказание состоит в определении областей аминокислотной последовательности как высоковероятных альфа-спиралей , бета-цепей (часто называемых расширенными конформациями ) или поворотов. Успех предсказания определяется путем сравнения его с результатами алгоритма DSSP, примененного к кристаллической структуре белка; для нуклеиновых кислот это можно определить по характеру водородных связей. Были разработаны специализированные алгоритмы для обнаружения конкретных четко определенных закономерностей, таких как трансмембранные спирали и спиральные спирали в белках или канонические структуры микро-РНК в РНК.
Основная информация
[ редактировать ]Идея этого метода состоит в том, чтобы использовать информацию об эволюционно родственных белках для предсказания вторичной структуры новой аминокислотной последовательности. PSI BLAST используется для поиска связанных последовательностей и построения матрицы оценок для конкретной позиции. Эта матрица обрабатывается искусственной нейронной сетью , [3] [6] который был построен и обучен для прогнозирования вторичной структуры входной последовательности; [7] Короче говоря, это метод машинного обучения . [8]
Алгоритм прогнозирования (метод)
[ редактировать ]Метод или алгоритм прогнозирования разделен на три этапа: создание профиля последовательности , прогнозирование начальной вторичной структуры и фильтрация прогнозируемой структуры . [9] PSIPRED нормализует профиль последовательности, созданный PSIBLAST. [3] Затем с помощью нейронных сетей прогнозируется первоначальная вторичная структура. Для каждой аминокислоты в последовательности нейронная сеть получает окно из 15 кислот. Прилагается дополнительная информация, указывающая, охватывает ли окно N или C-конец цепи. В результате получается окончательный входной слой из 315 входных единиц, разделенных на 15 групп по 21 единица. Сеть имеет один скрытый слой из 75 единиц и 3 выходных узла (по одному на каждый элемент вторичной структуры: спираль, лист, катушку). [6]
Вторая нейронная сеть используется для фильтрации прогнозируемой структуры первой сети. Эта сеть также имеет окно из 15 позиций. Также передается индикатор возможного положения окна на конце цепочки. В результате получается 60 входных единиц, разделенных на 15 групп по четыре. Сеть имеет один скрытый слой из 60 единиц и приводит к трем выходным узлам (по одному для каждого элемента вторичной структуры: спирали, листа, катушки). [9]
Три последних выходных узла выдают оценку каждому элементу вторичной структуры за центральное положение окна. Используя вторичную структуру с наивысшим баллом, PSIPRED генерирует прогноз белка. [9] Значение Q3 представляет собой долю остатков, правильно предсказанных в состояниях вторичной структуры, а именно в спирали, нити и клубке. [9]
См. также
[ редактировать ]- Джпред
- Белковый дизайн
- Прогнозирование функции белка
- Прогнозирование структуры белка de novo
- Программное обеспечение для молекулярного дизайна
- Список программного обеспечения для прогнозирования структуры белков
- Сравнение программного обеспечения для моделирования молекулярной механики
- Моделирование биологических систем
- Библиотека белковых фрагментов
- Решетчатые белки
- Статистический потенциал
Ссылки
[ редактировать ]- ^ «Индекс /downloads/psipred» . bioinfadmin.cs.ucl.ac.uk . Проверено 26 апреля 2021 г.
- ^ Гаджендра П.С. Рагхава; Харприт Каур. «Прогнозирование типов бета-поворотов» . Проверено 5 мая 2014 г.
- ^ Jump up to: а б с И-Пин Фиби Чен (18 января 2005 г.). Биоинформационные технологии . Спрингер. п. 107. ИСБН 978-3-540-20873-0 .
- ^ Кафф, Джеймс А.; Бартон, Джеффри А. (15 августа 2000 г.). «Применение нескольких профилей выравнивания последовательностей для улучшения предсказания вторичной структуры белка». Белки . 40 (3): 502–11. doi : 10.1002/1097-0134(20000815)40:3<502::aid-prot170>3.0.co;2-q . ПМИД 10861942 .
- ^ Херинга, Яап (2000). «Вычислительные методы прогнозирования вторичной структуры белка с использованием множественного выравнивания последовательностей» . Современная наука о белках и пептидах . 1 (3): 273–301 (29). CiteSeerX 10.1.1.470.7673 . дои : 10.2174/1389203003381324 . ПМИД 12369910 .
- ^ Jump up to: а б СК Растоги; Намитра Мендиратта; Параг Растоги (22 мая 2013 г.). Биоинформатика: методы и приложения: (геномика, протеомика и открытие лекарств) . PHI Learning Pvt. ООО стр. 302–. ISBN 978-81-203-4785-4 .
- ^ «ПСИПРЕД | Биоинформационные технологии» . 10 апреля 2014 года . Проверено 7 мая 2014 г.
- ^ «Обзор PSIPRED» . Проверено 7 мая 2014 г.
- ^ Jump up to: а б с д Джонс, Дэвид Т. (17 сентября 1999 г.). «Прогнозирование вторичной структуры белка на основе оценочных матриц для конкретных позиций» (PDF) . Журнал молекулярной биологии . 292 (2): 195–202. дои : 10.1006/jmbi.1999.3091 . ПМИД 10493868 . Проверено 7 мая 2014 г.