ПробКонс
ProbCons — это вероятностная система множественного выравнивания аминокислотных последовательностей с открытым исходным кодом, основанная на вероятностной согласованности. Это одна из наиболее эффективных программ выравнивания множественных последовательностей белков , поскольку она неоднократно демонстрировала статистически значимое преимущество в точности по сравнению с аналогичными инструментами, включая Clustal и MAFFT . [1] [2]
Алгоритм
[ редактировать ]Ниже описывается базовая схема алгоритма ProbCons. [3]
Шаг 1: Надежность выравнивающей кромки
[ редактировать ]Для каждой пары последовательностей вычислите вероятность того, что буквы и в паре выравнивание, созданное моделью.
(Где равен 1, если и находятся в выравнивании и 0 в противном случае.)
Шаг 2. Максимальная ожидаемая точность
[ редактировать ]Точность выравнивания относительно другого расклада определяется как количество общих выровненных пар, деленное на длину более короткой последовательности.
Рассчитайте ожидаемую точность каждой последовательности:
Это дает выравнивание с максимальной ожидаемой точностью (MEA):
Шаг 3: Преобразование вероятностной согласованности
[ редактировать ]Все пары последовательностей x,y из множества всех последовательностей теперь переоцениваются с использованием всех промежуточных последовательностей z:
Этот шаг можно повторять.
Шаг 4: Расчет направляющего дерева
[ редактировать ]Постройте направляющее дерево с помощью иерархической кластеризации, используя оценку MEA в качестве оценки сходства последовательностей. Сходство кластера определяется с использованием средневзвешенного значения по сходству парных последовательностей.
Шаг 5. Вычислите MSA
[ редактировать ]Наконец, вычислите MSA, используя прогрессивное выравнивание или итеративное выравнивание.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ До CB, Махабхашьям М.С., Брудно М., Бацоглу С. (2005). «PROBCONS: Выравнивание множественных последовательностей на основе вероятностной согласованности» . Геномные исследования . 15 (2): 330–340. дои : 10.1101/гр.2821705 . ПМЦ 546535 . ПМИД 15687296 .
- ^ Рошан, Усман (01 января 2014 г.). «Множественное выравнивание последовательностей с использованием Probcons и Probalign». В Расселе, Дэвид Дж (ред.). Множественные методы выравнивания последовательностей . Методы молекулярной биологии. Том. 1079. Хумана Пресс. стр. 147–153. дои : 10.1007/978-1-62703-646-7_9 . ISBN 9781627036450 . ПМИД 24170400 .
- ^ Лекция «Биоинформатика II» во Фрайбургском университете.