Пробалайн
Probalign — это инструмент выравнивания последовательностей, который рассчитывает выравнивание максимальной ожидаемой точности с использованием апостериорных вероятностей статистической суммы. [ 1 ] Вероятности базовых пар оцениваются с использованием оценки, аналогичной распределению Больцмана . Статистическая сумма рассчитывается с использованием подхода динамического программирования .
Алгоритм
[ редактировать ]Ниже описан алгоритм, используемый probalign для определения вероятностей пар оснований. [ 2 ]
Оценка соответствия
[ редактировать ]Чтобы оценить совпадение двух последовательностей, необходимы две вещи:
Оценка трассы a определяется как:
Теперь взвешенная оценка Больцмана трассы a равна:
Где является коэффициентом масштабирования.
Вероятность выравнивания при условии распределения Больцмана определяется выражением
Где – статистическая сумма, т.е. сумма весов Больцмана всех выравниваний.
Динамическое программирование
[ редактировать ]Позволять обозначают статистическую сумму префиксов и . Рассматриваются три различных случая:
- функция разделения всех выравниваний двух префиксов, которые заканчиваются совпадением.
- функция распределения всех выравниваний двух префиксов, которые заканчиваются вставкой .
- функция распределения всех выравниваний двух префиксов, которые заканчиваются удалением .
Тогда у нас есть:
Инициализация
[ редактировать ]Матрицы инициализируются следующим образом:
Рекурсия
[ редактировать ]Функция статистической суммы для выравнивания двух последовательностей и дается , который можно рекурсивно вычислить:
- аналогично
Вероятность базовой пары
[ редактировать ]Наконец, вероятность того, что позиции и образуют пару оснований, определяется следующим образом:
соответствующие значения для пересчитанных с перевернутыми строками пар оснований.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ У. Рошан и Д. Р. Ливсей, Probalign: множественное выравнивание последовательностей с использованием апостериорных вероятностей статистической суммы, Биоинформатика, 22 (22): 2715-21, 2006 ( PDF )
- ^ Лекция «Биоинформатика II» во Фрайбургском университете.