Jump to content

Пробалайн

Probalign — это инструмент выравнивания последовательностей, который рассчитывает выравнивание максимальной ожидаемой точности с использованием апостериорных вероятностей статистической суммы. [ 1 ] Вероятности базовых пар оцениваются с использованием оценки, аналогичной распределению Больцмана . Статистическая сумма рассчитывается с использованием подхода динамического программирования .

Алгоритм

[ редактировать ]

Ниже описан алгоритм, используемый probalign для определения вероятностей пар оснований. [ 2 ]

Оценка соответствия

[ редактировать ]

Чтобы оценить совпадение двух последовательностей, необходимы две вещи:

  • функция сходства (например , ПАМ , БЛОСУМ ,...)
  • Штраф за аффинный разрыв:

Оценка трассы a определяется как:

Теперь взвешенная оценка Больцмана трассы a равна:

Где является коэффициентом масштабирования.

Вероятность выравнивания при условии распределения Больцмана определяется выражением

Где – статистическая сумма, т.е. сумма весов Больцмана всех выравниваний.

Динамическое программирование

[ редактировать ]

Позволять обозначают статистическую сумму префиксов и . Рассматриваются три различных случая:

  1. функция разделения всех выравниваний двух префиксов, которые заканчиваются совпадением.
  2. функция распределения всех выравниваний двух префиксов, которые заканчиваются вставкой .
  3. функция распределения всех выравниваний двух префиксов, которые заканчиваются удалением .

Тогда у нас есть:

Инициализация

[ редактировать ]

Матрицы инициализируются следующим образом:

Рекурсия

[ редактировать ]

Функция статистической суммы для выравнивания двух последовательностей и дается , который можно рекурсивно вычислить:

  • аналогично

Вероятность базовой пары

[ редактировать ]

Наконец, вероятность того, что позиции и образуют пару оснований, определяется следующим образом:

соответствующие значения для пересчитанных с перевернутыми строками пар оснований.

См. также

[ редактировать ]
  1. ^ У. Рошан и Д. Р. Ливсей, Probalign: множественное выравнивание последовательностей с использованием апостериорных вероятностей статистической суммы, Биоинформатика, 22 (22): 2715-21, 2006 ( PDF )
  2. ^ Лекция «Биоинформатика II» во Фрайбургском университете.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 40f5bc3eaafdd8e39c5e09976a98a989__1684337640
URL1:https://arc.ask3.ru/arc/aa/40/89/40f5bc3eaafdd8e39c5e09976a98a989.html
Заголовок, (Title) документа по адресу, URL1:
Probalign - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)