Jump to content

Алгоритм обрезки деревьев Фельзенштейна

В статистической генетике алгоритм обрезки деревьев Фельзенштейна (или алгоритм очистки деревьев Фельзенштейна ), приписываемый Джозефу Фельзенштейну , представляет собой алгоритм для эффективного расчета вероятности эволюционного дерева на основе данных о последовательностях нуклеиновых кислот . [ 1 ] [ 2 ]

Алгоритм часто используется как подпрограмма при поиске оценки максимального правдоподобия для эволюционного дерева. Кроме того, его можно использовать при проверке гипотезы о постоянстве темпов эволюции (с помощью тестов отношения правдоподобия ). Его также можно использовать для оценки ошибок параметров, описывающих эволюционное дерево.

Подробности

[ редактировать ]
Простой пример филогенетического дерева, составленный на основе произвольных данных D

Вероятность появления дерева по определению, это вероятность наблюдения определенных данных ( например, выравнивание нуклеотидных последовательностей, т.е. последовательность сайт ДНК ) с учетом дерева. Часто пишут: .

Вот пример эволюционного дерева на данных произвольной последовательности. :


Это ключевое значение, и его часто довольно сложно вычислить. Чтобы облегчить вычисления, Фельзенштейн и его коллеги использовали несколько предположений, которые широко используются и сегодня. Основное предположение состоит в том, что мутации между участками ДНК независимы друг от друга. Это позволяет вычислить вероятность как простое произведение вероятностей. Теперь вы можете разделить данные между несколькими для каждого нуклеотидного сайта внутри . Глобальная вероятность дерева будет произведением вероятностей каждого сайта:

То же дерево, но сделанное из D1, состоящего из первых участков ДНК из D.

Если я повторно использую приведенный выше пример, дерево будет:


Второе предположение касается моделей эволюции последовательностей ДНК . Для расчета вероятности необходимы частоты нуклеотидов, а также вероятности перехода (при возникновении мутации вероятность перехода от одного нуклеотида к другому). Простейшей моделью является модель Джукса-Кантора , предполагающая равные частоты нуклеотидов. и равные вероятности перехода от к ( и ) и то же самое для других оснований. Здесь — глобальная скорость мутаций модели.

Фельзенштейн предложил еще больше разложить вычисления, используя «частичные правдоподобия» при вычислении . Вот как это работает.

Предположим, мы находимся на узле на дереве . имеет два дочерних узла и и для каждого основания ДНК присутствовать на , мы можем определить частичную вероятность такой как:

где и также являются основаниями ДНК. - вероятность перехода от нуклеотида в нуклеотид (то же самое для ). это частичная вероятность дочернего узла , оцененный по нуклеотиду (то же самое для ).

Используя эту формулу, нужно начинать с кончиков дерева. , затем двигаемся к корню и вычисляем частичные вероятности каждого необходимого узла на пути (4 частичных правдоподобия на узел). После завершения поиска в корне дерева вероятность дерева (для этого конкретного сайта) равна сумме частичных правдоподобий корня, умноженных на соответствующую частоту нуклеотидов.

После этого для каждого сайта , наконец, можно получить вероятность глобального эволюционного дерева, умножив каждую «субправдоподобие».

Алгоритм

[ редактировать ]

Простой пример

[ редактировать ]
  1. ^ Фельзенштейн, Дж. (1973). «Методы максимального правдоподобия и минимального шага для оценки эволюционных деревьев на основе данных о дискретных признаках». Систематическая биология . 22 (3): 240–249. дои : 10.1093/sysbio/22.3.240 .
  2. ^ Фельзенштейн, Дж. (1981). «Эволюционные деревья на основе последовательностей ДНК: подход максимального правдоподобия». Журнал молекулярной эволюции . 17 (6): 368–376. Бибкод : 1981JMolE..17..368F . дои : 10.1007/BF01734359 . ПМИД   7288891 . S2CID   8024924 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 6ba262484e0727c10bdb8f64b10c8b87__1716336540
URL1:https://arc.ask3.ru/arc/aa/6b/87/6ba262484e0727c10bdb8f64b10c8b87.html
Заголовок, (Title) документа по адресу, URL1:
Felsenstein's tree-pruning algorithm - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)