Родовая реконструкция
Реконструкция предков (также известная как картирование персонажей или оптимизация персонажей ) — это экстраполяция во времени измеренных характеристик особей, популяций или видов на их общих предков . Это важное применение филогенетики , реконструкции и изучения эволюционных связей между особями, популяциями или видами и их предками. В контексте эволюционной биологии реконструкция предков может использоваться для восстановления различных видов состояний предков у организмов, живших миллионы лет назад. [ 1 ] Эти состояния включают генетическую последовательность ( реконструкция предковой последовательности ), аминокислотную последовательность белка предковой , состав генома ( например, порядок генов), измеримую характеристику организма ( фенотип ) и географический ареал популяции. или вид (реконструкция ареала предков). Это желательно, поскольку позволяет нам исследовать части филогенетических деревьев, соответствующие далекому прошлому, проясняя эволюционную историю видов на дереве. Поскольку современные генетические последовательности по сути являются вариацией древних, доступ к древним последовательностям может выявить другие вариации и организмы, которые могли возникнуть из этих последовательностей. [ 2 ] Помимо генетических последовательностей можно попытаться отследить изменение одной черты характера на другую, например, превращение плавников в ноги.
Небиологические приложения включают реконструкцию словарного запаса или фонем древних языков . [ 3 ] и культурные особенности древних обществ, такие как устные традиции [ 4 ] или брачные практики. [ 5 ]
Реконструкция предков опирается на достаточно реалистичную статистическую модель эволюции, позволяющую точно восстановить состояния предков. Эти модели используют генетическую информацию, уже полученную с помощью таких методов, как филогенетика, для определения пути, по которому эволюция , и того, когда произошли эволюционные события. прошла [ 6 ] Однако независимо от того, насколько хорошо модель аппроксимирует фактическую историю эволюции, способность точно реконструировать предка ухудшается с увеличением времени эволюции между этим предком и его наблюдаемыми потомками. Кроме того, более реалистичные модели эволюции неизбежно более сложны и трудны для расчета. Прогресс в области реконструкции предков во многом зависел от экспоненциального роста вычислительной мощности и сопутствующей разработки эффективных вычислительных алгоритмов (например, алгоритма динамического программирования для совместной с максимальным правдоподобием ). реконструкции наследственных последовательностей [ 7 ] Методы реконструкции предков часто применяются к данному филогенетическому дереву , которое уже было получено на основе тех же данных. Несмотря на удобство этого подхода, он имеет тот недостаток, что его результаты зависят от точности одного филогенетического дерева. Напротив, некоторые исследователи [ 8 ] выступают за более интенсивный в вычислительном отношении байесовский подход, который учитывает неопределенность в реконструкции дерева путем оценки наследственных реконструкций по множеству деревьев.
История
[ редактировать ]Идею реконструкции предков часто приписывают Эмилю Цукеркандлу и Лайнусу Полингу . Вдохновленный разработкой в 1955 году методов определения первичной (аминокислотной) последовательности белков Фредериком Сэнгером , [ 9 ] Цукеркандль и Полинг постулировали [ 10 ] что такие последовательности можно использовать для вывода не только о филогении, связанной с наблюдаемыми белковыми последовательностями, но также и о предковой последовательности белка в самой ранней точке (корне) этого дерева. Однако идея реконструкции предков по измеримым биологическим характеристикам уже развивалась в области кладистики , одной из предшественников современной филогенетики. Кладистические методы, появившиеся еще в 1901 году, делают выводы об эволюционных отношениях видов на основе распределения общих характеристик, некоторые из которых, как предполагается, произошли от общих предков. Более того, Теодосий Добжанский и Альфред Стертевант сформулировали принципы реконструкции предков в филогенетическом контексте в 1938 году, делая вывод об эволюционной истории хромосомных инверсий у Drosophila pseudoobscura . [ 11 ]
Таким образом, реконструкция предков уходит корнями в несколько дисциплин. Сегодня вычислительные методы реконструкции предков продолжают расширяться и применяться в самых разных условиях, так что наследственные состояния выводятся не только по биологическим характеристикам и молекулярным последовательностям, но также и по структуре. [ 12 ] [ 13 ] или каталитические свойства [ 14 ] древних и современных белков , географическое расположение популяций и видов ( филогеография ) [ 15 ] [ 16 ] и структура геномов высшего порядка. [ 17 ]
Методы и алгоритмы
[ редактировать ]Любая попытка реконструкции предков начинается с филогении . В общем, филогения — это древовидная гипотеза о порядке, в котором популяции (называемые таксонами ) связаны происхождением от общих предков. Наблюдаемые таксоны представлены верхушками или конечными узлами дерева, которые постепенно соединяются ветвями со своими общими предками, которые представлены точками ветвления дерева, которые обычно называются предковыми или внутренними узлами . В конце концов, все линии сходятся к самому последнему общему предку всей выборки таксонов. В контексте реконструкции предков филогения часто рассматривается как известная величина (за исключением байесовских подходов). Поскольку может существовать огромное количество филогений, которые почти одинаково эффективны для объяснения данных, сокращение подмножества филогений, подтвержденных данными, до одного представителя или точечной оценки может быть удобным, а иногда и необходимым упрощающим предположением.
Реконструкцию предков можно рассматривать как прямой результат применения гипотетической модели эволюции к данной филогении. Когда модель содержит один или несколько свободных параметров, общая цель состоит в том, чтобы оценить эти параметры на основе измеренных характеристик наблюдаемых таксонов (последовательностей), произошедших от общих предков. Экономия является важным исключением из этой парадигмы: хотя было показано, что существуют обстоятельства, при которых она является оценкой максимального правдоподобия, [ 18 ] по своей сути он просто основан на эвристике, согласно которой изменения в состоянии персонажа редки, без попыток количественного определения этой редкости.
Существует три разных класса методов реконструкции предков. В хронологическом порядке открытия это максимальная экономия , максимальное правдоподобие и байесовский вывод . Максимальная экономность предполагает, что все эволюционные события одинаково вероятны; максимальная вероятность учитывает различную вероятность определенных классов событий; а вывод Байейсана связывает условную вероятность события с вероятностью дерева, а также с степенью неопределенности, связанной с этим деревом. Максимальная экономия и максимальное правдоподобие дают единственный наиболее вероятный результат, тогда как байесовский вывод учитывает неопределенности в данных и дает выборку возможных деревьев.
Максимальная экономия
[ редактировать ]Экономия, известная в просторечии как « бритва Оккама », относится к принципу выбора простейшей из конкурирующих гипотез. В контексте реконструкции предков экономия пытается найти распределение наследственных состояний внутри данного дерева, которое сводит к минимуму общее количество изменений состояний персонажа, которые были бы необходимы для объяснения состояний, наблюдаемых на вершинах дерева. Этот метод максимальной экономии [ 19 ] — один из самых ранних формализованных алгоритмов реконструкции наследственных состояний, а также один из самых простых. [ 13 ]
Максимальная экономия может быть реализована с помощью одного из нескольких алгоритмов. Одним из первых примеров является метод Fitch . [ 20 ] который присваивает состояния наследственных символов путем экономии посредством двух обходов корневого двоичного дерева . Первый этап — это пост-заказный обход , который начинается от вершин к корню дерева путем посещения узлов-потомков (дочерних узлов) раньше их родителей. Первоначально мы определяем набор возможных состояний характера S i для i -го предка на основе наблюдаемых состояний характера его потомков. Каждое назначение представляет собой множество пересечений состояний персонажей потомков предка; если пересечение представляет собой пустое множество, то это объединение множеств . В последнем случае подразумевается, что между предком и одним из двух его непосредственных потомков произошло изменение состояния персонажа. Каждое такое событие учитывается в функции стоимости алгоритма, которую можно использовать для распознавания альтернативных деревьев на основе максимальной экономии. Далее производится предзаказный обход дерева, начиная от корня к вершинам. Состояния персонажа затем назначаются каждому потомку в зависимости от того, какие состояния персонажа он разделяет со своим родителем. Поскольку корень не имеет родительского узла, может потребоваться выбрать состояние символа произвольно, особенно когда в корне реконструировано более одного возможного состояния.
Например, рассмотрим филогению, восстановленную для рода растений, содержащего 6 видов A–F, где каждое растение опыляется «пчелой», «колибри» или «ветром». Один очевидный вопрос заключается в том, какие опылители в более глубоких узлах были в филогении этого рода растений. При максимальной экономии реконструкция наследственного состояния для этой клады показывает, что «колибри» является наиболее экономным наследственным состоянием для нижней клады (растения D, E, F), что наследственные состояния для узлов в верхней кладе (растения A, B, C) сомнительны и что опылители как «колибри», так и «пчелы» одинаково правдоподобны для состояния опыления в корне филогении. Предположим, что у нас есть убедительные доказательства из летописи окаменелостей, что корневое состояние — «колибри». Разрешение корня на «колибри» даст образец реконструкции наследственного состояния, изображенный символами в узлах, при этом состояние, требующее наименьшего количества изменений, обведено кружком.
Методы экономии интуитивно привлекательны и очень эффективны, так что в некоторых случаях они до сих пор используются для затравки алгоритмов оптимизации максимального правдоподобия с начальной филогенией. [ 21 ] Однако лежащее в основе предположение о том, что эволюция достигла определенного конечного результата как можно быстрее, неверно. Естественный отбор и эволюция не направлены на достижение какой-либо цели, они просто выбирают за или против случайно происходящих генетических изменений. Методы экономии предполагают шесть общих предположений: что используемое вами филогенетическое дерево правильное, что у вас есть все соответствующие данные, в которых не было допущено ошибок при кодировании, что все ветви филогенетического дерева с одинаковой вероятностью изменятся, что Скорость эволюции медленная, и вероятность потери или приобретения характеристики одинакова. [ 1 ] В действительности предположения часто нарушаются, что приводит к нескольким проблемам:
- Изменение темпов эволюции. Метод Fitch предполагает, что изменения между всеми состояниями персонажей происходят с одинаковой вероятностью; таким образом, любое изменение влечет за собой одинаковую стоимость для данного дерева. Это предположение часто нереалистично и может ограничить точность таких методов. [ 8 ] Например, переходы происходят чаще, чем трансверсии в эволюции нуклеиновых кислот . Это предположение можно ослабить, назначив дифференциальные затраты конкретным изменениям состояния персонажа, что приведет к взвешенному алгоритму экономии. [ 22 ]
- Быстрая эволюция. Результатом эвристики «минимальной эволюции», лежащей в основе таких методов, является то, что такие методы предполагают, что изменения редки и, следовательно, неуместны в тех случаях, когда изменения являются нормой, а не исключением. [ 23 ] [ 24 ]
- Изменение во времени среди родословных. Методы экономии неявно предполагают, что на каждой ветви дерева прошло одинаковое количество эволюционного времени. Таким образом, они не учитывают различия в длине ветвей дерева, которые часто используются для количественной оценки хода эволюционного или хронологического времени. Из-за этого ограничения метод склонен делать вывод, что одно изменение произошло на очень короткой ветке, а не несколько изменений, произошедших, например, на очень длинной ветке. [ 25 ] Кроме того, возможно, что некоторые ветви дерева могут подвергаться более высокой скорости отбора и изменения, чем другие, возможно, из-за изменения факторов окружающей среды. Некоторые периоды времени могут представлять собой более быструю эволюцию, чем другие, и когда это происходит, экономия становится неточной. [ 26 ] Этот недостаток устраняется с помощью методов, основанных на моделях (как метода максимального правдоподобия, так и байесовских методов), которые делают вывод о стохастическом процессе эволюции по мере его развития вдоль каждой ветви дерева. [ 27 ]
- Статистическое обоснование. Без статистической модели, лежащей в основе метода, его оценки не имеют четко определенных неопределенностей. [ 23 ] [ 25 ] [ 28 ]
- Конвергентная эволюция. При рассмотрении состояния одного признака экономия автоматически предполагает, что два организма, обладающие этой характеристикой, будут более тесно связаны, чем те, у которых ее нет. Например, тот факт, что у собак и обезьян есть мех, не означает, что они более тесно связаны с человеком, чем обезьяны.
Максимальная вероятность
[ редактировать ]Методы максимального правдоподобия (ML) реконструкции наследственных состояний рассматривают состояния персонажей во внутренних узлах дерева как параметры и пытаются найти значения параметров, которые максимизируют вероятность данных (наблюдаемых состояний персонажей) с учетом гипотезы (модели эволюция и филогения, связывающая наблюдаемые последовательности или таксоны). Другими словами, этот метод предполагает, что предковыми состояниями являются те состояния, которые статистически наиболее вероятны, учитывая наблюдаемые фенотипы. Некоторые из самых ранних подходов ML к реконструкции предков были разработаны в контексте эволюции генетических последовательностей ; [ 29 ] [ 30 ] аналогичные модели были разработаны и для аналогичного случая эволюции дискретных признаков. [ 31 ]
Использование модели эволюции объясняет тот факт, что не все события происходят с одинаковой вероятностью. Например, переход , который представляет собой тип точечной мутации от одного пурина к другому или от одного пиримидина к другому, гораздо более вероятен, чем трансверсия , которая представляет собой вероятность переключения пурина на пиримидин или наоборот. наоборот. Эти различия не могут быть учтены максимальной экономией. Однако тот факт, что некоторые события более вероятны, чем другие, не означает, что они происходят всегда. Мы знаем, что на протяжении всей эволюционной истории были времена, когда существовал большой разрыв между тем, что, скорее всего, могло произойти, и тем, что произошло на самом деле. В этом случае максимальная экономия на самом деле может быть более точной, поскольку она более склонна к большим, маловероятным скачкам, чем максимальная вероятность. Было показано, что метод максимального правдоподобия весьма надежен при реконструкции состояний признаков, но он не так хорош для точной оценки стабильности белков. Максимальное правдоподобие всегда переоценивает стабильность белков, что имеет смысл, поскольку предполагает, что белки, которые были созданы и использованы, были наиболее стабильными и оптимальными. [ 13 ] Достоинства метода максимального правдоподобия были предметом споров, причем некоторые пришли к выводу, что тест максимального правдоподобия представляет собой хорошее среднее между точностью и скоростью. [ 32 ] Однако в других исследованиях утверждается, что максимальное правдоподобие требует слишком много времени и вычислительных мощностей, чтобы быть полезным в некоторых сценариях. [ 33 ]
Эти подходы используют ту же вероятностную структуру, что и для построения филогенетического дерева. [ 34 ] Короче говоря, эволюция генетической последовательности моделируется обратимым непрерывным марковским процессом . В самом простом из них все персонажи претерпевают независимые переходы состояний (например, замены нуклеотидов) с постоянной скоростью с течением времени. Эта базовая модель часто расширяется, чтобы обеспечить разные скорости на каждой ветви дерева. В действительности, скорость мутаций также может меняться со временем (например, из-за изменений окружающей среды); это можно смоделировать, позволив параметрам скорости изменяться по дереву за счет увеличения количества параметров. Модель определяет вероятности перехода из состояний i в j вдоль ветви длиной t (в единицах эволюционного времени). Вероятность филогении вычисляется на основе вложенной суммы вероятностей перехода, которая соответствует иерархической структуре предлагаемого дерева. В каждом узле вероятность его потомков суммируется по всем возможным состояниям предкового персонажа в этом узле:
где мы вычисляем вероятность поддерева с корнем в узле x с прямыми потомками y и z , обозначает состояние персонажа i -го узла, длина ветви (эволюционное время) между узлами i и j , и представляет собой набор всех возможных состояний символа (например, нуклеотидов A, C, G и T). [ 34 ] Таким образом, цель реконструкции предков состоит в том, чтобы найти задание для всех внутренних узлов x , что максимизирует вероятность наблюдаемых данных для данного дерева.
Маргинальная и совместная вероятность
[ редактировать ]Вместо того, чтобы вычислять общую вероятность альтернативных деревьев, проблема реконструкции предков состоит в том, чтобы найти комбинацию состояний символов в каждом предковом узле с самой высокой предельной максимальной вероятностью. Вообще говоря, есть два подхода к этой проблеме. Во-первых, можно присвоить наиболее вероятное состояние характера каждому предку независимо от реконструкции всех других состояний предков. Этот подход называется маргинальной реконструкцией . Это похоже на суммирование всех комбинаций наследственных состояний во всех других узлах дерева (включая корневой узел), кроме тех, для которых доступны данные. Маржинальная реконструкция — это поиск состояния в текущем узле, которое максимизирует вероятность интегрирования по всем другим состояниям во всех узлах пропорционально их вероятности. Во-вторых, вместо этого можно попытаться найти совместную комбинацию состояний наследственных символов по всему дереву, которая в совокупности максимизирует вероятность всего набора данных. Таким образом, этот подход называется совместной реконструкцией. [ 29 ] Неудивительно, что реконструкция суставов является более сложной в вычислительном отношении, чем краевая реконструкция. Тем не менее, были разработаны эффективные алгоритмы совместной реконструкции, временная сложность которых обычно линейна в зависимости от количества наблюдаемых таксонов или последовательностей. [ 7 ]
Методы реконструкции предков на основе ML, как правило, обеспечивают большую точность, чем методы MP, при наличии различий в скорости эволюции среди персонажей (или между участками генома). [ 35 ] [ 36 ] Однако эти методы пока не способны учитывать изменения в скорости эволюции с течением времени, иначе известные как гетеротахия . Если скорость эволюции определенного признака ускоряется на ветви филогении, то объем эволюции, произошедшей на этой ветви, будет недооценен для данной длины ветви и при условии постоянной скорости эволюции этого признака. Вдобавок к этому трудно отличить гетеротахию от различий между признаками в темпах эволюции. [ 37 ]
Поскольку ОД (в отличие от максимальной экономии) требует от исследователя указания модели эволюции, на его точность может повлиять использование крайне неверной модели (неправильная спецификация модели). Более того, ML может обеспечить только одну реконструкцию состояний персонажей (что часто называют «точечной оценкой») — когда поверхность правдоподобия сильно невыпуклая и содержит несколько пиков (локальные оптимумы), тогда одноточечная оценка не может быть реализована. обеспечивают адекватное представление, и байесовский подход может оказаться более подходящим.
Байесовский вывод
[ редактировать ]Байесовский вывод использует вероятность наблюдаемых данных для обновления убеждения исследователя или предварительного распределения , чтобы получить апостериорное распределение . В контексте реконструкции предков цель состоит в том, чтобы вывести апостериорные вероятности состояний предкового характера в каждом внутреннем узле данного дерева. Более того, можно интегрировать эти вероятности по апостериорным распределениям по параметрам эволюционной модели и пространству всех возможных деревьев. Это можно выразить как применение теоремы Байеса :
где S представляет предковые состояния, D соответствует наблюдаемым данным, а представляет собой как эволюционную модель, так и филогенетическое древо. - это вероятность наблюдаемых данных, которую можно вычислить с помощью алгоритма сокращения Фельзенштейна, как указано выше. - априорная вероятность наследственных состояний для данной модели и дерева. Окончательно, — это вероятность данных для данной модели и дерева, интегрированная по всем возможным предковым состояниям.
Байесовский вывод — это метод, который многие считают наиболее точным. [ 8 ] В целом байесовские статистические методы позволяют исследователям комбинировать уже существующую информацию с новой гипотезой. В случае эволюции он сочетает в себе вероятность наблюдаемых данных с вероятностью того, что события произошли в том порядке, в котором они произошли, при этом признавая возможность ошибок и неопределенности. В целом, это наиболее точный метод реконструкции наследственных генетических последовательностей, а также стабильности белков. [ 25 ] В отличие от двух других методов, байесовский вывод дает распределение возможных деревьев, что позволяет получить более точные и легко интерпретируемые оценки дисперсии возможных результатов. [ 38 ]
Выше мы дали две формулировки, чтобы подчеркнуть два различных применения теоремы Байеса, которые мы обсудим в следующем разделе.
Эмпирический и иерархический Байес
[ редактировать ]Одна из первых реализаций байесовского подхода к реконструкции наследственных последовательностей была разработана Янгом и его коллегами. [ 29 ] где оценки максимального правдоподобия эволюционной модели и дерева соответственно использовались для определения априорных распределений. Таким образом, их подход является примером эмпирического метода Байеса для вычисления апостериорных вероятностей состояний предков; этот метод был впервые реализован в программном пакете PAML. [ 39 ] С точки зрения приведенной выше формулировки правила Байеса, эмпирический метод Байеса фиксирует к эмпирическим оценкам модели и дерева, полученным на основе данных, эффективно снижая на основе апостериорного правдоподобия и априорных членов формулы. Более того, Ян и его коллеги [ 29 ] использовали эмпирическое распределение шаблонов сайтов (т. е. присвоение нуклеотидов вершинам дерева) при выравнивании наблюдаемых нуклеотидных последовательностей в знаменателе вместо исчерпывающих вычислений. по всем возможным значениям S с учетом . В вычислительном отношении эмпирический метод Байеса сродни реконструкции максимального правдоподобия предковых состояний, за исключением того, что вместо поиска ML-назначения состояний на основе их соответствующих распределений вероятностей в каждом внутреннем узле сами распределения вероятностей сообщаются напрямую.
Эмпирические байесовские методы реконструкции предков требуют от исследователя предположения, что параметры эволюционной модели и дерево известны без ошибок. Когда размер или сложность данных делают это предположение нереалистичным, может быть более разумным принять полностью иерархический байесовский подход и сделать вывод о совместном апостериорном распределении по состояниям предков, модели и дереву. [ 40 ] Хюльзенбек и Болбак впервые предложили [ 40 ] иерархический метод Байеса для реконструкции предков с использованием методов Монте-Карло цепи Маркова (MCMC) для выборки предковых последовательностей из этого совместного апостериорного распределения. Подобный подход был использован и для реконструкции эволюции симбиоза с водорослями у видов грибов ( лихенизация ). [ 41 ] Например, алгоритм Метрополиса-Гастингса для MCMC исследует совместное апостериорное распределение, принимая или отклоняя назначения параметров на основе соотношения апостериорных вероятностей.
Проще говоря, эмпирический подход Байеса вычисляет вероятности различных наследственных состояний для конкретного дерева и модели эволюции. Выражая реконструкцию наследственных состояний как набор вероятностей, можно непосредственно количественно оценить неопределенность при назначении какого-либо конкретного состояния предку. С другой стороны, иерархический байесовский подход усредняет эти вероятности по всем возможным деревьям и моделям эволюции пропорционально тому, насколько вероятны эти деревья и модели с учетом наблюдаемых данных.
Однако остается спорным вопрос о том, дает ли иерархический метод Байеса существенное преимущество на практике. [ 42 ] Более того, этот полностью байесовский подход ограничивается анализом относительно небольшого количества последовательностей или таксонов, поскольку пространство всех возможных деревьев быстро становится слишком огромным, что делает невозможным с вычислительной точки зрения сходимость выборок цепочек за разумный промежуток времени.
Калибровка
[ редактировать ]Реконструкция предков может быть основана на наблюдаемых состояниях в исторических образцах известного возраста, таких как окаменелости или архивные образцы. Поскольку точность реконструкции предков обычно снижается с увеличением времени, использование таких образцов дает данные, которые ближе к реконструируемым предкам, и, скорее всего, улучшит анализ, особенно когда скорость изменения признаков меняется с течением времени. Эта концепция была подтверждена экспериментальным эволюционным исследованием, в ходе которого были размножены реплицированные популяции бактериофага Т7 для создания искусственной филогении. [ 43 ] Возвращаясь к этим экспериментальным данным, Окли и Каннингем [ 44 ] обнаружили, что методы максимальной экономии не смогли точно реконструировать известное наследственное состояние непрерывного характера ( размер бляшки ); эти результаты были проверены с помощью компьютерного моделирования. Эту неудачу в реконструкции предков объясняли смещением направления эволюции размера бляшек (от большого к малому диаметру бляшек), что потребовало включения «окаменевших» образцов для устранения.
Исследования обоих млекопитающих-хищников. [ 45 ] и рыбы [ 46 ] продемонстрировали, что без учета ископаемых данных реконструированные оценки размеров тел предков нереально велики. Более того, Грэм Слейтер и его коллеги показали [ 47 ] использование псовых хищных животных , которое включение данных об окаменелостях в предыдущие распределения улучшило как байесовский вывод о предковых состояниях, так и выбор эволюционной модели по сравнению с анализом, использующим только одновременные данные.
Модели
[ редактировать ]Было разработано множество моделей для оценки наследственных состояний дискретных и непрерывных признаков современных потомков. [ 48 ] Такие модели предполагают, что эволюцию признака во времени можно моделировать как стохастический процесс. Для признаков с дискретными значениями (таких как «тип опылителя») этот процесс обычно рассматривается как цепь Маркова ; для характеристик с непрерывными значениями (таких как « размер мозга ») этот процесс часто воспринимается как броуновское движение или процесс Орнштейна-Уленбека . Используя эту модель в качестве основы для статистических выводов, теперь можно использовать методы максимального правдоподобия или байесовский вывод для оценки наследственных состояний.
Модели дискретного состояния
[ редактировать ]Предположим, рассматриваемая черта может попасть в одну из государства, помеченные . Типичным способом моделирования эволюции этого признака является использование цепи Маркова с непрерывным временем, которую кратко можно описать следующим образом. Каждое состояние имеет связанные с ним темпы перехода ко всем другим состояниям. Черта моделируется как переход между государства; когда он достигает заданного состояния, он запускает экспоненциальные «часы» для каждого из других состояний, в которые он может перейти. Затем он «гоняет» часы друг против друга и делает шаг к состоянию, чьи часы прозвенят первыми. В такой модели параметрами являются скорости перехода , который можно оценить, например, с помощью методов максимального правдоподобия, где проводится максимизация по множеству всех возможных конфигураций состояний родительских узлов.
Чтобы восстановить состояние данного предкового узла в филогении (назовем этот узел ) по максимальному правдоподобию, процедура такова: найти оценку максимального правдоподобия из ; затем вычислите вероятность каждого возможного состояния для кондиционирование на ; наконец, выберите наследственное состояние, которое максимизирует это. [ 23 ] Можно также использовать эту модель замещения в качестве основы для процедуры байесовского вывода, которая будет учитывать апостериорное убеждение в состоянии предкового узла с учетом некоторого априорного значения, выбранного пользователем.
Поскольку таких моделей может быть сколько угодно параметров, переобучение может стать проблемой. Некоторые распространенные варианты, которые уменьшают пространство параметров:
- Марков Модель с параметром -state 1 : эта модель является обратной во времени. -государственный аналог модели Джукса-Кантора . В этой модели все переходы имеют одинаковую скорость. , независимо от их начального и конечного состояний. Некоторые переходы можно запретить, объявив, что их ставки просто равны 0; это может иметь место, например, если некоторые состояния не могут быть достигнуты из других состояний за один переход.
- Асимметричный Марков Модель параметров состояния 2 : в этой модели пространство состояний упорядочено (так что, например, состояние 1 меньше состояния 2, которое меньше состояния 3), и переходы могут происходить только между соседними состояниями. Эта модель содержит два параметра и : один для скорости увеличения состояния (например, от 0 до 1, от 1 до 2 и т. д.) и один для скорости уменьшения состояния (например, от 2 до 1, от 1 до 0 и т. д.).
Пример: модель образования и вымирания бинарного состояния.
[ редактировать ]Модель образования и вымирания бинарного состояния [ 49 ] (BiSSE) — это модель дискретного пространства, которая не следует напрямую структурам, упомянутым выше. Это позволяет оценивать предковые бинарные состояния персонажей вместе со степенью диверсификации , связанной с различными состояниями персонажей; ее также можно напрямую расширить до более общей модели с несколькими дискретными состояниями. В своей самой базовой форме эта модель включает шесть параметров: две скорости видообразования (по одной для линий в состояниях 0 и 1); аналогично, две скорости вымирания; и две скорости изменения характера. Эта модель позволяет проверять гипотезы о скорости видообразования/вымирания/изменения признаков за счет увеличения количества параметров.
Модели с непрерывным состоянием
[ редактировать ]В случае, когда признак вместо этого принимает недискретные значения, вместо этого необходимо обратиться к модели, в которой признак развивается как некоторый непрерывный процесс. Вывод предковых состояний по методу максимального правдоподобия (или с помощью байесовских методов) будет действовать, как указано выше, но с вероятностью переходов состояний между соседними узлами, заданными каким-либо другим непрерывным распределением вероятностей.
- Броуновское движение : в этом случае, если узлы и соседствуют в филогении (скажем является предком ) и разделены ветвью длиной , вероятность перехода от находясь в состоянии к находясь в состоянии задается гауссовой плотностью со средним и дисперсия В данном случае имеется только один параметр ( ), и модель предполагает, что признак развивается свободно, без уклона в сторону увеличения или уменьшения, и что скорость изменений постоянна на всех ветвях филогенетического дерева. [ 50 ]
- Процесс Орнштейна-Уленбека : вкратце, процесс Орнштейна-Уленбека — это непрерывный стохастический процесс, который ведет себя как броуновское движение, но притягивается к некоторому центральному значению, причем сила притяжения увеличивается по мере удаления от этого значения. [ 51 ] [ 52 ] [ 53 ] Это полезно для моделирования сценариев, в которых признак подлежит стабилизирующему отбору вокруг определенного значения (скажем, ). В рамках этой модели описанный выше переход находясь в состоянии к находясь в состоянии будет иметь вероятность, определяемую переходной плотностью процесса Орнштейна-Уленбека с двумя параметрами: , который описывает дисперсию движущего броуновского движения, и , что описывает силу его притяжения к . Как имеет тенденцию , процесс все меньше и меньше сдерживается своим притяжением к и процесс становится броуновским движением. По этой причине модели могут быть вложенными, и могут быть проведены тесты логарифмического отношения правдоподобия, позволяющие определить, какая из двух моделей является подходящей. [ 50 ]
- Стабильные модели непрерывной эволюции персонажа: [ 54 ] хотя броуновское движение привлекательно и приемлемо как модель непрерывной эволюции, оно не допускает ненейтральности в своей базовой форме и не обеспечивает каких-либо изменений в скорости эволюции с течением времени. Вместо этого можно использовать стабильный процесс , значения которого в фиксированное время распределяются как стабильные распределения , для моделирования эволюции признаков. Устойчивые процессы, грубо говоря, ведут себя как броуновские движения, включающие в себя и разрывные скачки. Это позволяет соответствующим образом моделировать сценарии, в которых ожидаются короткие всплески быстрой эволюции признаков. В этой ситуации методы максимального правдоподобия плохо подходят из-за неровной поверхности правдоподобия и того, что правдоподобие можно сделать сколь угодно большим, поэтому более подходящими являются байесовские методы. [ 54 ]
Приложения
[ редактировать ]Эволюция персонажа
[ редактировать ]Реконструкция предков широко используется для вывода об экологических, фенотипических или биогеографических признаках, связанных с наследственными узлами филогенетического дерева. Все методы реконструкции наследственных черт имеют свои недостатки, поскольку они используют математические модели для прогнозирования того, как изменились черты при большом количестве недостающих данных. Эти недостающие данные включают в себя состояния вымерших видов, относительные скорости эволюционных изменений, знание исходных состояний признаков и точность филогенетических деревьев. Во всех случаях, когда используется реконструкция наследственных признаков, выводы должны быть обоснованы изучением биологических данных, подтверждающих выводы, основанные на модели. Гриффит О.В. и др. [ 55 ]
Реконструкция предков позволяет изучать пути эволюции, адаптивный отбор , экспрессию генов развития, [ 56 ] [ 57 ] и функциональное расхождение эволюционного прошлого. Обзор биологических и вычислительных методов реконструкции предков см. в Chang et al. . [ 58 ] Критику методов расчета реконструкции предков см. Williams PD et al. . [ 13 ]
Эволюция поведения и истории жизни
[ редактировать ]У рогатых ящериц (род Phrynosoma ) живорождение (живорождение) развивалось несколько раз на основе методов реконструкции предков. [ 59 ]
Реконструкция рациона галапагосских вьюрков
[ редактировать ]Имеются как филогенетические, так и характерные данные о радиации вьюрков , населяющих Галапагосские острова . Эти данные позволяют проверить гипотезы относительно времени и порядка изменений состояния персонажа во времени посредством реконструкции наследственного состояния. В засушливый сезон рацион 13 видов галапагосских вьюрков можно разделить на три широкие категории: во-первых, те, кто потребляет зерноподобную пищу, считаются « зерноядными », те, кто питается членистоногими, называются « насекомоядными », а те, кто потребляет растительность относят к « фоливорным ». [ 23 ] Реконструкция диетического наследственного состояния с использованием максимальной экономии восстанавливает два основных перехода от насекомоядного состояния: один к зерноядному и один к фоливорному. Реконструкция предкового состояния с максимальной вероятностью дает в целом схожие результаты, с одним существенным отличием: общий предок клад древесного вьюрка ( Camarhynchus ) и земляного вьюрка ( Geospiza ), скорее всего, был зерноядным, а не насекомоядным (если судить по экономности). В этом случае эта разница между состояниями предков, возвращаемыми методами максимальной экономии и максимального правдоподобия, вероятно, возникает в результате того, что оценки ML учитывают длины ветвей филогенетического дерева. [ 23 ]
Эволюция морфологических и физиологических признаков
[ редактировать ]Ящерицы -фриносоматиды демонстрируют замечательное морфологическое разнообразие, в том числе относительный состав типов мышечных волокон в мышцах задних конечностей . Реконструкция предка на основе экономии квадратичных изменений (эквивалент максимального правдоподобия при броуновского движения) эволюции характера [ 60 ] ) указывает на то, что рогатые ящерицы , один из трех основных субкладов этой линии, претерпели значительное эволюционное увеличение доли быстрых окислительных гликолитических волокон в подвздошно-фибулярных мышцах. [ 61 ]
Масса тела млекопитающих
[ редактировать ]В анализе массы тела 1679 видов плацентарных млекопитающих, сравнивающих стабильные модели непрерывной эволюции признаков с броуновского движения , Эллиот и Мурс моделями [ 54 ] показали, что эволюционный процесс, описывающий эволюцию массы тела млекопитающих, лучше всего характеризуется стабильной моделью непрерывной эволюции характера, которая учитывает редкие изменения большой величины. Согласно стабильной модели, предковые млекопитающие сохранили низкую массу тела благодаря ранней диверсификации, причем значительное увеличение массы тела совпало с возникновением нескольких отрядов видов с крупной массой тела (например, копытных). Напротив, моделирование с использованием модели броуновского движения выявило менее реалистичную, на порядок большую массу тела среди предковых млекопитающих, что потребовало значительного уменьшения размера тела до появления отрядов, демонстрирующих небольшой размер тела (например, Rodentia ). Таким образом, стабильные модели восстанавливают более реалистичную картину эволюции массы тела млекопитающих, позволяя происходить крупным преобразованиям на небольшом подмножестве ветвей. [ 54 ]
Коррелирующая эволюция персонажей
[ редактировать ]Филогенетические сравнительные методы (выводы, сделанные путем сравнения родственных таксонов) часто используются для выявления биологических характеристик, которые не развиваются независимо, что может выявить основную зависимость. Например, эволюция формы клюва вьюрка может быть связана с его кормовым поведением. Однако нецелесообразно искать эти ассоциации путем прямого сравнения измерений или генетических последовательностей, поскольку эти наблюдения не являются независимыми из-за их происхождения от общих предков. Для дискретных символов эта проблема была впервые решена в рамках максимальной экономии путем оценки того, имеют ли два символа тенденцию претерпевать изменения на одних и тех же ветвях дерева. [ 62 ] [ 63 ] Фельзенштейн определил эту проблему для непрерывной эволюции характера и предложил решение, подобное реконструкции предков, в которой филогенетическая структура данных учитывалась статистически, направляя анализ через вычисление «независимых контрастов» между узлами дерева, связанными непересекающимися ветвями. . [ 28 ]
Молекулярная эволюция
[ редактировать ]На молекулярном уровне аминокислотные остатки в разных местах белка могут развиваться независимо, поскольку они имеют прямое физико-химическое взаимодействие, или опосредованно, за счет взаимодействия с общим субстратом или за счет дальнодействующих взаимодействий в структуре белка. И наоборот, складчатую структуру белка потенциально можно вывести из распределения взаимодействий остатков. [ 64 ] Одно из первых применений наследственной реконструкции для предсказания трехмерной структуры белка посредством контактов остатков было опубликовано Шиндяловым и его коллегами. [ 65 ] Филогении, относящиеся к 67 различным семействам белков, были созданы с помощью метода кластеризации на основе расстояния ( метод невзвешенных парных групп со средним арифметическим , UPGMA), а предковые последовательности были реконструированы с помощью экономии. Авторы сообщили о слабой, но значительной тенденции к совместному развитию пар остатков в известной трехмерной структуре белков.
Реконструкция древних белков и последовательностей ДНК лишь недавно стала важной научной задачей. Развитие обширных баз данных геномных последовательностей в сочетании с достижениями в области биотехнологии и методов филогенетического вывода сделали реконструкцию предков дешевой, быстрой и научно практичной. Эта концепция была применена для идентификации коэволюционирующих остатков в белковых последовательностях с использованием более совершенных методов реконструкции филогений и предковых последовательностей. Например, реконструкция предков использовалась для идентификации совместно эволюционирующих остатков в белках, кодируемых геномами РНК-вирусов, особенно ВИЧ. [ 66 ] [ 67 ] [ 68 ]
Реконструкция предкового белка и ДНК позволяет воссоздать эволюцию белков и ДНК в лаборатории, чтобы ее можно было изучать напрямую. [ 58 ] Что касается белков, это позволяет исследовать эволюцию современной молекулярной структуры и функций. Кроме того, реконструкция предковых белков может привести к открытию новых биохимических функций, утраченных в современных белках. [ 69 ] [ 70 ] Это также позволяет глубже понять биологию и экологию вымерших организмов. [ 71 ] Хотя большинство реконструкций предков касались белков, их также использовали для проверки эволюционных механизмов на уровне бактериальных геномов. [ 72 ] и последовательности генов приматов. [ 73 ]
Дизайн вакцины
[ редактировать ]РНК-вирусы, такие как вирус иммунодефицита человека (ВИЧ), развиваются чрезвычайно быстро, на несколько порядков быстрее, чем млекопитающие или птицы. Для этих организмов реконструкцию предков можно применить в гораздо более коротком временном масштабе; например, чтобы реконструировать глобальную или региональную причину эпидемии , которая длилась десятилетия, а не миллионы лет. Команда во главе с Брайаном Гашеном предложила [ 74 ] что такие реконструированные штаммы будут использоваться в качестве мишеней для разработки вакцин , в отличие от последовательностей, выделенных у пациентов в наши дни. Поскольку ВИЧ чрезвычайно разнообразен, вакцина, предназначенная для воздействия на вирусную популяцию одного пациента, может не работать на другого пациента, поскольку эволюционная дистанция между этими двумя вирусами может быть большой. Однако их последний общий предок ближе к каждому из двух вирусов, чем друг к другу. Таким образом, вакцина, разработанная для общего предка, может иметь больше шансов оказаться эффективной для большей части циркулирующих штаммов. Другая команда развила эту идею дальше, разработав метод реконструкции центра дерева, позволяющий создать последовательность, общее эволюционное расстояние которой до современных штаммов минимально возможно. [ 75 ] Строго говоря, этот метод не был реконструкцией предков , поскольку последовательность центра дерева (COT) не обязательно представляет собой последовательность, которая когда-либо существовала в истории эволюции вируса. Однако Роллан и его коллеги обнаружили, что в случае ВИЧ вирус COT был функциональным при синтезе. Подобные эксперименты с синтетическими предковыми последовательностями, полученными методом максимального правдоподобия, также показали, что эти предки одновременно функциональны и иммуногенны. [ 76 ] [ 77 ] придавая некоторую достоверность этим методам. Более того, реконструкция предков потенциально может быть использована для определения генетической последовательности переданных вариантов ВИЧ, которые впоследствии привели к установлению следующей инфекции, с целью выявления отличительных характеристик этих вариантов (в виде неслучайного отбора переданной популяции ВИЧ-инфекции). вирусы), которые могут быть использованы для разработки вакцин. [ 78 ]
Перестройки генома
[ редактировать ]Вместо того, чтобы делать выводы о последовательности наследственной ДНК, можно интересоваться более крупномасштабной молекулярной структурой и содержанием генома предков. К этой проблеме часто подходят комбинаторно, моделируя геномы как перестановки генов или гомологичных областей. С этими перестановками разрешены различные операции, такие как инверсия (сегмент перестановки переворачивается на месте), удаление (сегмент удаляется), транспозиция (сегмент удаляется из одной части перестановки и вставляется в другое место). ), или получение генетического содержания посредством рекомбинации , дупликации или горизонтального переноса генов . «Проблема перестройки генома», впервые поставленная Уоттерсоном и его коллегами, [ 17 ] спрашивает: учитывая два генома (перестановки) и набор допустимых операций, какова кратчайшая последовательность операций, которая преобразует один геном в другой? Обобщением этой проблемы, применимым к реконструкции предков, является «проблема множественной перестройки генома»: [ 79 ] по заданному набору геномов и набору допустимых операций найти (i) бинарное дерево с заданными геномами в качестве листьев и (ii) такое расположение геномов по внутренним узлам дерева, что общее количество операций по всему дереву минимизируется. Этот подход похож на экономию, за исключением того, что дерево выводится вместе с наследственными последовательностями. К сожалению, даже проблема перестройки одного генома является NP-трудной . [ 80 ] хотя ему уделяется много внимания в математике и информатике (обзор см. в Fertin et al.). [ 81 ] ).
Реконструкцию геномов предков также называют реконструкцией кариотипа . Хромосомная живопись в настоящее время является основным экспериментальным методом. [ 82 ] [ 83 ] Недавно исследователи разработали вычислительные методы для реконструкции предкового кариотипа, используя преимущества сравнительной геномики . [ 84 ] [ 85 ] Кроме того, сравнительная геномика и реконструкция генома предков применялись для идентификации древних событий горизонтального переноса генов у последнего общего предка линии (например, Candidatus Accumulibacter phosphatis [ 86 ] ), чтобы определить эволюционную основу приобретения признаков.
Пространственные приложения
[ редактировать ]Миграция
[ редактировать ]Реконструкция предков не ограничивается биологическими признаками. Пространственное местоположение также является особенностью, и методы реконструкции предков могут определить местонахождение предков рассматриваемых людей. Такие методы использовали Леми и его коллеги. [ 16 ] географически проследить предков 192 штаммов птичьего гриппа A-H5N1 , отобранных из двадцати населенных пунктов Европы и Азии, а также 101 последовательности вируса бешенства , отобранных в двенадцати африканских странах.
Рассматривая местоположения как дискретные состояния (страны, города и т. д.), можно применять модели дискретных состояний, описанные выше. Однако, в отличие от модели, где пространство состояний для признака невелико, мест может быть много, а переходы между определенными парами состояний могут происходить редко или никогда не происходить; например, миграция между отдаленными регионами может никогда не произойти напрямую, если между двумя местами не существует воздушного сообщения, поэтому такие миграции должны сначала проходить через промежуточные регионы. Это означает, что в модели может быть много параметров, которые равны нулю или близки к нулю. С этой целью Леми и его коллеги использовали байесовскую процедуру, чтобы не только оценить параметры и предковые состояния, но и выбрать, какие параметры миграции не равны нулю; их работа предполагает, что эта процедура действительно приводит к более эффективному использованию данных. Они также исследуют использование предыдущих распределений, включающих географическую структуру или гипотезы о динамике миграции, и обнаруживают, что те, которые они рассматривали, мало повлияли на результаты.
Используя этот анализ, команда Леми обнаружила, что наиболее вероятным центром распространения A-H5N1 является Гуандун , а Гонконг также получает поддержку сзади. Кроме того, их результаты подтверждают гипотезу о давнем присутствии африканского бешенства в Западной Африке .
Ареалы видов
[ редактировать ]Вывод об исторических биогеографических закономерностях часто требует реконструкции предковых ареалов видов на филогенетических деревьях. [ 87 ] Например, хорошо изученная филогения видов растений рода Cyrtandra. [ 87 ] использовался вместе с информацией об их географических ареалах для сравнения четырех методов реконструкции ареала предков. Команда сравнила экономность Fitch, [ 20 ] (FP; экономия) стохастическое отображение [ 88 ] (SM; максимальное правдоподобие), дисперсионно-викарантный анализ [ 89 ] (DIVA; экономия) и расселение-вымирание-кладогенез. [ 15 ] [ 90 ] (DEC; максимальное правдоподобие). Результаты показали, что оба метода экономии работали плохо, что, вероятно, связано с тем, что методы экономии не учитывают длину ветвей. Оба метода максимального правдоподобия показали лучшие результаты; однако анализ DEC, который дополнительно позволяет включать геологические данные, дал более реалистичные выводы об эволюции ареала в Киртандре по сравнению с другими методами. [ 87 ]
Другой метод максимального правдоподобия восстанавливает филогеографическую историю гена. [ 91 ] путем реконструкции предкового местоположения выбранных таксонов. Этот метод предполагает пространственно явную модель миграции случайного блуждания для реконструкции местонахождения предков с учетом географических координат людей, представленных верхушками филогенетического дерева. Применительно к филогенетическому дереву хоровых лягушек Pseudacrisferiarum этот метод выявил недавнюю экспансию на север, более высокое расстояние расселения для каждого поколения в недавно колонизированном регионе, нецентральное местонахождение предков и направленную миграцию. [ 91 ]
Первое рассмотрение проблемы множественной перестройки генома, задолго до ее формализации в терминах перестановок, было представлено Стертевантом и Добжанским в 1936 году. [ 92 ] Они исследовали геномы нескольких штаммов плодовых мух из разных географических мест и заметили, что одна конфигурация, которую они назвали «стандартной», была наиболее распространенной во всех изученных областях. Примечательно, что они также заметили, что четыре разных штамма могут быть получены из стандартной последовательности путем одной инверсии, а два других могут быть связаны второй инверсией. Это позволило им выдвинуть гипотезу о филогении последовательностей и сделать вывод, что стандартная последовательность, вероятно, также была предковой.
Лингвистическая эволюция
[ редактировать ]Реконструкции слов и феноменов древних протоязыков, таких как протоиндоевропейский, были выполнены на основе наблюдаемых аналогов в современных языках. Обычно эти анализы проводятся вручную «сравнительным методом». [ 93 ] Во-первых, в изучаемых современных языках идентифицируются слова из разных языков, имеющие общую этимологию ( родственные слова ), аналогично выявлению ортологичных биологических последовательностей. Во-вторых, выявляются соответствия между отдельными звуками в родственных словах — шаг, аналогичный выравниванию биологических последовательностей , хотя и выполняемый вручную. Наконец, вероятные звуки предков выдвигаются путем ручной проверки и различных эвристических методов (например, того факта, что в большинстве языков есть как носовые, так и неносовые гласные ). [ 93 ]
Программное обеспечение
[ редактировать ]Существует множество пакетов программного обеспечения, которые могут выполнить реконструкцию наследственного состояния. Как правило, эти пакеты программного обеспечения разрабатываются и поддерживаются усилиями ученых в смежных областях и выпускаются по лицензиям свободного программного обеспечения . Следующая таблица не является исчерпывающим перечислением всех доступных пакетов, но представляет собой репрезентативную выборку широкого спектра пакетов, реализующих методы реконструкции предков с различными преимуществами и функциями.
Имя | Методы | Платформа | Входы | ! Типы персонажей | Непрерывные (C) или дискретные символы (D) | Лицензия на программное обеспечение |
---|---|---|---|---|---|---|
ПАМЛ | Максимальная вероятность | Юникс, Мак, Победа | ФИЛИП, НЕКСУС, ФАСТА | Нуклеотид, Белок | Д | Стандартная общественная лицензия GNU , версия 3. |
ЗВЕРЬ | Байесовский | Юникс, Мак, Победа | НЕКСУС, ЗВЕРЬ XML | Нуклеотид, Белок, Географический | С, Д | Меньшая стандартная общественная лицензия GNU |
фитосредства | Максимальная вероятность | Юникс, Мак, Победа | Ньюик, Нексус | Качественные и количественные характеристики | С, Д | Стандартная общественная лицензия GNU |
ОБЕЗЬЯНА | Максимальная вероятность | Юникс, Мак, Победа | НЕКСУС, ФАСТА, КЛУСТАЛ | Нуклеотид, Белок | С, Д | Стандартная общественная лицензия GNU |
Диверситри | Максимальная вероятность | Юникс, Мак, Победа | НЕКСУС | Качественные и количественные признаки, Географические | С, Д | Стандартная общественная лицензия GNU, версия 2. |
HyPhy | Максимальная вероятность | Юникс, Мак, Победа | МЕГА, НЕКСУС, ФАСТА, ФИЛИП | Нуклеотид, белок (настраиваемый) | Д | Лицензия свободной документации GNU 1.3 |
Байесовские черты | Байесовский | Юникс, Мак, Победа | TSV или таблица, разделенная пробелами. Строки — виды, столбцы — признаки. | Качественные и количественные характеристики | С, Д | Лицензия Creative Commons с указанием авторства |
Лагранж | Максимальная вероятность | Линукс, Мак, Вин | TSV/CSV видовых регионов. В строках указаны виды, а в столбцах — географические регионы. | Географический | - | Стандартная общественная лицензия GNU, версия 2. |
Мескитовый | Экономия, максимальная вероятность | Юникс, Мак, Победа | Фаста, НБРФ, Генбанк, PHYLIP, CLUSTAL, ТСВ | Нуклеотид, Белок, Географический | С, Д | Лицензия Creative Commons с указанием авторства 3.0 |
Филомаппер | Максимальное правдоподобие, байесианское (начиная с версии 2) | Юникс, Мак, Победа | НЕКСУС | Географическая, Экологическая ниша | С, Д | - |
Предки | Максимальная вероятность | Интернет | Пост | Нуклеотид (инделы) | Д | - |
Фирекс | Максимальная экономия | Линукс | Пост | Экспрессия генов | С, Д | Собственный |
СИММАП | Стохастическое картографирование | Мак | XML-подобный формат | Нуклеотид, качественные признаки | Д | Собственный |
г-н Байес | Байесовский | Юникс, Мак, Победа | НЕКСУС | Нуклеотид, Белок | Д | Стандартная общественная лицензия GNU |
ПАРАНА | Максимальная экономия | Юникс, Мак, Победа | Ньюик | Биологические сети | Д | Лицензия Апач |
ФАСТ (ПРИКВЕЛ) | Максимальная вероятность | Юникс, Мак, Победа | Множественное выравнивание | Нуклеотид | Д | Лицензия БСД |
РАСП | Максимальное правдоподобие, байесовский | Юникс, Мак, Победа | Ньюик | Географический | Д | - |
VIP | Максимальная экономия | Линукс, Вин | Ньюик | Географический | Д (сетка) | Лицензия GPL Creative Commons |
ФастМЛ | Максимальная вероятность | Интернет, Юникс | Пост | Нуклеотид, Белок | Д | Авторское право |
МЛГО | Максимальная вероятность | Интернет | Обычай | Перестановка порядка генов | Д | ГНУ |
БАРСУС | Байесовский | Юникс, Мак, Победа | Обычай | Перестановка порядка генов | Д | GNU GPL версия 2 |
СЧИТАТЬ | Максимальная экономия, максимальная вероятность | Юникс, Мак, Победа | Текстовый файл с разделителями-табуляцией, содержащий строки для таксонов и данные подсчета в столбцах. | Подсчет (числовых) данных (например, размер семейства гомологов) | Д | БСД |
МЕГА | Максимальная экономия, максимальная вероятность. | Мак, Победа | МЕГА | Нуклеотид, Белок | Д | Собственный |
УКАЗАНО | Местная бережливость | Юникс | Обычай | Карты генома | Д | Стандартная общественная лицензия GNU, версия 3. |
РАСШИФРОВАТЬ | Максимальная вероятность | Юникс, Мак, Победа | ФАСТА, ГенБанк | Нуклеотид | Д | Стандартная общественная лицензия GNU, версия 3. |
СНОВА | Максимальная вероятность. | Win, Unix, модуль Matlab | Пользовательский текстовый формат для параметров модели, дерева, наблюдаемых значений символов. | Двоичный | Д | Ничего не указано, хотя на сайте указано, что программное обеспечение находится в свободном доступе. |
Описания пакетов
[ редактировать ]Молекулярная эволюция
[ редактировать ]Большинство этих программных пакетов предназначены для анализа данных генетических последовательностей. Например, ПАМЛ [ 94 ] представляет собой набор программ для филогенетического анализа выравнивания последовательностей ДНК и белков по методу максимального правдоподобия. Реконструкцию предков можно выполнить с помощью программы codeml . Кроме того, LAZARUS представляет собой набор скриптов Python , которые включают в себя функции реконструкции предков PAML для пакетной обработки и большей простоты использования. [ 95 ] Пакеты программного обеспечения, такие как MEGA , HyPhy и Mesquite, также выполняют филогенетический анализ данных последовательностей, но они разработаны так, чтобы быть более модульными и настраиваемыми. HyPhy [ 96 ] реализует совместный метод максимального правдоподобия реконструкции предковой последовательности [ 7 ] который можно легко адаптировать для реконструкции более обобщенного диапазона дискретных состояний предков, таких как географические местоположения, путем указания индивидуальной модели на пакетном языке. Мескитовый [ 97 ] предоставляет методы реконструкции состояния предков как для дискретных, так и для непрерывных символов, используя методы максимальной экономии и максимального правдоподобия. Он также предоставляет несколько инструментов визуализации для интерпретации результатов реконструкции предков. МЕГА [ 98 ] Это тоже модульная система, но в ней больший упор делается на простоту использования, чем на настройку анализа. Начиная с версии 5, MEGA позволяет пользователю восстанавливать наследственные состояния, используя методы максимальной экономии, максимального правдоподобия и эмпирические методы Байеса. [ 98 ]
Байесовский анализ генетических последовательностей может повысить устойчивость к неправильной спецификации модели. г-н Байес [ 99 ] позволяет делать выводы о наследственных состояниях в наследственных узлах, используя полный иерархический байесовский подход. Программа PREQUEL, распространяемая в пакете PHAST. [ 100 ] выполняет сравнительную эволюционную геномику с использованием реконструкции наследственных последовательностей. СИММАП [ 101 ] стохастически отображает мутации в филогениях. Байесовские черты [ 31 ] анализирует дискретные или непрерывные признаки в байесовской системе для оценки моделей эволюции, реконструкции наследственных состояний и обнаружения коррелированной эволюции между парами признаков.
Другие типы персонажей
[ редактировать ]Другие программные пакеты больше ориентированы на анализ качественных и количественных признаков ( фенотипов ). Например, обезьяны пакет [ 102 ] в среде статистических вычислений R также предоставляет методы реконструкции предкового состояния как для дискретных, так и для непрерывных символов с помощью функции « туз », включая максимальное правдоподобие. Phyrex реализует алгоритм, основанный на максимальной экономии, для восстановления профилей экспрессии генов предков, в дополнение к методу максимального правдоподобия для реконструкции генетических последовательностей предков (путем обертывания функции baseml в PAML). [ 103 ]
Некоторые пакеты программного обеспечения также реконструируют филогеографию . ЗВЕРЬ (Байесовский эволюционный анализ путем выборки деревьев) [ 104 ] а BEAST 2 предоставляет инструменты для реконструкции географических местоположений предков на основе наблюдаемых последовательностей, аннотированных данными о местоположении, с использованием байесовских методов выборки MCMC . Диверситри [ 105 ] представляет собой пакет R, предоставляющий методы реконструкции предкового состояния в Mk2 ( марковская модель эволюции двоичного характера с непрерывным временем). [ 106 ] и модели BiSSE (видообразование и вымирание двоичных состояний). Лагранж проводит анализ реконструкции эволюции географического ареала на филогенетических деревьях. [ 15 ] Филомаппер [ 91 ] представляет собой статистическую основу для оценки исторических закономерностей потока генов и географических местоположений предков. РАСП [ 107 ] делает выводы о наследственных состояниях, используя статистический дисперсионно-викариантный анализ, методы Лагранжа, Байеса-Лагранжа, BayArea и BBM. VIP [ 108 ] делает выводы об исторической биогеографии, исследуя разрозненные географические распределения.
Перестройки генома предоставляют ценную информацию для сравнительной геномики видов. АНГЫ [ 109 ] сравнивает существующие родственные геномы посредством наследственной реконструкции генетических маркеров. БАРСУС [ 110 ] использует байесовский подход к изучению истории перестройки генов. Считать [ 111 ] реконструирует эволюцию размера семейств генов. ЭРЕМ [ 112 ] анализирует появление и потерю генетических особенностей, закодированных двоичными символами. ПАРАНА [ 113 ] выполняет основанный на экономии вывод о наследственных биологических сетях, которые представляют собой потерю и дупликацию генов.
Веб-приложения
[ редактировать ]Наконец, существует несколько приложений на базе веб-сервера, которые позволяют исследователям использовать методы максимального правдоподобия для реконструкции предков различных типов персонажей без необходимости установки какого-либо программного обеспечения. Например, Предки [ 114 ] веб-сервер для реконструкции предкового генома путем идентификации и расположения синтенных регионов. ФастМЛ [ 115 ] — веб-сервер вероятностной реконструкции наследственных последовательностей по методу максимального правдоподобия, использующий модель пробельного характера для восстановления индел- вариации. МЛГО [ 116 ] веб-сервер для анализа порядка генов максимального правдоподобия.
Будущие направления
[ редактировать ]Разработка и применение вычислительных алгоритмов для реконструкции предков продолжает оставаться активной областью исследований в разных дисциплинах. Например, реконструкция вставок и делеций последовательностей (инделей) отстает от более простого применения моделей замещения. Бушар-Коте и Джордан недавно описали новую модель (процесс Пуассона-Инделя). [ 117 ] что представляет собой важный шаг вперед в архетипической модели индел-эволюции Торна-Кишино-Фельзенштейна. [ 118 ] Кроме того, развитие этой области происходит благодаря быстрому прогрессу в области технологий секвенирования нового поколения , где последовательности генерируются из миллионов шаблонов нуклеиновых кислот путем обширного распараллеливания реакций секвенирования в специализированном аппарате. Эти достижения позволили создать «глубокую» картину генетического состава быстро развивающейся популяции, такой как РНК-вирусы. [ 119 ] или опухолевые клетки, [ 120 ] за относительно короткий промежуток времени. В то же время огромный объем данных и профили ошибок секвенирования, специфичные для конкретной платформы, создали новые биоинформационные проблемы для обработки этих данных для реконструкции наследственных последовательностей.
См. также
[ редактировать ]- Эволюционная биология
- Происхождение жизни
- Ферментная распущенность
- Реконструкция наследственной последовательности
Ссылки
[ редактировать ]Эта статья была адаптирована из следующего источника под лицензией CC BY 4.0 ( 2015 г. ) ( отчеты рецензента ): Джеффри Б. Джой; Ричард Х. Лян; Розмари М. Макклоски; Т Нгуен; Арт Пун (12 июля 2016 г.). «Реконструкция предков» . PLOS Вычислительная биология . 12 (7): e1004763. doi : 10.1371/JOURNAL.PCBI.1004763 . ISSN 1553-734X . ПМЦ 4942178 . ПМИД 27404731 . Викиданные Q28596371 .
- ^ Jump up to: а б Омланд К.Э. (1999). «Предположения и проблемы реконструкции древнего государства» . Систематическая биология . 48 (3): 604–611. дои : 10.1080/106351599260175 . ISSN 1063-5157 .
- ^ Цай В., Пей Дж., Гришин Н.В. (сентябрь 2004 г.). «Реконструкция наследственных белковых последовательностей и ее применение» . Эволюционная биология BMC . 4 (1): 33. дои : 10.1186/1471-2148-4-33 . ПМК 522809 . ПМИД 15377393 .
- ^ Платник Н.И., Кэмерон HD (1977). «Кладистические методы текстового, лингвистического и филогенетического анализа». Систематическая зоология . 26 (4): 380–385. дои : 10.2307/2412794 . ISSN 0039-7989 . JSTOR 2412794 .
- ^ Тегерани Джей Джей (2013). «Филогения Красной Шапочки» . ПЛОС ОДИН . 8 (11): e78871. Бибкод : 2013PLoSO...878871T . дои : 10.1371/journal.pone.0078871 . ПМЦ 3827309 . ПМИД 24236061 .
- ^ Уокер Р.С., Хилл К.Р., Флинн М.В., Эллсуорт Р.М. (апрель 2011 г.). «Эволюционная история брачных практик охотников-собирателей» . ПЛОС ОДИН . 6 (4): e19066. Бибкод : 2011PLoSO...619066W . дои : 10.1371/journal.pone.0019066 . ПМК 3083418 . ПМИД 21556360 .
- ^ Брукс Д.Р. (1999). «Филогения и сравнительный метод поведения животных, под редакцией Эмии П. Мартинс, Oxford University Press, 1996. X + 415 стр.». Поведенческие процессы . 47 (2): 135–136. дои : 10.1016/S0376-6357(99)00038-8 . ISSN 0376-6357 . ПМИД 24896936 . S2CID 9872907 .
- ^ Jump up to: а б с Пупко Т., Пеер И., Шамир Р., Граур Д. (июнь 2000 г.). «Быстрый алгоритм совместной реконструкции наследственных аминокислотных последовательностей». Молекулярная биология и эволюция . 17 (6): 890–896. doi : 10.1093/oxfordjournals.molbev.a026369 . ПМИД 10833195 .
- ^ Jump up to: а б с Пейджел М., Мид А., Баркер Д. (октябрь 2004 г.). «Байесовская оценка состояний наследственных признаков в филогениях» . Систематическая биология . 53 (5): 673–684. CiteSeerX 10.1.1.483.4931 . дои : 10.1080/10635150490522232 . ПМИД 15545248 .
- ^ Сэнгер Ф., Томпсон Э.О., Китай Р. (март 1955 г.). «Амидные группы инсулина» . Биохимический журнал . 59 (3): 509–518. дои : 10.1042/bj0590509 . ПМК 1216278 . ПМИД 14363129 .
- ^ Полинг Л., Цукеркандл Э., Хенриксен Т., Лёвстад Р. (1963). «Химическая палеогенетика. Молекулярные «восстановительные исследования» вымерших форм жизни» . Acta Chemica Scandinavica . 17 (дополнение): 9–16. doi : 10.3891/acta.chem.scand.17s-0009 . ISSN 0904-213X .
- ^ Jump up to: а б Добжанский Т., Стертевант А.Х. (январь 1938 г.). «Инверсии хромосом дрозофилы Pseudoobscura» . Генетика . 23 (1): 28–64. дои : 10.1093/генетика/23.1.28 . ПМК 1209001 . ПМИД 17246876 .
- ^ Хармс MJ, Торнтон JW (июнь 2010 г.). «Анализ структуры и функции белка с использованием реконструкции наследственных генов» . Современное мнение в области структурной биологии . 20 (3): 360–366. дои : 10.1016/j.sbi.2010.03.005 . ПМЦ 2916957 . ПМИД 20413295 .
- ^ Jump up to: а б с д Уильямс П.Д., Поллок Д.Д., Блэкберн Б.П., Гольдштейн Р.А. (июнь 2006 г.). «Оценка точности методов реконструкции предковых белков» . PLOS Вычислительная биология . 2 (6): е69. Бибкод : 2006PLSCB...2...69W . дои : 10.1371/journal.pcbi.0020069 . ПМЦ 1480538 . ПМИД 16789817 .
- ^ Ронквист Ф. (сентябрь 2004 г.). «Байесовский вывод эволюции характера». Тенденции в экологии и эволюции . 19 (9): 475–481. дои : 10.1016/j.tree.2004.07.002 . ПМИД 16701310 .
- ^ Jump up to: а б с Ри Р.Х., Смит С.А. (февраль 2008 г.). «Вывод с максимальной вероятностью об эволюции географического ареала путем расселения, локального вымирания и кладогенеза» . Систематическая биология . 57 (1): 4–14. CiteSeerX 10.1.1.457.2776 . дои : 10.1080/10635150701883881 . ПМИД 18253896 .
- ^ Jump up to: а б Леми П., Рамбо А., Драммонд А.Дж., Сушард М.А. (сентябрь 2009 г.). «Байесовская филогеография находит свои корни» . PLOS Вычислительная биология . 5 (9): е1000520. Бибкод : 2009PLSCB...5E0520L . дои : 10.1371/journal.pcbi.1000520 . ПМК 2740835 . ПМИД 19779555 .
- ^ Jump up to: а б Уоттерсон Г.А., Юэнс В.Дж., Холл Т.Э., Морган А. (1982). «Проблема инверсии хромосом». Журнал теоретической биологии . 99 (1): 1–7. Бибкод : 1982JThBi..99....1W . дои : 10.1016/0022-5193(82)90384-8 . ISSN 0022-5193 .
- ^ Таффли С., Стил М. (май 1997 г.). «Связь между максимальной вероятностью и максимальной экономией в рамках простой модели замены сайтов». Бюллетень математической биологии . 59 (3): 581–607. CiteSeerX 10.1.1.22.6143 . дои : 10.1007/BF02459467 . ПМИД 9172826 . S2CID 189885872 .
- ^ Суоффорд Д.Л., Мэддисон В.П. (1987). «Реконструкция наследственных состояний характера в условиях скупости Вагнера». Математические биологические науки . 87 (2): 199–229. дои : 10.1016/0025-5564(87)90074-5 . ISSN 0025-5564 .
- ^ Jump up to: а б Фитч WM (1971). «На пути к определению курса эволюции: минимальные изменения для конкретной топологии дерева». Систематическая зоология . 20 (4): 406–416. дои : 10.2307/2412116 . ISSN 0039-7989 . JSTOR 2412116 .
- ^ Стаматакис А (ноябрь 2006 г.). «RAxML-VI-HPC: филогенетический анализ на основе максимального правдоподобия с тысячами таксонов и смешанными моделями» (PDF) . Биоинформатика . 22 (21): 2688–2690. doi : 10.1093/биоинформатика/btl446 . ПМИД 16928733 .
- ^ Санкофф Д (1975). «Минимальные деревья мутаций последовательностей». SIAM Journal по прикладной математике . 28 (1): 35–42. CiteSeerX 10.1.1.665.9596 . дои : 10.1137/0128004 . ISSN 0036-1399 .
- ^ Jump up to: а б с д и Шлютер Д., Прайс Т., Мурс А.О., Людвиг Д. (декабрь 1997 г.). «Вероятность предковых состояний в адаптивном излучении». Эволюция; Международный журнал органической эволюции . 51 (6): 1699–1711. дои : 10.2307/2410994 . JSTOR 2410994 . ПМИД 28565128 .
- ^ Фельзенштейн Дж (1973). «Методы максимального правдоподобия и минимального шага для оценки эволюционных деревьев на основе данных о дискретных признаках». Систематическая зоология . 22 (3): 240–249. дои : 10.2307/2412304 . ISSN 0039-7989 . JSTOR 2412304 .
- ^ Jump up to: а б с Каннингем CW, Омланд К.Е., Окли TH (сентябрь 1998 г.). «Реконструкция наследственных состояний характера: критическая переоценка». Тенденции в экологии и эволюции . 13 (9): 361–366. Бибкод : 1998TEcoE..13..361C . дои : 10.1016/S0169-5347(98)01382-2 . ПМИД 21238344 . S2CID 6779286 .
- ^ Моерс А.О., Шлютер Д. (1999). «Реконструкция исходных состояний с максимальной вероятностью: поддержка одно- и двухскоростных моделей». Систематическая биология . 48 (3): 623–633. CiteSeerX 10.1.1.594.175 . дои : 10.1080/106351599260193 . ISSN 1063-5157 .
- ^ Ли Г, Стил М, Чжан Л (август 2008 г.). «Больше таксонов не обязательно лучше для реконструкции состояний предков». Систематическая биология . 57 (4): 647–653. arXiv : 0803.0195 . дои : 10.1080/10635150802203898 . ПМИД 18709600 . S2CID 1373201 .
- ^ Jump up to: а б Фельзенштейн Дж (1985). «Филогения и сравнительный метод». Американский натуралист . 125 (1): 1–15. дои : 10.1086/284325 . ISSN 0003-0147 . S2CID 9731499 .
- ^ Jump up to: а б с д Ян З., Кумар С., Ней М. (декабрь 1995 г.). «Новый метод вывода наследственных нуклеотидных и аминокислотных последовательностей» . Генетика . 141 (4): 1641–1650. дои : 10.1093/генетика/141.4.1641 . ПМК 1206894 . ПМИД 8601501 .
- ^ Коши Дж. М., Гольдштейн Р. А. (февраль 1996 г.). «Вероятностная реконструкция наследственных белковых последовательностей». Журнал молекулярной эволюции . 42 (2): 313–320. Бибкод : 1996JMolE..42..313K . CiteSeerX 10.1.1.1031.2646 . дои : 10.1007/BF02198858 . ПМИД 8919883 . S2CID 15997589 .
- ^ Jump up to: а б Пейгель М (1999). «Подход максимального правдоподобия к реконструкции состояний наследственных признаков дискретных признаков филогении» . Систематическая биология . 48 (3): 612–622. дои : 10.1080/106351599260184 . ISSN 1063-5157 .
- ^ Гуиндон С., Гаскуэль О (октябрь 2003 г.). «Простой, быстрый и точный алгоритм для оценки крупных филогений по максимальному правдоподобию» . Систематическая биология . 52 (5): 696–704. CiteSeerX 10.1.1.110.5852 . дои : 10.1080/10635150390235520 . ПМИД 14530136 .
- ^ Дорник Дж. А., Оомс М. (2003). «Вычислительные аспекты оценки максимального правдоподобия авторегрессионных дробно-интегрированных моделей скользящего среднего» . Вычислительная статистика и анализ данных . 42 (3): 333–348. дои : 10.1016/S0167-9473(02)00212-8 . ISSN 0167-9473 .
- ^ Jump up to: а б Фельзенштейн Дж (1981). «Эволюционные деревья на основе последовательностей ДНК: подход максимального правдоподобия». Журнал молекулярной эволюции . 17 (6): 368–376. Бибкод : 1981JMolE..17..368F . дои : 10.1007/BF01734359 . ПМИД 7288891 . S2CID 8024924 .
- ^ Эйр-Уокер А (декабрь 1998 г.). «Проблемы с экономией в последовательностях со смещенным базовым составом». Журнал молекулярной эволюции . 47 (6): 686–690. Бибкод : 1998JMolE..47..686E . дои : 10.1007/PL00006427 . ПМИД 9847410 . S2CID 26128712 .
- ^ Пупко Т., Пеэр И., Хасегава М., Граур Д., Фридман Н. (август 2002 г.). «Алгоритм ветвей и границ для вывода наследственных аминокислотных последовательностей, когда скорость замены варьируется в зависимости от сайта: применение к эволюции пяти семейств генов». Биоинформатика . 18 (8): 1116–1123. дои : 10.1093/биоинформатика/18.8.1116 . ПМИД 12176835 .
- ^ Грюнхейт Н., Локхарт П.Дж., Стил М., Мартин В. (июль 2008 г.). «Трудности в проверке коварионоподобных свойств последовательностей под мешающим влиянием изменяющихся пропорций вариабельных сайтов» . Молекулярная биология и эволюция . 25 (7): 1512–1520. дои : 10.1093/molbev/msn098 . hdl : 10092/2637 . ПМИД 18424773 .
- ^ Хюльзенбек Дж. П., Ронквист Ф. (август 2001 г.). «MRBAYES: Байесовский вывод филогенетических деревьев» . Биоинформатика . 17 (8): 754–755. дои : 10.1093/биоинформатика/17.8.754 . ПМИД 11524383 .
- ^ Ян Цзы (октябрь 1997 г.). «PAML: пакет программ для филогенетического анализа по методу максимального правдоподобия» . Компьютерные приложения в биологических науках . 13 (5): 555–556. дои : 10.1093/биоинформатика/13.5.555 . ПМИД 9367129 .
- ^ Jump up to: а б Хюльзенбек Дж. П., Боллбак Дж. П. (июнь 2001 г.). «Эмпирическая и иерархическая байесовская оценка наследственных состояний». Систематическая биология . 50 (3): 351–366. CiteSeerX 10.1.1.319.4271 . дои : 10.1080/106351501300317978 . ПМИД 12116580 .
- ^ Лутзони Ф., Пейджел М., Риб В. (июнь 2001 г.). «Основные линии грибов произошли от симбиотических предков лишайников». Природа . 411 (6840): 937–940. Бибкод : 2001Natur.411..937L . дои : 10.1038/35082053 . ПМИД 11418855 . S2CID 4414913 .
- ^ Хэнсон-Смит В., Колачковски Б., Торнтон Дж.В. (сентябрь 2010 г.). «Надежность реконструкции предковой последовательности с точки зрения филогенетической неопределенности» . Молекулярная биология и эволюция . 27 (9): 1988–1999. дои : 10.1093/molbev/msq081 . ПМЦ 2922618 . ПМИД 20368266 .
- ^ Хиллис Д.М., Булл Дж.Дж., Уайт М.Э., Бэджетт М.Р., Молино И.Дж. (январь 1992 г.). «Экспериментальная филогенетика: создание известной филогении». Наука . 255 (5044): 589–592. Бибкод : 1992Sci...255..589H . дои : 10.1126/science.1736360 . ПМИД 1736360 .
- ^ Окли, TH, Каннингем, CW (апрель 2000 г.). «Независимые контрасты успешны там, где реконструкция предков не удалась в известной филогении бактериофагов». Эволюция; Международный журнал органической эволюции . 54 (2): 397–405. doi : 10.1554/0014-3820(2000)054[0397:ICSWAR]2.0.CO;2 . ПМИД 10937216 . S2CID 198153271 .
- ^ Финарелли Дж. А., Флинн Дж. Дж. (апрель 2006 г.). «Реконструкция размеров тела предков Caniformia (Carnivora, Mammalia): эффекты включения данных из летописи окаменелостей». Систематическая биология . 55 (2): 301–313. дои : 10.1080/10635150500541698 . ПМИД 16611601 .
- ^ Альберт Дж.С., Джонсон Д.М., Кноуфт Дж.Х. (2009). «Окаменелости позволяют лучше оценить размер тела предков, чем существующие таксоны рыб». Акта Зоология . 90 : 357–384. дои : 10.1111/j.1463-6395.2008.00364.x . ISSN 0001-7272 .
- ^ Слейтер Дж.Дж., Хармон Л.Дж., Альфаро М.Э. (декабрь 2012 г.). «Интеграция окаменелостей с молекулярной филогенией улучшает выводы об эволюции признаков» . Эволюция; Международный журнал органической эволюции . 66 (12): 3931–3944. дои : 10.1111/j.1558-5646.2012.01723.x . ПМИД 23206147 . S2CID 24390146 .
- ^ Вебстер А.Дж., Первис А. (январь 2002 г.). «Проверка точности методов реконструкции родовых состояний слитных признаков» . Слушания. Биологические науки . 269 (1487): 143–149. дои : 10.1098/рспб.2001.1873 . ПМК 1690869 . ПМИД 11798429 .
- ^ Мэддисон В.П., Мидфорд П.Е., Отто С.П. (октябрь 2007 г.). «Оценка влияния двоичного признака на видообразование и вымирание» . Систематическая биология . 56 (5): 701–710. CiteSeerX 10.1.1.150.2224 . дои : 10.1080/10635150701607033 . ПМИД 17849325 .
- ^ Jump up to: а б Мартинс ЭП (1994). « Оценка скорости фенотипической эволюции на основе сравнительных данных». Американский натуралист . 144 (2): 193–209. дои : 10.1086/285670 . S2CID 85300707 .
- ^ Фельзенштейн Дж (1988). «Филогения и количественные признаки». Ежегодный обзор экологии и систематики . 19 : 445–471. doi : 10.1146/annurev.ecolsys.19.1.445 .
- ^ Гарланд-младший Т., Дикерман А.В., Дженис К.М., Джонс Дж.А. (1993). «Филогенетический анализ ковариации с помощью компьютерного моделирования». Систематическая биология . 42 (3): 265–292. дои : 10.1093/sysbio/42.3.265 .
- ^ Купер, Н., Г.Х. Томас, К. Вендитти, А. Мид и Р.П. Фреклтон. 2015. Предостережение относительно использования моделей Орнштейна Уленбека в макроэволюционных исследованиях. Биологический журнал Линнеевского общества.
- ^ Jump up to: а б с д Эллиот М.Г., Мурс А.О. (ноябрь 2014 г.). «Вывод о наследственных состояниях без предположения о нейтральности или постепенности с использованием стабильной модели непрерывной эволюции характера» . Эволюционная биология BMC . 14 (1): 226. Бибкод : 2014BMCEE..14..226E . дои : 10.1186/s12862-014-0226-8 . ПМК 4266906 . ПМИД 25427971 .
- ^ Гриффит О.В., Блэкберн Д.Г., Брэндли МК, Ван Дайк Ю., Уиттингтон СМ, Томпсон М.Б. (сентябрь 2015 г.). «Реконструкция наследственного состояния требует биологических доказательств для проверки эволюционных гипотез: тематическое исследование, изучающее эволюцию репродуктивного режима у чешуйчатых рептилий». Журнал экспериментальной зоологии. Часть B. Молекулярная эволюция и эволюция развития . 324 (6): 493–503. Бибкод : 2015JEZB..324..493G . дои : 10.1002/jez.b.22614 . ПМИД 25732809 .
- ^ Эркенбрак Э.М., Ако-Асаре К., Миллер Э., Текеленбург С., Томпсон Дж.Р., Романо Л. (январь 2016 г.). «Реконструкция наследственного состояния путем сравнительного анализа ядра GRN, действующего у иглокожих». Гены развития и эволюция . 226 (1): 37–45. дои : 10.1007/s00427-015-0527-y . ПМИД 26781941 . S2CID 6067524 .
- ^ Эркенбрак Э.М., Томпсон-младший (2019). «Филогенетика клеточных типов дает информацию об эволюционном происхождении скелетогенных клеток личинок иглокожих» . Коммуникационная биология . 2 : 160. дои : 10.1038/s42003-019-0417-3 . ПМК 6499829 . ПМИД 31069269 .
- ^ Jump up to: а б Чанг Б.С., Угальде Дж.А., Мац М.В. (2005). «Применение реконструкции наследственных белков для понимания функции белков: GFP-подобные белки». Молекулярная эволюция: получение биохимических данных . Методы энзимологии. Том. 395. стр. 652–670. дои : 10.1016/S0076-6879(05)95034-9 . ISBN 9780121828004 . ПМИД 15865989 .
- ^ Ходжес В.Л. (ноябрь 2004 г.). «Эволюция живорождения у рогатых ящериц (Phrynosoma): проверка гипотезы холодного климата». Журнал эволюционной биологии . 17 (6): 1230–1237. дои : 10.1111/j.1420-9101.2004.00770.x . ПМИД 15525408 . S2CID 25069395 .
- ^ Мэддисон В.П. (1991). «Экономные реконструкции состояний предков с квадратичным изменением для непрерывных символов на филогенетическом дереве». Систематическая биология . 40 (3): 304–314. дои : 10.1093/sysbio/40.3.304 .
- ^ Бонин К.Е., Глисон Т.Т., Гарланд Т. (декабрь 2005 г.). «Вариации типов мышечных волокон у ящериц (Squamata) и филогенетическая реконструкция гипотетических наследственных состояний». Журнал экспериментальной биологии . 208 (Часть 23): 4529–4547. дои : 10.1242/jeb.01903 . ПМИД 16339872 .
- ^ Ридли М. (1983). Объяснение органического разнообразия: сравнительный метод и приспособления для спаривания . Оксфорд: Кларендон Пресс.
- ^ Мэддисон WP (май 1990 г.). «Метод проверки коррелированной эволюции двух бинарных признаков: сосредоточены ли выигрыши или потери на определенных ветвях филогенетического дерева?». Эволюция; Международный журнал органической эволюции . 44 (3): 539–557. дои : 10.2307/2409434 . JSTOR 2409434 . ПМИД 28567979 .
- ^ Гёбель У, Сандер К, Шнайдер Р, Валенсия А (апрель 1994 г.). «Коррелированные мутации и контакты остатков в белках». Белки . 18 (4): 309–317. дои : 10.1002/прот.340180402 . ПМИД 8208723 . S2CID 14978727 .
- ^ Шиндялов И.Н., Колчанов Н.А., Сандер С. (март 1994 г.). «Можно ли предсказать трехмерные контакты в белковых структурах путем анализа коррелирующих мутаций?». Белковая инженерия . 7 (3): 349–358. дои : 10.1093/белок/7.3.349 . ПМИД 8177884 .
- ^ Корбер Б.Т., Фарбер Р.М., Вольперт Д.Х., Лапедес А.С. (август 1993 г.). «Ковариация мутаций в петле V3 белка оболочки вируса иммунодефицита человека типа 1: теоретико-информационный анализ» . Труды Национальной академии наук Соединенных Штатов Америки . 90 (15): 7176–7180. Бибкод : 1993PNAS...90.7176K . дои : 10.1073/pnas.90.15.7176 . ПМК 47099 . ПМИД 8346232 .
- ^ Шапиро Б., Рамбо А., Пибус О.Г., Холмс Э.К. (сентябрь 2006 г.). «Филогенетический метод обнаружения положительного эпистаза в последовательностях генов и его применение для эволюции РНК-вирусов» (PDF) . Молекулярная биология и эволюция . 23 (9): 1724–1730. дои : 10.1093/molbev/msl037 . ПМИД 16774976 .
- ^ Пун А.Ф., Льюис Ф.И., Понд С.Л., Фрост С.Д. (ноябрь 2007 г.). «Эволюционно-сетевая модель демонстрирует стратифицированные взаимодействия в петле V3 оболочки ВИЧ-1» . PLOS Вычислительная биология . 3 (11): е231. Бибкод : 2007PLSCB...3..231P . дои : 10.1371/journal.pcbi.0030231 . ПМК 2082504 . ПМИД 18039027 .
- ^ Джерманн Т.М., Опиц Дж.Г., Стэкхаус Дж., Беннер С.А. (март 1995 г.). «Реконструкция эволюционной истории суперсемейства парнокопытных рибонуклеаз». Природа . 374 (6517): 57–59. Бибкод : 1995Natur.374...57J . дои : 10.1038/374057a0 . ПМИД 7532788 . S2CID 4315312 .
- ^ Садки М., де Альба Э., Перес-Хименес Р., Санчес-Руис Х.М., Муньос В. (март 2009 г.). «Созданный белок как экспериментальная модель первичной складки» . Труды Национальной академии наук Соединенных Штатов Америки . 106 (11): 4127–4132. Бибкод : 2009PNAS..106.4127S . дои : 10.1073/pnas.0812108106 . ПМЦ 2647338 . ПМИД 19240216 .
- ^ Чанг Б.С., Йонссон К., Казми М.А., Донохью М.Дж., Сакмар Т.П. (сентябрь 2002 г.). «Воссоздание функционального зрительного пигмента предков архозавров» . Молекулярная биология и эволюция . 19 (9): 1483–1489. doi : 10.1093/oxfordjournals.molbev.a004211 . ПМИД 12200476 .
- ^ Чжан С., Чжан М., Джу Дж., Нитфельдт Дж., Уайз Дж., Терри П.М. и др. (сентябрь 2003 г.). «Диверсификация генома в филогенетических линиях I и II Listeria monocytogenes: идентификация сегментов, уникальных для популяций линии II» . Журнал бактериологии . 185 (18): 5573–5584. дои : 10.1128/JB.185.18.5573-5584.2003 . ЧВК 193770 . ПМИД 12949110 .
- ^ Кришнан Н.М., Селигманн Х., Стюарт С.Б., Де Конинг А.П., Поллок Д.Д. (октябрь 2004 г.). «Реконструкция предковой последовательности в митохондриальной ДНК приматов: композиционная ошибка и влияние на функциональные выводы» . Молекулярная биология и эволюция . 21 (10): 1871–1883. дои : 10.1093/molbev/msh198 . ПМИД 15229290 .
- ^ Гашен Б., Тейлор Дж., Юсим К., Фоли Б., Гао Ф., Ланг Д. и др. (июнь 2002 г.). «Соображения разнообразия при выборе вакцины против ВИЧ-1». Наука . 296 (5577): 2354–2360. Бибкод : 2002Sci...296.2354G . дои : 10.1126/science.1070441 . ПМИД 12089434 . S2CID 39452987 .
- ^ Ролланд М., Дженсен М.А., Никл Д.С., Ян Дж., Жир Г.Х., Хит Л. и др. (август 2007 г.). «Реконструкция и функция белков предкового центра дерева вируса иммунодефицита человека типа 1» . Журнал вирусологии . 81 (16): 8507–8514. дои : 10.1128/JVI.02683-06 . ЧВК 1951385 . ПМИД 17537854 .
- ^ Коте Д.Л., Ли Ю., Декер Дж.М., Биболле-Руш Ф., Заммит К.П., Салазар М.Г. и др. (сентябрь 2006 г.). «Наследственные и консенсусные иммуногены оболочки для ВИЧ-1 подтипа C» . Вирусология . 352 (2): 438–449. дои : 10.1016/j.virol.2006.05.011 . ПМИД 16780913 .
- ^ Дориа-Роуз Н.А., Жир Г.Х. , Родриго А.Г., Никл Д.С., Ли Ф., Махаланабис М. и др. (сентябрь 2005 г.). «Белок наследственной оболочки вируса иммунодефицита человека типа 1 подтипа B является функциональным и вызывает нейтрализующие антитела у кроликов, аналогичные тем, которые вырабатываются циркулирующей оболочкой подтипа B» . Журнал вирусологии . 79 (17): 11214–11224. doi : 10.1128/JVI.79.17.11214-11224.2005 . ПМК 1193599 . ПМИД 16103173 .
- ^ Макклоски Р.М., Лян Р.Х., Харриган П.Р., Брумме З.Л., Пун А.Ф. (июнь 2014 г.). «Оценка филогенетических методов реконструкции передаваемых вариантов ВИЧ с использованием данных продольной клональной последовательности ВИЧ» . Журнал вирусологии . 88 (11): 6181–6194. дои : 10.1128/JVI.00483-14 . ПМЦ 4093844 . ПМИД 24648453 .
- ^ Бурк Г., Певзнер П.А. (январь 2002 г.). «Эволюция в масштабе генома: реконструкция порядка генов у предковых видов» . Геномные исследования . 12 (1): 26–36. ПМК 155248 . ПМИД 11779828 .
- ^ Эвен С., Гольдрайх О (1981). «Задача генераторной последовательности минимальной длины NP-трудна». Журнал алгоритмов . 2 (3): 311–313. дои : 10.1016/0196-6774(81)90029-8 . ISSN 0196-6774 .
- ^ Фертен Г., Лабарр А., Русу И., Виалетт С., Таннье Э. (2009). Комбинаторика перестроек генома . МТИ Пресс. дои : 10.7551/mitpress/9780262062824.001.0001 . ISBN 9780262258753 .
- ^ Винберг Дж. (декабрь 2004 г.). «Эволюция эутерианных хромосом». Текущее мнение в области генетики и развития . 14 (6): 657–666. дои : 10.1016/j.gde.2004.10.001 . ПМИД 15531161 .
- ^ Фрёнике Л., Кальдес М.Г., Графодатский А., Мюллер С., Лайонс Л.А., Робинсон Т.Дж. и др. (март 2006 г.). «Предлагают ли молекулярная цитогенетика и биоинформатика расходящиеся модели геномов предков млекопитающих?» . Геномные исследования . 16 (3): 306–310. дои : 10.1101/гр.3955206 . ПМЦ 1415215 . ПМИД 16510895 .
- ^ Мерфи В.Дж., Ларкин Д.М., Эвертс-ван дер Винд А., Бурк Г., Теслер Г., Овил Л. и др. (июль 2005 г.). «Динамика эволюции хромосом млекопитающих, выведенная на основе сравнительных карт многих видов». Наука . 309 (5734): 613–617. Бибкод : 2005Sci...309..613M . дои : 10.1126/science.1111387 . ПМИД 16040707 . S2CID 32314883 .
- ^ Ма Дж., Чжан Л., Сух Б.Б., Рэни Б.Дж., Бурханс Р.К., Кент У.Дж. и др. (декабрь 2006 г.). «Реконструкция смежных областей предкового генома» . Геномные исследования . 16 (12): 1557–1565. дои : 10.1101/гр.5383506 . ПМЦ 1665639 . ПМИД 16983148 .
- ^ Ойсерман Б.О., Мойя Ф., Лоусон С.Э., Гарсия А.Л., Фогт М., Хеффернен М. и др. (декабрь 2016 г.). «Реконструкция предкового генома определяет эволюционную основу приобретения признаков у бактерий, накапливающих полифосфат» . Журнал ISME . 10 (12): 2931–2945. Бибкод : 2016ISMEJ..10.2931O . дои : 10.1038/ismej.2016.67 . ПМК 5148189 . ПМИД 27128993 .
- ^ Jump up to: а б с Кларк-младший, Ри Р.Х., Альфаро М.Э., Кинг М.Г., Вагнер В.Л., Роалсон Э.Х. (октябрь 2008 г.). «Сравнительное исследование методов реконструкции ареала предков: прослеживание неопределенной истории островных линий» . Систематическая биология . 57 (5): 693–707. дои : 10.1080/10635150802426473 . ПМИД 18853357 .
- ^ Хюльзенбек Дж. П., Нильсен Р., Боллбак Дж. П. (апрель 2003 г.). «Стохастическое отображение морфологических признаков» . Систематическая биология . 52 (2): 131–158. CiteSeerX 10.1.1.386.9241 . дои : 10.1080/10635150390192780 . ПМИД 12746144 .
- ^ Ронквист Ф (1996). «ДИВА версия 1.1» .
Компьютерная программа и руководство доступны по анонимному FTP из Уппсальского университета.
[ постоянная мертвая ссылка ] - ^ Ри Р.Х., Мур Б.Р., Уэбб К.О., Донохью М.Дж. (ноябрь 2005 г.). «Правдоподобная основа для вывода об эволюции географического ареала на филогенетических деревьях» . Эволюция; Международный журнал органической эволюции . 59 (11): 2299–2311. дои : 10.1111/j.0014-3820.2005.tb00940.x . ПМИД 16396171 . S2CID 23245573 .
- ^ Jump up to: а б с Леммон А.Р., Леммон Э.М. (август 2008 г.). «Правдоподобная структура для оценки филогеографической истории на непрерывном ландшафте» . Систематическая биология . 57 (4): 544–561. CiteSeerX 10.1.1.585.7211 . дои : 10.1080/10635150802304761 . ПМИД 18686193 .
- ^ Jump up to: а б Стертевант А.Х., Добжанский Т (июль 1936 г.). «Инверсии в третьей хромосоме диких рас Drosophila Pseudoobscura и их использование в изучении истории вида» . Труды Национальной академии наук Соединенных Штатов Америки . 22 (7): 448–450. Бибкод : 1936ПНАС...22..448С . дои : 10.1073/pnas.22.7.448 . ПМЦ 1076803 . ПМИД 16577723 .
- ^ Jump up to: а б Кэмпбелл Л. (1998). Историческая лингвистика: введение . Эдинбург: Издательство Эдинбургского университета.
- ^ Ян Цзы (август 2007 г.). «PAML 4: филогенетический анализ по максимальному правдоподобию». Молекулярная биология и эволюция . 24 (8): 1586–1591. CiteSeerX 10.1.1.322.1650 . дои : 10.1093/molbev/msm088 . ПМИД 17483113 .
- ^ «Lazarus: программный инструмент для реконструкции последовательностей наследственных белков» . markov.uoregon.edu . Архивировано из оригинала 7 марта 2015 г. Проверено 7 марта 2019 г.
- ^ Пруд С.Л., Фрост С.Д., Муза С.В. (март 2005 г.). «HyPhy: проверка гипотез с использованием филогении» . Биоинформатика . 21 (5): 676–679. doi : 10.1093/биоинформатика/bti079 . ПМИД 15509596 .
- ^ Мэддисон В.П., Мэддисон Д.Р. (2015). «Мескит: модульная система эволюционного анализа. Версия 2.75» .
- ^ Jump up to: а б Тамура К., Стечер Г., Петерсон Д., Филипски А., Кумар С. (декабрь 2013 г.). «MEGA6: Молекулярно-эволюционно-генетический анализ, версия 6.0» . Молекулярная биология и эволюция . 30 (12): 2725–2729. дои : 10.1093/molbev/mst197 . ПМК 3840312 . ПМИД 24132122 .
- ^ Ронквист Ф., Хюльзенбек Дж. П. (август 2003 г.). «MrBayes 3: Байесовский филогенетический вывод в рамках смешанных моделей» . Биоинформатика . 19 (12): 1572–1574. doi : 10.1093/биоинформатика/btg180 . ПМИД 12912839 .
- ^ Хубиш М.Ю., Поллард К.С., Зипель А. (январь 2011 г.). «PHAST и RPHAST: филогенетический анализ с использованием моделей пространства/времени» . Брифинги по биоинформатике . 12 (1): 41–51. дои : 10.1093/нагрудник/bbq072 . ПМК 3030812 . ПМИД 21278375 .
- ^ Bollback JP (февраль 2006 г.). «SIMMAP: стохастическое отображение дискретных признаков филогении» . БМК Биоинформатика . 7 (1): 88. дои : 10.1186/1471-2105-7-88 . ПМЦ 1403802 . ПМИД 16504105 .
- ^ Паради Э (2012). Анализ филогенетики и эволюции с помощью R. Нью-Йорк: Springer-Verlag.
- ^ Росснес Р., Эйдхаммер I, Либерлес Д.А. (май 2005 г.). «Филогенетическая реконструкция состояний наследственных признаков для экспрессии генов и данных сплайсинга мРНК» . БМК Биоинформатика . 6 (1): 127. дои : 10.1186/1471-2105-6-127 . ПМЦ 1166541 . ПМИД 15921519 .
- ^ Драммонд А.Дж., Сушард М.А., Се Д., Рамбо А. (август 2012 г.). «Байесовская филогенетика с BEAUti и BEAST 1.7» . Молекулярная биология и эволюция . 29 (8): 1969–1973. дои : 10.1093/molbev/mss075 . ПМК 3408070 . ПМИД 22367748 .
- ^ ФитцДжон Р.Г. (2012). «Diversitree: сравнительный филогенетический анализ диверсификации R». Методы экологии и эволюции . 3 (6): 1084–1092. Бибкод : 2012MEcEv...3.1084F . дои : 10.1111/j.2041-210X.2012.00234.x . ISSN 2041-210X . S2CID 82351808 .
- ^ Пейгель М (1994). «Обнаружение коррелированной эволюции филогений: общий метод сравнительного анализа дискретных признаков». Труды Королевского общества B: Биологические науки . 255 (1342): 37–45. Бибкод : 1994РСПСБ.255...37П . дои : 10.1098/rspb.1994.0006 . ISSN 0962-8452 . S2CID 85903564 .
- ^ Ю Ю, Харрис Эй Джей, Хе X (август 2010 г.). «S-DIVA (статистический анализ рассеяния и викариации): инструмент для определения биогеографической истории». Молекулярная филогенетика и эволюция . 56 (2): 848–850. Бибкод : 2010МОЛПЭ..56..848Г . дои : 10.1016/j.ympev.2010.04.011 . ПМИД 20399277 . S2CID 44980641 .
- ^ Ариас Дж.С., Шумик К.А., Голобов П.А. (декабрь 2011 г.). «Пространственный анализ викариантности: метод использования прямой географической информации в исторической биогеографии». Кладистика . 27 (6): 617–628. дои : 10.1111/j.1096-0031.2011.00353.x . hdl : 11336/70196 . ПМИД 34875812 . S2CID 85747431 .
- ^ Джонс Б.Р., Раджараман А., Таннье Э., Шов С. (сентябрь 2012 г.). «ANGES: реконструкция карт ANcestral GENOMS» . Биоинформатика . 28 (18): 2388–2390. doi : 10.1093/биоинформатика/bts457 . ПМИД 22820205 .
- ^ Ларгет Б., Кадане Дж.Б., Саймон Д.Л. (август 2005 г.). «Байесовский подход к оценке структуры генома предков». Молекулярная филогенетика и эволюция . 36 (2): 214–223. Бибкод : 2005МОЛПЭ..36..214Л . дои : 10.1016/j.ympev.2005.03.026 . ПМИД 15893477 .
- ^ Чурёш М (август 2010 г.). «Подсчет: эволюционный анализ филогенетических профилей с экономией и правдоподобием» . Биоинформатика . 26 (15): 1910–1912. doi : 10.1093/биоинформатика/btq315 . ПМИД 20551134 .
- ^ Кармель Л., Вольф Ю.И., Рогозин И.Б., Кунин Е.В. (2010). «EREM: оценка параметров и реконструкция предков с помощью алгоритма максимизации ожидания для вероятностной модели эволюции геномных бинарных символов» . Достижения биоинформатики . 2010 : 167408. doi : 10.1155/2010/167408 . ПМЦ 2866244 . ПМИД 20467467 .
- ^ Патро Р., Сефер Э., Малин Дж., Марсе Дж., Навлаха С., Кингсфорд К. (сентябрь 2012 г.). «Экономная реконструкция эволюции сети» . Алгоритмы молекулярной биологии . 7 (1): 25. дои : 10.1186/1748-7188-7-25 . ПМЦ 3492119 . ПМИД 22992218 .
- ^ Диалло А.Б., Макаренков В, Бланшетт М (январь 2010 г.). «Предки 1.0: веб-сервер для реконструкции наследственных последовательностей» . Биоинформатика . 26 (1): 130–131. doi : 10.1093/биоинформатика/btp600 . ПМИД 19850756 .
- ^ Ашкенази Х., Пенн О., Дорон-Файгенбойм А., Коэн О., Каннароцци Г., Зомер О., Пупко Т. (июль 2012 г.). «FastML: веб-сервер для вероятностной реконструкции наследственных последовательностей» . Исследования нуклеиновых кислот . 40 (проблема с веб-сервером): W580–W584. дои : 10.1093/nar/gks498 . ПМЦ 3394241 . ПМИД 22661579 .
- ^ Ху Ф, Линь Ю, Тан Дж (ноябрь 2014 г.). «MLGO: реконструкция филогении и вывод о предках на основе данных о порядке генов» . БМК Биоинформатика . 15 (1): 354. дои : 10.1186/s12859-014-0354-6 . ПМЦ 4236499 . ПМИД 25376663 .
- ^ Бушар-Коте А, Джордан, Мичиган (январь 2013 г.). «Эволюционный вывод с помощью процесса Пуассона-Инделя» . Труды Национальной академии наук Соединенных Штатов Америки . 110 (4): 1160–1166. arXiv : 1207.6327 . Бибкод : 2013PNAS..110.1160B . дои : 10.1073/pnas.1220450110 . ПМК 3557041 . ПМИД 23275296 .
- ^ Торн Дж.Л., Кишино Х., Фельзенштейн Дж. (август 1991 г.). «Эволюционная модель максимально правдоподобного выравнивания последовательностей ДНК». Журнал молекулярной эволюции . 33 (2): 114–124. Бибкод : 1991JMolE..33..114T . дои : 10.1007/BF02193625 . ПМИД 1920447 . S2CID 13333056 .
- ^ Пун А.Ф., Свенсон Л.К., Бунник Э.М., Эдо-Матас Д., Шуитемейкер Х., Ван 'т Ваут А.Б. , Харриган П.Р. (2012). «Реконструкция динамики эволюции ВИЧ внутри хозяев на основе серийных данных глубоких последовательностей» . PLOS Вычислительная биология . 8 (11): e1002753. Бибкод : 2012PLSCB...8E2753P . дои : 10.1371/journal.pcbi.1002753 . ПМЦ 3486858 . ПМИД 23133358 .
- ^ Шварц Р.Ф. , Тринь А., Сипос Б., Брентон Дж.Д., Голдман Н., Марковец Ф. (апрель 2014 г.). «Филогенетическая количественная оценка внутриопухолевой гетерогенности» . PLOS Вычислительная биология . 10 (4): e1003535. arXiv : 1306.1685 . Бибкод : 2014PLSCB..10E3535S . дои : 10.1371/journal.pcbi.1003535 . ПМЦ 3990475 . ПМИД 24743184 .