Jump to content

ФИЛИПП

Пакет выводов PHYLogeny
Оригинальный автор(ы) Джозеф Фельзенштейн
Разработчик(и) Вашингтонский университет
Первоначальный выпуск октябрь 1980 г .; 43 года назад ( 1980-10 )
Стабильная версия
3,697 / 2 ноября 2014 г .; 9 лет назад ( 2014-11-02 )
Репозиторий
Написано в С
Операционная система Windows , Mac OS X , Linux
Платформа х86 , х86-64
Доступно в Английский
Тип Филогенетика
Лицензия => v3.697: с открытым исходным кодом
=< v3.695: проприетарное бесплатное ПО
Веб-сайт эволюция .генетика .Вашингтон .edu /Филип .html  Edit this on Wikidata

Пакет вывода PHYLogeny ( PHYLIP ) — это бесплатный вычислительной филогенетики пакет программ для вывода эволюционных деревьев ( филогений ). [1] Он состоит из 65 портативных программ, т. е. код написан на языке программирования C. исходный Начиная с версии 3.696, оно лицензируется как программное обеспечение с открытым исходным кодом ; версии 3.695 и старше были проприетарным бесплатным ПО . Релизы выпускаются в виде исходного кода и в виде предварительно скомпилированных исполняемых файлов для многих операционных систем , включая Windows (95, 98, ME, NT, 2000, XP, Vista), Mac OS 8 , Mac OS 9 , OS X , Linux ( Debian , Red Hat ). ; и FreeBSD с FreeBSD.org. [2] Полная документация написана для всех программ в пакете и включена в него. Программы в пакете philip были написаны профессором Джозефом Фельзенштейном с факультета геномных наук и факультета биологии Вашингтонского университета в Сиэтле. [3]

Методы (реализуемые каждой программой), доступные в пакете, включают методы экономии , матрицы расстояний и методы правдоподобия , включая начальную загрузку и деревья консенсуса. Типы данных, которые можно обрабатывать, включают молекулярные последовательности , частоты генов, сайты и фрагменты рестрикции , матрицы расстояний и дискретные символы. [2]

Каждая программа управляется через меню, которое спрашивает пользователей, какие параметры они хотят установить, и позволяет им начать вычисления. Данные считываются в программу из текстового файла, который пользователь может подготовить с помощью любого текстового процессора или текстового редактора (но этот текстовый файл не может быть в специальном формате текстового процессора, вместо этого он должен быть в простом формате ASCII или только в текстовом формате). формат). Некоторые программы анализа последовательностей, такие как программа выравнивания Clustal W, могут записывать файлы данных в формате PHYLIP. Большинство программ ищут данные в файле с именем infile . Если программы philip не находят этот файл, они просят пользователя ввести имя файла данных. [2]

Формат файла

[ редактировать ]

Компоненты программ Phillip используют несколько различных форматов, каждый из которых относительно прост. Программы для анализа выравниваний последовательностей ДНК, выравниваний белковых последовательностей или дискретных символов (например, морфологических данных) могут принимать эти данные в последовательном или чередующемся формате, как показано ниже.

Последовательный формат:

5 42 
Turkey    AAGCTNGGGC ATTTCAGGGT GAGCCCGGGC AATACAGGGT AT 
Salmo schiAAGCCTTGGC AGTGCAGGGT GAGCCGTGGC CGGGCACGGT AT 
H. sapiensACCGGTTGGC CGTTCAGGGT ACAGGTTGGC CGTTCAGGGT AA 
Chimp     AAACCCTTGC CGTTACGCTT AAACCGAGGC CGGGACACTC AT 
Gorilla   AAACCCTTGC CGGTACGCTT AAACCATTGC CGGTACGCTT AA

Чередованный формат:

5 42 
Turkey    AAGCTNGGGC ATTTCAGGGT 
Salmo schiAAGCCTTGGC AGTGCAGGGT 
H. sapiensACCGGTTGGC CGTTCAGGGT 
Chimp     AAACCCTTGC CGTTACGCTT 
Gorilla   AAACCCTTGC CGGTACGCTT

GAGCCCGGGC AATACAGGGT AT 
GAGCCGTGGC CGGGCACGGT AT 
ACAGGTTGGC CGTTCAGGGT AA 
AAACCGAGGC CGGGACACTC AT 
AAACCATTGC CGGTACGCTT AA

Цифры представляют собой количество таксонов (в примере, показанном выше), за которым следует количество символов (выровненных нуклеотидов или аминокислот в случае молекулярных последовательностей). Данные о сайте рестрикции также должны включать количество ферментов.

По умолчанию имена ограничены 10 символами и должны быть заполнены пробелами, чтобы иметь такую ​​длину, и сразу за ними следуют символьные данные с использованием однобуквенных кодов, хотя имя с ограничением в 10 символов может быть изменено путем незначительной модификации кода (путем изменение nmlngth в philip.h и перекомпиляции). Все печатные символы ASCII/ISO разрешены в именах, за исключением круглых скобок (" (" и " )"), квадратные скобки (" [" и " ]"), двоеточие (" :"), точка с запятой (" ;") и запятая (" ,"). Пробелы, включенные в выравнивание, игнорируются.

Множество программ для филогенетического анализа, в том числе широко используемая RAxML. [4] [5] и IQ-ДЕРЕВО [6] программах используйте формат philip или незначительную модификацию этого формата, называемую расслабленным форматом philip.

Расслабленный формат Филипа (последовательный):

5 42 
Turkey                  AAGCTNGGGCATTTCAGGGTGAGCCCGGGCAATACAGGGTAT 
Salmo_schiefermuelleri  AAGCCTTGGCAGTGCAGGGTGAGCCGTGGCCGGGCACGGTAT 
H_sapiens               ACCGGTTGGCCGTTCAGGGTACAGGTTGGCCGTTCAGGGTAA 
Chimp                   AAACCCTTGCCGTTACGCTTAAACCGAGGCCGGGACACTCAT 
Gorilla                 AAACCCTTGCCGGTACGCTTAAACCATTGCCGGTACGCTTAA

Основным отличием смягченного формата philip является отсутствие ограничения в 10 символов и отсутствие необходимости заполнять имена пустыми буквами для достижения этой длины (хотя заполнение имен для начала матрицы символов в одной и той же позиции может улучшить читаемость для пользователя). В этом примере смягчения в именах используются подчеркивания, а не пробелы, а также пробелы между именами и выровненными символьными данными; Часто хорошей практикой является избегать пробелов в именах таксонов и отделять символьные данные от имени при создании файлов. Как и файлы строгого формата phylip, файлы расслабленного формата phylip могут иметь чередующийся формат и включать пробелы и конечные строки в данных последовательности.

Программы, использующие данные о расстоянии, такие как neighbor Программа, реализующая метод соединения соседей , также использует простой формат матрицы расстояний, включающий только количество таксонов, их названия и числовые значения расстояний:

Матрица расстояний Филиппа:

7 
Bovine    0.0000 1.6866 1.7198 1.6606 1.5243 1.6043 1.5905 
Mouse     1.6866 0.0000 1.5232 1.4841 1.4465 1.4389 1.4629 
Gibbon    1.7198 1.5232 0.0000 0.7115 0.5958 0.6179 0.5583 
Orang     1.6606 1.4841 0.7115 0.0000 0.4631 0.5061 0.4710 
Gorilla   1.5243 1.4465 0.5958 0.4631 0.0000 0.3484 0.3083 
Chimp     1.6043 1.4389 0.6179 0.5061 0.3484 0.0000 0.2692 
Human     1.5905 1.4629 0.5583 0.4710 0.3083 0.2692 0.0000

Цифра указывает на количество таксонов, и существуют такие же ограничения для названий таксонов. Обратите внимание, что эта матрица симметрична, а диагональ имеет значения 0 (поскольку расстояние между таксоном и самим собой по определению равно нулю).

Программы, использующие деревья в качестве входных данных, принимают деревья в формате Ньюика — неофициальном стандарте, согласованном в 1986 году авторами семи основных пакетов филогении. Вывод записывается в файлы с такими именами, как outfile и outtree. Деревья написаны на outtree имеют формат Ньюика.

Компонентные программы

[ редактировать ]
Программы, перечисленные в PHYLIP [7]
Название программы Описание
протпарс Оценивает филогению пептидных последовательностей с использованием экономии метода .
днапарс Оценивает филогению последовательностей ДНК с использованием метода экономии.
деньпенни Метод ветвей и связей с экономией ДНК находит все наиболее экономные филогении последовательностей нуклеиновых кислот с помощью поиска ветвей и связей.
днамов Интерактивное построение филогений из последовательностей нуклеиновых кислот с их оценкой методом экономии ДНК, с совместимостью и отображением реконструированных предковых оснований
днакомп Оценивает филогению на основе данных о последовательностях нуклеиновых кислот с использованием критерия совместимости.
днамл Оценивает филогению на основе нуклеотидных последовательностей с использованием максимального правдоподобия метода .
днамлк метод максимального правдоподобия ДНК с молекулярными часами; совместное использование dnaml и dnamlk позволяет проверить отношение правдоподобия для молекулярных часов гипотезы .
промл Оценивает филогению на основе аминокислотных последовательностей белков с использованием метода максимального правдоподобия.
промлк Метод максимального правдоподобия белковой последовательности с молекулярными часами
отдыхмл Оценка филогений по максимальному правдоподобию с использованием данных о сайтах рестрикции; не по фрагментам рестрикции, а по наличию или отсутствию отдельных сайтов
днаинвар Лейка и Кавендера Для данных о последовательностях нуклеиновых кислот четырех видов рассчитываются филогенетические инварианты , которые проверяют альтернативные древовидные топологии.
днадист Метод расстояния ДНК, который вычисляет четыре различных расстояния между видами на основе последовательностей нуклеиновых кислот; расстояния затем можно использовать в программах матрицы расстояний.
протдист Метод расстояния между белковыми последовательностями, который вычисляет меру расстояния для последовательностей с использованием оценок максимального правдоподобия на основе матрицы PAM Дейхоффа , приближения Кимуры 1983 года к ней или модели, основанной на генетическом коде плюс ограничение на переход на другую категорию аминокислот.
restdist Расстояния рассчитаны на основе данных о сайтах рестрикции или данных о фрагментах рестрикции.
секбут Программа начальной загрузки-складывания; считывает набор данных и выдает из него несколько наборов данных путем повторной выборки начальной загрузки
подгонка Фитча-Марголиаша матричный метод расстояний ; оценивает филогении на основе данных матрицы расстояний в рамках модели аддитивного дерева, согласно которой ожидается, что расстояния будут равны суммам длин ветвей между видами
китч матричный метод расстояний Фитча-Марголиаша с молекулярными часами; оценивает филогении на основе данных матрицы расстояний в рамках ультраметрической модели, которая аналогична модели аддитивного дерева, за исключением того, что предполагаются эволюционные часы.
сосед Реализация методов объединения соседей и UPGMA.
контроль Максимальная вероятность непрерывных признаков и частот генов; оценивает филогении на основе данных о частоте генов по максимальному правдоподобию в рамках модели, в которой все расхождения обусловлены генетическим дрейфом в отсутствие новых мутаций; также выполняет анализ максимального правдоподобия непрерывных персонажей, которые развиваются по модели броуновского движения, предполагая, что персонажи развиваются с одинаковой скоростью и некоррелированным образом; не учитывает корреляцию символов
контраст Считывает дерево из файла дерева и набор данных с непрерывными символами и выдает независимые контрасты для этих символов для использования в любом пакете многомерной статистики.
гендист Программа генетического расстояния, которая вычисляет одну из трех различных формул генетического расстояния на основе данных о частоте генов.
парс Неупорядоченный метод экономии дискретных символов с несколькими состояниями
смешивание Оценивает филогению с помощью некоторых методов экономии для данных дискретных символов с двумя состояниями (0, 1); позволяет использовать методы: Вагнера, Камина-Сокаля или произвольные смеси.
пенни Смешанный метод ветвей и границ, который находит все наиболее экономные филогении для данных дискретных символов с двумя состояниями, для критериев Вагнера, Камина-Сокала и смешанных критериев экономии, используя метод точного поиска ветвей и границ.
двигаться Интерактивное построение филогений по дискретным данным о признаках с двумя состояниями (0, 1); оценивает критерии экономичности и совместимости для этих филогений и отображает реконструированные состояния по всему дереву.
ложка Оценивает филогении по критерию Долло или полиморфизму экономии для данных дискретных символов с двумя состояниями (0, 1).
должок Находит все или наиболее экономные филогении для дискретно-символьных данных с двумя состояниями, для критериев экономии Долло или полиморфизма, используя метод ветвей и границ точного поиска.
долмов Интерактивное построение филогений на основе дискретных характерных данных с двумя состояниями (0, 1) с использованием критериев экономии Долло или полиморфизма; оценивает критерии экономичности и совместимости для этих филогений; отображает восстановленные состояния по всему дереву
щелкнуть Находит наибольшую клику взаимно совместимых символов и рекомендованную ими филогению для дискретных данных символов с двумя состояниями (0, 1); самая большая клика (или все клики в заданном диапазоне размеров самой большой) находится с помощью быстрого метода поиска ветвей и границ.
фактор Программа перекодирования символов, которая принимает дискретные данные с несколькими состояниями с деревьями состояний символов и выдает соответствующий набор данных с двумя состояниями (0, 1).
дрограмма Программа рисования корневых деревьев, которая отображает укорененные филогении, кладограммы и фенограммы в широком диапазоне форматов, управляемых пользователем. Программа является интерактивной и позволяет просматривать дерево на графических экранах ПК или Macintosh, а также на графических терминалах Tektronix или Digital.
рисованное дерево Программа рисования некорневых деревьев, похожая на DRAWGRAM, но отображает филогении.
согласие Программа дерева консенсуса, вычисляющая деревья методом дерева большинства правил, что также позволяет легко находить дерево строгого консенсуса; не удалось вычислить консенсусное дерево Адамса
от торговли Вычисляет симметричное разностное расстояние Робинсона – Фулдса между деревьями, что допускает различия в топологии дерева.
повторное дерево Интерактивная программа перестановки дерева, которая считывает дерево (при необходимости с указанием длины ветвей) и позволяет переукоренить дерево, перевернуть ветви, изменить названия видов и длину ветвей, а затем записать результат; может использоваться для преобразования между корневыми и некорневыми деревьями
  1. ^ Фельзенштейн, Дж. (1981). «Эволюционные деревья на основе последовательностей ДНК: подход максимального правдоподобия». Журнал молекулярной эволюции . 17 (6): 368–376. Бибкод : 1981JMolE..17..368F . дои : 10.1007/BF01734359 . ПМИД   7288891 . S2CID   8024924 .
  2. ^ Перейти обратно: а б с «Страница с общей информацией PHYLIP» . Проверено 14 февраля 2010 г.
  3. ^ Джозеф Фельзенштейн (август 2003 г.). Выводы о филогениях . Синауэр Ассошиэйтс. ISBN  0-87893-177-5 . Архивировано из оригинала 22 октября 2011 г. Проверено 24 марта 2006 г.
  4. ^ Стаматакис, Александрос (01 мая 2014 г.). «RAxML версия 8: инструмент для филогенетического анализа и пост-анализа крупных филогений» . Биоинформатика . 30 (9): 1312–1313. doi : 10.1093/биоинформатика/btu033 . ISSN   1460-2059 . ПМЦ   3998144 . ПМИД   24451623 .
  5. ^ Козлов Алексей М; Дарриба, Диего; Флури, Томаш; Морель, Бенуа; Стаматакис, Александрос (01 ноября 2019 г.). Рен, Джонатан (ред.). «RAxML-NG: быстрый, масштабируемый и удобный инструмент для максимально правдоподобного филогенетического вывода» . Биоинформатика . 35 (21): 4453–4455. doi : 10.1093/биоинформатика/btz305 . ISSN   1367-4803 . ПМК   6821337 . ПМИД   31070718 .
  6. ^ Минь, Буй Куанг; Шмидт, Хайко А; Черномор, Ольга; Шремпф, Доминик; Вудхэмс, Майкл Д.; фон Хэзелер, Арндт; Ланфир, Роберт (01 мая 2020 г.). Тилинг, Эмма (ред.). «IQ-TREE 2: Новые модели и эффективные методы филогенетического вывода в эпоху генома» . Молекулярная биология и эволюция . 37 (5): 1530–1534. дои : 10.1093/molbev/msaa015 . ISSN   0737-4038 . ПМК   7182206 . ПМИД   32011700 .
  7. ^ «Зеркало документации пакета PHYLIP» . Архивировано из оригинала 19 октября 2005 г. Проверено 24 марта 2006 г.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: c1d061d587d22870c4849e9957593bd0__1698747060
URL1:https://arc.ask3.ru/arc/aa/c1/d0/c1d061d587d22870c4849e9957593bd0.html
Заголовок, (Title) документа по адресу, URL1:
PHYLIP - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)