Т-Кофе
![]() | Эта статья может иметь запутанные или двусмысленные сокращения . ( Апрель 2011 г. ) |
Разработчик(и) | Седрик Нотредам, Центр регулирования геномики (CRG) - Барселона |
---|---|
Стабильная версия | 13.45.0.4846264 / 15 октября 2020 г |
Предварительный выпуск | 13.45.33.7d7e789 / 23 декабря 2020 г |
Репозиторий | |
Операционная система | UNIX , Linux , MS-Windows , Mac OS X |
Тип | Инструмент биоинформатики |
Лицензия | лицензия GPL |
Веб-сайт | www |
T-Coffee ( целевая функция согласованности на основе дерева для оценки выравнивания ) — это программное обеспечение для выравнивания нескольких последовательностей, использующее прогрессивный подход. [1] Он генерирует библиотеку парных выравниваний для управления множественным выравниванием последовательностей. Он также может комбинировать несколько сопоставлений последовательностей, полученных ранее, а в последних версиях может использовать структурную информацию из PDB файлов (3D-Coffee). Он имеет расширенные функции для оценки качества выравнивания и некоторую возможность определения наличия мотивов (Mocca). По умолчанию он производит выравнивание в формате aln ( Clustal ), но также может создавать форматы PIR, MSF и FASTA . Поддерживаются наиболее распространенные входные форматы ( FASTA , PIR ).
Алгоритм
[ редактировать ]Алгоритм T-Coffee состоит из двух основных функций: первая, используя разнородные источники данных, обеспечивает простые и гибкие средства создания множественных выравниваний. T-coffee может вычислять множественные выравнивания, используя библиотеку, созданную с использованием комбинации локальных и глобальных парных выравниваний. [1]
Второй — «Метод оптимизации», используемый для поиска множественного выравнивания, которое лучше всего соответствует парным выравниваниям во входной библиотеке, с использованием прогрессивной стратегии , которую можно сравнить с той, которая используется в ClustalW . Преимущество метода оптимизации состоит в том, что он быстрый и надежный. Информация в библиотеке используется для выполнения постепенного выравнивания и облегчает задачу рассмотрения согласований между всеми парами при выполнении каждого шага последовательного множественного выравнивания. [1]
Создание первичной библиотеки выравниваний
[ редактировать ]Библиотека включает набор парных выравниваний между всеми последовательностями, подлежащими выравниванию; выравнивания не обязательно должны быть согласованными. В библиотеке можно найти информацию по каждому из N(N-1)/2
где N — количество последовательностей. Для каждой пары последовательностей используются два источника выравнивания, один из которых классифицируется как локальный, а другой — как глобальный. [1]
Глобальные выравнивания создаются с помощью ClustalW для последовательностей, по две за раз, и sed для получения одного полноразмерного выравнивания между каждой парой последовательностей. Локальные трассы — это десять непересекающихся местных трасс с наибольшим количеством баллов, собранные с помощью программы Lalign пакета FASTA . [1]
Каждое выравнивание представлено в библиотеке в виде списка парных совпадений остатков, каждая пара является ограничением; однако некоторые ограничения более актуальны, чем другие. важность каждого ограничения зависит от того, какое из них с большей вероятностью окажется правильным. При вычислении множественных выравниваний приоритет отдается наиболее надежным парам остатков за счет использования схемы взвешивания. [1]
Объединение библиотек
[ редактировать ]Эффективное сочетание локальной и глобальной информации о согласовании является важным фактором T-Coffee. Используя основные библиотеки ClustalW и Lalign, этого можно добиться путем добавления. Любая дублированная пара между обеими библиотеками объединяется в одну запись с весом общей суммы обеих пар. В противном случае для пары создается новая запись. Пары с нулевым весом не будут представлены. [1] Для каждой пары выровненных остатков в библиотеке можно присвоить вес, который соответствует степени согласованности этих остатков. Это называется расширением библиотеки.
Сравнение с другим программным обеспечением для выравнивания
[ редактировать ]Хотя вывод по умолчанию представляет собой формат, подобный Clustal, он настолько отличается от вывода ClustalW/X, что многие программы, поддерживающие формат Clustal, не могут его прочитать; к счастью, ClustalX может импортировать выходные данные T-Coffee, поэтому самым простым решением этой проблемы обычно является импорт выходных данных T-Coffee в ClustalX, а затем реэкспорт. Другая возможность — запросить строгий формат вывода Clustalw с опцией « -output=clustalw_aln
".
Важной особенностью T-Coffee является его способность комбинировать разные методы и разные типы данных. В своей последней версии T-Coffee можно использовать для объединения последовательностей и структур белков, последовательностей и структур РНК. Он также может запускать и комбинировать выходные данные наиболее распространенных пакетов выравнивания последовательностей и структур.
T-Coffee поставляется вместе со сложной утилитой переформатирования последовательности под названием seq_reformat. Обширная документация доступна в Интернете.
Вариации
[ редактировать ]- M-Coffee: специальный режим T-Coffee, который позволяет объединять результаты наиболее распространенных пакетов множественного выравнивания последовательностей (Muscle, ClustalW, Mafft, ProbCons и т. д.). Итоговое выравнивание немного лучше, чем индивидуальное, но самое главное, программа указывает области выравнивания, в которых согласуются различные пакеты. Области высокого согласия обычно хорошо выровнены. [2]
- Экспрессо и 3D-Кофе: это специальные режимы Т-Кофе, позволяющие комбинировать последовательность и структуры в выравнивании. Выравнивание на основе структуры можно выполнить с использованием наиболее распространенных структурных выравнивателей, таких как TMalign, Mustang и sap. [3] [4] [5] [6]
- R-Coffee: специальный режим T-Coffee, позволяющий выравнивать последовательности РНК с использованием информации о вторичной структуре. [7] [8]
- PSI-Coffee: выравнивает отдаленно родственные белки с использованием расширения гомологии (медленно и точно) [9] [10]
- TM-Coffee: выравнивает трансмембранные белки с помощью расширения гомологии. [11]
- Pro-Coffee: выравнивает гомологичные области промотора [12]
- Точный: автоматически сочетает наиболее точные режимы для ДНК, РНК и белков (экспериментально). [13]
- Объединить: объединяет два (или более) множественных выравнивания последовательностей в одно. [1] [9]
Оценка
[ редактировать ]( S ) — Ядро Transitive Consistency это расширенная версия схемы оценки T-Coffee. [14] Он использует библиотеки попарного выравнивания T-Coffee для оценки любого стороннего MSA. Парные проекции можно создавать с использованием быстрых или медленных методов, что позволяет найти компромисс между скоростью и точностью. Было показано, что TCS приводит к значительно лучшим оценкам структурной точности и более точным филогенетическим деревьям по сравнению с «Орел или решка», GUIDANCE, Gblocks и tripAl. [15]
См. также
[ редактировать ]- Список программного обеспечения для выравнивания последовательностей
- Кластал
- МАФФТ
- МЫШЦЫ
- ПробКонс
- КласталВ
Ссылки
[ редактировать ]- ^ Jump up to: а б с д и ж г час Нотредам К., Хиггинс Д.Г. , Херинга Дж. (8 сентября 2000 г.). «T-Coffee: новый метод быстрого и точного выравнивания множественных последовательностей». Дж Мол Биол . 302 (1): 205–217. дои : 10.1006/jmbi.2000.4042 . ПМИД 10964570 . S2CID 10189971 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Уоллес, Иэн М.; О'Салливан, Орла; Хиггинс, Десмонд Г.; Нотредам, Седрик (2006). «M-Coffee: объединение нескольких методов выравнивания последовательностей с T-Coffee» . Исследования нуклеиновых кислот . 34 (6): 1692–1699. дои : 10.1093/нар/gkl091 . ISSN 1362-4962 . ПМЦ 1410914 . ПМИД 16556910 .
- ^ Армугом, Фабрис; Моретти, Себастьен; Пуаро, Оливье; Аудик, Стефан; Дюма, Пьер; Шаэли, Базиль; Кедуас, Владимир; Нотредам, Седрик (1 июля 2006 г.). «Экспрессо: автоматическое включение структурной информации в множественное выравнивание последовательностей с использованием 3D-Coffee» . Исследования нуклеиновых кислот . 34 (проблема с веб-сервером): W604–608. дои : 10.1093/nar/gkl092 . ISSN 1362-4962 . ПМК 1538866 . ПМИД 16845081 .
- ^ Чжан, Ян; Сколник, Джеффри (2005). «TM-align: алгоритм выравнивания структуры белка, основанный на TM-оценке» . Исследования нуклеиновых кислот . 33 (7): 2302–2309. дои : 10.1093/nar/gki524 . ISSN 1362-4962 . ПМЦ 1084323 . ПМИД 15849316 .
- ^ Конагурту, Арун С.; Уиссток, Джеймс К.; Стаки, Питер Дж.; Леск, Артур М. (15 августа 2006 г.). «МУСТАНГ: алгоритм множественного структурного выравнивания» . Белки . 64 (3): 559–574. дои : 10.1002/прот.20921 . ISSN 1097-0134 . ПМИД 16736488 . S2CID 14074658 .
- ^ Сунь, Чжэн; Тянь, Вэйдун (2012). «SAP — программа картирования и анализа последовательностей для выравнивания длинных последовательностей и точного обнаружения вариантов» . ПЛОС ОДИН . 7 (8): е42887. Бибкод : 2012PLoSO...742887S . дои : 10.1371/journal.pone.0042887 . ISSN 1932-6203 . ПМЦ 3413671 . ПМИД 22880129 .
- ^ Вильм, Андреас; Хиггинс, Десмонд Г.; Нотредам, Седрик (май 2008 г.). «R-Coffee: метод множественного выравнивания некодирующей РНК» . Исследования нуклеиновых кислот . 36 (9): е52. дои : 10.1093/нар/gkn174 . ISSN 1362-4962 . ПМК 2396437 . ПМИД 18420654 .
- ^ Моретти, Себастьян; Вильм, Андреас; Хиггинс, Десмонд Г.; Ксенарий, Иоаннис; Нотредам, Седрик (01 июля 2008 г.). «R-Coffee: веб-сервер для точного выравнивания некодирующих последовательностей РНК» . Исследования нуклеиновых кислот . 36 (проблема с веб-сервером): W10–13. дои : 10.1093/нар/gkn278 . ISSN 1362-4962 . ПМЦ 2447777 . ПМИД 18483080 .
- ^ Jump up to: а б Ди Томмасо П., Моретти С., Ксенариос I, Оробитг М., Монтаньола А., Чанг Дж. М., Тали Дж. Ф., Нотредам К. (июль 2011 г.). «T-Coffee: веб-сервер для множественного выравнивания последовательностей белков и последовательностей РНК с использованием структурной информации и расширения гомологии» . Нуклеиновые кислоты Рез . 39 (проблема с веб-сервером): W13–7. дои : 10.1093/nar/gkr245 . ПМК 3125728 . ПМИД 21558174 .
- ^ Кемена С, Нотредам С (01 октября 2009 г.). «Предстоящие проблемы для методов множественного выравнивания последовательностей в эпоху высокой пропускной способности» . Биоинформатика . 25 (19): 2455–65. doi : 10.1093/биоинформатика/btp452 . ПМЦ 2752613 . ПМИД 19648142 .
- ^ Чанг Дж.М., Ди Томмазо П., Тали Дж.Ф., Нотредам К. (28 марта 2012 г.). «Точное множественное выравнивание последовательностей трансмембранных белков с помощью PSI-Coffee» . БМК Биоинформатика . 13 : С1. дои : 10.1186/1471-2105-13-S4-S1 . ПМК 3303701 . ПМИД 22536955 .
- ^ Эрб И., Гонсалес-Валлинас-младший, Буссотти Дж., Бланко Е., Эйрас Е., Нотредам К. (апрель 2012 г.). «Использование данных ChIP-Seq для разработки метода выравнивания множественных промоторов» . Нуклеиновые кислоты Рез . 40 (7): е52. дои : 10.1093/nar/gkr1292 . ПМЦ 3326335 . ПМИД 22230796 .
- ^ «Т-Кофе Сервер» . tcoffee.crg.eu . Проверено 26 декабря 2023 г.
- ^ Чанг, Дж. М.; Ди Томмазо, П; Лефорт, В; Гаскуэль, О; Нотредам, C (1 июля 2015 г.). «TCS: веб-сервер для оценки множественного выравнивания последовательностей и филогенетической реконструкции» . Исследования нуклеиновых кислот . 43 (П1): П3-6. дои : 10.1093/нар/gkv310 . ПМЦ 4489230 . ПМИД 25855806 .
- ^ Чанг, Дж. М.; Ди Томмазо, П; Нотредам, К. (июнь 2014 г.). «TCS: новый показатель надежности множественного выравнивания последовательностей для оценки точности выравнивания и улучшения реконструкции филогенетического дерева» . Молекулярная биология и эволюция . 31 (6): 1625–37. дои : 10.1093/molbev/msu117 . ПМИД 24694831 .