Jump to content

Т-Кофе

Т-Кофе
Разработчик(и) Седрик Нотредам, Центр регулирования геномики (CRG) - Барселона
Стабильная версия
13.45.0.4846264 / 15 октября 2020 г .; 3 года назад ( 15.10.2020 )
Предварительный выпуск
13.45.33.7d7e789 / 23 декабря 2020 г .; 3 года назад ( 23.12.2020 )
Репозиторий
Операционная система UNIX , Linux , MS-Windows , Mac OS X
Тип Инструмент биоинформатики
Лицензия лицензия GPL
Веб-сайт www .tcoffee .org

T-Coffee ( целевая функция согласованности на основе дерева для оценки выравнивания ) — это программное обеспечение для выравнивания нескольких последовательностей, использующее прогрессивный подход. [1] Он генерирует библиотеку парных выравниваний для управления множественным выравниванием последовательностей. Он также может комбинировать несколько сопоставлений последовательностей, полученных ранее, а в последних версиях может использовать структурную информацию из PDB файлов (3D-Coffee). Он имеет расширенные функции для оценки качества выравнивания и некоторую возможность определения наличия мотивов (Mocca). По умолчанию он производит выравнивание в формате aln ( Clustal ), но также может создавать форматы PIR, MSF и FASTA . Поддерживаются наиболее распространенные входные форматы ( FASTA , PIR ).

Алгоритм

[ редактировать ]

Алгоритм T-Coffee состоит из двух основных функций: первая, используя разнородные источники данных, обеспечивает простые и гибкие средства создания множественных выравниваний. T-coffee может вычислять множественные выравнивания, используя библиотеку, созданную с использованием комбинации локальных и глобальных парных выравниваний. [1]

Второй — «Метод оптимизации», используемый для поиска множественного выравнивания, которое лучше всего соответствует парным выравниваниям во входной библиотеке, с использованием прогрессивной стратегии , которую можно сравнить с той, которая используется в ClustalW . Преимущество метода оптимизации состоит в том, что он быстрый и надежный. Информация в библиотеке используется для выполнения постепенного выравнивания и облегчает задачу рассмотрения согласований между всеми парами при выполнении каждого шага последовательного множественного выравнивания. [1]

Создание первичной библиотеки выравниваний

[ редактировать ]

Библиотека включает набор парных выравниваний между всеми последовательностями, подлежащими выравниванию; выравнивания не обязательно должны быть согласованными. В библиотеке можно найти информацию по каждому из N(N-1)/2 где N — количество последовательностей. Для каждой пары последовательностей используются два источника выравнивания, один из которых классифицируется как локальный, а другой — как глобальный. [1]

Глобальные выравнивания создаются с помощью ClustalW для последовательностей, по две за раз, и sed для получения одного полноразмерного выравнивания между каждой парой последовательностей. Локальные трассы — это десять непересекающихся местных трасс с наибольшим количеством баллов, собранные с помощью программы Lalign пакета FASTA . [1]

Каждое выравнивание представлено в библиотеке в виде списка парных совпадений остатков, каждая пара является ограничением; однако некоторые ограничения более актуальны, чем другие. важность каждого ограничения зависит от того, какое из них с большей вероятностью окажется правильным. При вычислении множественных выравниваний приоритет отдается наиболее надежным парам остатков за счет использования схемы взвешивания. [1]

Объединение библиотек

[ редактировать ]

Эффективное сочетание локальной и глобальной информации о согласовании является важным фактором T-Coffee. Используя основные библиотеки ClustalW и Lalign, этого можно добиться путем добавления. Любая дублированная пара между обеими библиотеками объединяется в одну запись с весом общей суммы обеих пар. В противном случае для пары создается новая запись. Пары с нулевым весом не будут представлены. [1] Для каждой пары выровненных остатков в библиотеке можно присвоить вес, который соответствует степени согласованности этих остатков. Это называется расширением библиотеки.

Сравнение с другим программным обеспечением для выравнивания

[ редактировать ]

Хотя вывод по умолчанию представляет собой формат, подобный Clustal, он настолько отличается от вывода ClustalW/X, что многие программы, поддерживающие формат Clustal, не могут его прочитать; к счастью, ClustalX может импортировать выходные данные T-Coffee, поэтому самым простым решением этой проблемы обычно является импорт выходных данных T-Coffee в ClustalX, а затем реэкспорт. Другая возможность — запросить строгий формат вывода Clustalw с опцией « -output=clustalw_aln".

Важной особенностью T-Coffee является его способность комбинировать разные методы и разные типы данных. В своей последней версии T-Coffee можно использовать для объединения последовательностей и структур белков, последовательностей и структур РНК. Он также может запускать и комбинировать выходные данные наиболее распространенных пакетов выравнивания последовательностей и структур.

T-Coffee поставляется вместе со сложной утилитой переформатирования последовательности под названием seq_reformat. Обширная документация доступна в Интернете.

Вариации

[ редактировать ]
  • M-Coffee: специальный режим T-Coffee, который позволяет объединять результаты наиболее распространенных пакетов множественного выравнивания последовательностей (Muscle, ClustalW, Mafft, ProbCons и т. д.). Итоговое выравнивание немного лучше, чем индивидуальное, но самое главное, программа указывает области выравнивания, в которых согласуются различные пакеты. Области высокого согласия обычно хорошо выровнены. [2]
  • Экспрессо и 3D-Кофе: это специальные режимы Т-Кофе, позволяющие комбинировать последовательность и структуры в выравнивании. Выравнивание на основе структуры можно выполнить с использованием наиболее распространенных структурных выравнивателей, таких как TMalign, Mustang и sap. [3] [4] [5] [6]
  • R-Coffee: специальный режим T-Coffee, позволяющий выравнивать последовательности РНК с использованием информации о вторичной структуре. [7] [8]
  • PSI-Coffee: выравнивает отдаленно родственные белки с использованием расширения гомологии (медленно и точно) [9] [10]
  • TM-Coffee: выравнивает трансмембранные белки с помощью расширения гомологии. [11]
  • Pro-Coffee: выравнивает гомологичные области промотора [12]
  • Точный: автоматически сочетает наиболее точные режимы для ДНК, РНК и белков (экспериментально). [13]
  • Объединить: объединяет два (или более) множественных выравнивания последовательностей в одно. [1] [9]

( S ) Ядро Transitive Consistency это расширенная версия схемы оценки T-Coffee. [14] Он использует библиотеки попарного выравнивания T-Coffee для оценки любого стороннего MSA. Парные проекции можно создавать с использованием быстрых или медленных методов, что позволяет найти компромисс между скоростью и точностью. Было показано, что TCS приводит к значительно лучшим оценкам структурной точности и более точным филогенетическим деревьям по сравнению с «Орел или решка», GUIDANCE, Gblocks и tripAl. [15]

См. также

[ редактировать ]
  1. ^ Jump up to: а б с д и ж г час Нотредам К., Хиггинс Д.Г. , Херинга Дж. (8 сентября 2000 г.). «T-Coffee: новый метод быстрого и точного выравнивания множественных последовательностей». Дж Мол Биол . 302 (1): 205–217. дои : 10.1006/jmbi.2000.4042 . ПМИД   10964570 . S2CID   10189971 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  2. ^ Уоллес, Иэн М.; О'Салливан, Орла; Хиггинс, Десмонд Г.; Нотредам, Седрик (2006). «M-Coffee: объединение нескольких методов выравнивания последовательностей с T-Coffee» . Исследования нуклеиновых кислот . 34 (6): 1692–1699. дои : 10.1093/нар/gkl091 . ISSN   1362-4962 . ПМЦ   1410914 . ПМИД   16556910 .
  3. ^ Армугом, Фабрис; Моретти, Себастьен; Пуаро, Оливье; Аудик, Стефан; Дюма, Пьер; Шаэли, Базиль; Кедуас, Владимир; Нотредам, Седрик (1 июля 2006 г.). «Экспрессо: автоматическое включение структурной информации в множественное выравнивание последовательностей с использованием 3D-Coffee» . Исследования нуклеиновых кислот . 34 (проблема с веб-сервером): W604–608. дои : 10.1093/nar/gkl092 . ISSN   1362-4962 . ПМК   1538866 . ПМИД   16845081 .
  4. ^ Чжан, Ян; Сколник, Джеффри (2005). «TM-align: алгоритм выравнивания структуры белка, основанный на TM-оценке» . Исследования нуклеиновых кислот . 33 (7): 2302–2309. дои : 10.1093/nar/gki524 . ISSN   1362-4962 . ПМЦ   1084323 . ПМИД   15849316 .
  5. ^ Конагурту, Арун С.; Уиссток, Джеймс К.; Стаки, Питер Дж.; Леск, Артур М. (15 августа 2006 г.). «МУСТАНГ: алгоритм множественного структурного выравнивания» . Белки . 64 (3): 559–574. дои : 10.1002/прот.20921 . ISSN   1097-0134 . ПМИД   16736488 . S2CID   14074658 .
  6. ^ Сунь, Чжэн; Тянь, Вэйдун (2012). «SAP — программа картирования и анализа последовательностей для выравнивания длинных последовательностей и точного обнаружения вариантов» . ПЛОС ОДИН . 7 (8): е42887. Бибкод : 2012PLoSO...742887S . дои : 10.1371/journal.pone.0042887 . ISSN   1932-6203 . ПМЦ   3413671 . ПМИД   22880129 .
  7. ^ Вильм, Андреас; Хиггинс, Десмонд Г.; Нотредам, Седрик (май 2008 г.). «R-Coffee: метод множественного выравнивания некодирующей РНК» . Исследования нуклеиновых кислот . 36 (9): е52. дои : 10.1093/нар/gkn174 . ISSN   1362-4962 . ПМК   2396437 . ПМИД   18420654 .
  8. ^ Моретти, Себастьян; Вильм, Андреас; Хиггинс, Десмонд Г.; Ксенарий, Иоаннис; Нотредам, Седрик (01 июля 2008 г.). «R-Coffee: веб-сервер для точного выравнивания некодирующих последовательностей РНК» . Исследования нуклеиновых кислот . 36 (проблема с веб-сервером): W10–13. дои : 10.1093/нар/gkn278 . ISSN   1362-4962 . ПМЦ   2447777 . ПМИД   18483080 .
  9. ^ Jump up to: а б Ди Томмасо П., Моретти С., Ксенариос I, Оробитг М., Монтаньола А., Чанг Дж. М., Тали Дж. Ф., Нотредам К. (июль 2011 г.). «T-Coffee: веб-сервер для множественного выравнивания последовательностей белков и последовательностей РНК с использованием структурной информации и расширения гомологии» . Нуклеиновые кислоты Рез . 39 (проблема с веб-сервером): W13–7. дои : 10.1093/nar/gkr245 . ПМК   3125728 . ПМИД   21558174 .
  10. ^ Кемена С, Нотредам С (01 октября 2009 г.). «Предстоящие проблемы для методов множественного выравнивания последовательностей в эпоху высокой пропускной способности» . Биоинформатика . 25 (19): 2455–65. doi : 10.1093/биоинформатика/btp452 . ПМЦ   2752613 . ПМИД   19648142 .
  11. ^ Чанг Дж.М., Ди Томмазо П., Тали Дж.Ф., Нотредам К. (28 марта 2012 г.). «Точное множественное выравнивание последовательностей трансмембранных белков с помощью PSI-Coffee» . БМК Биоинформатика . 13 : С1. дои : 10.1186/1471-2105-13-S4-S1 . ПМК   3303701 . ПМИД   22536955 .
  12. ^ Эрб И., Гонсалес-Валлинас-младший, Буссотти Дж., Бланко Е., Эйрас Е., Нотредам К. (апрель 2012 г.). «Использование данных ChIP-Seq для разработки метода выравнивания множественных промоторов» . Нуклеиновые кислоты Рез . 40 (7): е52. дои : 10.1093/nar/gkr1292 . ПМЦ   3326335 . ПМИД   22230796 .
  13. ^ «Т-Кофе Сервер» . tcoffee.crg.eu . Проверено 26 декабря 2023 г.
  14. ^ Чанг, Дж. М.; Ди Томмазо, П; Лефорт, В; Гаскуэль, О; Нотредам, C (1 июля 2015 г.). «TCS: веб-сервер для оценки множественного выравнивания последовательностей и филогенетической реконструкции» . Исследования нуклеиновых кислот . 43 (П1): П3-6. дои : 10.1093/нар/gkv310 . ПМЦ   4489230 . ПМИД   25855806 .
  15. ^ Чанг, Дж. М.; Ди Томмазо, П; Нотредам, К. (июнь 2014 г.). «TCS: новый показатель надежности множественного выравнивания последовательностей для оценки точности выравнивания и улучшения реконструкции филогенетического дерева» . Молекулярная биология и эволюция . 31 (6): 1625–37. дои : 10.1093/molbev/msu117 . ПМИД   24694831 .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: c8ad2498ba5e86d0425e5afa530f4e8d__1705507320
URL1:https://arc.ask3.ru/arc/aa/c8/8d/c8ad2498ba5e86d0425e5afa530f4e8d.html
Заголовок, (Title) документа по адресу, URL1:
T-Coffee - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)