Галстук-бабочка (анализ последовательности)
Оригинальный автор(ы) | Бен Лэнгмид Коул Трапнелл Майкл Поп Стивен Зальцберг |
---|---|
Разработчик(и) | Бен Лэнгмид и др., |
Стабильная версия | |
Репозиторий | Галстук-бабочка : github Галстук-бабочка 2 : github |
Написано в | С++ |
Операционная система | Линукс macOS Окна |
Тип | Биоинформатика |
Веб-сайт | www |
Bowtie — это пакет программного обеспечения, обычно используемый для выравнивания последовательностей и анализа последовательностей в биоинформатике . [ 3 ] Исходный код пакета распространяется свободно , а скомпилированные двоичные файлы доступны для платформ Linux , macOS и Windows . По состоянию на 2017 год статья по геномной биологии , описывающая оригинальный метод Боути, цитировалась более 11 000 раз. [ 3 ] Bowtie — это программное обеспечение с открытым исходным кодом , которое в настоящее время поддерживается Университетом Джонса Хопкинса .
История
[ редактировать ]Выравниватель последовательностей Bowtie был первоначально разработан Беном Лэнгмидом и соавт. в Университете Мэриленда в 2009 году. [ 3 ] Элайнер обычно используется для коротких считываний и большого эталонного генома или для анализа всего генома . Bowtie позиционируется как «сверхбыстрый и эффективно запоминающий короткий выравниватель для коротких последовательностей ДНК ». Увеличение скорости Bowtie частично связано с реализацией преобразования Берроуза – Уиллера для выравнивания. [ 4 ] что уменьшает объем памяти (обычно примерно до 2,2 ГБ для генома человека); [ 5 ] аналогичный метод используется BWA [ 6 ] и SOAP2 [ 7 ] методы выравнивания. [ 5 ]
с учетом качества Боути проводит жадный, рандомизированный поиск в глубину в пространстве возможных совпадений. Поскольку поиск является жадным, первое правильное совпадение, обнаруженное Боути, не обязательно будет «лучшим» с точки зрения количества несоответствий или качества.
Bowtie используется в качестве выравнивателя последовательностей в ряде других связанных алгоритмов биоинформатики, включая TopHat , [ 8 ] Запонки [ 9 ] и пакет CummeRbund Bioconductor . [ 10 ]
галстук-бабочка 2
[ редактировать ]16 октября 2011 года разработчики выпустили бета- форк проекта под названием Bowtie 2 . [ 11 ] В дополнение к преобразованию Берроуза-Уиллера, Bowtie 2 также использует FM-индекс (похожий на массив суффиксов ), чтобы сохранить небольшой объем памяти. Благодаря своей реализации Bowtie 2 больше подходит для поиска более длинных выравниваний с промежутками по сравнению с оригинальным методом Bowtie. В Bowtie 2 нет верхнего предела длины чтения, и это позволяет выравниваниям перекрывать неоднозначные символы в ссылке.
Ссылки
[ редактировать ]- ^ «Галстук-бабочка: сверхбыстрый и экономичный по памяти выравниватель короткого считывания» . галстук-бабочка-bio.sourceforge.net . Проверено 28 марта 2021 г.
- ^ «Галстук-бабочка 2: быстрое и точное выравнивание чтения» . галстук-бабочка-bio.sourceforge.net . Проверено 28 марта 2021 г.
- ^ Jump up to: а б с Лэнгмид, Бен; Коул Трапнелл; Михай Поп; Стивен Л. Зальцберг (4 марта 2009 г.). «Сверхбыстрое и эффективное для памяти выравнивание коротких последовательностей ДНК с геномом человека» . Геномная биология . 10 (3): 10: Р25. дои : 10.1186/gb-2009-10-3-r25 . ПМК 2690996 . ПМИД 19261174 .
- ^ Феррагина, Паоло; Манзини, Джованни (2005). «Индексирование сжатого текста». Журнал АКМ . 52 (4): 552–581. дои : 10.1145/1082036.1082039 . S2CID 6200428 .
- ^ Jump up to: а б «Галстук-бабочка: сверхбыстрый и экономичный выравниватель короткого чтения — SourceForge» . Проверено 29 ноября 2013 г.
- ^ Ли, Х.; Дурбин, Р. (18 мая 2009 г.). «Быстрое и точное выравнивание короткого чтения с помощью преобразования Берроуза-Уиллера» . Биоинформатика . 25 (14): 1754–1760. doi : 10.1093/биоинформатика/btp324 . ПМК 2705234 . ПМИД 19451168 .
- ^ Ли, Р.; Ю, Ц.; Ли, Ю.; Лам, Т.-В.; Ю, С.-М.; Кристиансен, К.; Ван, Дж. (3 июня 2009 г.). «SOAP2: улучшенный сверхбыстрый инструмент для выравнивания коротких чтений» . Биоинформатика . 25 (15): 1966–1967. doi : 10.1093/биоинформатика/btp336 . ПМИД 19497933 .
- ^ Трапнелл, К.; Пахтер, Л .; Зальцберг, SL (16 марта 2009 г.). «TopHat: обнаружение соединений сплайсинга с помощью RNA-Seq» . Биоинформатика . 25 (9): 1105–1111. doi : 10.1093/биоинформатика/btp120 . ПМЦ 2672628 . ПМИД 19289445 .
- ^ Трапнелл, Коул; Робертс, Адам ; Гофф, Лояльный; Пертеа, Гео; Ким, Дэхван; Келли, Дэвид Р.; Пиментель, Гарольд; Зальцберг, Стивен Л; Ринн, Джон Л; Пахтер, Лиор (1 марта 2012 г.). «Дифференциальный анализ экспрессии генов и транскриптов в экспериментах по секвенированию РНК с помощью TopHat и Cufflinks» . Протоколы природы . 7 (3): 562–578. дои : 10.1038/нпрот.2012.016 . ПМЦ 3334321 . ПМИД 22383036 .
- ^ «CummeRbund — пакет R для постоянного хранения, анализа и визуализации секвенирования РНК, полученного из запонок» . Проверено 11 августа 2015 г.
- ^ Лэнгмид, Бен; Зальцберг, Стивен Л. (4 марта 2012 г.). «Согласование быстрого чтения с пробелами с Bowtie 2» . Природные методы . 9 (4): 357–359. дои : 10.1038/nmeth.1923 . ПМЦ 3322381 . ПМИД 22388286 .