Список программного обеспечения для выравнивания последовательностей
Этот список программного обеспечения для выравнивания последовательностей представляет собой подборку программных инструментов и веб-порталов, используемых для парного выравнивания последовательностей и множественного выравнивания последовательностей . См. программное обеспечение для структурного выравнивания для структурного выравнивания белков.
Только поиск по базе данных
[ редактировать ]Имя | Описание | Тип последовательности* | Авторы | Год |
---|---|---|---|---|
ВЗРЫВ | Локальный поиск с быстрой эвристикой k-кортежей (базовый инструмент поиска по локальному выравниванию) | Оба | Альтшул С.Ф. , Гиш В. , Миллер В. , Майерс Э.В. , Липман DJ [1] | 1990 |
HPC-BLAST | Многоузловая и многоядерная оболочка BLAST, совместимая с NCBI. Эта оболочка, распространяемая вместе с последней версией BLAST, облегчает распараллеливание алгоритма в современных гибридных архитектурах со многими узлами и множеством ядер внутри каждого узла. [2] | Белок | Бердишоу С.Э. , Сойер С. , Хортон М.Д. , Брук Р.Г. , Рекапалли Б. | 2017 |
CS-BLAST | BLAST, зависящий от контекста последовательности, более чувствительный, чем BLAST, FASTA и SSEARCH. Итеративная версия для конкретной позиции CSI-BLAST более чувствительна, чем PSI-BLAST | Белок | Angermueller C, Biegert A, Soeding J [3] | 2013 |
КУДАСВ++ | Алгоритм Смита Уотермана с ускорением на графическом процессоре для нескольких графических процессоров с общим хостом | Белок | Лю Ю, Маскелл Д.Л. и Шмидт Б. | 2009/2010 |
АЛМАЗ | Выравниватель BLASTX и BLASTP на основе двойной индексации | Белок | Бухфинк Б, Се С, Хьюсон Д.Х., Рейтер К., Дрост Х.Г. [4] [5] | 2015/2021 |
ГОСТ | Локальный поиск с быстрой эвристикой k -кортежей, медленнее, но более чувствителен, чем BLAST | Оба | ||
ПОИСК, ГЛПОИСК | Глобальное:Глобальное (GG), Глобальное:Локальное (GL) соответствие статистике | Белок | ||
Геномный волшебник | Программное обеспечение для сверхбыстрого поиска мотивов локальных последовательностей ДНК и попарного выравнивания для данных NGS (FASTA, FASTQ). | ДНК | Хепперле Д (www.sequentix.de) | 2020 |
На коленях | Genoogle использует методы индексации и параллельной обработки для поиска последовательностей ДНК и белков. Он разработан на Java и имеет открытый исходный код. | Оба | Альбрехт Ф | 2015 |
ХММЕР | Локальный и глобальный поиск по профилю Скрытые марковские модели, более чувствительные, чем PSI-BLAST | Оба | Дурбин Р. , Эдди С.Р. , Крог А. , Митчисон Дж. [6] | 1998 |
HH-люкс | Попарное сравнение профильных скрытых марковских моделей; очень чувствительный | Белок | Сёдинг Дж. [7] [8] | 2005/2012 |
ЦАХАЛ | Обратная частота документов | Оба | ||
Адский | профиля SCFG Поиск | РНК | Эдди С | |
KLAST | Высокопроизводительный универсальный инструмент поиска сходства последовательностей | Оба | 2009/2014 | |
ЛАМБДА | Высокопроизводительный локальный элайнер, совместимый с BLAST, но намного более быстрый; поддерживает ЗРК/БАМ | Белок | Ханнес Хаусведелл, Йохен Зингер, Кнут Райнерт [9] | 2014 |
ММсек2 | Пакет программного обеспечения для поиска и кластеризации огромных наборов последовательностей. Чувствительность аналогична BLAST и PSI-BLAST, но на несколько порядков быстрее. | Белок | Штайнеггер М, Мирдита М, Галиес С, Сёдинг Дж [10] | 2017 |
ИССЛЕДОВАНИЕ | Сверхбыстрый инструмент анализа последовательностей | Оба | Эдгар, RC (2010). «Поиск и кластеризация на порядки быстрее, чем BLAST» . Биоинформатика . 26 (19): 2460–2461. doi : 10.1093/биоинформатика/btq461 . ПМИД 20709691 . публикация | 2010 |
ОСВАЛЬД | OpenCL Smith-Waterman о FPGA Altera для больших баз данных белков | Белок | Руччи Э, Гарсиа К, Ботелла Дж, Де Джусти А, Найуф М, Прието-Матиас М [11] | 2016 |
парасейлинг | Быстрый поиск Смита-Уотермана с использованием распараллеливания SIMD | Оба | Дейли Дж | 2015 |
ПСИ-ВЗРЫВ | Итеративный BLAST для конкретной позиции, локальный поиск с матрицами оценок для конкретной позиции , гораздо более чувствительный, чем BLAST. | Белок | Альтшул С.Ф. , Мэдден Т.Л., Шеффер А.А., Чжан Дж., Чжан З., Миллер В. , Липман DJ. [12] | 1997 |
PSI-Поиск | Сочетание алгоритма поиска Смита-Уотермана со стратегией построения профиля PSI-BLAST для поиска отдаленно родственных белковых последовательностей и предотвращения гомологичных ошибок чрезмерного удлинения. | Белок | Ли В., МакВильям Х., Гужон М., Коули А., Лопес Р., Пирсон В.Р. [13] | 2012 |
отдых и отдых | Retvieve and Relate (R&R) — это высокопроизводительная, но чувствительная поисковая система с несколькими базами данных, способная выполнять параллельный поиск по последовательностям ДНК, РНК и белков. | Оба | 2019 | |
СкалаBLAST | Масштабируемый BLAST с высокой степенью параллелизма | Оба | Оемен и др. [14] | 2011 |
Секилаб | Связывание и профилирование данных о выравнивании последовательностей из результатов NCBI-BLAST с основными серверами/службами анализа последовательностей. | Нуклеотид, пептид | 2010 | |
ОДИН | Локальный и глобальный поиск по профилю Скрытые марковские модели, более чувствительные, чем PSI-BLAST | Оба | Карплюс К , Крог А [15] | 1999 |
ИССЛЕДОВАНИЕ | Поиск Смита-Уотермана, медленнее, но более чувствителен, чем FASTA | Оба | ||
СВАФИ | Первый распараллеленный алгоритм, использующий новый процессор Intel Xeon Phis для ускорения поиска в базе данных белков Смита-Уотермана. | Белок | Лю Ю и Шмидт Б. | 2014 |
СВАФИ-LS | Первый параллельный алгоритм Смита-Уотермана, использующий кластеры Intel Xeon Phi для ускорения выравнивания длинных последовательностей ДНК. | ДНК | Лю Й, Тран Т., Лауэнрот Ф, Шмидт Б | 2014 |
ПЛАВАНИЕ | Реализация Смита-Уотермана для многоядерных и многоядерных архитектур Intel | Белок | Руччи Э., Гарсия К., Ботелла Дж., Де Джусти А., Найуф М. и Прието-Матиас М. [16] | 2015 |
ПЛАВАНИЕ2.0 | Усовершенствованный алгоритм Смита-Уотермана на многоядерных и многоядерных архитектурах Intel на основе векторных расширений AVX-512. | Белок | Руччи Э., Гарсия К., Ботелла Дж., Де Джусти А., Найуф М. и Прието-Матиас М. [17] | 2018 |
ПРОЛИСТАЙТЕ | Быстрый поиск Смита-Уотермана с использованием распараллеливания SIMD | Оба | Ронь Т | 2011 |
* Тип последовательности: белок или нуклеотид.
Попарное выравнивание
[ редактировать ]Имя | Описание | Тип последовательности* | Тип выравнивания** | Автор | Год |
---|---|---|---|---|---|
АКАНА | Быстрое парное выравнивание на основе эвристической привязки | Оба | Оба | Хуанг, Умбах, Ли | 2005 |
AlignMe | Выравнивание последовательностей мембранных белков | Белок | Оба | M. Stamm, K. Khafizov, R. Staritzbichler, L.R. Forrest | 2013 |
ALLALIGN | Для ДНК, РНК и белковых молекул размером до 32 МБ выравнивает все последовательности размером K или больше. Подобные выравнивания группируются для анализа. Автоматический фильтр повторяющихся последовательностей. | Оба | Местный | Э. Перепел | 2017 |
Биокондуктор Биоструны::pairwiseAlignment | Динамическое программирование | Оба | Оба + без концов | П. Абоюн | 2008 |
BioPerl dpAlign | Динамическое программирование | Оба | Оба + без концов | ЮМ Чан | 2003 |
БЛАСТЗ, ЛАСТЗ | Сопоставление с затравленным образцом | Нуклеотид | Местный | Шварц и др. [18] [19] | 2004,2009 |
CUDAlign | Выравнивание последовательностей ДНК неограниченного размера в одном или нескольких графических процессорах | Нуклеотид | Локальный, полуглобальный, глобальный | Э. Сандес [20] [21] [22] | 2011-2015 |
ДНКДот | Веб-инструмент точечной диаграммы | Нуклеотид | Глобальный | Р. Боуэн | 1998 |
ДОТЛЕ | Инструмент точечной диаграммы на основе Java | Оба | Глобальный | М. Паньи и Т. Жюнье | 1998 |
ПРАЗДНИК | Локальное расширение на заднем плане с описательной моделью эволюции | Нуклеотид | Местный | А.К. Худек и Д.Г. Браун | 2010 |
Компилятор генома Компилятор генома | Сравнивайте файлы хроматограмм (.ab1, .scf) с последовательностью шаблонов, находите ошибки и мгновенно исправляйте их. | Нуклеотид | Местный | Корпорация компилятора генома | 2014 |
Г-ПАС | Динамическое программирование на базе графического процессора с возвратом | Оба | Локальный, полуглобальный, глобальный | В. Фромберг, М. Кержинка и др. | 2011 |
TalkMis | Выполняется ли попарное выравнивание последовательностей с одним пробелом? | Оба | ПолуГлобальный | Фрусиос К., Флури Т., Илиопулос К.С., Парк К., Писсис С.П., Тишлер Г. | 2012 |
Геномный волшебник | Программное обеспечение для сверхбыстрого поиска мотивов локальных последовательностей ДНК и попарного выравнивания для данных NGS (FASTA, FASTQ). | ДНК | Локальный, полуглобальный, глобальный | Хепперле Д (www.sequentix.de) | 2020 |
ПОИСК, ГЛПОИСК | Глобальное:Глобальное (GG), Глобальное:Локальное (GL) соответствие статистике | Белок | Глобальный запрос | В. Пирсон | 2007 |
JAligner | Java- с открытым исходным кодом реализация Смита-Уотермана | Оба | Местный | А. Мустафа | 2005 |
К*Синхронизация | Выравнивание последовательности белка к структуре, которое включает вторичную структуру, структурную консервативность, профили структурных последовательностей и консенсусные показатели выравнивания. | Белок | Оба | Д. Чивиан и Д. Бейкер [23] | 2003 |
ЛАЛИГН | Множественное, непересекающееся локальное сходство (тот же алгоритм, что и SIM) | Оба | Локальное неперекрытие | В. Пирсон | 1991 (алгоритм) |
СЗ-выравнивание | Стандартный алгоритм динамического программирования Нидлмана-Вунша | Белок | Глобальный | и Чжан | 2012 |
спички | Локальное выравнивание Уотермана-Эггерта (на основе LALIGN) | Оба | Местный | И. Лонгден (модификация из У. Пирсона) | 1999 |
MCALIGN2 | явные модели эволюции индел | ДНК | Глобальный | Дж.Ванг и др. | 2006 |
MegAlign Pro (лазерная молекулярная биология) | Программное обеспечение для выравнивания последовательностей ДНК, РНК, белка или ДНК + белок с помощью алгоритмов парного и множественного выравнивания последовательностей, включая MUSCLE, Mauve, MAFFT, Clustal Omega, Jotun Hein, Wilbur-Lipman, Martinez Needleman-Wunsch, Lipman-Pearson и Dotplot анализ. | Оба | Оба | ДНКСТАР | 1993-2016 |
МУМмер | суффиксного дерева на основе | Нуклеотид | Глобальный | С. Курц и др. | 2004 |
иголка | Нидлмана-Вунша Динамическое программирование | Оба | ПолуГлобальный | А. Блисби | 1999 |
я сумасшедший | стоимость логарифмического и аффинного разрыва и явные модели эволюции инделей | Оба | Глобальный | Р. Картрайт | 2007 |
СЗ | Нидлмана-Вунша Динамическое программирование | Оба | Глобальный | ACR Мартин | 1990-2015 |
парасейлинг | Библиотека динамического программирования C/C++/Python/Java SIMD для SSE, AVX2 | Оба | Глобальный, Бесконечный, Локальный | Дж. Дейли | 2015 |
Путь | Смит-Уотерман на белка обратной трансляции графе (обнаруживает сдвиги рамки на уровне белка) | Белок | Местный | М. Гирдеа и др. [24] | 2009 |
ШаблонОхотник | Сопоставление с затравленным образцом | Нуклеотид | Местный | Б. Ма и др. [25] [26] | 2002–2004 |
ПробА (также пропА) | Выборка стохастической статистической суммы с помощью динамического программирования | Оба | Глобальный | У. Мюкштайн | 2002 |
ПиМОЛ | Команда «align» выравнивает последовательность и применяет ее к структуре | Белок | Глобальный (по выбору) | УЛ ДеЛано | 2007 |
РЕПутер | суффиксного дерева на основе | Нуклеотид | Местный | С. Курц и др. | 2001 |
САБЛЕЗУБ | Выравнивание с использованием прогнозируемых профилей подключения | Белок | Глобальный | Ф. Тейхерт, Дж. Миннинг, У. Бастолла и М. Порту | 2009 |
Сацума | Параллельное полногеномное выравнивание синтении | ДНК | Местный | М. Г. Грабхерр и др. | 2010 |
СЕКАЛН | Различное динамическое программирование | Оба | Локальный или глобальный | М. С. Уотерман и П. Харди | 1996 |
SIM, РАЗРЫВ, ДЕНЬ, КРУГ | Локальное сходство с различными обработками пробелов | Оба | Локальный или глобальный | X. Хуанг и В. Миллер | 1990-6 |
Сим | Местное сходство | Оба | Местный | X. Хуанг и В. Миллер | 1991 |
SPA: Суперпарное выравнивание | Быстрое попарное глобальное выравнивание | Нуклеотид | Глобальный | Шен, Ян, Яо, Хван | 2002 |
ИССЛЕДОВАНИЕ | Локальное ( Смита-Уотермана ) соответствие статистике | Белок | Местный | В. Пирсон | 1981 (Алгоритм) |
Студия последовательностей | Java-апплет, демонстрирующий различные алгоритмы из [27] | Общая последовательность | Локальное и глобальное | А. Мескаускас | 1997 (справочник) |
СВИФОЛД | Ускорение Смита-Уотермана на FPGA Intel с OpenCL для длинных последовательностей ДНК | Нуклеотид | Местный | Э. Руччи [28] [29] | 2017-2018 |
СВИФТ костюм | Быстрый поиск локального выравнивания | ДНК | Местный | К. Расмуссен, [30] В. Герлах | 2005,2008 |
носилки | Оптимизированное для памяти Нидлмана-Вунша динамическое программирование | Оба | Глобальный | И. Лонгден (модификация Г. Майерса и У. Миллера) | 1999 |
Траналайн | Выравнивает последовательности нуклеиновых кислот с учетом выравнивания белков. | Нуклеотид | ЧТО | Г. Уильямс (модификация Б. Пирсона) | 2002 |
ГЕН | Smith-Waterman с открытым исходным кодом для SSE/CUDA, поиск повторов на основе суффиксного массива и точечная диаграмма | Оба | Оба | ЮниПро | 2010 |
вода | Динамическое программирование Смита-Уотермана | Оба | Местный | А. Блисби | 1999 |
совпадение слов | k -кортеж попарного совпадения | Оба | ЧТО | И. Лонгден | 1998 |
ЯСС | Сопоставление с затравленным образцом | Нуклеотид | Местный | Л. Ноэ и Г. Кучеров [31] | 2004 |
* Тип последовательности: белок или нуклеотид. ** Тип выравнивания: локальный или глобальный.
Множественное выравнивание последовательностей
[ редактировать ]Имя | Описание | Тип последовательности* | Тип выравнивания** | Автор | Год | Лицензия |
---|---|---|---|---|---|---|
АБА | Расклад А-Брейн | Белок | Глобальный | Б.Рафаэль и др. | 2004 | Проприетарное бесплатное ПО для образования, исследований и некоммерческих организаций. |
НО | ручное выравнивание; некоторая помощь с программным обеспечением | Нуклеотиды | Местный | Дж. Бланди и К. Фогель | 1994 г. (последняя версия 2007 г.) | Бесплатно, GPL 2 |
ALLALIGN | Для молекул ДНК, РНК и белков размером до 32 МБ выравнивает все последовательности размером K или больше, MSA или внутри одной молекулы. Подобные выравнивания группируются для анализа. Автоматический фильтр повторяющихся последовательностей. | Оба | Местный | Э. Перепел | 2017 | Бесплатно |
АМАП | Последовательный отжиг | Оба | Глобальный | А. Шварц и Л. Пахтер | 2006 | |
БАли-Фи | Дерево+многовыравнивание; вероятностно-байесовский; совместная оценка | Оба + кодоны | Глобальный | Б.Д. Ределингс и М.А. Сушард | 2005 г. (последняя версия 2018 г.) | Бесплатно, лицензия GPL |
База за базой | Редактор множественного выравнивания последовательностей на базе Java со встроенными инструментами анализа. | Оба | Локальный или глобальный | Р. Броди и др. | 2004 | Проприетарное , бесплатное ПО , необходима регистрация. |
ХАОС, ДИАЛАЙН | Итеративное выравнивание | Оба | Местный (предпочтительно) | М. Брудно и Б. Моргенштерн | 2003 | |
Кластал Ж | Прогрессивное выравнивание | Оба | Локальный или глобальный | Томпсон и др. | 1994 | Бесплатно, LGPL |
КодонCode Aligner | Мультивыравнивание; Поддержка ClustalW и Phrap | Нуклеотиды | Локальный или глобальный | П. Рихтерих и др. | 2003 г. (последняя версия 2009 г.) | |
Компас | Сравнение совпадений нескольких белковых последовательностей с оценкой статистической значимости | Белок | Глобальный | R.I. Sadreyev, et al. | 2009 | |
РАСШИФРОВАТЬ | Прогрессивно-итеративное выравнивание | Оба | Глобальный | Эрик С. Райт | 2014 | Бесплатно, лицензия GPL |
ДИАЛИГН-TX и ДИАЛИГН-Т | Сегментный метод | Оба | Локальный (предпочтительно) или глобальный | А.Р.Субраманян | 2005 г. (последняя версия 2008 г.) | |
Выравнивание ДНК | Сегментный метод внутривидового выравнивания | Оба | Локальный (предпочтительно) или глобальный | А.Рёль | 2005 г. (последняя версия 2008 г.) | |
Ассемблер базовых последовательностей ДНК | Мультивыравнивание; Полное автоматическое выравнивание последовательности; Автоматическое исправление неоднозначности; Внутренний абонент базы; Выравнивание последовательности командной строки | Нуклеотиды | Локальный или глобальный | Геракл Биософт ООО | 2006 г. (последняя версия 2018 г.) | Коммерческий (некоторые модули бесплатны) |
ДНКДинамо | связанная ДНК с белком, множественное выравнивание с помощью MUSCLE , Clustal и Smith-Waterman | Оба | Локальный или глобальный | ДНКДинамо | 2004 г. (новейшая версия 2017 г.) | |
ЭДНА | Энергетическое выравнивание множественных последовательностей для сайтов связывания ДНК | Нуклеотиды | Локальный или глобальный | Салама, Р.А. и др. | 2013 | |
ФАМСА | Прогрессивное выравнивание чрезвычайно больших семейств белков (сотни тысяч членов) | Белок | Глобальный | Деорович и др. | 2016 | Бесплатно, GPL 3 |
ФСА | Последовательный отжиг | Оба | Глобальный | Р.К. Брэдли и др. | 2008 | |
Гениальный | Прогрессивно-итеративное выравнивание; Плагин ClustalW | Оба | Локальный или глобальный | А. Дж. Драммонд и др. | 2005 г. (последняя версия 2017 г.) | |
РУКОВОДСТВО | Контроль качества и фильтрация множественных выравниваний последовательностей | Оба | Локальный или глобальный | О. Пенн и др. | 2010 г. (последняя версия 2015 г.) | |
Калигн | Прогрессивное выравнивание | Оба | Глобальный | Т. Лассманн | 2005 | |
МАКСЕ | Прогрессивно-итерационное выравнивание. Множественное выравнивание кодирующих последовательностей с учетом сдвигов рамки и стоп-кодонов. | Нуклеотиды | Глобальный | V. Ranwez et al. | 2011 г. (последняя версия, v2.07 2023 г.) | |
МАФФТ | Прогрессивно-итеративное выравнивание | Оба | Локальный или глобальный | К. Като и др. | 2005 | Бесплатно, БСД |
НИКОГДА | Мультивыравнивание РНК | РНК | Местный | С. Зиберт и др. | 2005 | |
МАВИД | Прогрессивное выравнивание | Оба | Глобальный | Н. Брей и Л. Пахтер | 2004 | |
MegAlign Pro (лазерная молекулярная биология) | Программное обеспечение для выравнивания последовательностей ДНК, РНК, белка или ДНК + белок с помощью алгоритмов парного и множественного выравнивания последовательностей, включая MUSCLE, Mauve, MAFFT, Clustal Omega, Jotun Hein, Wilbur-Lipman, Martinez Needleman-Wunsch, Lipman-Pearson и Dotplot анализ. | Оба | Локальный или глобальный | ДНКСТАР | 1993-2023 | |
MSA | Динамическое программирование | Оба | Локальный или глобальный | DJ Липман и др. | 1989 г. (изменено 1995 г.) | |
MSAProbs | Динамическое программирование | Белок | Глобальный | Ю. Лю, Б. Шмидт, Д. Маскелл | 2010 | |
МУЛТАЛ | Динамическое программирование-кластеризация | Оба | Локальный или глобальный | Ф. Тело | 1988 | |
Мульти-ЛАГАН | Прогрессивное динамическое согласование программирования | Оба | Глобальный | M. Brudno et al. | 2003 | |
МЫШЦЫ | Прогрессивно-итеративное выравнивание | Оба | Локальный или глобальный | Р. Эдгар | 2004 | |
Опал | Прогрессивно-итеративное выравнивание | Оба | Локальный или глобальный | Т. Уиллер и Дж. Кечечиоглу | 2007 г. (последняя стабильная версия 2013 г., последняя бета-версия 2016 г.) | |
пекан | Вероятностная согласованность | ДНК | Глобальный | Б. Патен и др. | 2008 | |
Фило | Человеческая вычислительная среда для сравнительной геномики для решения множественного выравнивания | Нуклеотиды | Локальный или глобальный | МакГилл Биоинформатика | 2010 | |
PMFastR | Прогрессивное выравнивание с учетом структуры | РНК | Глобальный | Д. ДеБлазио, Дж. Браунд, С. Чжан | 2009 | |
Пралине | Расширенное выравнивание прогрессивной итеративной согласованности-гомологии с предварительным профилированием и прогнозированием вторичной структуры. | Белок | Глобальный | Дж. Херринг | 1999 г. (последняя версия 2009 г.) | |
ПикXAA | Непрогрессивная регулировка с максимальной ожидаемой точностью | Оба | Глобальный | МСП Сахрейян и Би Джей Юн | 2010 | |
доверенность на доступ | Частичный порядок/скрытая марковская модель | Белок | Локальный или глобальный | К. Ли | 2002 | |
Пробалайн | Вероятностная/согласованность с вероятностями статистической суммы | Белок | Глобальный | Рошан и Ливси | 2006 | Бесплатно, общественное достояние |
ПробКонс | Вероятностная/согласованность | Белок | Локальный или глобальный | С. До и др. | 2005 | Бесплатно, общественное достояние |
ПРОМАЛС3D | Прогрессивное выравнивание/скрытая модель Маркова/Вторичная структура/3D-структура | Белок | Глобальный | Дж. Пей и др. | 2008 | |
ПРРН/ПРРП | Итеративное выравнивание (особенно уточнение) | Белок | Локальный или глобальный | Ю. Тотоки (по мотивам О. Гото) | 1991 и позже | |
PSAlign | Неэвристический метод с сохранением выравнивания | Оба | Локальный или глобальный | Ш. Сзе, Ю. Лу, Ц. Ян. | 2006 | |
РевТранс | Сочетает выравнивание ДНК и белка путем обратной трансляции выравнивания белка в ДНК. | ДНК/Белок (специальный) | Локальный или глобальный | Вернерссон и Педерсен | 2003 г. (новейшая версия 2005 г.) | |
САГА | Выравнивание последовательностей с помощью генетического алгоритма | Белок | Локальный или глобальный | К. Нотредам и др. | 1996 г. (новая версия 1998 г.) | |
ОДИН | Скрытая модель Маркова | Белок | Локальный или глобальный | А. Крог и др. | 1994 г. (последняя версия 2002 г.) | |
Тюлень | Ручное выравнивание | Оба | Местный | А. Рамбо | 2002 | |
StatAlign | Байесовская совместная оценка выравнивания и филогении (MCMC) | Оба | Глобальный | А. Новак и др. | 2008 | |
Голосовой поиск | Множественное выравнивание и прогнозирование вторичной структуры | РНК | Локальный или глобальный | И. Холмс | 2005 | Бесплатно, GPL 3 (часть DART ) |
Т-Кофе | Более чувствительное прогрессивное выравнивание | Оба | Локальный или глобальный | К. Нотредам и др. | 2000 г. (новейшая версия 2008 г.) | Бесплатно, GPL 2 |
ГЕН | Поддерживает множественное выравнивание с помощью MUSCLE , KAlign, Clustal и MAFFT. плагинов | Оба | Локальный или глобальный | Команда ЮГЕНЭ | 2010 г. (новейшая версия 2020 г.) | Бесплатно, GPL 2 |
ВекторДрузья | VectorFriends Aligner, плагин MUSCLE и Clustal W плагин | Оба | Локальный или глобальный | Команда BioFriends | 2013 | Проприетарное бесплатное ПО для академического использования. |
GLProbs | Адаптивный подход на основе парной скрытой марковской модели | Белок | Глобальный | Ю. Йе и др. | 2013 |
* Тип последовательности: белок или нуклеотид. ** Тип выравнивания: локальный или глобальный.
Геномный анализ
[ редактировать ]Имя | Описание | Тип последовательности* | |
---|---|---|---|
ОРЕЛ [32] | Сверхбыстрый инструмент для поиска относительно отсутствующих слов в геномных данных. | Нуклеотид | |
ACT (инструмент сравнения Artemis) | Синтения и сравнительная геномика | Нуклеотид | |
AVID | Попарное глобальное выравнивание с целыми геномами | Нуклеотид | |
БЛАТ | Выравнивание последовательностей кДНК с геномом. | Нуклеотид | |
РАСШИФРОВАТЬ | Выравнивание реаранжированных геномов с использованием 6-кадровой трансляции | Нуклеотид | |
зенитная артиллерия | Нечеткое выравнивание и анализ всего генома | Нуклеотид | |
ГМАП | Выравнивание последовательностей кДНК с геномом. Определяет места соединения с высокой точностью. | Нуклеотид | |
Сплайн | Выравнивание последовательностей кДНК с геномом. Определяет места соединения с высокой точностью. Способен распознавать и разделять дупликации генов. | Нуклеотид | |
Лиловый | Множественное выравнивание реаранжированных геномов | Нуклеотид | |
МГА | Множественный выравниватель генома | Нуклеотид | |
Мулан | Локальные множественные выравнивания последовательностей длины генома | Нуклеотид | |
Мультиз | Множественное выравнивание геномов | Нуклеотид | |
ПЛАСТ нкРНК | Поиск нкРНК в геномах путем локального выравнивания статистической суммы | Нуклеотид | |
секвером | Профилирование данных о выравнивании последовательностей с основными серверами/сервисами | Нуклеотид, пептид | |
Секилаб | Профилирование данных о выравнивании последовательностей на основе результатов NCBI-BLAST с основными серверами-сервисами. | Нуклеотид, пептид | |
Шафл-ЛАГАН | Попарное глобальное выравнивание завершенных областей генома | Нуклеотид | |
СИБсим4, Сим4 | Программа, предназначенная для выравнивания экспрессируемой последовательности ДНК с геномной последовательностью с учетом интронов. | Нуклеотид | |
СЛЭМ | Поиск генов, выравнивание, аннотация (идентификация гомологии человека и мыши) | Нуклеотид | |
СРПРИЗМА | Эффективный выравниватель сборок с явными гарантиями, выравнивающий чтения без сращиваний. | Нуклеотид |
* Тип последовательности: белок или нуклеотид.
Поиск мотива
[ редактировать ]Имя | Описание | Тип последовательности* |
---|---|---|
ПМС | Поиск и открытие мотивов | Оба |
ФММ | Поиск и обнаружение мотивов (также можно получить положительные и отрицательные последовательности в качестве входных данных для расширенного поиска мотивов) | Нуклеотид |
БЛОКИ | Идентификация неразрывных мотивов из базы данных BLOCKS | Оба |
ЭМОТИВ | Извлечение и идентификация более коротких мотивов | Оба |
Сэмплер мотива Гиббса | Извлечение стохастического мотива по статистической вероятности | Оба |
ХММТОП | Прогнозирование трансмембранных спиралей и топологии белков | Белок |
I-сайты | Библиотека мотивов локальной структуры | Белок |
JКойлы | Прогнозирование спиральной катушки и лейциновой молнии | Белок |
МЕМ /МАСТ | Обнаружение и поиск мотивов | Оба |
CUDA-МЕМ | Алгоритм MEME с ускорением графического процессора (v4.4.0) для кластеров графических процессоров | Оба |
СПАСИБО | Обнаружение и поиск дискриминативных мотивов | Оба |
PHI-взрыв | Инструмент поиска и выравнивания мотивов | Оба |
Филоскан | Инструмент поиска мотивов | Нуклеотид |
ПРАТТ | Генерация шаблонов для использования со ScanProsite | Белок |
СканПросайт | Инструмент поиска в базе данных мотивов | Белок |
ТИРЕСИАС | Извлечение мотивов и поиск в базе данных | Оба |
БАЗАЛЬТ | Поиск по нескольким мотивам и регулярным выражениям | Оба |
* Тип последовательности: белок или нуклеотид.
Бенчмаркинг
[ редактировать ]Имя | Авторы |
---|---|
ПФАМ 30.0 (2016 г.) | |
УМНЫЙ (2015) | Летунич, Копли, Шмидт, Чиссарелли, Доркс, Шульц, Понтинг, Борк |
БАЛИБАЗ 3 (2015) | Томпсон, Плевняк, Пох |
Оксбенч (2011) | Рагхава, Сирл, Одли, Барбер, Бартон |
Эталонная коллекция (2009) | Эдгар |
ХОМСТРАД (2005) | Мизугути |
ПРЕФАБ 4.0 (2005 г.) | Эдгар |
САБмарк (2004) | Ван Валле, Ластерс, Винс |
Согласование просмотрщиков, редакторов
[ редактировать ]См. список программного обеспечения для визуализации центровки .
Выравнивание последовательности короткого считывания
[ редактировать ]Имя | Описание | парный вариант | Используйте качество FASTQ | с разрывами | Многопоточный | Лицензия | Ссылка | Год | |
---|---|---|---|---|---|---|---|---|---|
Ариок | Вычисляет выравнивание Смита-Уотермана и качество отображения на одном или нескольких графических процессорах. Поддерживает выравнивание BS-seq. Обрабатывает от 100 000 до 500 000 операций чтения в секунду (зависит от данных, оборудования и настроенной чувствительности). | Да | Нет | Да | Да | Бесплатно, БСД | [33] | 2015 | |
БарраКУДА | Программа выравнивания короткого чтения с ускорением GPGPU преобразования Берроуза – Уиллера (FM-индекс), основанная на BWA, поддерживает выравнивание инделей с промежутками и расширениями. | Да | Нет | Да | Да, потоки POSIX и CUDA. | Бесплатно, лицензия GPL | |||
BBMap | Использует короткие кмеры для быстрой индексации генома; нет ограничений по размеру или количеству каркасов. Более высокая чувствительность и специфичность, чем у капп Берроуза-Уиллера, с такой же или большей скоростью. Выполняет глобальное выравнивание, оптимизированное с помощью аффинного преобразования, которое медленнее, но более точно, чем метод Смита-Уотермана. Обрабатывает данные Illumina, 454, PacBio, Sanger и Ion Torrent. Поддержка сращивания; способный обрабатывать длинные инделы и РНК-сек. Чистая Ява; работает на любой платформе. Используется Объединенным институтом генома . | Да | Да | Да | Да | Бесплатно, БСД | 2010 | ||
БФАСТ | Явный компромисс между временем и точностью с предварительной оценкой точности, поддерживаемый индексацией эталонных последовательностей. Оптимально сжимает индексы. Может обрабатывать миллиарды коротких чтений. Может обрабатывать вставки, удаления, SNP и цветовые ошибки (может сопоставлять чтение цветового пространства ABI SOLiD). Выполняет полное выравнивание Смита Уотермана. | Да, потоки POSIX | Бесплатно, лицензия GPL | [34] | 2009 | ||||
БигБВА | Запускает Burrows-Wheeler Aligner -BWA в кластере Hadoop . Он поддерживает алгоритмы BWA-MEM, BWA-ALN и BWA-SW, работая с парными и одиночными чтениями. Это подразумевает существенное сокращение времени вычислений при работе в кластере Hadoop, добавление масштабируемости и отказоустойчивости. | Да | Некачественная обрезка оснований | Да | Да | Бесплатно, GPL 3 | [35] | 2015 | |
ВЗРЫВ | Программа выравнивания нуклеотидов BLAST, медленная и неточная для коротких чтений, использует базу данных последовательностей (EST, последовательность Сэнгера), а не эталонный геном. | ||||||||
БЛАТ | Сделано Джимом Кентом . Может обрабатывать одно несоответствие на начальном этапе выравнивания. | Да, клиент-сервер | Проприетарное бесплатное программное обеспечение для академического и некоммерческого использования. | [36] | 2002 | ||||
Галстук-бабочка | Использует преобразование Берроуза-Уиллера для создания постоянного, многократно используемого индекса генома; 1,3 ГБ памяти, занимаемой геномом человека. Выравнивает более 25 миллионов операций чтения Illumina за 1 час процессора. Поддерживает политики выравнивания, подобные Maq и SOAP. | Да | Да | Нет | Да, потоки POSIX | Бесплатное, Художественное | [37] | 2009 | |
Миссис | Использует преобразование Берроуза-Уиллера для создания индекса генома. Он немного медленнее, чем Bowtie, но позволяет выполнять выравнивание. | Да | Некачественная обрезка оснований | Да | Да | Бесплатно, лицензия GPL | [38] | 2009 | |
БВА-ПССМ | Вероятностный выравниватель короткого считывания, основанный на использовании оценочных матриц для конкретной позиции (PSSM). Выравниватель является адаптируемым в том смысле, что он может учитывать показатели качества считываний и модели смещений конкретных данных, например, те, которые наблюдаются в древней ДНК, данных PAR-CLIP или геномах со смещенным нуклеотидным составом. [39] | Да | Да | Да | Да | Бесплатно, лицензия GPL | [39] | 2014 | |
КЭШХ | Количественное определение и управление большими объемами данных последовательностей короткого считывания. Пайплайн CASHX содержит набор инструментов, которые можно использовать вместе или по отдельности в виде модулей. Этот алгоритм очень точен для идеального попадания в эталонный геном. | Нет | Проприетарное бесплатное программное обеспечение для академического и некоммерческого использования. | ||||||
ливень | Краткое сопоставление с использованием Hadoop MapReduce | Да, Hadoop MapReduce | Бесплатное, Художественное | ||||||
CUDA-EC | Исправление ошибок выравнивания при коротком чтении с использованием графических процессоров. | Да, графический процессор включен | |||||||
КУШО | Совместимый с CUDA выравниватель короткого чтения для больших геномов на основе преобразования Берроуза – Уиллера. | Да | Да | Нет | Да (графический процессор включен) | Бесплатно, лицензия GPL | [40] | 2012 | |
КУШО2 | Выравнивание короткого и длинного чтения с пробелами на основе максимального точного совпадения начальных чисел. Этот выравниватель поддерживает как выравнивание по базовому пространству (например, от секвенаторов Illumina, 454, Ion Torrent и PacBio), так и выравнивание чтения по цветовому пространству ABI SOLiD. | Да | Нет | Да | Да | Бесплатно, лицензия GPL | 2014 | ||
CUSHAW2-графический процессор | Выравниватель короткого считывания CUSHAW2 с графическим ускорением. | Да | Нет | Да | Да | Бесплатно, лицензия GPL | |||
КУШО3 | Чувствительное и точное выравнивание по базовому и цветовому пространству при коротком чтении с гибридной затравкой | Да | Нет | Да | Да | Бесплатно, лицензия GPL | [41] | 2012 | |
DrFAST | Программное обеспечение для выравнивания сопоставления чтения, которое реализует игнорирование кэша для минимизации передачи в основную/кэш-память, такое как mrFAST и mrsFAST, однако оно разработано для платформы секвенирования SOLiD (чтение цветового пространства). Он также возвращает все возможные местоположения на карте для улучшения обнаружения структурных изменений. | Да | Да, для конструктивных изменений | Да | Нет | Бесплатно, БСД | |||
ЭЛАНД | Реализовано компанией Illumina. Включает выравнивание без разрывов с конечной длиной чтения. | ||||||||
ЭРН | Расширенное рандомизированное числовое выравнивание для точного выравнивания показаний NGS. Он может отображать считывания, обработанные бисульфитом. | Да | Некачественная обрезка оснований | Да | Многопоточность и поддержка MPI | Бесплатно, GPL 3 | |||
ГАСССТ | Находит глобальные совпадения коротких последовательностей ДНК с крупными банками ДНК. | Многопоточность | Лицензия CeCILL версии 2. | [42] | 2011 | ||||
драгоценный камень | Качественный движок выравнивания (полное картографирование с подстановками и инделами). Точнее и в несколько раз быстрее, чем BWA или Bowtie 1/2. Предоставляется множество автономных биологических приложений (картограф, разделенный картограф, картография и другие). | Да | Да | Да | Да | Бесплатно, GPL 3 | [43] | 2012 | |
Геналиче КАРТА | Сверхбыстрый и комплексный выравниватель считывания NGS с высокой точностью и небольшим объемом памяти. | Да | Некачественная обрезка оснований | Да | Да | Собственный , коммерческий | |||
гениальный ассемблер | Быстрый и точный ассемблер перекрытия, способный работать с любой комбинацией технологий секвенирования, длиной считывания, любой ориентацией спаривания, с любым размером спейсера для спаривания, с эталонным геномом или без него. | Да | Собственный , коммерческий | ||||||
ГенсерарНГС | Полная платформа с удобным графическим интерфейсом для анализа данных NGS. Он объединяет запатентованный высококачественный алгоритм выравнивания и возможность подключаемого модуля для интеграции различных общедоступных выравнивателей в структуру, позволяющую импортировать короткие чтения, выравнивать их, обнаруживать варианты и создавать отчеты. Он создан для переупорядочения проектов, а именно в диагностических целях. | Да | Нет | Да | Да | Собственный , коммерческий | |||
ГМАП и ГСНАП | Надежное и быстрое выравнивание при коротком чтении. GMAP: более длинные чтения, с множественными инделами и сплайсингами (см. запись выше в разделе «Геномный анализ»); GSNAP: более короткие чтения, с одной инделей или до двух склеек на каждое чтение. Полезно для цифровой экспрессии генов, SNP и indel-генотипирования. Разработан Томасом Ву из Genentech. Используется Национальным центром геномных ресурсов (NCGR) в Алфее. | Да | Да | Да | Да | Проприетарное бесплатное программное обеспечение для академического и некоммерческого использования. | |||
ГНУМАП | Точно выполняет выравнивание данных последовательности, полученных с помощью секвенаторов нового поколения (в частности, Solexa-Illumina), с геномом любого размера. Включает обрезку адаптера, вызов SNP и анализ последовательности бисульфита. | Да, также поддерживаются файлы Illumina *_int.txt и *_prb.txt со всеми 4 показателями качества для каждой базы. | Многопоточность и поддержка MPI | [44] | 2009 | ||||
УЛЕЙ-шестиугольник | Использует хеш-таблицу и матрицу Блума для создания и фильтрации потенциальных позиций в геноме. Для более высокой эффективности используется перекрестное сходство между короткими чтениями и избегается перераспределение неуникальных избыточных последовательностей. Он быстрее, чем Bowtie и BWA, и позволяет выполнять инделирование и дивергентное чувствительное выравнивание вирусов, бактерий и более консервативных эукариотических выравниваний. | Да | Да | Да | Да | Проприетарное бесплатное программное обеспечение для академических и некоммерческих пользователей, зарегистрированных в экземпляре развертывания HIVE. | [45] | 2014 | |
пойдем | Улучшен мета-выравниватель и Minimap2 в Spark. Распределенный выравниватель длительного чтения на платформе Apache Spark с линейной масштабируемостью при выполнении на одном узле. | Да | Да | Да | Бесплатно | ||||
Исаак | Полностью использует всю вычислительную мощность, доступную на одном серверном узле; таким образом, он хорошо масштабируется в широком диапазоне аппаратных архитектур, а производительность выравнивания улучшается с увеличением возможностей аппаратного обеспечения. | Да | Да | Да | Да | Бесплатно, лицензия GPL | |||
ПОСЛЕДНИЙ | Использует адаптивные семена и более эффективно справляется с последовательностями, богатыми повторами (например, геномами). Например: он может сопоставлять чтения с геномами без повторной маскировки и не перегружаться повторяющимися обращениями. | Да | Да | Да | Да | Бесплатно, лицензия GPL | [46] | 2011 | |
МАГ | Непрерывное согласование, учитывающее показатели качества для каждой базы. | Бесплатно, лицензия GPL | |||||||
мрФАСТ, мрФАСТ | Программное обеспечение для выравнивания с пробелами (mrFAST) и без пробелов (mrsFAST), которое реализует игнорирование кэша для минимизации передач основной/кэш-памяти. Они разработаны для платформы секвенирования Illumina и могут возвращать все возможные местоположения на карте для улучшения обнаружения структурных вариаций. | Да | Да, для конструктивных изменений | Да | Нет | Бесплатно, БСД | |||
МАМА | MOM или отображение максимального олигонуклеотида — это инструмент сопоставления запросов, который фиксирует совпадение максимальной длины в пределах короткого чтения. | Да | |||||||
МОЗАИКА | Устройство для быстрого выравнивания зазоров и ассемблер с ориентировочным руководством. Выравнивает считывания с использованием полосового алгоритма Смита-Уотермана, засеянного результатами схемы k-мерного хеширования. Поддерживает чтение размером от очень короткого до очень длинного. | Да | |||||||
MPscan | Быстрое выравнивание, основанное на стратегии фильтрации (без индексации, использование q-грамм и обратное недетерминированное DAWG сопоставление ) | [47] | 2009 | ||||||
Новоалайн и НовоалайнКС | Неправильное выравнивание одиночного и парного концов Illumina GA I и II, цветового пространства ABI и ION Torrent. Высокая чувствительность и специфичность, использование базовых качеств на всех этапах согласования. Включает обрезку адаптера, калибровку базового качества, выравнивание Bi-Seq и возможность сообщать о нескольких выравниваниях за одно считывание. Использование неоднозначных кодов IUPAC для обозначения общих SNP может улучшить запоминание SNP и устранить аллельную предвзятость. | Да | Да | Да | Версии с многопоточностью и MPI доступны по платной лицензии. | Собственная бесплатная . однопоточная версия для академического и некоммерческого использования | |||
СледующийGENe | Разработан для использования биологами, выполняющими анализ данных секвенирования следующего поколения с помощью секвенаторов генома Roche FLX, Illumina GA/HiSeq, систем SOLiD Life Technologies Applied BioSystems, платформ PacBio и Ion Torrent. | Да | Да | Да | Да | Собственный , коммерческий | |||
Карта следующего поколения | Гибкая и быстрая программа считывания картографических данных (в два раза быстрее, чем BWA), обеспечивающая чувствительность картографирования, сравнимую с Stampy. Внутренне использует эффективную индексную структуру памяти (хеш-таблицу) для хранения позиций всех 13-меров, присутствующих в эталонном геноме. Области отображения, где требуется попарное выравнивание, определяются динамически для каждого чтения. Использует быстрые инструкции SIMD (SSE) для ускорения вычислений выравнивания на ЦП. Если доступно, выравнивание вычисляется на графическом процессоре (с использованием OpenCL/CUDA), что дополнительно сокращает время выполнения на 20–50 %. | Да | Нет | Да | Да, потоки POSIX , OpenCL/ CUDA , SSE | Бесплатно | [48] | 2013 | |
Omixon Вариант инструментария | Включает высокочувствительные и высокоточные инструменты для обнаружения SNP и инделей. Он предлагает решение для картирования коротких ридов NGS на умеренном расстоянии (до 30% расхождения последовательностей) от эталонных геномов. Он не накладывает ограничений на размер эталона, что в сочетании с его высокой чувствительностью делает Variant Toolkit хорошо подходящим для проектов целевого секвенирования и диагностики. | Да | Да | Да | Да | Собственный , коммерческий | |||
PALMapper | Эффективно и с высокой точностью вычисляет как соединенные, так и несращенные выравнивания. Опираясь на стратегию машинного обучения в сочетании с быстрым отображением на основе полосового алгоритма, подобного Смиту-Уотерману, он выравнивает около 7 миллионов операций чтения в час на одном процессоре. Он совершенствует первоначально предложенный подход QPALMA. | Да | Бесплатно, лицензия GPL | ||||||
Партек Флоу | Для использования биологами и биоинформатиками. Он поддерживает выравнивание без зазора, с зазором и сращивания соединений на основе считывания с одиночных и парных концов из необработанных данных Illumina, Life Technologies Solid TM, Roche 454 и Ion Torrent (с информацией о качестве или без нее). Он объединяет мощный контроль качества на уровне FASTQ/Qual и согласованных данных. Дополнительные функции включают обрезку и фильтрацию необработанных считываний, обнаружение SNP и InDel, количественную оценку мРНК и микроРНК и обнаружение слитых генов. | Да | Да | Да | Возможна многопроцессорная, клиент-серверная установка. | Собственная , коммерческая , бесплатная пробная версия. | |||
ПРОХОДИТЬ | Индексирует геном, а затем расширяет семена, используя заранее рассчитанное выравнивание слов. Работает с базовым пространством, цветовым пространством (SOLID) и может выравнивать считывания геномных и сплайсированных РНК-seq. | Да | Да | Да | Да | Проприетарное бесплатное программное обеспечение для академического и некоммерческого использования. | |||
ПерМ | Индексирует геном с помощью периодических начальных значений для быстрого поиска совпадений с полной чувствительностью до четырех несоответствий. Он может отображать чтения Illumina и SOLiD. В отличие от большинства картографических программ, скорость увеличивается при большей длине чтения. | Да | Бесплатно, лицензия GPL | [49] | |||||
ПРИМЭКС | Индексирует геном с помощью таблицы поиска k-mer с полной чувствительностью до регулируемого количества несоответствий. Лучше всего подходит для картирования последовательностей длиной 15–60 п.н. в геноме. | Нет | Нет | Да | Нет, несколько процессов для каждого поиска | [1] | 2003 | ||
КПальма | Может использовать показатели качества, длины интронов и расчетные предсказания сайтов сплайсинга для выполнения беспристрастного выравнивания. Может быть обучен специфике эксперимента по секвенированию РНК и генома. Полезно для открытия сайтов сплайсинга/интронов и построения моделей генов. (См. PALMapper для более быстрой версии). | Да, клиент-сервер | Бесплатно, GPL 2 | ||||||
RazerS | Нет ограничения длины чтения. Хэмминг или редактирование карт расстояний с настраиваемой частотой ошибок. Настраиваемая и прогнозируемая чувствительность (соотношение времени выполнения и чувствительности). Поддерживает парное сопоставление чтения. | Бесплатно, LGPL | |||||||
НАСТОЯЩИЙ, НАСТОЯЩИЙ | REAL — это эффективный, точный и чувствительный инструмент для выравнивания коротких ридов, полученных в результате секвенирования нового поколения. Программа может обрабатывать огромное количество односторонних считываний, генерируемых анализатором генома Illumina/Solexa следующего поколения. cREAL — это простое расширение REAL для сопоставления коротких ридов, полученных в результате секвенирования следующего поколения, с геномом с кольцевой структурой. | Да | Да | Бесплатно, лицензия GPL | |||||
РМАП | Может сопоставлять чтения с информацией о вероятности ошибки или без нее (показатели качества) и поддерживает парное чтение или сопоставление чтения с бисульфитной обработкой. Ограничений на длину чтения или количество несоответствий нет. | Да | Да | Да | Бесплатно, GPL 3 | ||||
РНК | Рандомизированный числовой выравниватель для точного выравнивания показаний NGS. | Да | Некачественная обрезка оснований | Да | Многопоточность и поддержка MPI | Бесплатно, GPL 3 | |||
Следователь РТГ | Чрезвычайно быстрый, устойчивый к большому количеству операций удаления и замены. Включает полное выравнивание чтения. Продукт включает в себя комплексные конвейеры для обнаружения вариантов и метагеномного анализа с любой комбинацией данных Illumina, Complete Genomics и Roche 454. | Да | Да, для варианта вызова | Да | Да | Запатентованное бесплатное программное обеспечение для индивидуального использования исследователями. | |||
Зегемель | Может обрабатывать вставки, удаления, несоответствия; использует расширенные массивы суффиксов | Да | Нет | Да | Да | Проприетарное . бесплатное ПО для некоммерческого использования | [50] | 2009 | |
SeqMap | До 5 смешанных замен и инсерций-делеций; различные варианты настройки и форматы ввода-вывода | Проприетарное бесплатное программное обеспечение для академического и некоммерческого использования. | |||||||
Шрек | Исправление ошибок короткого чтения с помощью суффиксного дерева структуры данных | Да, Ява | |||||||
Креветка | Индексирует эталонный геном, начиная с версии 2. Использует маски для генерации возможных ключей. Может отображать чтение цветового пространства ABI SOLiD. | Да | Да | Да | Да, ОпенМП | Бесплатно, [[лицензии BSD | Бесплатная, BSD ]] производная | 2009-2011 | |
СЛАЙДЕР | Slider — это приложение для вывода результатов анализатора последовательностей Illumina, которое использует файлы «вероятности» вместо файлов последовательностей в качестве входных данных для выравнивания по эталонной последовательности или набору эталонных последовательностей. | Да | Да | Нет | Нет | [53] [54] | 2009-2010 | ||
SOAP, SOAP2, SOAP3, SOAP3-дп | SOAP: надежный, с небольшим (1–3) количеством пробелов и несоответствий. Улучшение скорости по сравнению с BLAT: используется хеш-таблица из 12 букв. SOAP2: использование двунаправленного BWT для построения индекса ссылок, и это намного быстрее, чем первая версия. SOAP3: версия с ускорением на графическом процессоре, которая может найти все выравнивания с четырьмя несоответствиями за десятки секунд на один миллион операций чтения. SOAP3-dp, также ускоренный на графическом процессоре, поддерживает произвольное количество несоответствий и пробелов в соответствии со штрафными баллами за аффинные пробелы. | Да | Нет | Да, SOAP3-дп | Да, потоки POSIX ; SOAP3, SOAP3-dp требует графического процессора с CUDA поддержкой | Бесплатно, лицензия GPL | [55] [56] | ||
СОКС | Для технологий ABI SOLiD. Значительное увеличение времени сопоставления считываний с несоответствиями (или ошибками цвета). Использует итеративную версию алгоритма поиска строк Рабина-Карпа. | Да | Бесплатно, лицензия GPL | ||||||
ИскраBWA | Интегрирует Burrows-Wheeler Aligner (BWA) в среду Apache Spark, работающую поверх Hadoop . Версия 0.2 от октября 2016 г. поддерживает алгоритмы BWA-MEM, BWA-backtrack и BWA-ALN. Все они работают с одиночными и парными чтениями. | Да | Некачественная обрезка оснований | Да | Да | Бесплатно, GPL 3 | [57] | 2016 | |
ССАХА, ССАХА2 | Быстро для небольшого количества вариантов | Проприетарное бесплатное программное обеспечение для академического и некоммерческого использования. | |||||||
Стэмпи | Ибо Illumina читает. Высокая специфичность и чувствительность к прочтениям с инделами, структурными вариантами или множеством SNP. Медленно, но скорость значительно возросла благодаря использованию BWA для первого прохода центровки. | Да | Да | Да | Нет | Проприетарное бесплатное программное обеспечение для академического и некоммерческого использования. | [58] | 2010 | |
СТоРМ | Для чтения Illumina или ABI SOLiD с собственным выводом SAM . Высокая чувствительность к операциям чтения с большим количеством ошибок, вставкам (полное от 0 до 15, в противном случае расширенная поддержка). Использует разнесенные начальные числа (одиночное попадание) и очень быстрый полосовой фильтр выравнивания SSE - SSE2 - AVX2 - AVX-512 . Только для чтения фиксированной длины авторы рекомендуют в противном случае SHRIMP2. | Нет | Да | Да | Да, ОпенМП | Бесплатно | [59] | 2010 | |
Подчтение, Подъюнкт | Сверхбыстрые и точные выравниватели считывания. Субчтение можно использовать для картирования чтений как gDNA-seq, так и RNA-seq. Subjunc обнаруживает соединения экзон-экзон и картирует считывания RNA-seq. Они используют новую парадигму картографии под названием « посев и голосование» . | Да | Да | Да | Да | Бесплатно, GPL 3 | |||
Магнат | Новый ассемблер для показаний Illumina | Проприетарное бесплатное программное обеспечение для академического и некоммерческого использования. | |||||||
ГЕН | Визуальный интерфейс для Bowtie и BWA, а также встроенный элайнер. | Да | Да | Да | Да | Бесплатно, лицензия GPL | |||
VelociMapper | Инструмент сопоставления выравнивания опорных последовательностей с ускорением FPGA от TimeLogic . Быстрее, чем преобразования Берроуза-Уиллера, алгоритмы на основе такие как BWA и Bowtie. Поддерживает до 7 несовпадений и/или замен без снижения производительности. Обеспечивает чувствительные выравнивания с зазором Смита-Уотермана. | Да | Да | Да | Да | Собственный , коммерческий | |||
XpressAlign | Выравниватель короткого чтения на основе FPGA, который использует смущающее параллельное свойство выравнивания короткого чтения. Производительность линейно масштабируется в зависимости от количества транзисторов на кристалле (т.е. производительность гарантированно удваивается с каждой итерацией закона Мура без изменения алгоритма). Низкое энергопотребление полезно для оборудования центров обработки данных. Предсказуемое время выполнения. Лучшее соотношение цены и качества, чем у программных выравнивателей раздвижных окон на современном оборудовании, но не лучше, чем у программных выравнивателей на основе BWT в настоящее время. Может управлять большим количеством (>2) несоответствий. Найдет все хитовые позиции для всех семян. Экспериментальная версия с одной FPGA нуждается в доработке, чтобы превратить ее в производственную версию с несколькими FPGA. | Проприетарное бесплатное программное обеспечение для академического и некоммерческого использования. | |||||||
ЗУМ | 100% чувствительность для прочтений от 15 до 240 п.н. с практическими несоответствиями. Очень быстро. Поддержка вставки и удаления. Работает с инструментами Illumina и SOLiD, а не с 454. | Да (GUI), нет (CLI) | Собственный , коммерческий | [60] |
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Альтшул С.Ф., Гиш В., Миллер В., Майерс Э.В., Липман DJ; Гиш; Миллер; Майерс; Липман (октябрь 1990 г.). «Базовый инструмент поиска локального выравнивания». Журнал молекулярной биологии . 215 (3): 403–10. дои : 10.1016/S0022-2836(05)80360-2 . ПМИД 2231712 . S2CID 14441902 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Репозиторий кода HPC-BLAST https://github.com/UTennessee-JICS/HPC-BLAST.
- ^ Ангермюллер, К.; Бигерт, А.; Сёдинг, Дж. (декабрь 2012 г.). «Дискриминативное моделирование вероятностей замены аминокислот в зависимости от контекста» . Биоинформатика . 28 (24): 3240–7. doi : 10.1093/биоинформатика/bts622 . hdl : 11858/00-001M-0000-0015-8D22-F . ПМИД 23080114 .
- ^ Бухфинк, Се и Хьюсон (2015). «Быстрое и чувствительное выравнивание белков с помощью DIAMOND». Природные методы . 12 (1): 59–60. дои : 10.1038/nmeth.3176 . ПМИД 25402007 . S2CID 5346781 .
- ^ Б. Бухфинк, К. Рейтер и Х. Г. Дрост (2021). «Чувствительное выравнивание белков в масштабе древа жизни с использованием DIAMOND» . Природные методы . 18 (4): 366–368. дои : 10.1038/s41592-021-01101-x . ПМК 8026399 . ПМИД 33828273 .
- ^ Дурбин, Ричард; Эдди, Шон Р.; Крог, Андерс ; Митчисон, Грэм, ред. (1998). Анализ биологических последовательностей: вероятностные модели белков и нуклеиновых кислот . Кембридж, Великобритания: Издательство Кембриджского университета. ISBN 978-0-521-62971-3 . [ нужна страница ]
- ^ Сёдинг Дж. (апрель 2005 г.). «Обнаружение гомологии белков путем сравнения HMM-HMM» . Биоинформатика . 21 (7): 951–60. doi : 10.1093/биоинформатика/bti125 . hdl : 11858/00-001M-0000-0017-EC7A-F . ПМИД 15531603 .
- ^ Реммерт, Майкл; Бигерт, Андреас; Хаузер, Андреас; Сёдинг, Йоханнес (25 декабря 2011 г.). «HHblits: молниеносный итеративный поиск белковой последовательности путем выравнивания HMM-HMM». Природные методы . 9 (2): 173–175. дои : 10.1038/nmeth.1818 . hdl : 11858/00-001M-0000-0015-8D56-A . ISSN 1548-7105 . ПМИД 22198341 . S2CID 205420247 .
- ^ Хаусведелл Х., Сингер Дж., Райнерт К. (1 сентября 2014 г.). «Лямбда: локальный выравниватель для массивных биологических данных» . Биоинформатика . 30 (17): 349–355. doi : 10.1093/биоинформатика/btu439 . ПМК 4147892 . ПМИД 25161219 .
- ^ Штайнеггер, Мартин; Соединг, Йоханнес (16 октября 2017 г.). «MMseqs2 обеспечивает чувствительный поиск белковых последовательностей для анализа огромных наборов данных» . Природная биотехнология . 35 (11): 1026–1028. дои : 10.1038/nbt.3988 . hdl : 11858/00-001M-0000-002E-1967-3 . ПМИД 29035372 . S2CID 402352 .
- ^ Руччи, Энцо; Гарсия, Карлос; Ботелла, Гильермо; Джусти, Армандо Э. Де; Науф, Марсело; Прието-Матиас, Мануэль (30 июня 2016 г.). «ОСВАЛЬД: OpenCL Смита-Уотермана о FPGA Altera для больших баз данных белков» . Международный журнал приложений для высокопроизводительных вычислений . 32 (3): 337–350. дои : 10.1177/1094342016654215 . ISSN 1094-3420 . S2CID 212680914 .
- ^ Альтшул С.Ф., Мэдден Т.Л., Шеффер А.А. и др. (сентябрь 1997 г.). «Gapped BLAST и PSI-BLAST: новое поколение программ поиска по базам данных белков» . Исследования нуклеиновых кислот . 25 (17): 3389–402. дои : 10.1093/нар/25.17.3389 . ПМК 146917 . ПМИД 9254694 .
- ^ Ли В., МакВильям Х., Гужон М. и др. (июнь 2012 г.). «PSI-Search: итеративный поиск SSEARCH профиля с сокращенным HOE» . Биоинформатика . 28 (12): 1650–1651. doi : 10.1093/биоинформатика/bts240 . ПМЦ 3371869 . ПМИД 22539666 .
- ^ Омен, К.; Неплоча, Дж. (август 2006 г.). «ScalaBLAST: масштабируемая реализация BLAST для высокопроизводительного биоинформатического анализа с интенсивным использованием данных» . Транзакции IEEE в параллельных и распределенных системах . 17 (8): 740–749. дои : 10.1109/TPDS.2006.112 . S2CID 11122366 .
- ^ Хьюи, Р.; Карплюс, К.; Крог, А. (2003). SAM: система программного обеспечения для выравнивания последовательностей и моделирования. Технический отчет UCSC-CRL-99-11 (Отчет). Калифорнийский университет, Санта-Круз, Калифорния.
- ^ Руччи, Энцо; Гарсиа, Карлос; Ботелла, Гильермо; Де Джусти, Армандо; Науф, Марсело; Прието-Матиас, Мануэль (25 декабря 2015 г.). «Анализ производительности SWIMM с учетом энергопотребления: реализация Смита – Уотермана на многоядерных и многоядерных архитектурах Intel» . Параллелизм и вычисления: практика и опыт . 27 (18): 5517–5537. дои : 10.1002/cpe.3598 . hdl : 11336/53930 . ISSN 1532-0634 . S2CID 42945406 .
- ^ Руччи, Энцо; Гарсия, Чарльз; Бутылка, Уильям; Де Джусти, Армандо; Науф, Марсело; Прието-Матиас, Мануэль (25 декабря 2015 г.). «SWIMM 2.0: Улучшенный Смит-Уотерман для многоядерных и многоядерных архитектур Intel на основе векторных расширений AVX-512» . Международный журнал параллельного программирования . 47 (2): 296–317. дои : 10.1007/ s10766-018-0585-7 ISSN 1573-7640 . S2CID 49670113 .
- ^ Шварц С., Кент В.Дж., Смит А., Чжан З., Берч Р., Хардисон Р.К., Хаусслер Д., Миллер В.; Кент; Смит; Чжан; Берч; Хардисон; Хаусслер; Миллер (2003). «Согласование человека и мыши с помощью BLASTZ» . Геномные исследования . 13 (1): 103–107. дои : 10.1101/гр.809403 . ПМК 430961 . ПМИД 12529312 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Харрис Р.С. (2007). Улучшенное попарное выравнивание геномной ДНК (Диссертация).
- ^ Сандес, Эданс Ф. де О.; де Мело, Альба Кристина, Массачусетс (май 2013 г.). «Получение выравниваний Смита-Уотермана с оптимизацией для биологических последовательностей мегабазы с использованием графического процессора». Транзакции IEEE в параллельных и распределенных системах . 24 (5): 1009–1021. дои : 10.1109/TPDS.2012.194 .
- ^ Сандес, Эданс Ф. де О.; Миранда, Г.; Де Мело, ACMA; Марторелл, X.; Айгуад, Э. (май 2014 г.). CUDAlign 3.0: параллельное сравнение биологических последовательностей в больших кластерах графических процессоров . Кластерные, облачные и грид-вычисления (CCGrid), 2014 г., 14-й международный симпозиум IEEE/ACM. п. 160. дои : 10.1109/CCGrid.2014.18 .
- ^ Сандес, Эданс Ф. де О.; Миранда, Г.; Де Мело, ACMA; Марторелл, X.; Айгуад, Э. (август 2014 г.). Подробное сравнение параллельных мегабазовых последовательностей с несколькими гетерогенными графическими процессорами . Материалы 19-го симпозиума ACM SIGPLAN по принципам и практике параллельного программирования. стр. 383–384. дои : 10.1145/2555243.2555280 .
- ^ Чивиан, Д; Бейкер, Д. (2006). «Моделирование гомологии с использованием генерации ансамбля параметрического выравнивания с консенсусом и выбором модели на основе энергии» . Исследования нуклеиновых кислот . 34 (17): е112. дои : 10.1093/nar/gkl480 . ПМЦ 1635247 . ПМИД 16971460 .
- ^ Гирдеа, М; Ноэ, Л; Кучеров, Г (январь 2010 г.). «Обратный перевод для обнаружения отдаленных гомологий белков при наличии мутаций сдвига рамки считывания» . Алгоритмы молекулярной биологии . 5 (6): 6. дои : 10.1186/1748-7188-5-6 . ПМЦ 2821327 . ПМИД 20047662 .
- ^ Ма, Б.; Тромп, Дж.; Ли, М. (2002). «PatternHunter: более быстрый и чувствительный поиск гомологии» . Биоинформатика . 18 (3): 440–445. дои : 10.1093/биоинформатика/18.3.440 . ПМИД 11934743 .
- ^ Ли, М.; Ма, Б.; Кисман, Д.; Тромп, Дж. (2004). «Patternhunter II: высокочувствительный и быстрый поиск гомологии». Журнал биоинформатики и вычислительной биологии . 2 (3): 417–439. CiteSeerX 10.1.1.1.2393 . дои : 10.1142/S0219720004000661 . ПМИД 15359419 .
- ^ Гасфилд, Дэн (1997). Алгоритмы на строках, деревьях и последовательностях . Издательство Кембриджского университета. ISBN 978-0-521-58519-4 .
- ^ Руччи, Энцо; Гарсия, Карлос; Ботелла, Гильермо; Науф, Марсело; Де Джусти, Армандо; Прието-Матиас, Мануэль (2018). «SWIFOLD: реализация Смита-Уотермана на FPGA с OpenCL для длинных последовательностей ДНК» . Системная биология BMC . 12 (Приложение 5): 96. doi : 10.1186/s12918-018-0614-6 . ПМК 6245597 . ПМИД 30458766 .
- ^ Руччи, Энцо; Гарсия, Карлос; Ботелла, Гильермо; Науф, Марсело; Де Джусти, Армандо; Прието-Матиас, Мануэль. Ускорение выравнивания Смита-Уотермана длинных последовательностей ДНК с помощью OpenCL на FPGA . 5-я Международная рабочая конференция по биоинформатике и биомедицинской инженерии. стр. 500–511. дои : 10.1007/978-3-319-56154-7_45 .
- ^ Расмуссен К., Стой Дж., Майерс Э.В.; Стой; Майерс (2006). «Эффективные фильтры q-грамм для поиска всех совпадений эпсилон на заданной длине». Журнал вычислительной биологии . 13 (2): 296–308. CiteSeerX 10.1.1.465.2084 . дои : 10.1089/cmb.2006.13.296 . ПМИД 16597241 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Ной Л, Кучеров Г; Кучеров (2005). «YASS: повышение чувствительности поиска по сходству ДНК» . Исследования нуклеиновых кислот . 33 (дополнение_2): W540–W543. дои : 10.1093/nar/gki478 . ПМК 1160238 . ПМИД 15980530 .
- ^ ПРАТЕС, Диого; Сильва, Хорхе (2020). «Минимальные стойкие последовательности SARS-CoV-2» . Биоинформатика . 36 (21): 5129–5132. doi : 10.1093/биоинформатика/btaa686 . ПМК 7559010 . ПМИД 32730589 .
- ^ Уилтон, Ричард; Будавари, Тамас; Лэнгмид, Бен; Уилан, Сара Дж.; Зальцберг, Стивен Л.; Салай, Александр С. (2015). «Arioc: высокопроизводительное выравнивание чтения с ускорением графического процессора исследования пространства поиска с начальным и расширением» . ПерДж . 3 : е808. дои : 10.7717/peerj.808 . ПМЦ 4358639 . ПМИД 25780763 .
- ^ Гомер, Нильс; Мерриман, Барри; Нельсон, Стэнли Ф. (2009). «BFAST: инструмент выравнивания для крупномасштабного повторного секвенирования генома» . ПЛОС ОДИН . 4 (11): е7767. Бибкод : 2009PLoSO...4.7767H . дои : 10.1371/journal.pone.0007767 . ПМК 2770639 . ПМИД 19907642 .
- ^ Абуин, Дж. М.; Пичел, Дж. К.; Пена, ТФ; Амиго, Дж. (2015). «BigBWA: подход к согласованию Берроуза-Уиллера с технологиями больших данных» . Биоинформатика . 31 (24): 4003–5. doi : 10.1093/биоинформатика/btv506 . ПМИД 26323715 .
- ^ Кент, WJ (2002). «BLAT — инструмент выравнивания, подобный BLAST» . Геномные исследования . 12 (4): 656–664. дои : 10.1101/гр.229202 . ISSN 1088-9051 . ПМК 187518 . ПМИД 11932250 .
- ^ Лэнгмид, Бен; Трапнелл, Коул; Поп, Михай; Зальцберг, Стивен Л. (2009). «Сверхбыстрое и эффективное для памяти выравнивание коротких последовательностей ДНК с геномом человека» . Геномная биология . 10 (3): 25 рандов. дои : 10.1186/gb-2009-10-3-r25 . ISSN 1465-6906 . ПМК 2690996 . ПМИД 19261174 .
- ^ Ли, Х.; Дурбин, Р. (2009). «Быстрое и точное выравнивание короткого чтения с помощью преобразования Берроуза – Уиллера» . Биоинформатика . 25 (14): 1754–1760. doi : 10.1093/биоинформатика/btp324 . ISSN 1367-4803 . ПМК 2705234 . ПМИД 19451168 .
- ^ Jump up to: а б Керпеджиев, Петр; Фреллсен, Джес; Линдгрин, Стинус; Крог, Андерс (2014). «Адаптируемое вероятностное отображение коротких чтений с использованием оценочных матриц для конкретной позиции» . БМК Биоинформатика . 15 (1): 100. дои : 10.1186/1471-2105-15-100 . ISSN 1471-2105 . ПМК 4021105 . ПМИД 24717095 .
- ^ Лю, Ю.; Шмидт, Б.; Маскелл, Д.Л. (2012). «CUSHAW: совместимый с CUDA выравниватель короткого чтения для больших геномов на основе преобразования Берроуза-Уиллера» . Биоинформатика . 28 (14): 1830–1837. doi : 10.1093/биоинформатика/bts276 . ISSN 1367-4803 . ПМИД 22576173 .
- ^ Лю, Ю.; Шмидт, Б. (2012). «Выравнивание при длинном чтении на основе максимального точного совпадения начальных чисел» . Биоинформатика . 28 (18): i318–i324. doi : 10.1093/биоинформатика/bts414 . ISSN 1367-4803 . ПМЦ 3436841 . ПМИД 22962447 .
- ^ Ризк, Гийом; Лавенье, Доминик (2010). «GASSST: инструмент поиска коротких последовательностей глобального выравнивания» . Биоинформатика . 26 (20): 2534–2540. doi : 10.1093/биоинформатика/btq485 . ПМК 2951093 . ПМИД 20739310 .
- ^ Марко-Сола, Сантьяго; Саммет, Майкл; Гиго, Родерик; Рибека, Паоло (2012). «Картограф GEM: быстрое, точное и универсальное выравнивание путем фильтрации». Природные методы . 9 (12): 1185–1188. дои : 10.1038/nmeth.2221 . ISSN 1548-7091 . ПМИД 23103880 . S2CID 2004416 .
- ^ Клемент, Нидерланды; Снелл, К.; Клемент, MJ; Холленхорст, ПК; Пурвар, Дж.; Грейвс, Би Джей; Кэрнс, Британская Колумбия; Джонсон, МЫ (2009). «Алгоритм GNUMAP: несмещенное вероятностное картирование олигонуклеотидов в результате секвенирования следующего поколения» . Биоинформатика . 26 (1): 38–45. doi : 10.1093/биоинформатика/btp614 . ISSN 1367-4803 . ПМК 6276904 . ПМИД 19861355 .
- ^ Сантана-Кинтеро, Луис; Дингердиссен, Хейли; Тьерри-Миг, Жан; Мазумдер, Раджа; Симонян, Ваган (2014). «HIVE-Hexagon: Высокопроизводительное параллельное выравнивание последовательностей для анализа данных секвенирования следующего поколения» . ПЛОС ОДИН . 9 (6): 1754–1760. Бибкод : 2014PLoSO...999033S . дои : 10.1371/journal.pone.0099033 . ПМК 4053384 . ПМИД 24918764 .
- ^ Кильбаса, СМ; Ван, Р.; Сато, К.; Хортон, П.; Фрит, MC (2011). «Адаптивные семена приручают сравнение геномных последовательностей» . Геномные исследования . 21 (3): 487–493. дои : 10.1101/гр.113985.110 . ПМК 3044862 . ПМИД 21209072 .
- ^ Соперники, Эрик; Салмела, Лина; Киискинен, Петтери; Калси, Петри; Тархио, Йорма (2009). «Mpscan: быстрая локализация множественных чтений в геномах». Алгоритмы в биоинформатике . Конспекты лекций по информатике. Том. 5724. стр. 246–260. Бибкод : 2009LNCS.5724..246R . CiteSeerX 10.1.1.156.928 . дои : 10.1007/978-3-642-04241-6_21 . ISBN 978-3-642-04240-9 . S2CID 17187140 .
- ^ Седлажек, Фриц Дж.; Решенедер, Филипп; фон Хэзелер, Арндт (2013). «NextGenMap: быстрое и точное картирование чтения в высокополиморфных геномах» . Биоинформатика . 29 (21): 2790–2791. doi : 10.1093/биоинформатика/btt468 . ПМИД 23975764 .
- ^ Чен, Янхо; Суаяя, Таде; Чен, Тин (2009). «PerM: эффективное сопоставление коротких считываний секвенирования с периодическими полностью чувствительными разнесенными семенами» . Биоинформатика . 25 (19): 2514–2521. doi : 10.1093/биоинформатика/btp486 . ПМЦ 2752623 . ПМИД 19675096 .
- ^ Сирлс, Дэвид Б.; Хоффманн, Стив; Отто, Кристиан; Курц, Стефан; Шарма, Синтия М.; Хаитович, Филипп; Фогель, Йорг; Стадлер, Питер Ф.; Хакермюллер, Йорг (2009). «Быстрое сопоставление коротких последовательностей с несоответствиями, вставками и удалениями с использованием индексных структур» . PLOS Вычислительная биология . 5 (9): e1000502. Бибкод : 2009PLSCB...5E0502H . дои : 10.1371/journal.pcbi.1000502 . ISSN 1553-7358 . ПМЦ 2730575 . ПМИД 19750212 .
- ^ Рамбл, Стивен М.; Лакрут, Фил; Далка, Адриан В.; Фиуме, Марк; Сидов, Аренд; Брудно, Михаил (2009). «SHRIMP: точное отображение коротких чтений цветового пространства» . PLOS Вычислительная биология . 5 (5): e1000386. Бибкод : 2009PLSCB...5E0386R . дои : 10.1371/journal.pcbi.1000386 . ПМЦ 2678294 . ПМИД 19461883 .
- ^ Дэвид, Матей; Дзамба, Миско; Листер, Дэн; Илие, Люциан; Брудно, Михаил (2011). «SHRIMP2: чувствительное, но практичное картографирование короткого чтения» . Биоинформатика . 27 (7): 1011–1012. doi : 10.1093/биоинформатика/btr046 . ПМИД 21278192 .
- ^ Малхис, Навар; Баттерфилд, Ярон С.Н.; Эстер, Мартин; Джонс, Стивен Дж. М. (2009). «Слайдер — максимальное использование информации о вероятности для выравнивания считываний коротких последовательностей и обнаружения SNP» . Биоинформатика . 25 (1): 6–13. doi : 10.1093/биоинформатика/btn565 . ПМЦ 2638935 . ПМИД 18974170 .
- ^ Малхис, Навар; Джонс, Стивен Дж. М. (2010). «Высококачественные вызовы SNP с использованием данных Illumina при небольшой зоне покрытия». Биоинформатика . 26 (8): 1029–1035. doi : 10.1093/биоинформатика/btq092 . ПМИД 20190250 .
- ^ Ли, Р.; Ли, Ю.; Кристиансен, К.; Ван, Дж. (2008). «SOAP: программа выравнивания коротких олигонуклеотидов» . Биоинформатика . 24 (5): 713–714. doi : 10.1093/биоинформатика/btn025 . ISSN 1367-4803 . ПМИД 18227114 .
- ^ Ли, Р.; Ю, Ц.; Ли, Ю.; Лам, Т.-В.; Ю, С.-М.; Кристиансен, К.; Ван, Дж. (2009). «SOAP2: улучшенный сверхбыстрый инструмент для выравнивания короткого чтения». Биоинформатика . 25 (15): 1966–1967. doi : 10.1093/биоинформатика/btp336 . ISSN 1367-4803 . ПМИД 19497933 .
- ^ Абуин, Джозеф М.; Пичел, Джон К.; Пенья, Томас Ф.; Друг, Джордж (16 мая 2016 г.). «SparkBWA: ускорение согласования данных высокопроизводительного секвенирования ДНК» . ПЛОС ОДИН 11 (5): e0155461. Бибкод : 2016PLoSO..1155461A . дои : 10.1371/journal.pone.0155461 . ISSN 1932-6203 . ПМЦ 4868289 . ПМИД 27182962 .
- ^ Лантер, Г.; Гудсон, М. (2010). «Stampy: статистический алгоритм для чувствительного и быстрого картирования считываний последовательностей Illumina» . Геномные исследования . 21 (6): 936–939. дои : 10.1101/гр.111120.110 . ISSN 1088-9051 . ПМК 3106326 . ПМИД 20980556 .
- ^ Ноэ, Л.; Гирдеа, М.; Кучеров, Г. (2010). «Разработка эффективных разнесенных начальных чисел для сопоставления чтения SOLiD» . Достижения биоинформатики . 2010 : 708501. doi : 10.1155/2010/708501 . ПМЦ 2945724 . ПМИД 20936175 .
- ^ Лин, Х.; Чжан, З.; Чжан, MQ; Ма, Б.; Ли, М. (2008). «ZOOM! Нанесены на карту миллионы олигонуклеотидов» . Биоинформатика . 24 (21): 2431–2437. doi : 10.1093/биоинформатика/btn416 . ПМЦ 2732274 . ПМИД 18684737 .