Пакет для краткого анализа олигонуклеотидов
SOAP (Пакет анализа коротких олигонуклеотидов) — это набор для биоинформатики программных инструментов от отдела биоинформатики BGI , позволяющий собирать, выравнивать и анализировать данные секвенирования ДНК следующего поколения . Он особенно подходит для данных секвенирования короткого считывания .
Все программы в пакете SOAP можно использовать бесплатно и распространяются под GPL лицензией на программное обеспечение с открытым исходным кодом .
Функциональность [ править ]
Набор инструментов SOAP можно использовать для выполнения следующих задач сборки генома:
Выравнивание последовательности [ править ]
SOAPaligner (SOAP2) специально разработан для быстрого выравнивания коротких чтений и превосходно работает по сравнению с аналогичными инструментами выравнивания, такими как Bowtie и MAQ. [1]
Сборка генома [ править ]
SOAPdenovo — это короткий ассемблер нового чтения, использующий конструкцию графа Де Брёйна . Он оптимизирован для коротких чтений, например, созданных Illumina , и способен собирать большие геномы, такие как геном человека. [2] SOAPdenovo использовался для сборки генома гигантской панды . [3] Он был обновлен до SOAPdenovo2, который был оптимизирован для больших геномов и включал широко используемый модуль GapCloser. [4]
Сборка транскриптома [ править ]
SOAPdenovo-Trans — это de novo сборщик транскриптома , разработанный специально для RNA-Seq и созданный для проекта «1000 геномов растений» . [5]
Индел Дискавери [ править ]
SOAPindel — это инструмент для поиска вставок и удалений в данных парного секвенирования следующего поколения, предоставляющий список кандидатов на вставки с показателями качества. [6]
SNP Discovery [ править ]
SOAPsnp — это построитель согласованных последовательностей. Этот инструмент использует выходные данные SOAPaligner для создания согласованной последовательности, которая позволяет SNP вызывать у вновь секвенированного человека.
вариаций структурных Открытие
SOAPsv — это инструмент для поиска структурных вариаций с использованием сборки всего генома. [7]
Контроль качества и предварительная обработка [ править ]
SOAPnuke — это инструмент для комплексного контроля качества и предварительной обработки наборов данных геномных экспериментов, экспериментов по малой РНК , цифровой экспрессии генов и метагеномных экспериментов. [8]
История [ править ]
SOAP v1 [ править ]
Первый выпуск SOAP состоял только из выравнивания последовательностей инструмента SOAPaligner . [9]
SOAP v2 [ править ]
SOAP v2 [1] расширен и улучшен SOAP v1 за счет значительного повышения производительности инструмента SOAPaligner . Время выравнивания сократилось в 20-30 раз, а использование памяти сократилось в 3 раза. Добавлена поддержка сжатых форматов файлов.
Затем пакет SOAP был расширен за счет новых инструментов: SOAPdenovo 1&2, SOAPindel, SOAPsnp и SOAPsv.
SOAP v3 [ править ]
SOAP v3 расширил инструмент выравнивания, став первым инструментом выравнивания с коротким чтением, использующим процессоры графического процессора. [10] В результате этих улучшений SOAPalign значительно превзошёл конкурирующие системы выравнивания Bowtie и BWA по скорости .
См. также [ править ]
Внешние ссылки [ править ]
- http://soap.genomics.org.cn. Архивировано 24 декабря 2018 г. в Wayback Machine.
- http://soap.genomics.org.cn/soap1
- http://bioinformatics.genomics.org.cn
- http://seqanswers.com/forums/showthread.php?t=43
Ссылки [ править ]
- ↑ Перейти обратно: Перейти обратно: а б Ли, Р.; Ю, Ц.; Ли, Ю.; Лам, Т.-В.; Ю, С.-М.; Кристиансен, К.; Ван, Дж. (2009). «SOAP2: улучшенный сверхбыстрый инструмент для выравнивания короткого чтения». Биоинформатика . 25 (15): 1966–1967. doi : 10.1093/биоинформатика/btp336 . ISSN 1367-4803 . ПМИД 19497933 .
- ^ Ли, Р.; Чжу, Х.; Руан, Дж.; Цянь, В.; Фанг, X.; Ши, З.; Ли, Ю.; Ли, С.; Шан, Г.; Кристиансен, К.; Ли, С.; Ян, Х.; Ван, Дж.; Ван, Дж. (2009). «Сборка геномов человека de novo с помощью массово параллельного секвенирования короткого чтения» . Геномные исследования . 20 (2): 265–272. дои : 10.1101/гр.097261.109 . ISSN 1088-9051 . ПМЦ 2813482 . ПМИД 20019144 .
- ^ Ли, Жуйцян; Тянь, Чжу, Хунмэй; Цай, Цюаньфэй; Ли, Бо; Чжан, Чжихэ; Ван, Вэнь, Цзюнь; Вэй, Ли, Хэн; Ли, Цзяньвэнь; Нильсен, Расмус; Гу, Ванцзюнь; А.; Фредерик Чи-Чинг; Цао, Цзяньцзюнь; Сяо и др ( 2009 . Оливер . ) : 311–317. Бибкод : 2010Natur.463..311L . doi : nature08696 . ISSN 0028-0836 . PMC 3951497. . PMID 20010809 10.1038 /
- ^ Ло, Жуйбан; Се, Иньлун; Хуан, Вэйхуа; Хэ, Гуанчжоу; Пань, Ци; Юнцзе2 : эмпирически улучшенная эффективность памяти . короткий ассемблер нового чтения» . GigaScience . 1 (1): 18. doi : /2047-217X-1-18 . PMC 3626529. . PMID 23587118 10.1186
- ^ Се, Иньлун; Тан, Цзинбо; Паттерсон, Джордан; Хуан, Вэйхуа; Гу, Шэнчан; Ли, Чжоу, Синь (2014-06-15). . с короткими чтениями РНК» novo / 30 ( 12 ): : doi 4532719 : сборка транскриптома de - Trans 10.1093 btu077 . bioinformatics « SOAPdenovo . / . 1660–1666
- ^ Ли, Шэнтин; Ли, Жуйцян; Ли, Хэн; Лу, Цзяньлян; Ли, Инжуй; Болунд, Ларс; Шируп, Миккель Х.; Ван, Цзюнь (01 января 2013 г.). «SOAPindel: эффективная идентификация инделей из коротких парных чтений» . Геномные исследования . 23 (1): 195–200. дои : 10.1101/гр.132480.111 . ISSN 1088-9051 . ПМЦ 3530679 . ПМИД 22972939 .
- ^ , Инжуй, Луо, Жуйбан; У, Чжу, Хунмей; Цао, Хунчжи; Хуан, Шуцзя; Ма, Ханьчжоу (август 2011 г.). Ли вариации в двух геномах человека, картированные с разрешением в один нуклеотид путем сборки всего генома de novo» . Nature Biotechnology . 29 (8): 723–730. doi : 10.1038/nbt.1904 . ISSN 1546-1696 . PMID 21785424 .
- ^ Чэнь, Юншэн; Хуан, Чжибо; Ли, Янь; Юй, Чжан; «SOAPnuke: программное обеспечение с поддержкой ускорения MapReduce качества и предварительной обработки данных высокопроизводительного секвенирования» . GigaScience . 7 (1): 1–6. 10.1093 / gix120 . doi gigascience : / контроля для комплексного
- ^ Ли, Р.; Ли, Ю.; Кристиансен, К.; Ван, Дж. (2008). «SOAP: программа выравнивания коротких олигонуклеотидов» . Биоинформатика . 24 (5): 713–714. doi : 10.1093/биоинформатика/btn025 . ISSN 1367-4803 . ПМИД 18227114 .
- ^ Лю, К.-М.; Вонг, Т.; Ву, Э.; Луо, Р.; Ю, С.-М.; Ли, Ю.; Ван, Б.; Ю, Ц.; Чу, X.; Чжао, К.; Ли, Р.; Лам, Т.-В. (2012). «SOAP3: сверхбыстрый инструмент параллельного выравнивания на базе графического процессора для короткого чтения» . Биоинформатика . 28 (6): 878–879. doi : 10.1093/биоинформатика/bts061 . ISSN 1367-4803 . ПМИД 22285832 .