Jump to content

Список инструментов биоинформатики RNA-Seq

РНК-Seq [1] [2] [3] это техника [4] что позволяет проводить исследования транскриптома (см. также «Технологии транскриптомики» ) на основе технологий секвенирования нового поколения . Этот метод во многом зависит от инструментов биоинформатики, разработанных для поддержки различных этапов процесса. Здесь перечислены некоторые из основных часто используемых инструментов и ссылки на некоторые важные веб-ресурсы.

Проектирование является фундаментальным этапом конкретного эксперимента RNA-Seq. Необходимо тщательно рассмотреть некоторые важные вопросы, такие как глубина/охват секвенирования или количество биологических или технических повторов. Обзор дизайна. [5]

  • PROPER : Перспективная оценка мощности RNAseq.
  • RNAtor : приложение для Android для расчета оптимальных параметров популярных инструментов и наборов, доступных для проектов секвенирования ДНК.
  • Скотти : веб-инструмент для разработки экспериментов по секвенированию РНК для измерения дифференциальной экспрессии генов.
  • Расчет размера выборки ssizeRNA для экспериментального дизайна RNA-Seq.

Контроль качества, обрезка, исправление ошибок и предварительная обработка данных

[ редактировать ]

Оценка качества исходных данных [6] является первым шагом биоинформатического конвейера RNA-Seq. Часто необходимо фильтровать данные, удаляя последовательности или основания низкого качества (обрезка), адаптеры, загрязнения, чрезмерно представленные последовательности или исправляя ошибки, чтобы обеспечить согласованный конечный результат.

Контроль качества

[ редактировать ]
  • AfterQC — автоматическая фильтрация, обрезка, удаление ошибок и контроль качества данных fastq.
  • bam-lorenz-coverage Инструмент, который может генерировать графики Лоренца и графики покрытия или экспортировать эту статистику в текстовые файлы непосредственно из файлов BAM. [7]
  • dupRadar [8] Пакет R, который предоставляет функции для построения графиков и анализа уровня дублирования в зависимости от уровней экспрессии.
  • FastQC — инструмент контроля качества данных последовательностей с высокой пропускной способностью ( Институт Бабрахама ), разработанный на Java . Импорт данных возможен из файлов FastQ , формата BAM или SAM. Этот инструмент предоставляет обзор проблемных областей, сводные графики и таблицы для быстрой оценки данных. Результаты представлены в постоянных отчетах в формате HTML . FastQC можно запускать как отдельное приложение или интегрировать в более крупное конвейерное решение.
  • fastqp Простая оценка качества FASTQ с использованием Python.
  • Кракен : [9] Набор инструментов для контроля качества и анализа данных высокопроизводительной последовательности.
  • HTSeq [10] Сценарий Python htseq-qa берет файл с чтениями секвенирования (необработанными или выровненными чтениями) и создает PDF-файл с полезными графиками для оценки технического качества анализа.
  • мРИН [11] - Оценка целостности мРНК непосредственно на основе данных RNA-Seq.
  • МультиКК [12] - Объединяйте и визуализируйте результаты многочисленных инструментов (FastQC, HTSeq, RSeQC, Tophat, STAR и другие) по всем образцам в единый отчет.
  • NGSQC : кроссплатформенный конвейер анализа качества для данных глубокого секвенирования.
  • Набор инструментов NGS QC Набор инструментов для контроля качества (КК) данных секвенирования следующего поколения (NGS). Набор инструментов включает удобные в использовании автономные инструменты для контроля качества данных о последовательностях, полученных с использованием платформ Illumina и Roche 454, с подробными результатами в виде таблиц и графиков, а также фильтрации высококачественных данных о последовательностях. Он также включает в себя несколько других инструментов, которые полезны для контроля и анализа качества данных NGS.
  • PRINSEQ — это инструмент, который генерирует сводную статистику данных о последовательностях и качестве и используется для фильтрации, переформатирования и обрезки данных о последовательностях следующего поколения. Он специально разработан для данных 454/Roche, но также может использоваться для других типов последовательностей.
  • QC-Chain — это пакет инструментов контроля качества данных секвенирования следующего поколения (NGS), включающий как оценку качества необработанных считываний, так и скрининг загрязнения de novo, который может выявить все возможные последовательности загрязнения.
  • QC3 — инструмент контроля качества, предназначенный для данных секвенирования ДНК для необработанных данных, выравнивания и вызова вариантов.
  • qrqc Быстро сканирует операции чтения и собирает статистику по базовым и качественным частотам, длине чтения и частым последовательностям. Создает графический вывод статистики для использования в конвейерах контроля качества и дополнительный отчет о качестве в формате HTML. Объекты S4 SequenceSummary позволяют писать специальные тесты и функциональные возможности на основе собранных данных.
  • РНК-SeQC [13] это инструмент, который можно применять при планировании экспериментов, оптимизации процессов и контроле качества перед вычислительным анализом. По сути, обеспечивает три типа контроля качества: подсчет чтений (например, повторных чтений, сопоставленных чтений и сопоставленных уникальных чтений, чтений рРНК, чтений с аннотациями транскриптов, специфичности цепи), охвата (например, среднего покрытия, среднего коэффициента вариации, 5'/ 3'-охват, пробелы в охвате, систематическая ошибка GC) и корреляция экспрессии (инструмент обеспечивает оценку уровней экспрессии на основе RPKM). RNA-SeQC реализован на Java и не требует установки, однако его можно запустить с помощью веб-интерфейса GenePattern . Входными данными могут быть один или несколько файлов BAM. HTML-отчеты генерируются как выходные данные.
  • RSeQC [14] анализирует различные аспекты экспериментов RNA-Seq: качество последовательности, глубину секвенирования, специфичность цепи, смещение GC, распределение прочтений по структуре генома и однородность покрытия. Входными данными могут быть файлы SAM, BAM, FASTA, BED или файл размера хромосомы (обычный текстовый файл с двумя столбцами). Визуализация может выполняться с помощью браузеров генома, таких как UCSC, IGB и IGV. Однако для визуализации также можно использовать сценарии R.
  • САМСтат [15] выявляет проблемы и сообщает несколько статистических данных на разных этапах процесса. Этот инструмент независимо оценивает некартированные, плохо и точно картированные последовательности, чтобы сделать вывод о возможных причинах плохого картирования.
  • SolexaQA рассчитывает статистику качества последовательности и создает визуальное представление качества данных для данных секвенирования второго поколения. Первоначально разработанная для системы Illumina (исторически известной как «Solexa»), SolexaQA теперь также поддерживает данные Ion Torrent и 454.
  • Trim galore — это сценарий-оболочка для автоматизации обрезки качества и адаптеров, а также контроля качества с некоторыми дополнительными функциями для удаления смещенных позиций метилирования для файлов последовательностей RRBS (для направленного, ненаправленного (или парного) секвенирования).

Улучшение качества

[ редактировать ]

Улучшение качества RNA-Seq и исправление систематической ошибки — сложная задача. [16] [17] Каждый протокол RNA-Seq вносит определенный тип систематической ошибки, каждый этап процесса (например, используемая технология секвенирования) может генерировать тот или иной шум или тип ошибки. Более того, даже исследуемые виды и биологический контекст образцов могут повлиять на результаты и внести некоторую предвзятость. Уже сообщалось о многих источниках систематической ошибки – содержание GC и обогащение ПЦР, [18] [19] истощение рРНК, [20] ошибки, допущенные при секвенировании, [21] прайминг обратной транскрипции, вызванный случайными гексамерами. [22]

Для решения каждой из обнаруженных ошибок были разработаны различные инструменты.

Обрезка и снятие адаптеров

[ редактировать ]
  • Чужой триммер [23] реализует очень быстрый подход (на основе k -меров) для обрезки низкокачественных пар оснований и отсечения технических ( чужеродных ) олигонуклеотидов из считываний одноконцевого или парного секвенирования в простых или сжатых с помощью gzip файлах FASTQ (более подробную информацию см. в разделе AlienTrimmer). ).
  • Многопоточный инструмент BBDuk для обрезки адаптеров и фильтрации или маскировки загрязнений на основе сопоставления кмеров, позволяющий определять расстояние Хэмминга или редактирования, а также вырожденные базы. Также выполняет обрезку и фильтрацию оптимального качества, преобразование формата, отчеты о концентрации загрязнений, gc-фильтрацию, фильтрацию по длине, энтропийную фильтрацию, фильтрацию целомудрия и генерирует текстовые гистограммы для большинства операций. Взаимное преобразование между fastq, fasta, sam, Scarf, чередующимися и парными двухфайловыми файлами, gzip, bzip, ASCII-33 и ASCII-64. Держит пары вместе. Открытый исходный код, написанный на чистой Java; поддерживает все платформы без перекомпиляции и других зависимостей.
  • Clean_reads очищает операции чтения NGS (Sanger, 454, Illumina и Solid). Он может обрезать области плохого качества, адаптеры, векторы и регулярные выражения. Он также отфильтровывает чтения, которые не соответствуют минимальным критериям качества на основе длины последовательности и среднего качества.
  • застроенный [24] — это метод обрезки чтения в зависимости от содержимого для данных Illumina с использованием оценок качества каждой базы в отдельности. Он не зависит от покрытия секвенирования и взаимодействия с пользователем. Основное внимание при реализации уделяется удобству использования и включению обрезки чтения в конвейеры обработки и анализа данных секвенирования следующего поколения. Он может обрабатывать данные одноконцевого и парного секвенирования произвольной длины.
  • адаптироваться [25] удаляет последовательности адаптеров из данных секвенирования следующего поколения (Illumina, SOLiD и 454). Он используется особенно тогда, когда длина считывания секвенатора больше, чем длина секвенируемой молекулы, как в случае с микроРНК.
  • Deconseq Обнаружение и удаление загрязнений из данных последовательности.
  • Эрне-Фильтр [26] — это пакет выравнивания коротких строк, цель которого — предоставить полный набор инструментов для обработки коротких (NGS-подобных) операций чтения. ERNE включает в себя ERNE-FILTER (обрезка считываний и фильтрация загрязнений), ERNE-MAP (инструмент/алгоритм выравнивания ядра), ERNE-BS5 (выравниватель считываний, обработанный бисульфитом) и ERNE-PMAP/ERNE-PBS5 (распределенные версии выравнивателей).
  • FastqMcf Fastq-mcf пытается: Обнаружить и удалить адаптеры секвенирования и праймеры; Обнаружение ограниченного перекоса на концах операций чтения и клипа; Обнаружение низкого качества в конце чтения и клипа; Обнаружить N и удалить с концов; Удалить чтения с флагом CASAVA 'Y' (фильтрация чистоты); Отбросьте последовательности, которые после всего вышеперечисленного оказались слишком короткими; Синхронизируйте несколько чтений матов, выполняя все вышеперечисленное.
  • FASTX Toolkit — это набор инструментов командной строки для управления чтением файлов формата FASTA или FASTQ . Эти команды позволяют предварительно обработать файлы перед сопоставлением с помощью таких инструментов, как Bowtie . Некоторые из разрешенных задач: преобразование из формата FASTQ в формат FASTA, информация о статистике качества, удаление адаптеров секвенирования, фильтрация и обрезка последовательностей на основе качества или преобразования ДНК / РНК .
  • Flexbar выполняет удаление последовательностей адаптеров, функции обрезки и фильтрации.
  • FreClu повышает общую точность выравнивания, выполняя коррекцию ошибок секвенирования за счет обрезки коротких чтений на основе методологии кластеризации.
  • htSeqTools — пакет Bioconductor, способный выполнять контроль качества, обработку данных и визуализацию. htSeqTools позволяет визуализировать корреляции выборок, удалять артефакты чрезмерного усиления, оценивать эффективность обогащения, корректировать смещение цепей и визуализировать совпадения.
  • Процедура обрезки адаптера NxTrim и создание виртуальной библиотеки для библиотек Illumina Nextera Mate Pair.
  • ПРИНЦЕК [27] генерирует статистику ваших данных о последовательностях для длины последовательности, содержания GC, показателей качества, n-повторностей, сложности, последовательностей тегов, поли-A/T-хвостов, отношений шансов. Фильтруйте данные, переформатируйте и обрезайте последовательности.
  • Sabre Инструмент демультиплексирования и обрезки штрих-кодов для файлов FastQ.
  • Scythe Триммер для удаления загрязнений с адаптером на 3-футовом конце.
  • SEECER — это алгоритм исправления ошибок секвенирования наборов данных RNA-seq. Он использует необработанные последовательности считывания, созданные платформами секвенирования нового поколения, такими как машины Illumina или Roche. SEECER удаляет ошибки несоответствия и вставки из необработанных чтений и значительно улучшает последующий анализ данных. Особенно если данные RNA-Seq используются для создания сборки транскриптома de novo, запуск SEECER может оказать огромное влияние на качество сборки.
  • Sickle Оконный адаптивный инструмент обрезки файлов FASTQ с использованием качества.
  • СноБелый [28] представляет собой конвейер, предназначенный для гибкой и агрессивной очистки считываний последовательностей (гДНК или кДНК) перед сборкой. Он принимает и возвращает файлы последовательностей в формате fastq или fasta.
  • ShortRead — это пакет, предоставляемый в средах R (язык программирования) / BioConductor и позволяющий вводить, манипулировать, оценивать качество и выводить данные секвенирования следующего поколения. Этот инструмент позволяет манипулировать данными, например фильтровать решения для удаления операций чтения на основе заранее определенных критериев. ShortRead может быть дополнен несколькими пакетами Bioconductor для дальнейшего анализа и решений по визуализации ( BioStrings , BSgenome , IRanges и так далее).
  • SortMeRNA — это программный инструмент для фильтрации, картирования и выбора OTU-чтений NGS в метатранскриптомных и метагеномных данных. Основной алгоритм основан на приблизительных начальных числах и позволяет анализировать нуклеотидные последовательности. Основное применение SortMeRNA — фильтрация рибосомальной РНК из метатранскриптомных данных.
  • TagCleaner Инструмент TagCleaner можно использовать для автоматического обнаружения и эффективного удаления последовательностей тегов (например, тегов WTA) из наборов геномных и метагеномных данных. Он легко настраивается и имеет удобный интерфейс.
  • Триммоматик [29] выполняет обрезку для платформ Illumina и работает с чтениями FASTQ (односторонними или парными). Некоторые из выполненных задач: вырезание адаптеров, вырезание оснований в дополнительных положениях на основе пороговых значений качества, обрезка операций чтения до определенной длины, преобразование показателей качества в Phred-33/64.
  • fastp Инструмент, предназначенный для комплексной предварительной обработки файлов FastQ. Этот инструмент разработан на C++ с поддержкой многопоточности.
  • FASTX-Toolkit FASTX-Toolkit представляет собой набор инструментов командной строки для предварительной обработки файлов Short-Reads FASTA/FASTQ.

Обнаружение химерных чтений

[ редактировать ]

Современные технологии секвенирования обычно требуют амплификации образцов ДНК с помощью полимеразной цепной реакции (ПЦР). Амплификация часто приводит к образованию химерных элементов (особенно рибосомного происхождения) — последовательностей, образованных из двух или более соединенных исходных последовательностей.

  • UCHIME — это алгоритм обнаружения химерных последовательностей.
  • ChimeraSlayer — это утилита для обнаружения химерных последовательностей, совместимая с последовательностями Сэнгера почти полной длины и более короткими последовательностями 454-FLX (~ 500 п.н.).

Исправление ошибок

[ редактировать ]

Характеристика ошибок высокопроизводительного секвенирования и их возможное исправление. [30]

  • Acacia Корректор ошибок для пиросеквенированных считываний ампликонов.
  • Исправление ошибок AllPathsLG .
  • АмпликонНойз [31] AmpliconNoise — набор программ для удаления шума из 454 секвенированных ПЦР-ампликонов. Он включает в себя два этапа: удаление шума из самого секвенирования и удаление точечных ошибок ПЦР. Этот проект также включает в себя алгоритм Персея для удаления химер.
  • Байес Хаммер . Байесовская кластеризация для исправления ошибок. Этот алгоритм основан на графах Хэмминга и байесовской субкластеризации. Хотя BAYES HAMMER был разработан для секвенирования отдельных клеток, он также совершенствует существующие инструменты исправления ошибок для данных массового секвенирования.
  • Благословить [32] Решение для коррекции ошибок на основе фильтра Блума для высокопроизводительного чтения секвенирования.
  • Синий [33] Blue — это инструмент для исправления ошибок с коротким чтением, основанный на консенсусе и контексте k-mer.
  • BFC Корректор ошибок секвенирования, разработанный для коротких считываний Illumina. Он использует нежадный алгоритм со скоростью, сравнимой с реализациями, основанными на жадных методах.
  • Denoiser Denoiser предназначен для устранения проблем с шумом в данных пиросеквенирования. Denoiser — это эвристический вариант PyroNoise. Разработчики denoiser сообщают о хорошем соглашении с PyroNoise по нескольким наборам тестовых данных.
  • Echo Алгоритм коррекции ошибок короткого чтения без ссылок.
  • Легче . Исправление ошибок последовательности без подсчета.
  • LSC LSC использует короткие чтения Illumina для исправления ошибок при длинных чтениях.
  • Карект Карект: точная коррекция ошибок замены, вставки и удаления для данных секвенирования следующего поколения.
  • NoDe NoDe: алгоритм исправления ошибок при считывании ампликонов пиросеквенирования.
  • PyroTagger PyroTagger: быстрый и точный конвейер для анализа данных пиропоследовательности ампликонов рРНК.
  • Quake — это инструмент для исправления ошибок секвенирования замещения в экспериментах с глубоким охватом считываний секвенирования Illumina.
  • QuorUM : корректор ошибок для чтения Illumina.
  • Ркорректор . Исправление ошибок при чтении Illumina RNA-seq.
  • Reptile — это программное обеспечение, разработанное на C++ для исправления ошибок секвенирования при коротком чтении с платформ секвенирования следующего поколения.
  • Коррекция ошибок секвенирования Seecer для считываний РНК.
  • СГА
  • SOAPденово
  • УНОАЗ

Коррекция смещения

[ редактировать ]
  • Альпийский [34] Моделирование и коррекция смещения последовательности фрагментов для RNA-seq.
  • cqn [35] это инструмент нормализации данных RNA-Seq, реализующий метод условной квантильной нормализации.
  • ЭДАСек [36] представляет собой пакет Bioconductor для нормализации содержимого GC для данных RNA-Seq.
  • GeneScissors Комплексный подход к обнаружению и исправлению ложных выводов о транскриптоме, вызванных несовпадением считываний RNAseq.
  • Вглядеться [37] представляет собой сборник байесовских подходов к выводу о скрытых детерминантах и ​​их эффектах на основе профилей экспрессии генов с использованием методов факторного анализа. Применение PEER: а) выявило пакетные эффекты и экспериментальные факторы, мешающие эксперименту, б) увеличило количество результатов экспрессии QTL в три раза, в) позволило сделать вывод о промежуточных клеточных признаках, таких как фактор транскрипции или активация пути.
  • РУВ [38] — это пакет R, который реализует методы удаления нежелательных изменений (RUV), предложенные Риссо и др. (2014) для нормализации количества чтений RNA-Seq между образцами.
  • sva Анализ суррогатных переменных.
  • svaseq удаляет пакетные эффекты и другой нежелательный шум из данных секвенирования.
  • системный вызов [39] представляет собой инструмент классификатора для идентификации и исправления систематических ошибок в данных последовательностей с высокой пропускной способностью.

Прочие задачи/данные предварительной обработки

[ редактировать ]

Дальнейшие задачи, выполняемые перед выравниванием, а именно слияния парного чтения.

  • AuPairWise: метод оценки воспроизводимости РНК-Seq посредством совместной экспрессии.
  • BamHash — это метод на основе контрольной суммы, гарантирующий, что пары чтения в файлах FASTQ точно соответствуют парам чтения, хранящимся в файлах BAM, независимо от порядка чтения. BamHash можно использовать для проверки целостности хранящихся файлов и обнаружения любых несоответствий. Таким образом, BamHash можно использовать для определения того, безопасно ли удалять файлы FASTQ, хранящие необработанные чтения секвенирования, после выравнивания, без потери данных.
  • BBMerge Объединяет парные чтения на основе перекрытия для создания более длинных прочтений и гистограммы размера вставки. Быстрый, многопоточный и дает крайне мало ложных срабатываний. Открытый исходный код, написанный на чистой Java; поддерживает все платформы без перекомпиляции и других зависимостей. Распространяется с помощью BBMap.
  • Biopieces — это набор инструментов биоинформатики, которые можно очень легко и гибко объединять для выполнения как простых, так и сложных задач. Biopieces работают с потоком данных таким образом, что поток данных может проходить через несколько разных Biopieces, каждый из которых выполняет одну конкретную задачу: изменение или добавление записей в поток данных, создание графиков или загрузку данных в базы данных и веб-сервисы.
  • СПРАВЛЯТЬСЯ [40] COPE: точный инструмент для считывания парных концов на основе k-меров, облегчающий сборку генома.
  • DeconRNASeq — это пакет R для деконволюции гетерогенных тканей на основе данных мРНК-Seq.
  • FastQ Screen проверяет последовательности формата FASTQ в наборе баз данных, чтобы подтвердить, что последовательности содержат то, что ожидается (например, содержание видов, адаптеров, векторов и т. д.).
  • FLASH — это инструмент предварительной обработки чтения. FLASH объединяет перекрывающиеся парные чтения и преобразует их в одиночные длинные чтения.
  • IDCheck
  • ORNA и ORNA Q/K Инструмент для уменьшения избыточности в данных секвенирования РНК, который снижает требования к вычислительным ресурсам ассемблера.
  • PANDASeq — это программа для выравнивания считываний Illumina, опционально с праймерами ПЦР, встроенными в последовательность, и восстановления перекрывающейся последовательности.
  • ГРУША [41] PEAR: Слияние парного чтения Illumina.
  • Скрипт qRNASeq Инструмент qRNAseq можно использовать для точного исключения дубликатов ПЦР из данных RNA-Seq, если во время подготовки библиотеки использовались Molecular Indexes™ или другие стохастические метки.
  • SHERA [42] выравниватель с коротким ходом, уменьшающий количество ошибок.
  • XORRO Быстрое перекрытие парного чтения.
  • ДеконтаМайнер [43] обнаруживает загрязнение в данных RNA-Seq.

Инструменты выравнивания

[ редактировать ]

После контроля качества первый этап анализа RNA-Seq включает в себя сопоставление секвенированных прочтений с эталонным геномом (если таковой имеется) или с базой данных транскриптома. См. также Список программного обеспечения для выравнивания последовательностей .

Короткие (несращенные) элайнеры

[ редактировать ]

Короткие выравниватели способны выравнивать непрерывные чтения (не содержащие пробелов в результате сплайсинга) с эталонным геномом. По сути, существует два типа: 1) на основе метода преобразования Берроуза-Уиллера, такого как Боути и BWA, и 2) на основе методов расширения семени, алгоритмов Нидлмана-Вунша или Смита-Уотермана . Первая группа (Bowtie и BWA) во много раз быстрее, однако некоторые инструменты второй группы имеют тенденцию быть более чувствительными, генерируя более правильно выровненные чтения.

  • BFAST выравнивает короткие чтения с эталонными последовательностями и проявляет особую чувствительность к ошибкам, SNP, вставкам и удалениям. BFAST работает с алгоритмом Смита-Уотермана .
  • Bowtie — это короткий выравниватель, использующий алгоритм, основанный на преобразовании Берроуза-Уиллера и FM-индексе . Боути терпит небольшое количество несоответствий.
  • Bowtie2 Bowtie 2 — это инструмент с эффективным использованием памяти для выравнивания считываний секвенирования с длинными эталонными последовательностями. Он особенно рекомендуется для выравнивания считываний от 50 до 100 или 1000 символов и особенно хорош для выравнивания относительно длинных геномов (например, млекопитающих). Bowtie 2 индексирует геном с помощью FM-индекса , чтобы сохранить небольшой объем памяти: для генома человека объем памяти обычно составляет около 3,2 ГБ. Bowtie 2 поддерживает режимы выравнивания с зазором, локального и парного конца.
  • Burrows-Wheeler Aligner (BWA) BWA представляет собой пакет программного обеспечения для картирования малодивергентных последовательностей на большом эталонном геноме, таком как геном человека. Он состоит из трех алгоритмов: BWA-backtrack, BWA-SW и BWA-MEM. Первый алгоритм предназначен для чтения последовательностей Illumina до 100 бит в секунду, а остальные два — для более длинных последовательностей в диапазоне от 70 бит в секунду до 1 Мбит в секунду. BWA-MEM и BWA-SW имеют схожие функции, такие как поддержка длительного чтения и раздельное выравнивание, но последняя версия BWA-MEM обычно рекомендуется для высококачественных запросов, поскольку она быстрее и точнее. BWA-MEM также имеет более высокую производительность, чем BWA-backtrack, при чтении Illumina со скоростью 70–100 бит/с.
  • Пакет короткого анализа олигонуклеотидов (SOAP)
  • GNUMAP выполняет выравнивание с использованием вероятностного алгоритма Нидлмана-Вунша . Этот инструмент способен выполнять выравнивание повторяющихся областей генома без потери информации. Результаты программы были разработаны для облегчения визуализации с использованием доступного программного обеспечения.
  • Maq сначала выравнивает чтения по эталонным последовательностям, а затем выполняет этап консенсуса. На первом этапе выполняется только неразрывное выравнивание и допускается до 3-х несовпадений.
  • Mosaik Mosaik способен выравнивать чтения, содержащие короткие пробелы, с использованием алгоритма Смита-Уотермана , который идеально подходит для преодоления SNP, вставок и удалений.
  • NovoAlign (коммерческий) — это короткая версия платформы Illumina, основанная на алгоритме Нидлмана-Вунша . Он способен работать с бисульфитными данными. Вывод в формате SAM.
  • PerM — это пакет программного обеспечения, который был разработан для высокоэффективного выравнивания масштаба генома для сотен миллионов коротких считываний, произведенных платформами секвенирования ABI SOLiD и Illumina. PerM способен обеспечить полную чувствительность для выравнивания в пределах 4 несовпадений для считываний SOLID 50 бит/с и 9 несовпадений для считываний Illumina 100 бит/с.
  • RazerS
  • SEAL использует модель MapReduce для выполнения распределенных вычислений на кластерах компьютеров. Seal использует BWA для выравнивания, а Picard MarkDuulates — для обнаружения и удаления дубликатов при считывании.
  • Сегемель
  • SeqMap
  • SHRiMP использует два метода для выравнивания коротких чтений. Во-первых, метод фильтрации q-грамм , основанный на множественных начальных числах, идентифицирует области-кандидаты. Во-вторых, эти регионы детально исследуются с помощью алгоритма Смита–Уотермана .
  • СОЛЬ
  • Stampy сочетает в себе чувствительность хеш-таблиц и скорость BWA. Stampy подготовлен к выравниванию ридов, содержащих вариации последовательностей, такие как вставки и делеции. Он способен обрабатывать до 4500 баз и представляет выходные данные в формате SAM.
  • Подчтение [44] является выравнивателем чтения. Он использует парадигму сопоставления начального числа и голосования для определения местоположения сопоставления чтения, используя наибольшую отображаемую область. Он автоматически решает, должно ли чтение отображаться глобально или локально. Для данных секвенирования РНК следует использовать Subread с целью анализа экспрессии. Субчтение также можно использовать для картирования чтений ДНК-секвенирования.
  • ZOOM (коммерческий) — это короткая версия платформы Illumina/Solexa 1G. ZOOM использует методологию расширенных разнесенных начальных чисел, создавая хэш-таблицы для операций чтения, и допускает несовпадения, а также вставки и удаления.
  • WHAM WHAM — это высокопроизводительный инструмент выравнивания последовательностей, разработанный в Университете Висконсин-Мэдисон. Он выравнивает короткие последовательности ДНК (чтения) со всем геномом человека со скоростью более 1500 миллионов чтений со скоростью 60 бит/с в час, что на один-два порядка быстрее, чем ведущие современные методы.

Сращенные элайнеры

[ редактировать ]

Многие риды охватывают соединения экзон-экзон и не могут быть выровнены напрямую с помощью коротких выравнивателей, поэтому были необходимы специальные выравниватели - сплайсированные выравниватели. Некоторые сплайсированные выравниватели используют короткие выравниватели для выравнивания сначала несплайсированных/непрерывных считываний (подход «сначала экзоны»), а затем следуют другой стратегии для выравнивания остальных, содержащих сплайсированные области - обычно считывания разбиваются на более мелкие сегменты и картируются независимо. См. также. [45] [46]

Выравниватели на основе известных сращиваемых соединений (выравниватели с аннотациями)

[ редактировать ]

В этом случае обнаружение сращиваемых соединений основано на имеющихся в базах данных данных об известных соединениях. Инструменты этого типа не могут идентифицировать новые места сращивания. Некоторые из этих данных поступают из других методов выражения, таких как теги выраженной последовательности (EST).

  • Erange — это инструмент для сопоставления и количественной оценки данных транскриптомов млекопитающих.
  • ИзоформЭкс
  • КартаАЛ
  • ЧАСТЬ
  • RNA-MATE — это вычислительный конвейер для выравнивания данных из системы Applied Biosystems SOLID. Обеспечивает возможность контроля качества и обрезки чтений. Выравнивание генома выполняется с использованием карт чтения , а соединения сплайсинга идентифицируются на основе библиотеки известных последовательностей соединений экзонов. Этот инструмент позволяет визуализировать выравнивание и подсчет тегов.
  • RUM выполняет выравнивание на основе конвейера, имея возможность манипулировать чтением с помощью соединений сращивания, используя Bowtie и Blat. Блок-схема начинает выполнять сопоставление с базой данных генома и транскриптома, выполняемой Боути. Следующим шагом является выравнивание некартированных последовательностей с эталонным геномом с использованием BLAT. На последнем этапе все выравнивания объединяются для получения окончательного выравнивания. Входные файлы могут быть в формате FASTA или FASTQ. Вывод представлен в формате RUM и SAM.
  • РНКСЕКР .
  • SAMMate
  • SpliceSeq
  • X-Mate

И снова выравниватели стыков

[ редактировать ]

Выравниватели сращивания de novo позволяют обнаруживать новые соединения сращивания без необходимости использования ранее аннотированной информации (некоторые из этих инструментов предоставляют аннотации в качестве дополнительной опции).

  • ABMapper
  • BBMap использует короткие кмеры для выравнивания считываний непосредственно с геномом (охватывающим интроны для поиска новых изоформ) или транскриптомом. Очень толерантен к ошибкам замены и удалениям и очень быстр. Поддерживает вывод всех тегов SAM, необходимых для запонок. Нет ограничений на размер генома или количество сплайсингов на одно чтение. Поддерживает чтение Illumina, 454, Sanger, Ion Torrent, PacBio и Oxford Nanopore, парное или одностороннее. Не использует какие-либо эвристики поиска сайтов сплайсинга, оптимизированные для одной таксономической ветви, а скорее находит глобальные выравнивания с множественными аффинными преобразованиями с оптимальной оценкой и, таким образом, идеально подходит для изучения новых организмов без аннотаций и неизвестных мотивов сплайсинга. Открытый исходный код, написанный на чистой Java; поддерживает все платформы без перекомпиляции и других зависимостей.
  • ContextMap был разработан для преодоления некоторых ограничений других подходов к отображению, таких как разрешение неоднозначностей. Основная идея этого инструмента состоит в том, чтобы рассматривать чтения в контексте экспрессии генов, повышая таким образом точность выравнивания. ContextMap может использоваться как отдельная программа и поддерживаться картографами, создающими на выходе файл SAM (например, TopHat или MapSplice). В автономном режиме чтения выравниваются с геномом, с базой данных транскриптома или с тем и другим.
  • CRAC предлагает новый способ анализа чтений, который объединяет местоположение генома и локальное покрытие, а также обнаруживает мутации-кандидаты, инделы, соединения сплайсинга или слияния в каждом отдельном чтении. Важно отметить, что CRAC улучшает свои прогнозные характеристики, когда поставляется, например, с чтениями длиной 200 нт, и должен соответствовать будущим потребностям анализа чтения.
  • ГСНАП
  • GMAP Программа геномного картирования и выравнивания последовательностей мРНК и EST.
  • HISAT — это программа сплайсированного выравнивания для картирования считываний РНК-seq. В дополнение к одному глобальному FM-индексу , который представляет весь геном, HISAT использует большой набор небольших FM-индексов, которые в совокупности охватывают весь геном (каждый индекс представляет геномную область размером ~64 000 п.н., и для покрытия всего генома необходимо ~48 000 индексов). геном человека). Эти небольшие индексы (называемые локальными индексами) в сочетании с несколькими стратегиями выравнивания обеспечивают эффективное выравнивание чтений RNA-seq, в частности чтений, охватывающих несколько экзонов. Объем памяти HISAT относительно невелик (~ 4,3 ГБ для генома человека). Мы разработали HISAT на основе реализации Bowtie2 для выполнения большинства операций с FM-индексом.
  • HISAT2 — это программа выравнивания для сопоставления считываний секвенирования следующего поколения (как ДНК, так и РНК) с популяцией геномов человека (а также с одним эталонным геномом). На основе расширения BWT для графов [Sirén et al. 2014], мы разработали и реализовали графовый FM-индекс (GFM), оригинальный подход и его первую реализацию, насколько нам известно. В дополнение к использованию одного глобального индекса GFM, который представляет популяцию геномов человека, HISAT2 использует большой набор небольших индексов GFM, которые в совокупности охватывают весь геном (каждый индекс представляет геномную область размером 56 Кб, при этом для покрытия человеческого генома необходимо 55 000 индексов). население). Эти небольшие индексы (называемые локальными индексами) в сочетании с несколькими стратегиями выравнивания обеспечивают быстрое и точное выравнивание считываний секвенирования. Эта новая схема индексации называется индексом FM иерархического графика (HGFM).
  • HMMSplicer может идентифицировать канонические и неканонические соединения сращивания в коротких чтениях. Во-первых, несращенные чтения удаляются с помощью Bowtie. После этого оставшиеся чтения по одному делятся пополам, затем каждая часть высеивается против генома и определяются границы экзонов на основе скрытой марковской модели . Каждому перекрестку присваивается показатель качества, который полезен для обнаружения ложноположительных результатов.
  • КартаСоединение
  • PALMapper
  • Проходить [47] выравнивает промежуточные и непропущенные чтения, а также бисульфитного секвенирования данные . Включает возможность фильтрации данных перед выравниванием (удалением адаптеров). Pass использует алгоритмы Нидлмана-Вунша и Смита-Уотермана и выполняет выравнивание в три этапа: сканирование положений начальных последовательностей в геноме, тестирование смежных областей и, наконец, уточнение выравнивания.
  • Страсть
  • ПАСТА
  • QPALMA прогнозирует места сращивания, поддерживаемые алгоритмами машинного обучения . В этом случае обучающий набор представляет собой набор склеенных чтений с качественной информацией и уже известными выравниваниями.
  • ПОРОДЫ : [48] считывает выравниватель SNP и сайты редактирования РНК.
  • SeqSaw
  • SoapSplice Инструмент для полногеномного ab initio обнаружения сайтов сплайсинга из RNA-Seq, метода, использующего технологии секвенирования нового поколения для секвенирования информационной РНК.
  • Карта соединения
  • SplitSeek
  • SuperSplat был разработан для поиска всех типов сращиваемых соединений. Алгоритм итерационным образом разбивает каждое чтение на все возможные комбинации из двух фрагментов и пытается выполнить выравнивание для каждого фрагмента. Вывод в формате «Суперплат».
Выравниватели сращивания de novo, которые также дополнительно используют аннотации
[ редактировать ]
  • КартаСледующая
  • ОЛЕГО
  • STAR - это инструмент, который использует «последовательный поиск максимального отображаемого начального числа в несжатых суффиксных массивах с последующей процедурой кластеризации и сшивания начального числа», обнаруживает канонические, неканонические соединения сплайсинга и последовательности химерного слияния. Он уже адаптирован для выравнивания длинных чтений ( технологий секвенирования третьего поколения ) и может достигать скорости 45 миллионов парных чтений в час на процессор. [49]
  • Сослагательное наклонение [44] это специализированная версия Subread. Он использует все картируемые области в считывании секвенирования РНК для обнаружения экзонов и соединений экзон-экзон. Он использует сигналы донора/рецептора для поиска точных мест сращивания. Subjunc дает полное выравнивание для каждого чтения РНК-seq, включая чтения, охватывающие экзоны, в дополнение к обнаруженным экзон-экзонным соединениям. Subjunc следует использовать с целью обнаружения соединений и обнаружения геномных вариаций в данных секвенирования РНК.
  • Цилиндр [50] готов найти соединения de novo. TopHat выравнивает чтение в два этапа. Во-первых, несращенные чтения выравниваются по Bowtie. После этого выровненные прочтения собираются с полученными Maq островками последовательностей. Во-вторых, соединения сплайсинга определяются на основе изначально некартированных ридов и возможных канонических донорных и акцепторных сайтов внутри островковых последовательностей.
Другие сращиваемые элайнеры
[ редактировать ]
  • G.Mo.R-Se — это метод, который использует считывания RNA-Seq для создания de novo . моделей генов

Оценка инструментов выравнивания

[ редактировать ]
  • AlignerBoost — это универсальный набор программных инструментов для повышения точности картирования секвенирования следующего поколения с использованием байесовской системы качества картирования.
  • CADBURE Биоинформатический инструмент для оценки эффективности выравнивателей на вашем наборе данных RNA-Seq.
  • QualiMap : оценка данных выравнивания секвенирования следующего поколения.
  • RNAseqEVAL Коллекция инструментов для оценки картирования последовательностей РНК.
  • Тизер : Индивидуальный бенчмаркинг и оптимизация результатов сопоставления чтения для данных NGS.

Нормализация, количественный анализ и дифференциальное выражение

[ редактировать ]

Общие инструменты

[ редактировать ]

Эти инструменты выполняют нормализацию и рассчитывают численность каждого гена, выраженного в образце. [51] РПКМ, ФПКМ и ТПМ [52] являются некоторыми из единиц, используемых для количественной оценки экспрессии. Некоторое программное обеспечение также предназначено для изучения изменчивости генетической экспрессии между образцами (дифференциальная экспрессия). Количественные и дифференциальные исследования во многом определяются качеством выравнивания ридов и точностью реконструкции изоформ. Доступно несколько исследований, сравнивающих методы дифференциальной экспрессии. [53] [54] [55]

  • ABSSeq — новый метод анализа RNA-Seq, основанный на моделировании абсолютных различий в экспрессии.
  • ALDEx2 — инструмент для сравнительного анализа данных высокопроизводительного секвенирования. ALDEx2 использует композиционный анализ данных и может применяться к RNAseq, секвенированию генов 16S рРНК, метагеномному секвенированию и экспериментам по селективному росту.
  • Alexa-Seq — это конвейер, который позволяет выполнять анализ экспрессии генов, анализ специфичной экспрессии транскриптов, экспрессию экзонных соединений и количественный альтернативный анализ. Обеспечивает широкую альтернативную визуализацию выражений, статистику и графики.
  • ARH-seq – идентификация дифференциального сплайсинга в данных RNA-seq.
  • АСЦ [56]
  • бальное платье
  • BaySeq — это пакет Bioconductor для идентификации дифференциальной экспрессии с использованием данных секвенирования нового поколения с помощью эмпирических байесовских методов . Существует возможность использования пакета «снег» для распараллеливания компьютерной обработки данных, рекомендуемого при работе с большими наборами данных.
  • ГМНБ [57] представляет собой байесовский метод временного анализа дифференциальной экспрессии генов в разных фенотипах или условиях лечения, который естественным образом учитывает неоднородность глубины секвенирования в разных образцах, устраняя необходимость в специальной нормализации.
  • BBSeq
  • BitSeq (байесовский вывод транскриптов на основе данных секвенирования) — это приложение для определения уровней экспрессии отдельных транскриптов на основе данных секвенирования (RNA-Seq) и оценки дифференциальной экспрессии (DE) между условиями.
  • CEDER Точное обнаружение дифференциально экспрессируемых генов путем объединения значимости экзонов с использованием RNA-Seq.
  • CPTRA Пакет CPTRA предназначен для анализа данных секвенирования транскриптома с различных платформ секвенирования. Он сочетает в себе преимущества 454, Illumina GAII или других платформ и может выполнять выравнивание и аннотирование тегов последовательностей, а также задачи количественного определения экспрессии.
  • casper — это пакет Bioconductor для количественной оценки экспрессии на уровне изоформ. Он сочетает в себе использование информативных сводок данных, гибкую оценку экспериментальных ошибок и соображения статистической точности, которые (как сообщается) обеспечивают существенное снижение ошибки оценки.
  • Запонки/Cuffdiff подходят для измерения глобальной экспрессии изоформ транскрипта de novo . Он выполняет сборку транскриптов, оценку численности и определяет дифференциальную экспрессию (Cuffdiff) и регуляцию в образцах RNA-Seq. [58]
  • DESeq — это пакет Bioconductor для проведения дифференциального анализа экспрессии генов на основе отрицательного биномиального распределения.
  • ДЭГСек
  • Derfinder Независимый от аннотаций анализ дифференциальной экспрессии данных секвенирования РНК с разрешением пар оснований с использованием подхода DER Finder.
  • DEvis — мощное интегрированное решение для анализа данных дифференциальной экспрессии. Используя DESeq2 в качестве основы, DEvis предоставляет широкий спектр инструментов для манипулирования данными, визуализации и управления проектами.
  • DEXSeq — это пакет Bioconductor, который определяет дифференциальное дифференциальное использование экзонов на основе количества экзонов RNA-Seq между образцами. DEXSeq использует отрицательное биномиальное распределение и предоставляет возможности визуализации и исследования результатов.
  • DEXUS — это пакет Bioconductor, который идентифицирует дифференциально экспрессируемые гены в данных RNA-Seq при всех возможных схемах исследований, таких как исследования без повторов, без групп образцов и в неизвестных условиях. [59] В отличие от других методов, DEXUS не требует повторов для обнаружения дифференциально экспрессируемых транскриптов, поскольку повторы (или условия) оцениваются методом EM для каждого транскрипта.
  • DGEclust — это пакет Python для кластеризации данных экспрессии из RNA-seq, CAGE и других анализов NGS с использованием иерархической модели смеси процессов Дирихле . Предполагаемые конфигурации кластеров могут быть подвергнуты последующей обработке для идентификации дифференциально экспрессируемых генов и для создания генных и выборочных дендрограмм и тепловых карт. [60]
  • DiffSplice — это метод обнаружения и визуализации дифференциальной экспрессии, не зависящий от аннотаций генов. Этот метод поддерживается при идентификации альтернативных модулей сплайсинга (ASM), которые расходятся в разных изоформах. К каждому ASM применяется непараметрический тест для выявления значимой дифференциальной транскрипции с измеренной частотой ложных обнаружений.
  • DROP Конвейер обнаружения выбросов РНК (DROP) — это комплексный рабочий процесс для обнаружения аберрантной экспрессии, аберрантного сплайсинга и моноаллельной экспрессии из необработанных файлов секвенирования. [61]
  • EBSeq — это пакет Bioconductor для идентификации генов и изоформ, дифференциально экспрессирующихся (DE) в двух или более биологических условиях в эксперименте по секвенированию РНК. Его также можно использовать для идентификации контигов DE после выполнения сборки транскриптома de novo. При проведении DE-анализа изоформ или контигов разные группы изоформ/контигов имеют разную неопределенность оценки. EBSeq моделирует различные неопределенности, используя эмпирическую модель Байеса с различными априорными значениями.
  • EdgeR — это пакет R для анализа дифференциальной экспрессии данных методов секвенирования ДНК, таких как данные RNA-Seq, SAGE или ChIP-Seq. EdgeR использует статистические методы, поддерживаемые отрицательным биномиальным распределением, в качестве модели изменчивости количества.
  • EdgeRun — пакет R для чувствительного, функционально значимого обнаружения дифференциальных выражений с использованием безусловного точного теста.
  • EQP Конвейер количественного определения экзонов (EQP): комплексный подход к количественному определению экспрессии генов, экзонов и соединений на основе данных секвенирования РНК.
  • ESAT Набор инструментов для анализа концевых последовательностей (ESAT) специально разработан для количественного анализа аннотаций специализированных библиотек генов RNA-Seq, нацеленных на 5'- или 3'-концы транскриптов.
  • Производительность eXpress включает количественную оценку RNA-Seq на уровне транскриптов, аллель-специфичный анализ и анализ гаплотипов, а также позволяет оценить содержание транскриптов нескольких изоформ, присутствующих в гене. Хотя eXpress может быть напрямую связан с выравнивателями (например, Bowtie), его также можно использовать с ассемблерами de novo, и, таким образом, для выполнения выравнивания не требуется эталонный геном. Он работает на Linux, Mac и Windows.
  • ERANGE выполняет выравнивание, нормализацию и количественную оценку экспрессируемых генов.
  • FeatureCounts — эффективный квантификатор чтения общего назначения.
  • ФДМ
  • FineSplice Улучшенное обнаружение и оценка соединений сплайсинга на основе данных RNA-Seq.
  • ГФОЛД [62] Обобщенное кратное изменение для ранжирования дифференциально экспрессируемых генов на основе данных секвенирования РНК.
  • глобальная последовательность [63] Глобальный тест на подсчет: проверка связи между RNA-Seq и многомерными данными.
  • GPSeq Это программный инструмент для анализа данных секвенирования РНК с целью оценки экспрессии генов и экзонов, идентификации дифференциально экспрессируемых генов и дифференциально сплайсированных экзонов.
  • IsoDOT – Дифференциальная экспрессия изоформ РНК.
  • Limma Limma обеспечивает анализ дифференциальной экспрессии для секвенирования РНК и исследований на микрочипах.
  • LPEseq точно проверяет дифференциальную экспрессию с ограниченным количеством повторов.
  • Kallisto «Kallisto — это программа для количественной оценки количества транскриптов на основе данных RNA-Seq или, в более общем плане, целевых последовательностей с использованием считываний высокопроизводительного секвенирования. Она основана на новой идее псевдовыравнивания для быстрого определения совместимости считываний с мишенями без необходимость согласования по сравнению со стандартными данными RNA-Seq, kallisto может количественно оценить 30 миллионов человеческих чтений менее чем за 3 минуты на настольном компьютере Mac, используя только последовательности считывания и индекс транскриптома, на создание которого уходит менее 10 минут. "
  • MATS Многомерный анализ сплайсинга транскриптов (MATS).
  • MAPTest обеспечивает общую основу тестирования для дифференциального анализа экспрессии в эксперименте с временной динамикой RNA-Seq. Метод пакета основан на модели скрытой отрицательно-биномиальной смеси Гаусса. Предложенный тест является оптимальным по максимальной средней мощности. Тест позволяет не только идентифицировать традиционные гены DE, но и проверить множество сложных гипотез, представляющих биологический интерес. [64]
  • MetaDiff Дифференциальный анализ экспрессии изоформ с использованием мета-регрессии случайных эффектов.
  • MetaseqR — это пакет Bioconductor, который обнаруживает дифференциально экспрессируемые гены на основе данных RNA-Seq путем объединения шести статистических алгоритмов с использованием весов, оцененных на основе их производительности, с смоделированными данными, оцененными на основе реальных данных, общедоступных или полученных от пользователей. Таким образом, MetaseqR оптимизирует компромисс между точностью и чувствительностью. [65] Кроме того, MetaseqR создает подробный интерактивный отчет с различными диагностическими и исследовательскими графиками и автоматически генерируемым текстом.
  • MMSEQ — это конвейер для оценки экспрессии изоформ и аллельного дисбаланса в диплоидных организмах на основе RNA-Seq. В конвейере используются такие инструменты, как Bowtie, TopHat, ArrayExpressHTS и SAMtools. Кроме того, EdgeR или DESeq для выполнения дифференциального выражения.
  • МультиДЕ
  • Myrna — это конвейерный инструмент, который работает в облачной среде ( Elastic MapReduce ) или на уникальном компьютере для оценки дифференциальной экспрессии генов в наборах данных RNA-Seq. Bowtie используется для выравнивания коротких чтений и алгоритмов R для интервальных вычислений, нормализации и статистической обработки.
  • NEUMA — это инструмент для оценки содержания РНК с использованием нормализации длины на основе уникально выровненных ридов и моделей изоформ мРНК. NEUMA использует известные данные транскриптома, доступные в таких базах данных, как RefSeq .
  • NOISeq NOISeq — это непараметрический подход для идентификации дифференциально экспрессируемых генов на основе данных подсчета или ранее нормализованных данных подсчета. NOISeq эмпирически моделирует шумовое распределение изменений количества путем сопоставления различий кратности изменений (M) и абсолютных различий экспрессии (D) для всех признаков в образцах в одних и тех же условиях.
  • NPEBseq — это непараметрический эмпирический байесовский метод анализа дифференциальных выражений.
  • NSMAP позволяет делать выводы об изоформах, а также оценивать уровни экспрессии без аннотированной информации. Экзоны выравниваются, и сплайсинговые соединения идентифицируются с помощью TopHat. Все возможные изоформы рассчитываются на основе комбинации обнаруженных экзонов.
  • NURD — реализация нового метода оценки экспрессии изоформ на основе неоднородных данных секвенирования РНК.
  • PANDORA Пакет R для анализа и составления отчетов о результатах RNA-Seq путем объединения нескольких статистических алгоритмов.
  • PennSeq PennSeq: точная количественная оценка экспрессии генов, специфичных для изоформ, в RNA-Seq путем моделирования неравномерного распределения считываний.
  • QuasR Количественная оценка и аннотирование коротких чтений в R .
  • RapMap Быстрый, чувствительный и точный инструмент для сопоставления считываний РНК-секвенирования с транскриптомами.
  • recursiveCorPlot Кластеризация на основе корреляции для данных РНК-seq (+ интерфейс, подобный corrplot ggplot — R-пакет: recursiveCorPlot ). [66]
  • RNAeXpress можно запускать с графическим интерфейсом Java или командной строкой на Mac, Windows и Linux. Его можно настроить для выполнения подсчета чтений, обнаружения функций или сравнения GTF на сопоставленных данных rnaseq.
  • Rcount Rcount: простой и гибкий подсчет чтений RNA-Seq.
  • rDiff — это инструмент, который может обнаружить дифференциальный процессинг РНК (например, альтернативный сплайсинг, полиаденилирование или заселение рибосом).
  • RNASeqPower Расчет образцов Оценка размера для исследований секвенирования РНК. Версия пакета R.
  • RNA-Skim RNA-Skim: быстрый метод количественного определения RNA-Seq на уровне транскриптов.
  • rSeq rSeq — это набор инструментов для анализа данных RNA-Seq. Он состоит из программ, которые занимаются многими аспектами анализа данных RNA-Seq, такими как оценка качества считывания, генерация эталонных последовательностей, картирование последовательностей, оценка экспрессии генов и изоформ (RPKM) и т. д.
  • РСЭМ
  • rQuant — это веб-сервис ( установка Galaxy (вычислительная биология) ), который определяет количество транскриптов на локус гена на основе квадратичного программирования . rQuant способен оценить систематические отклонения, вызванные условиями эксперимента. Используется комбинация инструментов: PALMapper (выравнивание считываний), mTiM и mGene (выведение новых транскриптов).
  • Salmon — это программный инструмент для расчета количества транскриптов на основе данных секвенирования РНК с использованием подхода либо без выравнивания (на основе необработанных считываний), либо на основе выравнивания (на основе предварительно вычисленных выравниваний). Он использует онлайн-подход стохастической оптимизации, чтобы максимизировать вероятность наличия транскриптов в наблюдаемых данных. Само программное обеспечение способно использовать множество потоков для быстрого получения точных количественных оценок. Он является частью пакета программного обеспечения Sailfish и является преемником инструмента Sailfish.
  • SAJR — это счетчик чтения, написанный на языке Java, и R-пакет для дифференциального анализа сплайсинга. Он использует считывания соединения для оценки исключения экзона и считывания, картированные внутри экзона, для оценки его включения. SAJR моделирует его с помощью GLM с квазибиномиальным распределением и использует логарифмический критерий правдоподобия для оценки значимости.
  • Скотти Выполняет анализ мощности, чтобы оценить количество повторов и глубину секвенирования, необходимые для вызова дифференциальной экспрессии.
  • Алгоритм без выравнивания запечатывания для количественной оценки экспрессии последовательности путем сопоставления кмеров между необработанными чтениями и эталонным транскриптомом. Обрабатывает парные чтения и альтернативные изоформы и использует мало памяти. Принимает все распространенные форматы чтения и выводит количество чтений, покрытие и значения FPKM для каждой ссылочной последовательности. Открытый исходный код, написанный на чистой Java; поддерживает все платформы без перекомпиляции и других зависимостей. Распространяется с помощью BBMap. (Seal — Sequence Expression AnaLyzer — не имеет отношения к распределенному выравнивателю короткого считывания SEAL.)
  • полусуп [67] Модель полуконтролируемой смеси: обнаружение SNP с интерактивным воздействием на количественный признак
  • Sleuth — это программа для анализа экспериментов RNA-Seq, в которых количество транскриптов определялось количественно с помощью каллисто.
  • Обнаружение дифференциального сплайсинга SplicingCompass с использованием данных RNA-Seq.
  • sSeq Целью этого пакета R является обнаружение генов, которые дифференциально экспрессируются в двух условиях в экспериментах по секвенированию РНК.
  • StringTie — это сборщик выравниваний РНК-Seq в потенциальные транскрипты. Он использует новый алгоритм сетевого потока, а также дополнительный этап сборки de novo для сборки и количественного анализа полноразмерных транскриптов, представляющих несколько вариантов сплайсинга для каждого локуса гена. Он был разработан как преемник Cufflinks (в число его разработчиков входят некоторые разработчики Cufflinks) и имеет многие из тех же функций.
  • Метод оценки содержания изоформ транскрипта TIGAR с гэповым выравниванием данных RNA-Seq с помощью вариационного байесовского вывода.
  • TimeSeq обнаруживает дифференциально экспрессируемые гены в данных RNA-Seq с временной динамикой.
  • TPMCкалькулятор [68] одноэтапное программное обеспечение для количественной оценки количества мРНК геномных функций.
  • WemIQ — это программный инструмент для точной и надежной количественной оценки экспрессии изоформ и коэффициентов сплайсинга экзонов на основе данных секвенирования РНК.

Оценка количественной оценки и дифференциального выражения

[ редактировать ]
  • Моделирование данных CompcodeR RNAseq, анализ дифференциальной экспрессии и сравнение эффективности методов дифференциальной экспрессии.
  • Анализ дифференциальной экспрессии DEAR-O на основе данных секвенирования РНК – онлайн.
  • PROPER для дифференциальной экспрессии с использованием RNA-seq. Комплексная оценка
  • Вычислительные и эмпирические ресурсы RNAontheBENCH для сравнительного анализа методов количественного определения и дифференциальной экспрессии RNAseq.
  • rnaseqcomp Несколько количественных и визуализированных тестов для конвейеров количественного анализа секвенирования РНК. Количественные оценки генов, транскриптов, соединений или экзонов по двум условиям для каждого конвейера с необходимой метаинформацией должны быть организованы в числовые матрицы, чтобы продолжить оценку.

Многоинструментальные решения

[ редактировать ]
  • DEB — это веб-интерфейс/конвейер, который позволяет сравнивать результаты значительно экспрессируемых генов, полученные с помощью разных инструментов. На данный момент доступны три алгоритма: EdgeR, DESeq и bayseq.
  • SARTools R-конвейер на основе DESeq2 и EdgeR для комплексного дифференциального анализа данных RNA-Seq.

Выражение мобильного элемента

[ редактировать ]
  • TeXP — это конвейер количественного анализа транспозируемых элементов, который отделяет первазивную транскрипцию от автономной транскрипции элементов LINE-1. [69]

Workbench (конвейер анализа/интегрированные решения)

[ редактировать ]

Коммерческие решения

[ редактировать ]
  • ActiveSite от Cofactor Genomics
  • Avadis NGS (в настоящее время Strand NGS)
  • BaseSpace от Illumina
  • Biowardrobe — интегрированная платформа для анализа данных эпигеномики и транскриптомики.
  • BBrowser — платформа для анализа общедоступных и собственных данных транскриптомики отдельных клеток.
  • CLC Геномика Workbench
  • ДНКСТАР
  • ПОЭТОМУ
  • Генеданные
  • ДжинСпринг GX
  • Genevestigator от Nebion (базовая версия бесплатна для академических исследователей).
  • геоспиза
  • Золотая спираль
  • Маверикс Биомикс
  • СледующийGENe
  • ОмиксОфис
  • Детская площадка Омикс [70] от BigOmics Analytics. Удобная платформа для анализа RNA-Seq и данных протеомики. Бесплатно до трех наборов данных.
  • Partek Flow Комплексный анализ отдельных клеток в интуитивно понятном интерфейсе.
  • Клюкор . Простота использования для анализа и визуализации. Импорт файлов BAM одной кнопкой.
  • ВулканПлотАИ . Внедрите искусственный интеллект в свой vulcanPlot.

Решения с открытым (бесплатным) исходным кодом

[ редактировать ]
  • ArrayExpressHTS — это пакет BioConductor, который позволяет осуществлять предварительную обработку, оценку качества и оценку экспрессии наборов данных RNA-Seq. Его можно запустить удаленно в облаке Европейского института биоинформатики или локально. В пакете используется несколько инструментов: ShortRead (контроль качества), Bowtie, TopHat или BWA (привязка к эталонному геному), формат SAMtools, Cufflinks или MMSEQ (оценка экспрессии).
  • BioJupies — это веб-платформа, которая предоставляет комплексное решение для анализа секвенирования РНК, от бесплатной услуги выравнивания до полного отчета по анализу данных, предоставляемого в виде интерактивного блокнота Jupyter.
  • BioQueue — это веб-система очередей, разработанная преимущественно для повышения эффективности и надежности выполнения заданий в биоинформатических исследованиях путем оценки системных ресурсов, необходимых для определенного задания. В то же время BioQueue также стремится обеспечить доступность и воспроизводимость анализа данных в биомедицинских исследованиях. BioQueue, реализованный на Python 2.7, может работать как в POSIX-совместимых системах (Linux, Solaris, OS X и т. д.), так и в Windows. См. также. [71]
  • BioWardrobe — это интегрированный пакет, предназначенный для анализа наборов данных ChIP-Seq и RNA-Seq с использованием удобного веб-интерфейса пользователя. Для RNA-Seq Biowardrobe выполняет картирование, контроль качества, оценку RPKM и анализ дифференциальной экспрессии между образцами (группами образцов). Результаты анализа дифференциальной экспрессии можно интегрировать с данными ChIP-Seq для построения профилей средней плотности меток и тепловых карт. Пакет использует несколько инструментов с открытым исходным кодом, включая STAR и DESeq. См. также. [72]
  • Chipster — это удобное программное обеспечение для анализа данных с высокой пропускной способностью. Он содержит более 350 инструментов анализа для секвенирования следующего поколения (NGS), микрочипов, протеомики и данных о последовательностях. Пользователи могут сохранять и делиться рабочими процессами автоматического анализа, а также интерактивно визуализировать данные с помощью встроенного геномного браузера и многих других средств визуализации.
  • DEWE (Differential Expression Workflow Executor) — это настольное приложение с открытым исходным кодом, которое предоставляет удобный графический интерфейс для простого выполнения анализа дифференциальной экспрессии в данных RNA-Seq. В настоящее время DEWE предоставляет два рабочих процесса дифференциального анализа выражений: HISAT2, StringTie и Ballgown и Bowtie2, StringTie и библиотеки R (Ballgown и EdgeR). Он работает в Linux, Windows и Mac OS X.
  • easyRNASeq Вычисляет покрытие коротких чтений с высокой пропускной способностью относительно эталонного генома и суммирует его по интересующим признакам (например, экзону, гену, транскрипту). Данные можно нормализовать как «RPKM» или с помощью пакета «DESeq» или «edgeR».
  • График выражения
  • FASTGenomics — это онлайн-платформа для обмена данными и результатами анализа одноклеточной РНК с использованием воспроизводимых рабочих процессов. Данные об экспрессии генов могут быть переданы в соответствии с европейскими стандартами защиты данных (GDPR). FASTGenomics позволяет пользователю загружать свои собственные данные и создавать индивидуальные и воспроизводимые рабочие процессы для исследования и анализа данных об экспрессии генов (Scholz et al. 2018).
  • FX FX — это удобный для пользователя инструмент анализа экспрессии генов RNA-Seq, основанный на концепции облачных вычислений. С помощью FX вы можете просто загрузить необработанные данные FASTQ RNA-Seq в облако и позволить вычислительной инфраструктуре выполнить тяжелый анализ.
  • Galaxy : Galaxy — это рабочая платформа общего назначения для вычислительной биологии .
  • GENE-Counter — это конвейер Perl для дифференциального анализа экспрессии генов RNA-Seq. Gene-counter выполняет выравнивание с помощью CASHX, Bowtie, BWA или другого выравнивателя выходных сигналов SAM. Дифференциальная экспрессия генов выполняется с помощью трех дополнительных пакетов (NBPSeq, EdgeR и DESeq) с использованием методов отрицательного биномиального распределения. Результаты сохраняются в базе данных MySQL , что позволяет проводить дополнительный анализ.
  • GenePattern — это свободно доступная онлайн-платформа, которая обеспечивает доступ к методам анализа RNA-Seq без необходимости программирования.
  • GeneProf Свободно доступные и простые в использовании конвейеры анализа для экспериментов по секвенированию РНК и ChIP-секвенированию.
  • GREIN — это интерактивная веб-платформа для повторной обработки и повторного анализа данных GEO RNA-seq. GREIN использует внутренний вычислительный конвейер для единообразной обработки данных секвенирования РНК и большого количества (>5800) уже обработанных наборов данных. Удобные интерфейсы предоставляют множество возможностей пользовательского анализа, включая настройку и загрузку обработанных данных, интерактивную визуализацию, анализ статистической мощности, построение сигнатур дифференциальной экспрессии генов и их комплексную функциональную характеристику, анализ связности с данными LINCS L1000, и т. д.
  • GT-FAR — это конвейер секвенирования РНК, который выполняет контроль качества секвенирования РНК, выравнивание, количественную оценку без эталонных значений и вызов вариантов сплайсинга. Он фильтрует, обрезает и последовательно сопоставляет чтения с моделями генов, а также прогнозирует и проверяет новые соединения сплайсинга, после чего количественно определяет экспрессию для каждого гена, экзона и известного/нового соединения сплайсинга, а также вызов вариантов.
  • MultiExperiment Viewer (MeV) подходит для анализа, интеллектуального анализа данных и визуализации крупномасштабных геномных данных. Модули MeV включают в себя различные алгоритмы для выполнения таких задач, как кластеризация и классификация, t-критерий Стьюдента , анализ обогащения набора генов или анализ значимости. MeV работает на Java .
  • NGSUtils — это набор программных инструментов для работы с наборами данных секвенирования нового поколения.
  • Rail-RNA Масштабируемый анализ сплайсинга и покрытия RNA-seq.
  • RAP RNA-Seq Analysis Pipeline, новое облачное веб-приложение NGS.
  • RSEQtools «RSEQtools состоит из набора модулей, которые выполняют общие задачи, такие как вычисление значений экспрессии генов, генерация сигнальных дорожек сопоставленных чтений и сегментация этого сигнала на активно транскрибируемые области. В дополнение к анонимизации, обеспечиваемой этим форматом, он также облегчает развязку выравнивания показаний последующих анализов».
  • RobiNA предоставляет пользовательский графический интерфейс для работы с пакетами R/BioConductor. RobiNA предоставляет пакет, который автоматически устанавливает все необходимые внешние инструменты (фреймворки R/Bioconductor и Bowtie ). Этот инструмент предлагает разнообразие методов контроля качества и возможность создавать множество таблиц и графиков, предоставляющих подробные результаты для дифференциального выражения. Кроме того, результаты можно визуализировать и манипулировать ими с помощью MapMan и PageMan . RobiNA работает на Java версии 6.
  • RseqFlow — это конвейер анализа РНК-Seq, который предлагает экспресс-реализацию этапов анализа наборов данных секвенирования РНК. Он может выполнять контроль качества (QC) до и после картирования данных секвенирования, рассчитывать уровни экспрессии для уникально картированных считываний, идентифицировать дифференциально экспрессируемые гены и преобразовывать форматы файлов для упрощения визуализации.
  • S-MART обрабатывает картированные данные RNA-Seq и выполняет, по сути, манипулирование данными (выбор/исключение прочтений, кластеризацию и анализ дифференциальной экспрессии) и визуализацию (считывание информации, распределение, сравнение с эпигеномными данными ChIP-Seq). Его может запустить на любом ноутбуке человек без компьютерного опыта. Дружественный графический интерфейс пользователя упрощает работу с инструментами.
  • Taverna — это доменно-независимая система управления рабочими процессами с открытым исходным кодом — набор инструментов, используемых для разработки и выполнения научных рабочих процессов, а также для помощи в компьютерных экспериментах.
  • TCW — это инструмент для вычислений транскриптомов.
  • TRAPLINE — стандартизированный и автоматизированный конвейер для анализа, оценки и аннотирования данных секвенирования РНК.
  • ViennaNGS Набор инструментов для создания эффективных конвейеров анализа секвенирования нового поколения.
  • wapRNA Это бесплатное веб-приложение для обработки высокопроизводительных данных RNA-Seq (wapRNA) с платформ секвенирования нового поколения (NGS), таких как Genome Analyser от Illumina Inc. (Solexa) и SOLiD от Applied Biosystems (SOLiD). ). wapRNA предоставляет интегрированный инструмент для секвенирования РНК. Это означает использование технологий высокопроизводительного секвенирования для секвенирования кДНК с целью получения информации о содержании РНК в образце.

Альтернативный анализ сплайсинга

[ редактировать ]

Общие инструменты

[ редактировать ]
  • Пакет инструментов для анализа альтернативного сплайсинга (ASATP) Пакет инструментов для анализа альтернативного сплайсинга (ASATP) включает ряд наборов инструментов для анализа событий альтернативного сплайсинга, которые можно использовать для обнаружения и визуализации событий альтернативного сплайсинга, проверки изменений ORF, оценки правил альтернативного сплайсинга и выполнения статистический анализ.
  • Asprofile — это набор программ для извлечения, количественной оценки и сравнения событий альтернативного сплайсинга (AS) из данных секвенирования РНК.
  • AStalavista Веб-сервер AStalavista извлекает и отображает события альтернативного сплайсинга (AS) из заданной геномной аннотации координат экзон-интронного гена. Сравнивая все заданные транскрипты, AStalavista обнаруживает изменения в их структуре сплайсинга и идентифицирует все события AS (например, пропуск экзона, альтернативный донор и т. д.), присваивая каждому из них код AS.
  • CLASS2 на основе считываний RNA-seq. Точная и эффективная аннотация вариантов сплайсинга
  • Запонки/Запонки
  • DEXseq Вывод об дифференциальном использовании экзонов в RNA-Seq.
  • Diceseq Статистическое моделирование динамики сплайсинга изоформ на основе данных временных рядов RNA-seq.
  • EBChangepoint Эмпирическая модель точки изменения Байеса для идентификации альтернативного сплайсинга 3' и 5' с помощью RNA-Seq.
  • Eoulsan Универсальная платформа, предназначенная для высокопроизводительного анализа данных секвенирования. Позволяет автоматический анализ (сопоставление, подсчет и дифференциальный анализ с помощью DESeq2).
  • GESS для обнаружения de novo сайтов событий с пропуском экзонов из необработанных считываний РНК-seq.
  • LeafCutter — набор новых методов, которые позволяют идентифицировать и количественно оценивать новые и существующие альтернативные события сплайсинга, уделяя особое внимание вырезанию интронов.
  • ЛИМОНЫ [73] Инструмент для идентификации сплайсинговых соединений в транскриптомах организмов, не имеющих референсных геномов.
  • МАДЖИК . Моделирование количественной оценки включения альтернативного соединения.
  • MATS Многомерный анализ сплайсинга транскриптов (MATS).
  • MISO количественно определяет уровень экспрессии вариантов сплайсинга на основе данных RNA-Seq и способен распознавать дифференциально регулируемые экзоны/изоформы в разных образцах. MISO использует вероятностный метод (байесовский вывод) для расчета вероятности происхождения считываний.
  • Rail-RNA Масштабируемый анализ сплайсинга и покрытия RNA-seq.
  • RPASuite [74] RPASuite (пакет анализа обработки РНК) — это вычислительный конвейер для идентификации дифференциально и когерентно обработанных транскриптов с использованием данных секвенирования РНК, полученных из нескольких тканевых или клеточных линий.
  • RSVP RSVP — это пакет программного обеспечения для прогнозирования альтернативных изоформ генов, кодирующих белки, на основе данных геномной ДНК и выровненных считываний секвенирования РНК. Метод основан на использовании графов ORF, которые являются более общими, чем графы сплайсинга, используемые при традиционной сборке транскриптов.
  • SAJR вычисляет количество прочтений, подтверждающих включение или исключение сегмента (части гена между двумя ближайшими сайтами сплайсинга), а затем моделирует эти подсчеты с помощью GLM с квазибиномиальным распределением для учета биологической изменчивости.
  • Пакет SGSeq AR для прогнозирования событий сращивания de novo.
  • SplAdder Идентификация, количественная оценка и тестирование альтернативных событий сплайсинга на основе данных RNA-Seq.
  • SpliceGrapher Прогнозирование новых событий альтернативного сплайсинга на основе данных RNA-Seq. Также включает графические инструменты для визуализации графов сращивания. [75] [76]
  • SpliceJumper — основанный на классификации подход для вызова соединений сплайсинга на основе данных секвенирования РНК.
  • SplicePie — это конвейер для анализа непоследовательного и многоэтапного сращивания. SplicePie содержит три основных этапа анализа: анализ порядка сплайсинга для каждого образца, поиск событий рекурсивного сплайсинга для каждого образца и суммирование предсказанных событий рекурсивного сплайсинга для всех анализируемых образцов (для большей надежности рекомендуется использовать больше образцов). Первые два шага выполняются индивидуально для каждой выборки, а на последнем этапе рассматривается перекрытие во всех выборках. Однако анализ можно провести и на одном образце.
  • SplicePlot — это инструмент для визуализации альтернативного сплайсинга и эффектов сплайсинга локусов количественных признаков (sQTL) на основе данных секвенирования РНК. Он предоставляет простой интерфейс командной строки для рисования графиков сашими, графиков кустов и структурных графиков альтернативных событий склейки из файлов .bam, .gtf и .vcf.
  • SpliceR Пакет R для классификации альтернативного сплайсинга и прогнозирования потенциала кодирования на основе данных секвенирования РНК.
  • SpliceSEQ SpliceViewer — это Java-приложение, которое позволяет исследователям исследовать альтернативные закономерности сплайсинга мРНК в данных исследований высокопроизводительного секвенирования мРНК. Считывания последовательностей сопоставляются с графами сплайсинга, которые однозначно определяют количественный уровень включения каждого экзона и соединения сплайсинга. Затем графики просматриваются, чтобы предсказать изоформы белка, которые, вероятно, возникнут в результате наблюдаемого считывания экзонов и сплайсинговых соединений. Аннотации UniProt сопоставляются с каждой изоформой белка для выявления потенциальных функциональных последствий альтернативного сплайсинга.
  • Сращивание ловушки [77] представляет собой статистический инструмент для количественной оценки коэффициентов включения экзонов на основе данных секвенирования РНК.
  • Splicing Express – пакет программного обеспечения для альтернативного анализа сплайсинга с использованием данных секвенирования нового поколения.
  • SUPPA Этот инструмент генерирует различные события альтернативного сплайсинга (AS) и вычисляет значение PSI («Процент сплайсинга») для каждого события, используя количественную оценку содержания транскриптов из нескольких образцов.
  • SwitchSeq идентифицирует экстремальные изменения в сплайсинге (события переключения).
  • с помощью решётки . Идентификация подлинных стыковых соединений
  • TrueSight Алгоритм самообучения для обнаружения сплайсинговых соединений с использованием RNA-seq.
  • Vast-tools Набор инструментов для профилирования альтернативных событий сплайсинга в данных RNA-Seq.

Анализ удержания интронов

[ редактировать ]
  • IRcall / IRclassifier IRcall — это вычислительный инструмент для обнаружения IR-событий на основе данных RNA-Seq. IRclassifier — это контролируемый подход на основе машинного обучения для обнаружения IR-событий на основе данных RNA-Seq.
  • ФРЕЙЗЕР [78] [79]

Дифференциальное использование изоформ/транскриптов

[ редактировать ]
  • IsoformSwitchAnalyzeR IsoformSwitchAnalyzeR — это пакет R, который позволяет статистическую идентификацию переключателей изоформ с прогнозируемыми функциональными последствиями, где интересующие последствия могут быть выбраны из длинного списка, но включают увеличение/потерю белковых доменов, изменения сигнальных пептидов в чувствительности к NMD. [80] IsoformSwitchAnalyzeR предназначен для последующего анализа данных из любого полноразмерного инструмента количественного анализа изоформ/транскриптов, но напрямую поддерживает Cufflinks/Cuffdiff, RSEM Kallisto и Salmon.
  • DRIMSeq Пакет R, который использует обобщенное линейное моделирование (GLM) для идентификации переключений изоформ на основе расчетных данных о количестве изоформ. [81]
  • BayesDRIMSeq Пакет R, содержащий байесовскую реализацию DRIMSeq. [82]
  • Запонки/Запонки Инструмент для количественного определения изоформ/транскриптов полной длины и дифференциального анализа, который, помимо прочего, проверяет изменения в использовании изоформ, принадлежащих к одному и тому же первичному транскрипту (совместно использующему TSS), с помощью одностороннего t-критерия, основанного на асимптотике Дженсена- Метрика Шеннона. [58]
  • rSeqNP Пакет R, реализующий непараметрический подход для проверки дифференциальной экспрессии и сплайсинга на основе данных RNA-Seq. [83]
  • Изолятор Полноразмерный инструмент для количественного определения изоформ/транскриптов и дифференциального анализа, который анализирует все образцы в эксперименте одновременно, используя простую байесовскую иерархическую модель. Можно определить дифференциальное использование изоформ путем тестирования вероятности монотонного сплайсинга. [84]

Слитые гены/химеры/искатели транслокаций/структурные вариации

[ редактировать ]

Геномные изменения, возникающие в результате таких заболеваний, как рак, могут вызывать аберрантные генетические модификации, такие как слияния или транслокации. Идентификация этих модификаций играет важную роль в исследованиях канцерогенеза. [85]

  • Выше [86] это алгоритм обнаружения слияния, основанный на STAR [49] Элайнер RNA-Seq. Он является победителем конкурса DREAM Challenge по обнаружению термоядерного синтеза. [87] Arriba также может обнаруживать сайты вирусной интеграции, внутренние тандемные дупликации, дупликации целых экзонов, кольцевые РНК , события захвата энхансера с участием локусов иммуноглобулина/рецептора Т-клеток и точки разрыва в интронах или межгенных областях.
  • Беллерофонт [88]
  • Брейкдансер [89]
  • БрейкФьюжн [90]
  • ХимераСкан [91]
  • ЭБАРДеново [92]
  • Easyfuse — это конвейер, сочетающий в себе STAR-Fusion [93] и ловец слияний [94] для обнаружения слитых транскриптов на основе данных RNA-seq с высокой точностью. Более старая версия (1.3.7) также включает InFusion, [95] КартаSplice2 [96] и мыльный предохранитель [97] для обнаружения сращений с максимальной чувствительностью. [98]
  • Эрикскрипт [99]
  • DEEPEST — это статистический алгоритм обнаружения слияния. [100] DEEPEST также может обнаруживать кольцевые РНК .
  • DeFuse DeFuse — это пакет программного обеспечения для обнаружения слияния генов с использованием данных RNA-Seq. [101]
  • Dr. Disco Dr. Disco — это детектор слияния, который учитывает весь эталонный геном и, следовательно, также способен обнаруживать геномные точки останова. Поэтому он особенно подходит для секвенирования рРНК минус РНК. [7]
  • egfr-v3-determiner EGFR-v3-determiner — это инструмент, который подсчитывает сплайс/структурные варианты EGFRvIII и EGFRwt непосредственно из файлов выравнивания. [102]
  • FusionAnalyser FusionAnalyser использует сопоставление парных чтений с разными генами (мостовые чтения). [103]
  • FusionCatcher FusionCatcher ищет новые/известные соматические слитые гены, транслокации и химеры в данных секвенирования РНК (чтение многоцепочечных/нецепочечных парных концов с платформ Illumina NGS) из больных образцов. [94]
  • FusionHunter идентифицирует транскрипты слияния независимо от уже известных аннотаций. Он использует Bowtie в качестве первого выравнивателя и считывания парных концов.
  • FusionMap FusionMap — это выравниватель слияния, который выравнивает считывания, охватывающие места слияния, непосредственно с геномом без предварительного знания потенциальных областей слияния. Он обнаруживает и характеризует термоядерные соединения с разрешением пары оснований. FusionMap можно применять для обнаружения слитых соединений как в одноконцевых, так и в парных наборах данных в исследованиях gDNA-Seq или RNA-Seq. [104]
  • FusionSeq [105]
  • Инфузия [95]
  • JAFFA основан на идее сравнения транскриптома с эталонным транскриптомом, а не на геномно-ориентированном подходе, как в других средствах поиска слияний . [106]
  • КартаСоединение [96]
  • nпредохранитель [107]
  • Oncomine NGS RNA-Seq. Браузер экспрессии генов
  • ПРАДА [108]
  • SOAPFuse обнаруживает слитые транскрипты на основе данных секвенирования парных концов РНК человека. Он превосходит пять других аналогичных инструментов как по производительности вычислений, так и по производительности обнаружения слияния с использованием как реальных, так и смоделированных данных. [97]
  • SOAPfusion [109]
  • СТАР-Фьюжн [93]
  • TopHat-Fusion основан на версии TopHat и был разработан для обработки операций чтения, возникающих в результате слияния генов. Он не требует предварительных данных об известных генах и использует Bowtie для согласования непрерывных считываний. [110]
  • ViralFusionSeq [111] — это инструмент высокопроизводительного секвенирования (HTS) для обнаружения событий вирусной интеграции и реконструкции транскриптов слияния с одноосновательным разрешением.
  • ViReMa (Viral Recombination Mapper) обнаруживает и сообщает о событиях рекомбинации или слияния внутри и между геномами вируса и хозяина, используя наборы данных глубокого секвенирования. [112]

Идентификация изменения номера копии

[ редактировать ]
  • CNVseq обнаруживает вариации числа копий , поддерживаемые статистической моделью, полученной в результате сравнительной геномной гибридизации . Выравнивание последовательностей выполняется с помощью BLAT, расчеты выполняются модулями R и полностью автоматизированы с использованием Perl. Есть несколько других инструментов биоинформатики, которые могут вызывать CNA из RNA-Seq. [113]

Одноклеточная РНК-Seq

[ редактировать ]

Секвенирование отдельных клеток . Традиционная методология секвенирования РНК широко известна как «массовый секвенирование РНК», в этом случае РНК извлекается из группы клеток или тканей, а не из отдельной клетки, как это происходит в методах с отдельными клетками. Некоторые инструменты, доступные для массового секвенирования РНК, также применяются для анализа отдельных клеток, однако, чтобы учесть специфику этого метода, были разработаны новые алгоритмы.

  • CEL-Seq [114] секвенирование одноклеточной РНК методом мультиплексной линейной амплификации.
  • Drop-Seq [115] Высокопараллельное профилирование экспрессии отдельных клеток по всему геному с использованием нанолитровых капель.
  • FISSEQ Секвенирование транскриптома отдельных клеток in situ , т.е. без диссоциации клеток.
  • Oscope : статистический конвейер для идентификации осциллирующих генов в несинхронизированных экспериментах по секвенированию одноклеточной РНК.
  • подводное плавание [116] Извлечение родственных связей и моделирование динамических изменений, связанных с дифференцировкой клеток нескольких линий.
  • scLVM [117] scLVM — это основа моделирования данных секвенирования одноклеточной РНК, которую можно использовать для разделения наблюдаемой гетерогенности на различные источники, тем самым позволяя корректировать мешающие источники вариаций.
  • scM&T-Seq Параллельное секвенирование отдельных клеток.
  • Сфинкс [118] SPHINX — это гибридный подход к объединению, который обеспечивает высокую эффективность объединения за счет использования как «композиционных», так и «сходных» функций последовательности запроса во время процесса объединения. SPHINX может анализировать последовательности в наборах метагеномных данных так же быстро, как подходы, основанные на композиции, но, тем не менее, обладает точностью и специфичностью алгоритмов, основанных на сходстве.
  • ТРАСС [119] Реконструкция парного Т-клеточного рецептора на основе считываний одноклеточной РНК-Seq.
  • VDJГоловоломки [120] Реконструкция Т-клеточного рецептора на основе считывания одноклеточной РНК-Seq и связывание клонотипа с функциональным фенотипом и транскриптомом отдельных клеток.

Интегрированные пакеты

[ редактировать ]
  • Монокль [121] Дифференциальная экспрессия и анализ временных рядов для экспериментов по секвенированию одноклеточной РНК и кПЦР .
  • СКАНПИ [122] [123] Масштабируемая реализация на основе Python для предварительной обработки, визуализации, кластеризации, вывода траектории и тестирования дифференциальных выражений.
  • SCell [124] комплексный анализ данных секвенирования одноклеточной РНК.
  • Сёра [125] [126] Пакет R, предназначенный для контроля качества, анализа и изучения данных одноклеточной РНК-секвенирования.
  • Синселл [127] пакет R/ Bioconductor для статистической оценки иерархий клеточных состояний на основе секвенирования одноклеточной РНК.
  • ИСКРЕННИЙ [128] Конвейер для анализа профилирования одноклеточной РНК-Seq.

Контроль качества и фильтрация генов

[ редактировать ]
  • Виолончель [129] Конвейер для картирования и оценки качества данных секвенирования РНК отдельных клеток.
  • OEFinder [130] Пользовательский интерфейс для выявления и визуализации эффектов упорядочения в данных секвенирования одноклеточной РНК.
  • SinQC [131] Метод и инструмент для контроля качества данных секвенирования одноклеточной РНК.

Очистка и шумоподавление данных

[ редактировать ]
  • АвтоКласс [132] Универсальный алгоритм искусственного интеллекта для глубокой очистки данных одноклеточной РНК-Seq.

Нормализация

[ редактировать ]
  • ОСНОВЫ [133] Понимание изменений в экспрессии генов на уровне отдельных клеток.
  • ГРМ [134] Нормализация и снижение шума для экспериментов по секвенированию одноклеточной РНК.

Уменьшение размеров

[ редактировать ]
  • УМИРАТЬ [135] Уменьшение размерности для анализа экспрессии генов в отдельных клетках с нулевым завышением.

Дифференциальное выражение

[ редактировать ]
  • БПСК [136] Пакет R BPSC для подбора модели и анализа дифференциальной экспрессии одноклеточной РНК-seq.
  • МАЧТА [137] гибкая статистическая основа для оценки транскрипционных изменений и характеристики гетерогенности в данных секвенирования одноклеточной РНК.
  • SCDE [138] Характеристика транскрипционной гетерогенности посредством анализа сверхдисперсии путей и набора генов.

Визуализация

[ редактировать ]

Симуляторы RNA-Seq

[ редактировать ]

Эти симуляторы генерируют считывания in silico и являются полезными инструментами для сравнения и проверки эффективности алгоритмов, разработанных для обработки данных RNA-Seq. Более того, некоторые из них позволяют анализировать и моделировать протоколы RNA-Seq.

  • Симулятор BEERS форматируется для данных мыши или человека, а парные операции чтения секвенируются на платформе Illumina. Бирс генерирует чтения, начиная с пула моделей генов, взятых из разных источников опубликованных аннотаций. Некоторые гены выбираются случайным образом, после чего в них намеренно вводятся ошибки (такие как инделы, изменения оснований и хвосты низкого качества), за которыми следует создание новых сплайсинговых соединений.
  • Моделирование данных compcodeR RNAseq, анализ дифференциальной экспрессии и сравнение эффективности методов дифференциальной экспрессии.
  • CuReSim — индивидуальный симулятор чтения.
  • Симулятор Flux реализует компьютерное моделирование конвейера для имитации эксперимента RNA-Seq. При моделировании учитываются все этапы компонентов, влияющие на RNA-Seq (обратная транскрипция, фрагментация, лигирование адаптера, ПЦР-амплификация, сегрегация в геле и секвенирование). Эти шаги представляют экспериментальные атрибуты, которые можно измерить, и фиксируют приблизительные экспериментальные отклонения. Flux Simulator позволяет объединить каждый из этих шагов в качестве модулей для анализа различных типов протоколов.
  • PBSIM PacBio считывает данные симулятора – для точной сборки генома.
  • Полиэстер. Этот пакет биопроводников можно использовать для моделирования считывания секвенирования РНК из экспериментов по дифференциальной экспрессии с повторами. Затем чтения можно выровнять и использовать для сравнения методов дифференциального выражения.
  • RandomReads Генерирует синтетические чтения генома с помощью модели ошибок Illumina или PacBio. Чтения могут быть парными или непарными, с произвольной длиной и размером вставки, выводом в формате fasta или fastq. RandomReads имеет широкий выбор опций скорости мутации, с индивидуальными настройками замены, удаления, вставки, а также скорости N и распределения длин, аннотируя читается с исходным, неизмененным геномным расположением начала и конца. Программа RandomReads не меняет уровни экспрессии и, следовательно, предназначена не для моделирования экспериментов по секвенированию РНК, а для проверки чувствительности и специфичности выравнивателей РНК-секвенирования с интронами de novo. Включает инструмент для оценки и создания кривых ROC на основе полученных файлов Sam. Открытый исходный код, написанный на чистой Java; поддерживает все платформы без перекомпиляции и других зависимостей. Распространяется с помощью BBMap.
  • rlsim — это пакет программного обеспечения для моделирования подготовки библиотеки RNA-seq с оценкой параметров.
  • rnaseqbenchmark Эталонный тест для конвейеров количественного анализа секвенирования РНК.
  • rnaseqcomp Эталоны для конвейеров количественного анализа секвенирования РНК.
  • RSEM Read Simulator RSEM предоставляет пользователям программу «rsem-simulate-reads» для моделирования данных RNA-Seq на основе параметров, полученных из реальных наборов данных.
  • RNASeqReadSimulator содержит набор простых скриптов Python, управляемых из командной строки. Он генерирует случайные уровни экспрессии транскриптов (одиночных или парных), в равной степени имитирует чтения с определенным шаблоном позиционной предвзятости и генерирует случайные ошибки от платформ секвенирования.
  • RNA Seq Simulator RSS берет файлы выравнивания SAM из данных RNA-Seq и моделирует рассредоточенные, множественные реплики, дифференциальные, нецепочечные наборы данных RNA-Seq.
  • SimSeq Непараметрический подход к моделированию наборов данных последовательностей РНК.
  • WGsim Wgsim — небольшой инструмент для моделирования чтения последовательностей из эталонного генома. Он способен моделировать диплоидные геномы с помощью SNP и полиморфизмов вставки / удаления (INDEL), а также моделировать чтения с однородными ошибками секвенирования замен. Он не генерирует ошибок секвенирования INDEL, но это можно частично компенсировать путем моделирования полиморфизмов INDEL.

Сборщики транскриптома

[ редактировать ]

Транскриптом это совокупность РНК, экспрессируемых в одной клетке или группе клеток, включая некодирующие и кодирующие белок РНК. Существует два типа подходов к сборке транскриптомов. Методы, основанные на геноме, используют эталонный геном (если возможно, законченный и высококачественный геном) в качестве шаблона для выравнивания и сборки прочтений в транскрипты. Геномно-независимые методы не требуют эталонного генома и обычно используются, когда геном недоступен. В этом случае прочтения собираются непосредственно в транскрипты.

Геномно-ориентированные ассемблеры

[ редактировать ]
  • Сборка байесовского транскриптома Байемблера .
  • CIDANE - комплексное открытие изоформ и оценка численности.
  • CLASS CLASS — это программа для сборки транскриптов из считываний РНК-seq, выровненных по геному. CLASS создает набор транскриптов в три этапа. На этапе 1 используется линейное программирование для определения набора экзонов для каждого гена. На этапе 2 создается представление гена в виде графа сплайсинга путем соединения экзонов (вершин) через интроны (ребра), извлеченные из сплайсированных выравниваний чтения. На этапе 3 выбирается подмножество кандидатов-транскриптов, закодированных в графе, которые могут объяснить все чтения, используя либо экономичный подход (SET_COVER), либо подход оптимизации динамического программирования. На этом этапе учитываются ограничения, вытекающие из пар пар и выравниваний сплайсинга, а также, необязательно, знания о структуре гена, извлеченные из известных аннотаций или выравниваний последовательностей кДНК.
  • Cufflinks Cufflinks собирает транскрипты, оценивает их численность и тестирует дифференциальную экспрессию и регуляцию в образцах RNA-Seq. Он принимает выровненные считывания RNA-Seq и собирает эти выравнивания в экономичный набор транскриптов. Затем Запонки оценивают относительное содержание этих транскриптов на основе того, сколько чтений поддерживает каждый из них, принимая во внимание ошибки в протоколах подготовки библиотеки.
  • iReckon iReckon — это алгоритм одновременной реконструкции изоформ и оценки численности. Помимо моделирования новых изоформ, мультикартированных ридов и дубликатов ридов, этот метод учитывает возможное присутствие несплайсированной пре-мРНК и удержание интронов. iReckon требует только набора сайтов начала и конца транскрипции, но может использовать известные полные изоформы для повышения чувствительности. Начиная с набора почти всех возможных изоформ, iReckon использует регуляризованный алгоритм ЭМ для определения тех, которые действительно присутствуют в секвенированном образце, а также их содержания. iReckon является многопоточным для повышения эффективности на всех трудоемких этапах.
  • IsoInfer IsoInfer — это программа C/C++ для вывода изоформ на основе коротких считываний RNA-Seq (одноконцевых и парных), границы экзон-интрон и информации TSS/PAS.
  • IsoLasso IsoLasso — это алгоритм для сборки транскриптов и оценки уровней их экспрессии на основе считываний RNA-Seq.
  • Flipflop FlipFlop реализует метод обнаружения транскриптов de novo и оценки их численности на основе данных RNA-Seq. Он отличается от Cufflinks тем, что одновременно выполняет задачи идентификации и количественного анализа, используя выпуклый подход максимального правдоподобия с штрафом.
  • GIIRA GIIRA — это метод прогнозирования генов, который идентифицирует потенциальные кодирующие области исключительно на основе картирования считываний из эксперимента RNA-Seq. В первую очередь он был разработан для прогнозирования генов прокариот и способен распознавать гены в экспрессируемой области оперона. Однако он также применим к эукариотам и предсказывает структуры экзонов-интронов, а также альтернативные изоформы.
  • MITIE Одновременная идентификация транскрипта на основе секвенирования РНК и количественный анализ в нескольких образцах.
  • RNAeXpress RNA-eXpress был разработан как удобное для пользователя решение для извлечения и аннотирования биологически важных транскриптов из данных секвенирования РНК нового поколения. Этот подход дополняет существующие базы данных аннотаций генов, гарантируя, что все транскрипты, присутствующие в образце, рассматриваются для дальнейшего анализа.
  • Священное Писание Священное Писание — это метод реконструкции транскриптома, который основан исключительно на считывании РНК-Seq и собранном геноме для создания транскриптома ab initio. Статистические методы оценки значимости покрытия чтения также применимы к другим данным секвенирования. В Писании также есть модули для пикового вызова ChIP-Seq.
  • СЛАЙД Разреженное линейное моделирование данных РНК-Seq для обнаружения изоформ и оценки численности.
  • Strawberry Программа для геномной реконструкции транскриптов и количественного определения по секвенированию парных концов РНК.
  • StringTie StringTie — это сборщик выравниваний РНК-Seq в потенциальные транскрипты. Он использует новый алгоритм сетевого потока, а также дополнительный этап сборки de novo для сборки и количественного анализа полноразмерных транскриптов, представляющих несколько вариантов сплайсинга для каждого локуса гена. Его входные данные могут включать не только выравнивания необработанных ридов, используемых другими ассемблерами транскриптов, но также выравнивания более длинных последовательностей, которые были собраны из этих ридов. Чтобы идентифицировать дифференциально экспрессирующиеся гены между экспериментами, выходные данные StringTie могут быть обработаны программами Cuffdiff или Ballgown.
  • TransComb — сборка транскриптома под контролем генома посредством расчесывания соединений в графах сплайсинга.
  • Traph Инструмент для идентификации и количественного определения транскриптов с помощью RNA-Seq.
  • Тайлинговая сборка для независимого от аннотаций открытия новых генов.

Геномно-независимые ( de novo ) ассемблеры

[ редактировать ]
  • Бриджер [139] был разработан в Шаньдунском университете и использует преимущества методов, используемых в Cufflinks, для преодоления ограничений существующих ассемблеров de novo.
  • Новый алгоритм сборки CLC от CLC Genomics Workbench.
  • KISSPLICE — это программное обеспечение, которое позволяет анализировать данные секвенирования РНК с использованием эталонного генома или без него. Это точный локальный ассемблер транскриптома, позволяющий идентифицировать SNP, инделы и события альтернативного сплайсинга. Он может иметь дело с произвольным количеством биологических состояний и количественно оценивать каждый вариант в каждом состоянии.
  • Oasis Сборщик транскриптома De novo для очень короткого чтения.
  • rnaSPAdes
  • Rnnotator — автоматизированный конвейер сборки транскриптома de novo из считываний многоцепочечной РНК-Seq.
  • САТ-Ассемблер
  • SOAPденово-Транс
  • Картирование перевода лесов
  • Транс-АБыСС
  • Т-ИДБА
  • Trinity - метод эффективной и надежной реконструкции транскриптомов de novo на основе данных секвенирования РНК. Trinity объединяет три независимых программных модуля: Inchworm, Chrysalis и Butterfly, которые последовательно применяются для обработки больших объемов считываний РНК-сек.
  • бархат
  • ТрансЛиГ

Инструменты оценки сборки

[ редактировать ]
  • Буско предоставляет количественные меры для оценки сборки генома, набора генов и полноты транскриптома, основанные на эволюционно обоснованных ожиданиях содержания генов от почти универсальных ортологов с одной копией, выбранных с помощью инструмента OrthoDB.
  • Detonate DETONATE (сборка DE novo TranscriptOme rNa-seq с оценкой правды или без нее) состоит из двух пакетов компонентов: RSEM-EVAL и REF-EVAL. Оба пакета в основном предназначены для оценки сборок транскриптома de novo, хотя REF-EVAL можно использовать для сравнения наборов любых видов геномных последовательностей.
  • Инструмент оценки качества rnaQUAST для сборок транскриптомов.
  • TransRate Transrate — это программное обеспечение для анализа качества сборки транскриптома de novo. Он подробно изучает вашу сборку и сравнивает ее с экспериментальными данными, такими как чтение секвенирования, отчетность об оценках качества контигов и сборок. Это позволяет вам выбирать между ассемблерами и параметрами, отфильтровывать плохие контиги из сборки и помогает решить, когда прекратить попытки улучшить сборку.

Сети совместного выражения

[ редактировать ]
  • GeneNetWeaver — это инструмент с открытым исходным кодом для создания тестов in silico и профилирования производительности методов сетевого вывода.
  • WGCNA — это пакет R для анализа сети взвешенной корреляции.
  • Pigengene — это пакет R, который извлекает биологическую информацию из профилей экспрессии генов. Основываясь на сети коэкспрессии, он вычисляет собственные гены и эффективно использует их в качестве признаков для соответствия деревьям решений и байесовским сетям, которые полезны при диагностике и прогнозировании. [140]

Прогнозирование и анализ микроРНК

[ редактировать ]
  • iSRAP [141] исследовательский инструмент в одно касание для быстрого профилирования данных секвенирования малых РНК.
  • SPAR [142] секвенирование малых РНК, секвенирование коротких тотальных РНК, секвенирование микроРНК, обработка данных секвенирования малых РНК отдельных клеток, анализ, аннотирование, визуализация и сравнение со эталонными наборами данных ENCODE и DASHR.
  • miRDeep2
  • МИРЕНА
  • miRExpress
  • МИР-ПРЕФЕР М
  • miRDeep-P Для растений
  • miRDeep
  • miRPlant
  • МиРдуп
  • Шортстек [143] Пакет выравнивания и аннотаций, предназначенный для анализа малых РНК в растениях, известный своей ориентацией на аннотации высокой достоверности.

Инструменты визуализации

[ редактировать ]
  • AПросмотрите настраиваемую структуру геномного браузера нового поколения.
  • Artemis Artemis — это бесплатный браузер генома и инструмент аннотаций, который позволяет визуализировать особенности последовательности, данные следующего поколения и результаты анализа в контексте последовательности, а также ее шестикадровый перевод.
  • Apollo Apollo предназначен для поддержки географически рассредоточенных исследователей, а работа распределенного сообщества координируется посредством автоматической синхронизации: все изменения в одном клиенте мгновенно передаются всем другим клиентам, что позволяет пользователям видеть обновления аннотаций от соавторов в режиме реального времени во время работы. процесс редактирования.
  • BamView BamView — это бесплатное интерактивное средство отображения выравниваний чтения в файлах данных BAM. Он был разработан группой Pathogen в Институте Сэнгера.
  • Геном браузера : [144] веб-анализ и визуализация данных секвенирования РНК.
  • Degust Интерактивный веб-инструмент для визуализации данных дифференциальной экспрессии генов.
  • DensityMap — это инструмент Perl для визуализации плотности объектов вдоль хромосом.
  • EagleView EagleView — это программа для просмотра ассемблера генома, насыщенная информацией, с возможностью интеграции данных. EagleView может отображать дюжину различных типов информации, включая базовые качества, сигналы трассировки, специфичные для машины, и аннотации функций генома.
  • expvip-web — настраиваемая платформа для анализа и визуализации данных секвенирования РНК.
  • GBПросмотреть
  • Средство просмотра интегративной геномики (IGV)
  • просмотр генома
  • КартаView
  • Пакет программного обеспечения для комплексного анализа генома MicroScope для создания тепловых карт экспрессии генов.
  • ReadXplorer ReadXplorer — это бесплатно доступный комплексный инструмент для исследования и оценки данных NGS. Он извлекает и добавляет показатели количества и качества к каждому выравниванию, чтобы классифицировать сопоставленные чтения. Эта классификация затем учитывается для различных представлений данных и всех поддерживаемых функций автоматического анализа.
  • RNASeqExpressionBrowser — это веб-инструмент, который предоставляет средства для поиска и визуализации данных экспрессии RNA-seq (например, на основе информации о последовательностях или аннотаций доменов). Он может генерировать подробные отчеты для выбранных генов, включая данные об экспрессии и соответствующие аннотации. При необходимости можно легко интегрировать ссылки на (общедоступные) базы данных. RNASeqExpressionBrowser обеспечивает защиту паролем и, таким образом, ограничение доступа только авторизованным пользователям.
  • Savant Savant — это геномный браузер нового поколения, разработанный для работы с геномными данными последнего поколения.
  • Самскоп
  • СекМонк
  • Таблетка [145] T Tablet — это легкая, высокопроизводительная графическая программа просмотра для сборки и выравнивания последовательностей нового поколения.
  • Tbrowse — браузер транскриптомов HTML5.
  • TBro — браузер транскриптомов для экспериментов по секвенированию РНК de novo.
  • Веспа

Инструменты функционального, сетевого и путевого анализа

[ редактировать ]
  • BioCyc Визуализируйте данные секвенирования РНК на диаграммах отдельных путей, диаграммах нескольких путей, называемых коллажами путей, и масштабируемых диаграммах метаболических карт конкретного организма. Вычисляет обогащение путей.
  • кластеров BRANE для вывода регуляторной сети генов в сочетании с кластеризацией. Улучшение биологически связанной априорной сети [146]
  • BRANE Cut Улучшение биологически связанной априорной сети с помощью разрезов графов для вывода регуляторной сети генов. [147]
  • FunRich . Инструмент анализа функционального обогащения
  • GAGE применим независимо от размеров выборки, плана эксперимента, аналитических платформ и других типов гетерогенности. [148] Этот пакет Biocondutor также предоставляет функции и данные для анализа путей, GO и набора генов в целом.
  • Анализ ассоциации набора генов для RNA-Seq GSAASeq — это вычислительные методы, которые оценивают дифференциальную экспрессию пути/набора генов между двумя биологическими состояниями на основе данных подсчета последовательностей.
  • GeneSCF — инструмент функционального обогащения в режиме реального времени с поддержкой нескольких организмов. [149]
  • ГОэкспресс [150] Визуализируйте данные микрочипов и RNAseq, используя аннотации онтологии генов.
  • ГОСек [151] Анализатор генной онтологии для секвенирования РНК и других данных со смещением длины.
  • ГСААСЕКСП [152] Набор инструментов для анализа ассоциаций наборов генов данных RNA-Seq.
  • ГСВА [153] анализ вариаций набора генов для данных микрочипов и RNA-Seq.
  • Heat*Seq — интерактивный веб-инструмент для сравнения экспериментов по высокопроизводительному секвенированию с общедоступными данными.
  • Ingenuity Systems (коммерческая версия) iReport и IPA
  • PathwaySeq [154] Анализ путей для данных RNA-Seq с использованием подхода, основанного на оценке.
  • лепесток Моделирование сети совместной экспрессии в R.
  • ТоПАСек : [155] пакет R для анализа путей на основе топологии микрочипов и данных RNA-Seq.
  • RNA-Enrich Метод функционального обогащения без ограничений для секвенирования РНК с улучшенной способностью обнаружения.
  • ТРАПИД [156] [157] Быстрый анализ данных транскриптома.
  • Т-РЕкс [158] Анализ экспрессии RNA-seq.

Дополнительные инструменты аннотации для данных RNA-Seq

[ редактировать ]
  • Frama От данных секвенирования РНК до аннотированных сборок мРНК.
  • HLAminer — это вычислительный метод для идентификации аллелей HLA непосредственно из наборов данных последовательностей полного генома, экзома и транскриптома. Прогнозы аллелей HLA получаются путем целевой сборки данных последовательностей дробовика и сравнения с базой данных эталонных последовательностей аллелей. Этот инструмент разработан на Perl и доступен как консольный инструмент.
  • pasa PASA, аббревиатура от «Программа для сборки сплайсированных выравниваний», представляет собой инструмент аннотации эукариотического генома, который использует сплайсированные выравнивания экспрессируемых последовательностей транскриптов для автоматического моделирования генных структур и поддержания аннотаций генных структур в соответствии с самыми последними доступными экспериментальными данными о последовательностях. PASA также идентифицирует и классифицирует все варианты сплайсинга, поддерживаемые выравниванием транскриптов.
  • seq2HLA — это инструмент аннотации для получения индивидуального типа и экспрессии HLA класса I и II с использованием стандартных данных NGS RNA-Seq в формате fastq . Он включает в себя сопоставление считываний RNA-Seq со справочной базой данных аллелей HLA с использованием галстука-бабочки , определение и отчетность типа HLA, показателя достоверности и уровня экспрессии, специфичного для локуса. разработан на Python и R. Этот инструмент Он доступен в виде консольного инструмента или Galaxy . модуля

Инструменты сжатия

[ редактировать ]
  • Геноцип [159] Компрессор для геномных файлов, включая FASTQ, SAM/BAM/CRAM, VCF, GFF/GVF/GTF. Содержит встроенные методы сжатия файлов BAM RNA-Seq. ( сайт Genozip ).
  • Quark Quark обеспечивает полуэталонное сжатие данных РНК-секвенирования.

Базы данных РНК-Seq

[ редактировать ]
  • ARCHS4 Равномерно обработанные данные секвенирования РНК из GEO/SRA (>300 000 образцов) с поиском метаданных для поиска подмножеств опубликованных образцов.
  • ENA Европейский архив нуклеотидов (ENA) предоставляет полную информацию о мировой информации о секвенировании нуклеотидов, включая необработанные данные секвенирования, информацию о сборке последовательностей и функциональные аннотации.
  • КОДИРОВАТЬ
  • queryable-rna-seq-database Эта система, формально известная как запрашиваемая база данных RNA-Seq, предназначена для упрощения процесса анализа RNA-seq, предоставляя возможность загружать данные результатов анализа RNA-Seq в базу данных, хранить их, и запрашивать его разными способами.
  • CIRCpedia v2 — это обновленная комплексная база данных, содержащая аннотации circRNA из более чем 180 наборов данных РНК-секвенирования шести различных видов. Этот атлас позволяет пользователям искать, просматривать и загружать циркРНК с характеристиками/особенностями экспрессии в различных типах клеток/тканях, включая образцы заболеваний. Кроме того, обновленная база данных включает анализ консервации циркРНК между людьми и мышами.
[ редактировать ]
  • Мозговая РНК-Seq [160] База данных транскриптома RNA-Seq и сплайсинга глии, нейронов и сосудистых клеток коры головного мозга.
  • СлияниеРак [161] база данных слитых генов рака, полученная на основе данных секвенирования РНК.
  • Hipposeq - обширная база данных RNA-seq экспрессии генов в главных нейронах гиппокампа .
  • Митранскриптом представляет собой систематический список длинных полиаденилированных транскриптов РНК человека, основанный на данных RNA-Seq из более чем 6500 образцов, связанных с различными типами рака и тканей. База данных содержит подробный анализ экспрессии более 91 000 генов, большинство из которых представляют собой неохарактеризованные длинные РНК.
  • RNA-Seq Atlas — справочная база данных для определения профиля экспрессии генов в нормальных тканях путем секвенирования следующего поколения.
  • SRA Архив чтения последовательностей (SRA) хранит необработанные данные последовательностей, полученные с помощью технологий секвенирования «следующего поколения», включая 454, IonTorrent, Illumina, SOLiD, Helicos и Complete Genomics. В дополнение к необработанным данным о последовательностях SRA теперь хранит информацию о выравнивании в виде размещений считываний в эталонной последовательности.
  • DASHR База данных генов малых РНК человека и зрелых продуктов, полученных на основе данных секвенирования малых РНК.

Базы данных RNA-Seq отдельных видов

[ редактировать ]
  1. ^ Ван З., Герштейн М., Снайдер М. (январь 2009 г.). «RNA-Seq: революционный инструмент для транскриптомики» . Обзоры природы. Генетика . 10 (1): 57–63. дои : 10.1038/nrg2484 . ПМЦ   2949280 . ПМИД   19015660 .
  2. ^ Кукурба К.Р., Монтгомери С.Б. (апрель 2015 г.). «Секвенирование и анализ РНК» . Протоколы Колд-Спринг-Харбора . 2015 (11): 951–969. дои : 10.1101/pdb.top084970 . ПМЦ   4863231 . ПМИД   25870306 .
  3. ^ Конеса А., Мадригал П., Таразона С., Гомес-Кабреро Д., Сервера А., Макферсон А. и др. (январь 2016 г.). «Обзор лучших практик анализа данных секвенирования РНК» . Геномная биология . 17 (13): 13. дои : 10.1186/s13059-016-0881-8 . ПМЦ   4728800 . ПМИД   26813401 .
  4. ^ «Секвенирование и анализ РНК» (PDF) . Канадские семинары по биоинформатике . 2012.
  5. ^ Поплавски А., Биндер Х. (июль 2018 г.). «Возможность расчета размера выборки для исследований РНК-секвенирования». Брифинги по биоинформатике . 19 (4): 713–720. дои : 10.1093/нагрудник/bbw144 . ПМИД   28100468 . S2CID   28848959 .
  6. ^ Шэн К., Викерс К., Чжао С., Ван Дж., Сэмюэлс Д.С., Коус О. и др. (июль 2017 г.). «Многоперспективный контроль качества анализа данных секвенирования РНК Illumina» . Брифинги по функциональной геномике . 16 (4): 194–204. дои : 10.1093/bfgp/elw035 . ПМК   5860075 . ПМИД   27687708 .
  7. ^ Перейти обратно: а б Хугстрат Ю., Комор М.А., Бетчер Р., ван Рит Дж., ван де Веркен Х.Дж., ван Лисхаут С. и др. (декабрь 2021 г.). «Транскрипты слияния и их геномные точки разрыва в данных секвенирования полиаденилированной и рибосомальной РНК-минус РНК» . ГигаСайенс . 10 (12): giab080. doi : 10.1093/gigascience/giab080 . ПМЦ   8673554 . ПМИД   34891161 .
  8. ^ Сайолс С., Кляйн Х. (2015). «dupRadar: Оценка уровня дупликации в наборах данных RNA-Seq. Версия пакета R 1.1.0» . doi : 10.18129/B9.bioc.dupRadar . {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )
  9. ^ Дэвис MP, ван Донген С., Абреу-Гуджер С., Бартоничек Н., Энрайт А.Дж. (сентябрь 2013 г.). «Kraken: набор инструментов для контроля качества и анализа данных высокопроизводительной последовательности» . Методы . 63 (1): 41–49. дои : 10.1016/j.ymeth.2013.06.027 . ПМЦ   3991327 . ПМИД   23816787 .
  10. ^ Андерс С., Пил П.Т., Хубер В. (январь 2015 г.). «HTSeq — платформа Python для работы с данными высокопроизводительного секвенирования» . Биоинформатика . 31 (2): 166–169. doi : 10.1093/биоинформатика/btu638 . ПМК   4287950 . ПМИД   25260700 .
  11. ^ Фэн Х, Чжан Х, Чжан С (август 2015 г.). «mRIN для прямой оценки полногеномной и геноспецифической целостности мРНК на основе крупномасштабных данных секвенирования РНК» . Природные коммуникации . 6 (7816): 7816. Бибкод : 2015NatCo...6.7816F . дои : 10.1038/ncomms8816 . ПМК   4523900 . ПМИД   26234653 .
  12. ^ Юэлс П., Магнуссон М., Лундин С., Келлер М. (октябрь 2016 г.). «MultiQC: суммируйте результаты анализа для нескольких инструментов и образцов в одном отчете» . Биоинформатика . 32 (19): 3047–3048. doi : 10.1093/биоинформатика/btw354 . ПМК   5039924 . ПМИД   27312411 .
  13. ^ ДеЛука Д.С., Левин Дж.З., Сиваченко А., Феннелл Т., Назер М.Д., Уильямс С. и др. (июнь 2012 г.). «RNA-SeQC: показатели RNA-seq для контроля качества и оптимизации процессов» . Биоинформатика . 28 (11): 1530–1532. doi : 10.1093/биоинформатика/bts196 . ПМЦ   3356847 . ПМИД   22539670 .
  14. ^ Ван Л., Ван С., Ли В. (август 2012 г.). «RSeQC: контроль качества экспериментов по секвенированию РНК» . Биоинформатика . 28 (16): 2184–2185. doi : 10.1093/биоинформатика/bts356 . ПМИД   22743226 .
  15. ^ Лассманн Т., Хаяшизаки Ю., Дауб К.О. (январь 2011 г.). «SAMStat: мониторинг систематических ошибок в данных секвенирования следующего поколения» . Биоинформатика . 27 (1): 130–131. doi : 10.1093/биоинформатика/btq614 . ПМК   3008642 . ПМИД   21088025 .
  16. ^ Лаэнс Н.Ф., Кавакли И.Х., Чжан Р., Хайер К., Блэк М.Б., Дуек Х. и др. (июнь 2014 г.). «IVT-seq обнаруживает крайнюю неточность в секвенировании РНК» . Геномная биология . 15 (6): Р86. дои : 10.1186/gb-2014-15-6-r86 . ПМК   4197826 . ПМИД   24981968 .
  17. ^ Ли С., Лабай П.П., Зумбо П., Сикачек П., Ши В., Ши Л. и др. (сентябрь 2014 г.). «Обнаружение и коррекция систематических отклонений в данных крупномасштабного секвенирования РНК» . Природная биотехнология . 32 (9): 888–895. дои : 10.1038/nbt.3000 . ПМК   4160374 . ПМИД   25150837 .
  18. ^ Бенджамини Ю., Speed ​​TP (май 2012 г.). «Подведение итогов и исправление смещения содержания GC при высокопроизводительном секвенировании» . Исследования нуклеиновых кислот . 40 (10): е72. дои : 10.1093/нар/gks001 . ПМЦ   3378858 . ПМИД   22323520 .
  19. ^ Эйрд Д., Росс М.Г., Чен В.С., Дэниелссон М., Феннелл Т., Расс С. и др. (2011). «Анализ и минимизация систематической ошибки ПЦР-амплификации в библиотеках секвенирования Illumina» . Геномная биология . 12 (2): Р18. дои : 10.1186/gb-2011-12-2-r18 . ПМК   3188800 . ПМИД   21338519 .
  20. ^ Адиконис X, Борхес-Ривера Д., Сатия Р., ДеЛука Д.С., Басби М.А., Берлин А.М. и др. (июль 2013 г.). «Сравнительный анализ методов секвенирования РНК для деградированных или малозатратных образцов» . Природные методы . 10 (7): 623–629. дои : 10.1038/nmeth.2483 . ПМК   3821180 . ПМИД   23685885 .
  21. ^ Накамура К., Осима Т., Моримото Т., Икеда С., Ёсикава Х., Шива Ю. и др. (июль 2011 г.). «Профиль ошибок секвенаторов Illumina, специфичный для последовательности» . Исследования нуклеиновых кислот . 39 (13): е90. дои : 10.1093/nar/gkr344 . ПМК   3141275 . ПМИД   21576222 .
  22. ^ Хансен К.Д., Бреннер С.Е., Дудуа С. (июль 2010 г.). «Смещения в секвенировании транскриптома Illumina, вызванные случайным праймингом гексамера» . Исследования нуклеиновых кислот . 38 (12): е131. дои : 10.1093/nar/gkq224 . ПМЦ   2896536 . ПМИД   20395217 .
  23. ^ Крискуоло А., Брисс С. (ноябрь 2013 г.). «AlienTrimmer: инструмент для быстрого и точного удаления нескольких коротких последовательностей примесей из считываний высокопроизводительного секвенирования» . Геномика . 102 (5–6): 500–506. дои : 10.1016/j.ygeno.2013.07.011 . ПМИД   23912058 .
  24. ^ Смедс Л., Кюнстнер А (19 октября 2011 г.). «ConDeTri — триммер чтения данных Illumina, зависящий от содержимого» . ПЛОС ОДИН . 6 (10): e26314. Бибкод : 2011PLoSO...626314S . дои : 10.1371/journal.pone.0026314 . ПМК   3198461 . ПМИД   22039460 .
  25. ^ Магоч Т., Зальцберг С.Л. (ноябрь 2011 г.). «FLASH: быстрая регулировка длины коротких ридов для улучшения сборки генома» . Биоинформатика . 27 (21): 2957–2963. дои : 10.14806/ej.17.1.200 . ПМК   3198573 . ПМИД   21903629 .
  26. ^ Прецца Н., Дель Фаббро С., Вецци Ф., Де Паоли Э., Поликрити А. (2012). «Эрнэ-Бс5». Материалы конференции ACM по биоинформатике, вычислительной биологии и биомедицине . Полет. 12. стр. 12–19. дои : 10.1145/2382936.2382938 . ISBN  9781450316705 . S2CID   5673753 .
  27. ^ Шмидер Р., Эдвардс Р. (март 2011 г.). «Контроль качества и предварительная обработка наборов метагеномных данных» . Биоинформатика . 27 (6): 863–864. doi : 10.1093/биоинформатика/btr026 . ПМК   3051327 . ПМИД   21278185 .
  28. ^ Длугош К.М., Лай З., Бонин А., Йерро Дж., Ризеберг Л.Х. (февраль 2013 г.). «Идентификация аллелей для популяционной геномики на основе транскриптома у инвазивного растения Centaurea solstitialis» . Г3 . 3 (2): 359–367. дои : 10.1534/g3.112.003871 . ПМК   3564996 . ПМИД   23390612 .
  29. ^ Болджер А.М., Лозе М., Усадель Б. (август 2014 г.). «Trimmomatic: гибкий триммер для данных последовательности Illumina» . Биоинформатика . 30 (15): 2114–2120. doi : 10.1093/биоинформатика/btu170 . ПМК   4103590 . ПМИД   24695404 .
  30. ^ Ленеманн Д., Боркхардт А., Макхарди AC (январь 2016 г.). «Шумоподавление данных глубокого секвенирования ДНК — ошибки высокопроизводительного секвенирования и их исправление» . Брифинги по биоинформатике . 17 (1): 154–179. дои : 10.1093/нагрудник/bbv029 . ПМК   4719071 . ПМИД   26026159 .
  31. ^ Айва С., Ланзен А., Давенпорт Р.Дж., Тернбо П.Дж. (январь 2011 г.). «Удаление шума из пиросеквенированных ампликонов» . БМК Биоинформатика . 12 (38): 38. дои : 10.1186/1471-2105-12-38 . ПМК   3045300 . ПМИД   21276213 .
  32. ^ Хо Ю, Ву XL, Чен Д, Ма Дж, Хву ВМ (май 2014 г.). «BLESS: решение для коррекции ошибок на основе фильтра Блума для высокопроизводительного чтения секвенирования» . Биоинформатика . 30 (10): 1354–1362. doi : 10.1093/биоинформатика/btu030 . ПМК   6365934 . ПМИД   24451628 .
  33. ^ Гринфилд П., Дьюсинг К., Папаниколау А., Бауэр, округ Колумбия (октябрь 2014 г.). «Синий: исправление ошибок последовательности с использованием консенсуса и контекста» . Биоинформатика . 30 (19): 2723–2732. doi : 10.1093/биоинформатика/btu368 . ПМИД   24919879 .
  34. ^ Майкл, я люблю; Джон Б. Хогенеш; Рафаэль А. Иризарри (2015). «Моделирование систематической ошибки последовательности фрагментов РНК-seq уменьшает систематические ошибки в оценке численности транскриптов». биоRxiv   10.1101/025767 .
  35. ^ Хансен К.Д., Иризарри Р.А., Ву Зи (апрель 2012 г.). «Устранение технической изменчивости в данных секвенирования РНК с использованием условной квантильной нормализации» . Биостатистика . 13 (2): 204–216. doi : 10.1093/biostatistics/kxr054 . ПМК   3297825 . ПМИД   22285995 .
  36. ^ Риссо Д., Шварц К., Шерлок Г., Дюдуа С. (декабрь 2011 г.). «Нормализация содержания GC для данных RNA-Seq» . БМК Биоинформатика . 12 (1): 480. дои : 10.1186/1471-2105-12-480 . ПМЦ   3315510 . ПМИД   22177264 .
  37. ^ Стегл О, Партс Л, Пийпари М, Винн Дж, Дурбин Р (февраль 2012 г.). «Использование вероятностной оценки остатков экспрессии (PEER) для повышения мощности и интерпретируемости анализа экспрессии генов» . Протоколы природы . 7 (3): 500–507. дои : 10.1038/nprot.2011.457 . ПМЦ   3398141 . ПМИД   22343431 .
  38. ^ Риссо Д., Нгай Дж., Спид Т.П., Дудуа С. (сентябрь 2014 г.). «Нормализация данных РНК-секвенирования с использованием факторного анализа контрольных генов или образцов» . Природная биотехнология . 32 (9): 896–902. дои : 10.1038/nbt.2931 . ПМК   4404308 . ПМИД   25150836 .
  39. ^ Мичем Ф., Боффелли Д., Дахби Дж., Мартин Д.И., Сингер М., Пахтер Л. (ноябрь 2011 г.). «Идентификация и исправление систематических ошибок в данных последовательностей с высокой пропускной способностью» . БМК Биоинформатика . 12 (1): 451. дои : 10.1186/1471-2105-12-451 . ПМЦ   3295828 . ПМИД   22099972 .
  40. ^ Лю Б., Юань Дж., Ю С.М., Ли З., Се Ю., Чэнь Ю. и др. (ноябрь 2012 г.). «COPE: точный инструмент для считывания парных концов на основе k-меров для облегчения сборки генома» . Биоинформатика . 28 (22): 2870–2874. doi : 10.1093/биоинформатика/bts563 . ПМИД   23044551 .
  41. ^ Чжан Дж., Коберт К., Флури Т., Стаматакис А. (март 2014 г.). «PEAR: быстрое и точное слияние парного чтения Illumina» . Биоинформатика . 30 (5): 614–620. doi : 10.1093/биоинформатика/btt593 . ПМЦ   3933873 . ПМИД   24142950 .
  42. ^ Родриг С., Матерна АК, Тимберлейк СК, Блэкберн МК, Мальмстрем РР, Алм Э.Дж., Чисхолм С.В. (июль 2010 г.). «Открытие секвенирования короткого чтения для метагеномики» . ПЛОС ОДИН . 5 (7): е11840. Бибкод : 2010PLoSO...511840R . дои : 10.1371/journal.pone.0011840 . ПМЦ   2911387 . ПМИД   20676378 .
  43. ^ Санджованни М., Граната И., Тинд А.С., Гуаррачино М.Р. (апрель 2019 г.). «От мусора к сокровищу: обнаружение неожиданного загрязнения в некартированных данных NGS» . БМК Биоинформатика . 20 (Приложение 4): 168. doi : 10.1186/s12859-019-2684-x . ПМК   6472186 . ПМИД   30999839 .
  44. ^ Перейти обратно: а б Ляо Ю., Смит Г.К., Ши В. (май 2013 г.). «Выравниватель Subread: быстрое, точное и масштабируемое сопоставление чтения путем посева и голосования» . Исследования нуклеиновых кислот . 41 (10): е108. дои : 10.1093/нар/gkt214 . ПМЦ   3664803 . ПМИД   23558742 .
  45. ^ Гран-при Аламанкоса, Агирре Э, Эйрас Э (2014). «Методы изучения сплайсинга на основе данных высокопроизводительного секвенирования РНК». Сплайсосомный сплайсинг пре-мРНК . Методы молекулярной биологии. Том. 1126. стр. 357–97. arXiv : 1304.5952 . дои : 10.1007/978-1-62703-980-2_26 . ISBN  978-1-62703-979-6 . ПМИД   24549677 . S2CID   18574607 .
  46. ^ Баруццо Дж., Хайер К.Е., Ким Э.Дж., Ди Камилло Б., Фитцджеральд Г.А., Грант Г.Р. (февраль 2017 г.). «Комплексный сравнительный анализ элайнеров RNA-seq на основе моделирования» . Природные методы . 14 (2): 135–139. дои : 10.1038/nmeth.4106 . ПМК   5792058 . ПМИД   27941783 .
  47. ^ Кампанья Д, Телатин А, Форкато С, Витуло Н, Валле Дж (январь 2013 г.). «PASS-bis: бисульфитный выравниватель, подходящий для анализа всего метилома Illumina и считываний SOLiD» . Биоинформатика . 29 (2): 268–270. doi : 10.1093/биоинформатика/bts675 . ПМИД   23162053 .
  48. ^ Ан Дж, Сяо X (декабрь 2015 г.). «RASER: считывает выравниватель SNP и сайты редактирования РНК» . Биоинформатика . 31 (24): 3906–3913. doi : 10.1093/биоинформатика/btv505 . ПМК   4692970 . ПМИД   26323713 .
  49. ^ Перейти обратно: а б Добин А., Дэвис К.А., Шлезингер Ф., Дренков Дж., Залески С., Джа С. и др. (январь 2013 г.). «STAR: сверхбыстрый универсальный выравниватель RNA-seq» . Биоинформатика . 29 (1): 15–21. doi : 10.1093/биоинформатика/bts635 . ПМК   3530905 . ПМИД   23104886 .
  50. ^ Трапнелл С., Пахтер Л., Зальцберг С.Л. (май 2009 г.). «TopHat: обнаружение соединений сплайсинга с помощью RNA-Seq» . Биоинформатика . 25 (9): 1105–1111. doi : 10.1093/биоинформатика/btp120 . ПМЦ   2672628 . ПМИД   19289445 .
  51. ^ Пахтер Л. (2011). «Модели количественного определения транскриптов из RNA-Seq». arXiv : 1104.3889 [ q-bio.GN ].
  52. ^ Джин Х., Ван Ю., Лю З. (март 2017 г.). «Комплексная оценка методов количественного определения РНК-секвенирования на линейность» . БМК Биоинформатика . 18 (Приложение 4): 117. doi : 10.1186/s12859-017-1526-y . ПМЦ   5374695 . ПМИД   28361706 .
  53. ^ Квам В.М., Лю П., Си Ю (февраль 2012 г.). «Сравнение статистических методов обнаружения дифференциально экспрессируемых генов по данным секвенирования РНК» . Американский журнал ботаники . 99 (2): 248–256. дои : 10.3732/ajb.1100340 . ПМИД   22268221 .
  54. ^ Диллис М.А., Рау А., Обер Дж., Эннеке-Антье С., Жанмуген М., Слуга Н. и др. (ноябрь 2013 г.). «Комплексная оценка методов нормализации для анализа данных высокопроизводительного секвенирования РНК Illumina» . Брифинги по биоинформатике . 14 (6): 671–683. дои : 10.1093/нагрудник/bbs046 . ПМИД   22988256 .
  55. ^ Эванс С., Хардин Дж., Стобель Д.М. (сентябрь 2018 г.). «Выбор методов нормализации межобразцовой РНК-Seq с точки зрения их предположений» . Брифинги по биоинформатике . 19 (5): 776–792. дои : 10.1093/нагрудник/bbx008 . ПМК   6171491 . ПМИД   28334202 .
  56. ^ Ву З, Дженкинс Б.Д., Райнерсон Т.А. , Дирман С.Т., Сайто М.А., Мерсье М., Уитни Л.П. (ноябрь 2010 г.). «Эмпирический байесовский анализ транскрипционного профилирования без повторов на основе секвенирования» . БМК Биоинформатика . 11 : 564. дои : 10.1186/1471-2105-11-564 . ПМК   3098101 . ПМИД   21080965 .
  57. ^ Хаджирамезанали, Э. и Дадане, С.З. и Фигейредо, П. д. И Сзе, С., Чжоу, З. и Цянь, К. Анализ дифференциальных выражений данных динамического секвенирования с помощью гамма-цепи Маркова. arXiv : 1803.02527
  58. ^ Перейти обратно: а б Трапнелл С., Уильямс Б.А., Пертеа Г., Мортазави А., Кван Г., ван Барен М.Дж. и др. (май 2010 г.). «Сборка транскриптов и количественная оценка с помощью RNA-Seq выявляют неаннотированные транскрипты и переключение изоформ во время дифференцировки клеток» . Природная биотехнология . 28 (5): 511–515. дои : 10.1038/nbt.1621 . ПМК   3146043 . ПМИД   20436464 .
  59. ^ Кламбауэр Г., Унтертинер Т., Хохрайтер С. (ноябрь 2013 г.). «DEXUS: выявление дифференциальной экспрессии в исследованиях RNA-Seq в неизвестных условиях» . Исследования нуклеиновых кислот . 41 (21): e198. дои : 10.1093/нар/gkt834 . ПМЦ   3834838 . ПМИД   24049071 .
  60. ^ Вавулис Д.В., Франческатто М., Хьютинк П., Гоф Дж. (февраль 2015 г.). «DGEclust: анализ дифференциального выражения данных кластерного подсчета» . Геномная биология . 16 (1): 39. дои : 10.1186/s13059-015-0604-6 . ПМЦ   4365804 . ПМИД   25853652 .
  61. ^ Йепес, Висенте А.; Мертес, Кристиан; Мюллер, Микаэла Ф.; Клапрот-Андраде, Даниэла; Вачутка, Леонард; Фресар, Лор; Гусич, Мирьяна; Шеллер, Инес Ф.; Голдберг, Патрисия Ф.; Прокиш, Хольгер; Ганьер, Жюльен (февраль 2021 г.). «Обнаружение аберрантных событий экспрессии генов в данных секвенирования РНК». Протоколы природы . 16 (2): 1276–1296. дои : 10.1038/s41596-020-00462-5 . ПМИД   33462443 .
  62. ^ Фэн Дж., Мейер К.А., Ван Ц., Лю Дж.С., Ширли Лю Х., Чжан Ю. (ноябрь 2012 г.). «GFOLD: обобщенное кратное изменение для ранжирования дифференциально экспрессируемых генов на основе данных секвенирования РНК» . Биоинформатика . 28 (21): 2782–2788. doi : 10.1093/биоинформатика/bts515 . ПМИД   22923299 .
  63. ^ Раушенбергер А., Йонкер М.А., ван де Виль М.А., Менезес Р.С. (март 2016 г.). «Тестирование связи между RNA-Seq и многомерными данными» . БМК Биоинформатика . 17 (118): 118. дои : 10.1186/s12859-016-0961-5 . ПМЦ   4782413 . ПМИД   26951498 .
  64. ^ Цао М., Чжоу В., Брейдт Ф.Дж., Пирс Г. (март 2020 г.). «Крупномасштабный множественный вывод о максимальной средней мощности на основе данных подсчета во времени с применением к анализу секвенирования РНК» . Биометрия . 76 (1): 9–22. дои : 10.1111/biom.13144 . ПМИД   31483480 .
  65. ^ Мулос П., Хацис П. (февраль 2015 г.). «Систематическая интеграция статистических алгоритмов RNA-Seq для точного обнаружения дифференциальных моделей экспрессии генов» . Исследования нуклеиновых кислот . 43 (4): е25. дои : 10.1093/nar/gku1273 . ПМЦ   4344485 . ПМИД   25452340 .
  66. ^ Хугстрат, Юри; Рисунок, Каспар; Гисай, Сантоеша А.; ван Хейфте, Леви; Барин, Настаран; Господь, Ирис; Коппитерс, Воутер; ван ден Бош, Тьерри П.П.; Боллебум, Энн; Гао, Чжэньюй; Винсент, Арно JPE; Карим, Латифа; Декерс, Манон; Тапурн, Мартин Дж.Б.; Керкхоф, Мелисса; Вейерброк, Астрид; Самсон, Марк; Хобен, Энн; Лукацова, славянка; Ломбарди, Джозеф; Леенстра, Зигер; Ханс, Моник; Флейшойер, Рут Э.М.; Уоттс, Колин; Ангелопулос, Никос; Горлия, Тьерри; Гольфинопулос, Василис; Бурс, Винсент; ван ден Бент, Мартин Дж.; Роб, Питер А.; Френч, Пим Дж. (9 марта 2023 г.). «Транскриптомный анализ выявляет изменения микроокружения опухоли при глиобластоме» . Раковая клетка . 41 (4): 678–692.e7. doi : 10.1016/j.ccell.2023.02.019 . hdl : 1887/3748087 . ПМИД   36898379 . S2CID   257437946 .
  67. ^ Раушенбергер А., Менезес Р.С., ван де Виль М.А., ван Шур Н.М., Йонкер М.А. (2018). «Обнаружение SNP с интерактивным воздействием на количественный признак». arXiv : 1805.09175 [ stat.ME ].
  68. ^ Вера Альварес Р., Понгор Л.С., Мариньо-Рамирес Л., Ландсман Д. (июнь 2019 г.). «TPMCalculator: одноэтапное программное обеспечение для количественной оценки количества мРНК геномных функций» . Биоинформатика . 35 (11): 1960–1962. doi : 10.1093/биоинформатика/bty896 . ПМК   6546121 . ПМИД   30379987 .
  69. ^ Наварро ФК, Хупс Дж., Беллфи Л., Сервейра Э., Чжу К., Чжан С. и др. (август 2019 г.). «TeXP: Деконволюция эффектов повсеместной и автономной транскрипции мобильных элементов» . PLOS Вычислительная биология . 15 (8): e1007293. Бибкод : 2019PLSCB..15E7293N . дои : 10.1371/journal.pcbi.1007293 . ПМК   6715295 . ПМИД   31425522 .
  70. ^ Ахмедов М., Мартинелли А., Гейгер Р., Кви И. (март 2020 г.). «Omics Playground: комплексная платформа самообслуживания для визуализации, анализа и исследования больших данных Omics» . НАР Геномика и биоинформатика . 2 (1): lqz019. дои : 10.1093/nargab/lqz019 . ПМЦ   7671354 . ПМИД   33575569 .
  71. ^ Яо Л, Ван Х, Сон Ю, Суй Г (октябрь 2017 г.). «BioQueue: новая система конвейеров для ускорения биоинформатического анализа» . Биоинформатика . 33 (20): 3286–3288. doi : 10.1093/биоинформатика/btx403 . ПМИД   28633441 .
  72. ^ Карташов А.В., Барский А. (август 2015 г.). «Биокардроб: интегрированная платформа для анализа данных эпигеномики и транскриптомики» . Геномная биология . 16 (1): 158. дои : 10.1186/s13059-015-0720-3 . ПМЦ   4531538 . ПМИД   26248465 .
  73. ^ Левин Л., Бар-Яаков Д., Бускила А., Хорев М., Кармель Л. , Мишмар Д. (2015). «ЛИМОНЫ — инструмент для идентификации сплайсинговых соединений в транскриптомах организмов, не имеющих эталонных геномов» . ПЛОС ОДИН . 10 (11): e0143329. Бибкод : 2015PLoSO..1043329L . дои : 10.1371/journal.pone.0143329 . ПМЦ   4659627 . ПМИД   26606265 .
  74. ^ Пундхир С., Городкин Дж. (июль 2015 г.). «Дифференциальные и когерентные закономерности обработки малых РНК» . Научные отчеты . 5 : 12062. Бибкод : 2015NatSR...512062P . дои : 10.1038/srep12062 . ПМЦ   4499813 . ПМИД   26166713 .
  75. ^ Роджерс М.Ф., Томас Дж., Редди А.С., Бен-Гур А. (январь 2012 г.). «SpliceGrapher: обнаружение закономерностей альтернативного сплайсинга на основе данных RNA-Seq в контексте моделей генов и данных EST» . Геномная биология . 13 (1): Р4. дои : 10.1186/gb-2012-13-1-r4 . ПМЦ   3334585 . ПМИД   22293517 .
  76. ^ Роджерс М.Ф., Баучер С., Бен-Гур А. (2013). «СплайсГраферXT» . Материалы Международной конференции по биоинформатике, вычислительной биологии и биомедицинской информатике . БКБ'13. Нью-Йорк, штат Нью-Йорк, США: ACM. стр. 247:247–247:255. дои : 10.1145/2506583.2506625 . ISBN  9781450324342 . S2CID   15009112 .
  77. ^ Ву Дж., Акерман М., Сунь С., МакКомби В.Р., Крайнер А.Р., Чжан М.К. (ноябрь 2011 г.). «SpliceTrap: метод количественной оценки альтернативного сплайсинга в условиях одной клетки» . Биоинформатика . 27 (21): 3010–3016. doi : 10.1093/биоинформатика/btr508 . ПМК   3198574 . ПМИД   21896509 .
  78. ^ Мертес, Кристиан; Шеллер, Инес Ф.; Йепес, Висенте А.; Челик, Мухаммед Х.; Лян, Инцзицюн; Кремер, Лаура С.; Гусич, Мирьяна; Прокиш, Хольгер; Ганьер, Жюльен (22 января 2021 г.). «Обнаружение аберрантных событий сплайсинга в данных РНК-секвенирования с использованием FRASER» . Природные коммуникации . 12 (1): 529. Бибкод : 2021NatCo..12..529M . дои : 10.1038/s41467-020-20573-7 . ПМЦ   7822922 . ПМИД   33483494 .
  79. ^ Шеллер, Инес Ф.; Лутц, Каролина; Мертес, Кристиан; Йепес, Висенте А.; Ганьер, Жюльен (декабрь 2023 г.). «Улучшенное обнаружение аберрантного сплайсинга с помощью FRASER 2.0 и интронного индекса Жаккара» . Американский журнал генетики человека . 110 (12): 2056–2067. дои : 10.1016/j.ajhg.2023.10.014 . ПМЦ   10716352 . ПМИД   38006880 .
  80. ^ Виттинг-Сееруп К., Санделин А. (сентябрь 2017 г.). «Пейзаж изоформных переключений при раке человека» . Молекулярные исследования рака . 15 (9): 1206–1220. дои : 10.1158/1541-7786.mcr-16-0459 . ПМИД   28584021 .
  81. ^ Новицка М., Робинсон, доктор медицинских наук (6 декабря 2016 г.). «DRIMSeq: мультиномиальная система Дирихле для результатов многомерного подсчета в геномике» . F1000Исследования . 5 : 1356. doi : 10.12688/f1000research.8900.2 . ПМК   5200948 . ПМИД   28105305 .
  82. ^ Папастамулис П., Рэттрей М. (ноябрь 2017 г.). «Байесовская оценка использования дифференциальных транскриптов на основе данных секвенирования РНК». Статистические приложения в генетике и молекулярной биологии . 16 (5–6): 367–386. arXiv : 1701.03095 . Бибкод : 2017arXiv170103095P . дои : 10.1515/sagmb-2017-0005 . ПМИД   29091583 . S2CID   915799 .
  83. ^ Ши Ю, Чиннаян А.М., Цзян Х (июль 2015 г.). «rSeqNP: непараметрический подход для обнаружения дифференциальной экспрессии и сплайсинга на основе данных RNA-Seq» . Биоинформатика . 31 (13): 2222–2224. doi : 10.1093/биоинформатика/btv119 . ПМЦ   4481847 . ПМИД   25717189 .
  84. ^ Джонс, округ Колумбия, Куппусами К.Т., Палпант, Нью-Джерси, Пэн Х, Марри С.Э., Руохола-Бейкер Х., Руццо В.Л. (20 ноября 2016 г.). «Изолятор: точный и стабильный анализ экспрессии на уровне изоформы в экспериментах по секвенированию РНК». bioRxiv   10.1101/088765 .
  85. ^ Кумар С., Во А.Д., Цинь Ф., Ли Х (февраль 2016 г.). «Сравнительная оценка методов обнаружения слитых транскриптов по данным RNA-Seq» . Научные отчеты . 6 (21587): 21597. Бибкод : 2016NatSR...621597K . дои : 10.1038/srep21597 . ПМЦ   4748267 . ПМИД   26862001 .
  86. ^ Уриг С., Эллерманн Дж., Вальтер Т., Буркхардт П., Фрелих М., Хаттер Б. и др. (март 2021 г.). «Точное и эффективное обнаружение слияний генов по данным секвенирования РНК» . Геномные исследования . 31 (3): 448–460. дои : 10.1101/гр.257246.119 . ПМЦ   7919457 . ПМИД   33441414 .
  87. ^ Крисон А., Хаан Д., Данг К., Чиотти К.Э., Инкман М., Лэмб А. и др. (август 2021 г.). «Задача сообщества оценить методы секвенирования РНК, обнаружения слияния и количественного определения изоформ для обнаружения рака» . Клеточные системы . 12 (8): 827–838.e5. дои : 10.1016/j.cels.2021.05.021 . ПМЦ   8376800 . ПМИД   34146471 .
  88. ^ Эббот, Франческо; Аквавива, Андреа; Пачелло, Джулия; Фоти, Кармело; Фикарра, Элиза; Феррарини, Альберто; Делледонн, Массимо; Якобуччи, Илария; Соверини, Симона; Мартинелли, Джованни; Масии, Энрико (15 августа 2012 г.). «Bellerophontes: система анализа данных RNA-Seq для обнаружения химерных транскриптов на основе точной модели слияния» . Биоинформатика . 28 (16): 2114–2121. doi : 10.1093/биоинформатика/bts334 . ISSN   1367-4811 . ПМИД   22711792 .
  89. ^ Фань, Сиань; Эбботт, Трэвис Э.; Ларсон, Дэвид; Чен, Кен (2014). «BreakDancer: Идентификация геномных структурных вариаций на основе картирования парного чтения» . Современные протоколы в биоинформатике . 45 : 15.6.1–11. дои : 10.1002/0471250953.bi1506s45 . ISSN   1934-340X . ПМК   4138716 . ПМИД   25152801 .
  90. ^ Чен, Кен; Уоллис, Джон В.; Кандот, Кириак; Калики-Вейзер, Джоэль М.; Мунгалл, Карен Л.; Мангалл, Эндрю Дж.; Джонс, Стивен Дж.; Марра, Марко А.; Лей, Тимоти Дж.; Мардис, Элейн Р.; Уилсон, Ричард К.; Вайнштейн, Джон Н.; Дин, Ли (15 июля 2012 г.). «BreakFusion: целевая идентификация слияний генов на основе сборки в данных парного секвенирования всего транскриптома» . Биоинформатика . 28 (14): 1923–1924. doi : 10.1093/биоинформатика/bts272 . ISSN   1367-4811 . ПМЦ   3389765 . ПМИД   22563071 .
  91. ^ Айер, Мэтью К.; Чиннаян, Арул М.; Махер, Кристофер А. (11 августа 2011 г.). «ChimeraScan: инструмент для идентификации химерной транскрипции в данных секвенирования» . Биоинформатика . 27 (20): 2903–2904. doi : 10.1093/биоинформатика/btr467 . ISSN   1367-4811 . ПМК   3187648 . ПМИД   21840877 .
  92. ^ Чу, Сюэ-Тин; Сяо, Уильям В.Л.; Чен, Джен-Чи; Да, Цзы-Юнг; Цай, Монг-Сюнь; Лин, Хан; Лю, Йен-Венн; Ли, Шэн-Ань; Чен, Чаур-Чин; Цао, Тереза ​​Т.Х.; Као, Ченг-Янь (1 марта 2013 г.). «EBARDenovo: высокоточная сборка РНК-Seq de novo с эффективным обнаружением химер» . Биоинформатика . 29 (8): 1004–1010. doi : 10.1093/биоинформатика/btt092 . ISSN   1367-4811 . ПМИД   23457040 .
  93. ^ Перейти обратно: а б Хаас, Брайан Дж.; Добин, Алекс; Странский, Николас; Ли, Бо; Ян, Сяо; Щекотать, Тимоти; Банкапур, Асма; Ганоте, Кэрри; Доук, Томас Г. (24 марта 2017 г.). «STAR-Fusion: быстрое и точное обнаружение транскрипта слияния с помощью RNA-Seq» . дои : 10.1101/120295 . S2CID   43186395 . Проверено 30 августа 2023 г. {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )
  94. ^ Перейти обратно: а б Никоричи, Даниэль; Саталан, Михаэла; Эдгрен, Хенрик; Кангаспеска, Сара; Мурумаги, Астрид; Каллиониеми, Олли; Виртанен, Сами; Килкку, Олави (19 ноября 2014 г.). «FusionCatcher — инструмент для поиска соматических слитых генов в данных секвенирования парных концов РНК» . дои : 10.1101/011650 . S2CID   85702767 . Проверено 30 августа 2023 г. {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )
  95. ^ Перейти обратно: а б Оконечников Константин; Имаи-Мацушима, Аки; Пол, Лукас; Зейтц, Александр; Мейер, Томас Ф.; Гарсия-Алькальде, Фернандо (1 декабря 2016 г.). «InFusion: продвижение открытия слитых генов и химерных транскриптов на основе данных глубокого секвенирования РНК» . ПЛОС ОДИН . 11 (12): e0167417. Бибкод : 2016PLoSO..1167417O . дои : 10.1371/journal.pone.0167417 . ISSN   1932-6203 . ПМК   5132003 . ПМИД   27907167 .
  96. ^ Перейти обратно: а б Ван К., Сингх Д., Цзэн З., Коулман С.Дж., Хуанг Й., Савич Г.Л. и др. (октябрь 2010 г.). «MapSplice: точное картирование считываний РНК-seq для обнаружения соединений сплайсинга» . Исследования нуклеиновых кислот . 38 (18): е178. дои : 10.1093/nar/gkq622 . ПМЦ   2952873 . ПМИД   20802226 .
  97. ^ Перейти обратно: а б Цзя В, Цю К, Хэ М, Сун П, Чжоу Ц, Чжоу Ф и др. (февраль 2013 г.). «SOAPfuse: алгоритм идентификации транскриптов слияния на основе данных Seq РНК с парными концами» . Геномная биология . 14 (2): Р12. дои : 10.1186/gb-2013-14-2-r12 . ПМК   4054009 . ПМИД   23409703 .
  98. ^ Вебер, Дэвид; Ибн-Салем, Йонас; Сорн, Патрик; Сучан, Мартин; Хольтстрэтер, Кристоф; Ларманн, Урс; Фоглер, Изабель; Шмольдт, Катрин; Ланг, Франциска; Шрорс, Барбара; Лёвер, Мартин; Шахин, Угур (4 апреля 2022 г.). «Точное обнаружение слияний опухолеспецифических генов выявляет сильно иммуногенные персональные неоантигены» . Природная биотехнология . 40 (8): 1276–1284. дои : 10.1038/s41587-022-01247-9 . ISSN   1087-0156 . ПМЦ   7613288 . ПМИД   35379963 .
  99. ^ Бенелли, Маттео; Пескуччи, Кьяра; Марселья, Джузеппина; Севергнини, Марко; Торричелли, Франческа; Маги, Альберто (23 октября 2012 г.). «Обнаружение химерных транскриптов в данных секвенирования парной РНК с помощью EricScript» . Биоинформатика . 28 (24): 3232–3239. doi : 10.1093/биоинформатика/bts617 . ISSN   1367-4811 . ПМИД   23093608 .
  100. ^ Деганнасири Р., Фриман Д.Э., Йордански М., Се Г.Л., Дамлянович А., Ленерт Э., Зальцман Дж. (июль 2019 г.). «Улучшенное обнаружение слияний генов с помощью статистических методов выявляет онкогенные РНК, вызывающие рак» . Труды Национальной академии наук Соединенных Штатов Америки . 116 (31): 15524–15533. Бибкод : 2019PNAS..11615524D . дои : 10.1073/pnas.1900391116 . ПМК   6681709 . ПМИД   31308241 .
  101. ^ Макферсон, Эндрю; Хормоздиари, Ферейдун; Заид, Абдалнасер; Джулиани, Райан; Ха, Гэвин; Сан, Марк Г.Ф.; Гриффит, Малачи; Херави Муссави, Алиреза; Сенц, Джанин; Мельник, Наталья; Пачеко, Марина; Марра, Марко А.; Херст, Мартин; Нильсен, Торстен О.; Сахинальп, С. Дженк (май 2011 г.). «deFuse: алгоритм обнаружения слияния генов в данных опухолевой РНК-Seq» . PLOS Вычислительная биология . 7 (5): e1001138. Бибкод : 2011PLSCB...7E1138M . дои : 10.1371/journal.pcbi.1001138 . ISSN   1553-7358 . ПМК   3098195 . ПМИД   21625565 .
  102. ^ Хугстрат Ю., Гисай С.А., де Вит М., де Хир И., Драйсма К., ван Рит Дж. и др. (март 2022 г.). «Транскриптом EGFRvIII при глиобластоме: метаомный анализ» . Нейроонкология . 24 (3): 429–441. дои : 10.1093/neuonc/noab231 . ПМЦ   8917407 . ПМИД   34608482 .
  103. ^ Пьяцца, Рокко; Пирола, Алессандра; Спинелли, Роберта; Валлетта, Симона; Редаэлли, Сара; Магистрони, Вера; Гамбакорти-Пассерини, Карло (сентябрь 2012 г.). «FusionAnalyser: новый графический, управляемый событиями инструмент для обнаружения перестановок слияния» . Исследования нуклеиновых кислот . 40 (16): е123. дои : 10.1093/nar/gks394 . ISSN   1362-4962 . ПМЦ   3439881 . ПМИД   22570408 .
  104. ^ Ге, Хуаньин; Лю, Кеджун; Хуан, Тодд; Клык, Клык; Ньюман, Мэтью; Хёк, Вольфганг (18 мая 2011 г.). «FusionMap: обнаружение слитых генов на основе данных секвенирования следующего поколения с разрешением пары оснований» . Биоинформатика . 27 (14): 1922–1928. doi : 10.1093/биоинформатика/btr310 . ISSN   1367-4803 . ПМИД   21593131 .
  105. ^ Сбонер, Андреа; Хабеггер, Лукас; Пфлюгер, Дороти; Терри, Стефан; Чен, Дэвид З.; Розовский, Джоэл С; Тевари, Ашутош К; Китабаяси, Наоки; Мосс, Бенджамин Дж; Чи, Марк С; Демикелис, Франческа; Рубин, Марк А; Герштейн, Марк Б. (октябрь 2010 г.). «FusionSeq: модульная система для поиска слияний генов путем анализа данных секвенирования парных концов РНК» . Геномная биология . 11 (10): Р104. дои : 10.1186/gb-2010-11-10-r104 . ISSN   1474-760X . ПМК   3218660 . ПМИД   20964841 .
  106. ^ Дэвидсон, Надя М; Маевски, Ян Дж; Ошлак, Алисия (12 января 2015 г.). «JAFFA: Высокочувствительное обнаружение слитых генов, ориентированное на транскриптом» . Геномная медицина . 7 (1): 43. bioRxiv   10.1101/013698 . doi : 10.1186/s13073-015-0167-x (неактивен 20 февраля 2024 г.). hdl : 11343/261352 . ПМЦ   4445815 . ПМИД   26019724 . {{cite journal}}: CS1 maint: DOI неактивен по состоянию на февраль 2024 г. ( ссылка )
  107. ^ Макферсон, Эндрю; У, Чуньсяо; Вятт, Александр В.; Шах, Сохраб; Коллинз, Колин; Сахинальп, С. Дженк (28 июня 2012 г.). «nFuse: открытие сложных геномных перестроек при раке с помощью высокопроизводительного секвенирования» . Геномные исследования . 22 (11): 2250–2261. дои : 10.1101/гр.136572.111 . ISSN   1088-9051 . ПМЦ   3483554 . ПМИД   22745232 .
  108. ^ Торрес-Гарсия, Вандалис; Чжэн, Сиюань; Сиваченко Андрей; Вегесна, Рахулсимхам; Ван, Цянху; Яо, Ронг; Бергер, Майкл Ф.; Вайнштейн, Джон Н.; Гетц, Гад; Верхаак, Роэл Г.В. (1 апреля 2014 г.). «PRADA: конвейер для анализа данных секвенирования РНК» . Биоинформатика . 30 (15): 2224–2226. doi : 10.1093/биоинформатика/btu169 . ISSN   1367-4811 . ПМЦ   4103589 . ПМИД   24695405 .
  109. ^ Ву, Джикунь; Чжан, Вэньцянь; Хуан, Сонгбо; Он, Цзэнцюань; Ченг, Яньбин; Ван, Цзюнь; Лам, Так-Ва; Пэн, Чжию; Ю, Сиу-Мин (11 октября 2013 г.). «SOAPfusion: надежный и эффективный инструмент вычислительного синтеза для чтения РНК-seq» . Биоинформатика . 29 (23): 2971–2978. doi : 10.1093/биоинформатика/btt522 . ISSN   1367-4811 . ПМИД   24123671 .
  110. ^ Ким, Дэхван; Зальцберг, Стивен Л. (2011). «TopHat-Fusion: алгоритм обнаружения новых транскриптов слияния» . Геномная биология . 12 (8): С72. дои : 10.1186/gb-2011-12-8-r72 . ISSN   1465-6906 . ПМК   3245612 . ПМИД   21835007 .
  111. ^ Ли, Цзин-Воэй; Ван, Рэймонд; Ю, Чи-Шинг; Ко, Нгай На; Вонг, Натали; Чан, Тин-Фунг (12 января 2013 г.). «ViralFusionSeq: точно обнаруживайте события вирусной интеграции и реконструируйте транскрипты слияния с одноосновательным разрешением» . Биоинформатика . 29 (5): 649–651. doi : 10.1093/биоинформатика/btt011 . ISSN   1367-4811 . ПМЦ   3582262 . ПМИД   23314323 .
  112. ^ Рут А., Джонсон Дж. Э. (январь 2014 г.). «Обнаружение функциональных геномных мотивов в вирусах с помощью ViReMa - устройства отображения рекомбинации вирусов - для анализа данных секвенирования следующего поколения» . Исследования нуклеиновых кислот . 42 (2): е11. дои : 10.1093/nar/gkt916 . ПМК   3902915 . ПМИД   24137010 .
  113. ^ Тинд А.С., Монга И., Тхакур П.К., Кумари П., Диндория К., Крзак М. и др. (ноябрь 2021 г.). «Демистификация новых приложений массового секвенирования РНК: применение и полезность биоинформатической методологии». Брифинги по биоинформатике . 22 (6). дои : 10.1093/нагрудник/bbab259 . ПМИД   34329375 .
  114. ^ Хашимшони Т., Вагнер Ф., Шер Н., Янаи И. (сентябрь 2012 г.). «CEL-Seq: Seq одноклеточной РНК путем мультиплексной линейной амплификации» . Отчеты по ячейкам . 2 (3): 666–673. дои : 10.1016/j.celrep.2012.08.003 . ПМИД   22939981 .
  115. ^ Макоско Э.З., Басу А., Сатия Р., Немеш Дж., Шекхар К., Голдман М. и др. (май 2015 г.). «Высокопараллельное профилирование полногеномной экспрессии отдельных клеток с использованием нанолитровых капель» . Клетка . 161 (5): 1202–1214. дои : 10.1016/j.cell.2015.05.002 . ПМЦ   4481139 . ПМИД   26000488 .
  116. ^ Марко Э., Карп Р.Л., Го Г., Робсон П., Харт А.Х., Триппа Л., Юань Г.К. (декабрь 2014 г.). «Бифуркационный анализ данных об экспрессии генов в отдельных клетках раскрывает эпигенетический ландшафт» . Труды Национальной академии наук Соединенных Штатов Америки . 111 (52): Е5643–Е5650. Бибкод : 2014PNAS..111E5643M . дои : 10.1073/pnas.1408993111 . ПМЦ   4284553 . ПМИД   25512504 .
  117. ^ Бюттнер Ф., Натараджан К.Н., Казале Ф.П., Прозерпио В., Шиальдоне А., Тайс Ф.Дж. и др. (февраль 2015 г.). «Вычислительный анализ межклеточной гетерогенности в данных секвенирования одноклеточной РНК выявляет скрытые субпопуляции клеток» . Природная биотехнология . 33 (2): 155–160. дои : 10.1038/nbt.3102 . ПМИД   25599176 .
  118. ^ Мохаммед М.Х., Гош Т.С., Сингх Н.К., Манде С.С. (январь 2011 г.). «СФИНКС - алгоритм таксономического объединения метагеномных последовательностей». Биоинформатика . 27 (1): 22–30. doi : 10.1093/биоинформатика/btq608 . ПМИД   21030462 .
  119. ^ Стаббингтон М.Дж., Лённберг Т., Прозерпио В., Клер С., Спик А.О., Дуган Г., Тейхманн С.А. (апрель 2016 г.). «Судьба Т-клеток и вывод о клональности на основе транскриптомов одноклеточных» . Природные методы . 13 (4): 329–332. дои : 10.1038/nmeth.3800 . ПМЦ   4835021 . ПМИД   26950746 .
  120. ^ Эльтахла А.А., Риццетто С., Пирозян М.Р., Бетц-Стаблейн Б.Д., Вентури В., Кедзерска К. и др. (июль 2016 г.). «Связывание рецептора Т-клеток с одноклеточным транскриптомом в антиген-специфичных Т-клетках человека». Иммунология и клеточная биология . 94 (6): 604–611. дои : 10.1038/icb.2016.16 . ПМИД   26860370 . S2CID   25714515 .
  121. ^ Трапнелл К. «Монокль 3» . cole-trapnell-lab.github.io . Проверено 23 сентября 2021 г.
  122. ^ Вольф Ф.А., Ангерер П., Тайс Ф.Дж. (февраль 2018 г.). «SCANPY: крупномасштабный анализ данных об экспрессии генов в отдельных клетках» . Геномная биология . 19 (1): 15. дои : 10.1186/s13059-017-1382-0 . ПМК   5802054 . ПМИД   29409532 .
  123. ^ «Scanpy — анализ отдельных ячеек в Python — документация Scanpy 1.8.1» . scanpy.readthedocs.io . readthedocs.io . Проверено 23 сентября 2021 г.
  124. ^ Диас А., Лю С.Дж., Сандовал С., Поллен А., Новаковски Т.Дж., Лим Д.А., Кригштейн А. (июль 2016 г.). «SCell: комплексный анализ данных секвенирования одноклеточной РНК» . Биоинформатика . 32 (14): 2219–2220. doi : 10.1093/биоинформатика/btw201 . ПМЦ   4937196 . ПМИД   27153637 .
  125. ^ Батлер А., Хоффман П., Смайберт П., Папалекси Э., Сатия Р. (июнь 2018 г.). «Интеграция транскриптомных данных отдельных клеток в различных условиях, технологиях и видах» . Природная биотехнология . 36 (5): 411–420. дои : 10.1038/nbt.4096 . ПМК   6700744 . ПМИД   29608179 .
  126. ^ Хао И., Хао С., Андерсен-Ниссен Е., Маук В.М., Чжэн С., Батлер А. и др. (июнь 2021 г.). «Комплексный анализ мультимодальных одноклеточных данных» . Клетка . 184 (13): 3573–3587.e29. дои : 10.1016/j.cell.2021.04.048 . ПМЦ   8238499 . ПМИД   34062119 .
  127. ^ Юлия М., Теленти А., Рауселл А. (октябрь 2015 г.). «Sincell: пакет R/Bioconductor для статистической оценки иерархий клеточных состояний на основе секвенирования одноклеточной РНК» . Биоинформатика . 31 (20): 3380–3382. doi : 10.1093/биоинформатика/btv368 . ПМЦ   4595899 . ПМИД   26099264 .
  128. ^ Го М, Ван Х, Поттер С.С., Уитсетт Дж.А., Сюй Ю (ноябрь 2015 г.). «SINCERA: конвейер для анализа профиля одноклеточной РНК-Seq» . PLOS Вычислительная биология . 11 (11): e1004575. Бибкод : 2015PLSCB..11E4575G . дои : 10.1371/journal.pcbi.1004575 . ПМК   4658017 . ПМИД   26600239 .
  129. ^ Иличич Т., Ким Дж.К., Колодзейчик А.А., Баггер Ф.О., Маккарти Дж., Мариони Дж.К., Тейхманн С.А. (февраль 2016 г.). «Классификация клеток низкого качества на основе данных одноклеточной РНК-секвенирования» . Геномная биология . 17 (1): 29. дои : 10.1186/s13059-016-0888-1 . ПМЦ   4758103 . ПМИД   26887813 .
  130. ^ Ленг Н., Чой Дж., Чу Л.Ф., Томсон Дж.А., Кендзиорски С., Стюарт Р. (май 2016 г.). «OEFinder: пользовательский интерфейс для выявления и визуализации эффектов упорядочения в данных секвенирования одноклеточной РНК» . Биоинформатика . 32 (9): 1408–1410. doi : 10.1093/биоинформатика/btw004 . ПМЦ   4848403 . ПМИД   26743507 .
  131. ^ Цзян П., Томсон Дж.А., Стюарт Р. (август 2016 г.). «Контроль качества секвенирования одноклеточной РНК с помощью SinQC» . Биоинформатика . 32 (16): 2514–2516. doi : 10.1093/биоинформатика/btw176 . ПМЦ   4978927 . ПМИД   27153613 .
  132. ^ Ли Х, Брауэр ЧР, Луо В (апрель 2022 г.). «Универсальная глубокая нейронная сеть для глубокой очистки данных одноклеточной РНК-Seq» . Природные коммуникации . 13 (1): 1901. Бибкод : 2022NatCo..13.1901L . дои : 10.1038/s41467-022-29576-y . ПМК   8990021 . ПМИД   35393428 .
  133. ^ Вальехос К.А., Мариони Х.К., Ричардсон С. (июнь 2015 г.). «ОСНОВЫ: Байесовский анализ данных секвенирования одиночных клеток» . PLOS Вычислительная биология . 11 (6): e1004333. Бибкод : 2015PLSCB..11E4333V . дои : 10.1371/journal.pcbi.1004333 . ПМЦ   4480965 . ПМИД   26107944 .
  134. ^ Дин Б., Чжэн Л., Чжу Ю., Ли Н., Цзя Х., Ай Р. и др. (июль 2015 г.). «Нормализация и снижение шума для экспериментов по секвенированию одноклеточной РНК» . Биоинформатика . 31 (13): 2225–2227. doi : 10.1093/биоинформатика/btv122 . ПМЦ   4481848 . ПМИД   25717193 .
  135. ^ Пирсон Э., Яу К. (ноябрь 2015 г.). «ZIFA: уменьшение размерности для анализа экспрессии генов в отдельных клетках с нулевым завышением» . Геномная биология . 16 (241): 241. doi : 10.1186/s13059-015-0805-z . ПМК   4630968 . ПМИД   26527291 .
  136. ^ Ву Т.Н., Уиллс К.Ф., Калари КР, Ню Н., Ван Л., Ранталайнен М., Павитан Ю. (июль 2016 г.). «Модель Бета-Пуассона для анализа данных секвенирования одноклеточной РНК» . Биоинформатика . 32 (14): 2128–2135. doi : 10.1093/биоинформатика/btw202 . ПМИД   27153638 .
  137. ^ Финак Г., МакДэвид А., Ядзима М., Денг Дж., Герсук В., Шалек А.К. и др. (декабрь 2015 г.). «MAST: гибкая статистическая основа для оценки транскрипционных изменений и характеристики гетерогенности в данных секвенирования одноклеточной РНК» . Геномная биология . 16 (1): 278. дои : 10.1186/s13059-015-0844-5 . ПМК   4676162 . ПМИД   26653891 .
  138. ^ Харченко П.В., Зильберштейн Л., Скадден Д.Т. (июль 2014 г.). «Байесовский подход к анализу дифференциальной экспрессии отдельных клеток» . Природные методы . 11 (7): 740–742. дои : 10.1038/nmeth.2967 . ПМЦ   4112276 . ПМИД   24836921 .
  139. ^ Чанг З., Ли Г., Лю Дж., Чжан Ю., Эшби С., Лю Д. и др. (февраль 2015 г.). «Bridger: новая основа для сборки транскриптома de novo с использованием данных RNA-seq» . Геномная биология . 16 (1): 30. дои : 10.1186/s13059-015-0596-2 . ПМЦ   4342890 . ПМИД   25723335 .
  140. ^ Форушани А., Аграхари Р., Докинг Р., Чанг Л., Дунс Г., Худоба М. и др. (март 2017 г.). «Крупномасштабный анализ генной сети показывает значение пути внеклеточного матрикса и гомеобоксных генов при остром миелоидном лейкозе: введение в пакет Pigengene и его применение» . BMC Медицинская Геномика . 10 (1): 16. дои : 10.1186/s12920-017-0253-6 . ПМЦ   5353782 . ПМИД   28298217 .
  141. ^ Квек С., Юнг CH, Беллингем С.А., Лони А., Хилл А.Ф. (2015). «iSRAP — исследовательский инструмент в одно касание для быстрого профилирования данных секвенирования малых РНК» . Журнал внеклеточных везикул . 4 : 29454. дои : 10.3402/jev.v4.29454 . ПМЦ   4641893 . ПМИД   26561006 .
  142. ^ Кукса П.П., Амли-Вольф А., Катаник Ж., Валладарес О., Ван Л.С., Люнг Ю.Ю. (июль 2018 г.). «SPAR: небольшой портал RNA-seq для анализа экспериментов по секвенированию» . Исследования нуклеиновых кислот . 46 (П1): П36–П42. дои : 10.1093/nar/gky330 . ПМК   6030839 . ПМИД   29733404 .
  143. ^ Джонсон Н.Р., Йео Дж.М., Корух К., Экстелл М.Дж. (июль 2016 г.). «Улучшенное размещение малых РНК с мультикартированием» . Г3 . 6 (7): 2103–2111. дои : 10.1534/g3.116.030452 . ПМЦ   4938663 . ПМИД   27175019 .
  144. ^ Шмид-Бургк Дж.Л., Хорнунг В. (ноябрь 2015 г.). «BrowserGenome.org: веб-анализ и визуализация данных секвенирования РНК» . Природные методы . 12 (11): 1001. doi : 10.1038/nmeth.3615 . ПМИД   26513548 . S2CID   205424303 .
  145. ^ Милн И., Стивен Г., Байер М., Кок П.Дж., Причард Л., Кардл Л. и др. (март 2013 г.). «Использование планшета для визуального изучения данных секвенирования второго поколения» . Брифинги по биоинформатике . 14 (2): 193–202. дои : 10.1093/нагрудник/bbs012 . ПМИД   22445902 .
  146. ^ Пирайр А., Купри С., Дюваль Л., Песке Ж.К. (2017). «Кластер BRANE: уточнение вывода о регуляторной сети генов с помощью кластера». Транзакции IEEE/ACM по вычислительной биологии и биоинформатике (представленная рукопись). 15 (3): 850–860. дои : 10.1109/TCBB.2017.2688355 . ПМИД   28368827 . S2CID   12866368 .
  147. ^ Пирайр А., Купри С., Бидар Ф., Дюваль Л., Песке Ж.К. (ноябрь 2015 г.). «BRANE Cut: биологически связанное априорное улучшение сети с разрезами графа для вывода регуляторной сети генов» . БМК Биоинформатика . 16 : 368. дои : 10.1186/s12859-015-0754-2 . ПМЦ   4634801 . ПМИД   26537179 .
  148. ^ Луо В., Фридман М.С., Шедден К., Ханкенсон К.Д., Вульф П.Дж. (май 2009 г.). «GAGE: общеприменимое обогащение набора генов для анализа путей» . БМК Биоинформатика . 10 (161): 161. дои : 10.1186/1471-2105-10-161 . ПМК   2696452 ​​. ПМИД   19473525 .
  149. ^ Субхаш С., Кандури С. (сентябрь 2016 г.). «GeneSCF: инструмент функционального обогащения в реальном времени с поддержкой нескольких организмов» . БМК Биоинформатика . 17 (1): 365. дои : 10.1186/s12859-016-1250-z . ПМК   5020511 . ПМИД   27618934 .
  150. ^ Рю-Альбрехт К. (2014). «Визуализация данных микрочипов и RNAseq с использованием аннотаций онтологии генов. Версия пакета R 1.4.1» . Гитхаб .
  151. ^ Молодой доктор медицины; Уэйкфилд М.Дж.; Смит Г.К.; Ошлак А (2010). «Анализ онтологии генов для секвенирования РНК: учет систематической ошибки отбора» . Геномная биология . 11 (2): Р14. дои : 10.1186/gb-2010-11-2-r14 . ПМЦ   2872874 . ПМИД   20132535 ​​.
  152. ^ Сюн Кью, Мукерджи С., Фьюри Т.С. (сентябрь 2014 г.). «GSAASeqSP: набор инструментов для анализа ассоциаций наборов генов в данных RNA-Seq» . Научные отчеты . 4 (6347): 6347. Бибкод : 2014NatSR...4E6347X . дои : 10.1038/srep06347 . ПМК   4161965 . ПМИД   25213199 .
  153. ^ Хэнзельманн С., Кастело Р., Гинни Дж. (январь 2013 г.). «GSVA: анализ вариаций набора генов для данных микрочипов и секвенирования РНК» . БМК Биоинформатика . 14 (17): 7. дои : 10.1186/1471-2105-14-7 . ПМК   3618321 . ПМИД   23323831 .
  154. ^ Чжоу Ю. Х. (март 2016 г.). «Анализ путей данных RNA-Seq с использованием подхода, основанного на оценке» . Биометрия . 72 (1): 165–174. дои : 10.1111/biom.12372 . ПМЦ   4992401 . ПМИД   26259845 .
  155. ^ Игнатова И, Будинская Е (октябрь 2015 г.). «ToPASeq: пакет R для анализа путей на основе топологии микрочипов и данных RNA-Seq» . БМК Биоинформатика . 16 (350): 350. дои : 10.1186/s12859-015-0763-1 . ПМЦ   4625615 . ПМИД   26514335 .
  156. ^ Ван Бел М., Пруст С., Ван Несте С., Дефорс Д., Ван де Пер Ю., Вандеполе К. (декабрь 2013 г.). «TRAPID: эффективный онлайн-инструмент для функционального и сравнительного анализа транскриптомов RNA-Seq de novo» . Геномная биология . 14 (12): 134 р. дои : 10.1186/gb-2013-14-12-r134 . ПМЦ   4053847 . ПМИД   24330842 .
  157. ^ Буккини Ф., Дель Кортона А., Крефт Л., Ботцки А., Ван Бел М., Вандеполе К. (сентябрь 2021 г.). «TRAPID 2.0: веб-приложение для таксономического и функционального анализа транскриптомов de novo» . Исследования нуклеиновых кислот . 49 (17): е101. дои : 10.1093/nar/gkab565 . ПМЦ   8464036 . ПМИД   34197621 .
  158. ^ де Йонг А., ван дер Мелен С., Койперс О.П., Кок Дж. (сентябрь 2015 г.). «T-REx: веб-сервер транскриптомного анализа данных экспрессии RNA-seq» . БМК Геномика . 16 (663): 663. doi : 10.1186/s12864-015-1834-4 . ПМЦ   4558784 . ПМИД   26335208 .
  159. ^ Лан Д., Ламас Б. (14 сентября 2022 г.). «Genozip 14 — усовершенствования в сжатии файлов BAM и CRAM». биоRxiv . дои : 10.1101/2022.09.12.507582 . S2CID   252357508 .
  160. ^ Чжан Ю., Чен К., Слоан С.А., Беннетт М.Л., Шольце А.Р., О'Киф С. и др. (сентябрь 2014 г.). «База данных транскриптома и сплайсинга РНК-секвенирования глии, нейронов и сосудистых клеток коры головного мозга» . Журнал неврологии . 34 (36): 11929–11947. doi : 10.1523/JNEUROSCI.1860-14.2014 . ПМК   4152602 . ПМИД   25186741 .
  161. ^ Ван Ю, Ву Н, Лю Дж, Ву З, Донг Д (июль 2015 г.). «FusionCancer: база данных слитых генов рака, полученных на основе данных RNA-seq» . Диагностическая патология . 10 (131): 131. дои : 10.1186/s13000-015-0310-4 . ПМЦ   4517624 . ПМИД   26215638 .
  162. ^ Франзен О, Ган Л.М., Бьоркегрен Дж.Л. (январь 2019 г.). «PanglaoDB: веб-сервер для исследования данных секвенирования одноклеточной РНК мыши и человека» . База данных . 2019 . дои : 10.1093/база данных/baz046 . ПМК   6450036 . ПМИД   30951143 .

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 05d61e98502a49b82932eecf3dedc1a3__1721128680
URL1:https://arc.ask3.ru/arc/aa/05/a3/05d61e98502a49b82932eecf3dedc1a3.html
Заголовок, (Title) документа по адресу, URL1:
List of RNA-Seq bioinformatics tools - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)