Анновар
Annovar ( Annotate variation ) - это программный инструмент для биоинформатики для интерпретации и приоритетов вариантов отдельных нуклеотидов (SNV), вставки , делеций и вариантов количества копий (CNV) данного генома. [ 1 ]
Он обладает способностью аннотировать геномы человека HG18, HG19, HG38 и модели -организмы, такие как: мышь ( Mus musculus ), данио ( Данио -Риорио ), фруктовая муха ( Drosophila melanogaster ) , Круглый ( Caenorhabditis взгляд Elegan ) и многие другие. [ 2 ] Аннотации могут быть использованы для определения функциональных последствий мутаций на гены и организмы, вывести цитогенетические полосы, сообщать о оценках функциональных значений и/или находить варианты в консервативных регионах. [ 2 ] Annovar вместе с эффектом SNP ( SNPEFF ) и предиктором варианта эффекта (VEP) являются тремя наиболее часто используемыми инструментами аннотации варианта.
Фон
[ редактировать ]
Стоимость секвенирования ДНК с высокой пропускной способностью резко снизилась с 100 миллионов долларов/геном человека в 2001 году до 1000 долларов США/геном человека в 2017 году. [ 3 ] Благодаря этому увеличению доступности, секвенирование ДНК высокой пропускной способности стало более широко использоваться в исследованиях и клинических условиях. [ 4 ] [ 5 ] Некоторые общие зоны, которые широко используют высокопроизводительные секвенирование ДНК, являются: секвенирование целого экзома , секвенирование всего генома (WGS) и исследования ассоциаций широкого генома (GWAS) . [ 6 ] [ 7 ]
Существует все больше доступных инструментов, стремящихся к всестороннему управлению, анализировать и интерпретировать огромное количество данных, полученных из высокопроизводительного секвенирования ДНК. Инструменты должны быть эффективными и достаточно надежными для анализа большого количества вариантов (более 3 миллионов человек в геноме человека), хотя и достаточно чувствительные для выявления редких и клинически значимых вариантов, которые, вероятно, являются вредными/вредными. [ 8 ] Annovar был разработан Кай Вангом в 2010 году в Центре прикладной геномики в детской больнице Филадельфии. [ 1 ] Это тип вариантного инструмента аннотации, который компилирует вредные оценки прогнозирования генетических вариантов из таких программ, как полифен, Clinvar и CADD, и аннотирует SNV, вставки, делеции и CNV предоставленного генома. Annovar является одним из первых эффективных, настраиваемых, расширяемых и кроссплатформенных совместимых инструментов аннотации варианта.
С точки зрения более крупного рабочего процесса биоинформатики, Annovar подходит ближе к концу, после того, как чтения секвенирования ДНК, имеющиеся между отображенными, выровненными и вариантами, были предсказаны из файла выравнивания (BAM), также известного как вызов варианта. Этот процесс будет создавать результирующий файл VCF , текстовый файл, разделенный TAB, в структуре таблицы, содержащей генетические варианты в виде строк. Этот файл может затем использоваться в качестве входного в программном обеспечении Annovar для процесса аннотации варианта, выводя интерпретации вариантов, идентифицированных из конвейера Upstream Bioinformatics.
Типы функциональной аннотации генетических вариантов
[ редактировать ]Аннотация на основе генов
[ редактировать ]Этот подход определяет, вызывают ли входные варианты изменения кодирования белка и аминокислоты, на которые влияют мутации. [ 9 ] Входной файл может состоять из экзонов, интронов, межгенных областей, сайтов акцептора/доноров сплайсинга и 5 '/3' -нетранслируемых областей. Основное внимание уделяется изучению взаимосвязи между несинонимическими мутациями (SNP, инделями или CNV) и их функциональным воздействием на известные гены. [ 10 ] В частности, аннотация на основе генов будет подчеркнуть точное изменение аминокислот, если мутация находится в экзонической области, и прогнозируемое влияние на функцию известного гена. Этот подход полезен для идентификации вариантов в известных генах из данных секвенирования целых экзома.
Региональная аннотация
[ редактировать ]Этот подход идентифицирует вредные варианты в специфических областях геномных областей, основанных на геномных элементах вокруг гена. [ 11 ] Некоторые категории региональные аннотации будут учитываться:
- Является ли вариант в известной консервативной геномной области?: Мутации происходят во время митоза и мейоза . Если нет селективного давления для специфических нуклеотидных последовательностей, то все области генома будут мутированы, являются равными скоростями. Геномные области, которые высоко консервативны, указывают на геномные последовательности, которые необходимы для выживания и/или репродуктивного успеха организма. Таким образом, если вариант нарушает высоко консервативную область, вариант, вероятно, очень вреден. [ 12 ]
- Является ли вариант в предсказанном сайте связывания фактора транскрипции ?: ДНК транскрибируется в РНК -мессенджер (мРНК) РНК -полимеразой II . Этот процесс может быть модулированные факторы транскрипции , которые могут усилить или ингибировать связывание RNAPOL II. Если вариант нарушает сайт связывания фактора транскрипции, то транскрипция гена может быть изменена, вызывая изменения в уровне экспрессии генов и/или количестве производства белка. Эти изменения могут вызвать фенотипические изменения.
- Является ли вариант в прогнозируемом сайте мишени miRNA ?: МикроРНА (miRNA) - это тип РНК, который комплементарный связывается с целевой последовательности мРНК, чтобы подавить или замолчать трансляцию мРНК. Если вариант нарушает местоположение цели miRNA, miRNA могла бы изменить аффинность связывания с соответствующим транскриптом гена, тем самым изменяя уровень экспрессии мРНК транскрипта. Это может дополнительно влиять на уровни продукции белка, что может вызвать фенотипические изменения.
- Предполагается ли вариант прерывать стабильную РНК-вторичную структуру?: РНК может функционировать на уровне РНК в виде некодирующей РНК или быть переведенной в белки для нижестоящих процессов. РНК-вторичные структуры чрезвычайно важны при определении правильного периода полураспада и функции этих РНК. Два вида РНК с плотно регулируемыми вторичными структурами представляют собой рибосомную РНК (рРНК) и передача РНК (тРНК), которые необходимы для трансляции мРНК в белок. Если вариант нарушает стабильность вторичной структуры РНК, период полураспада РНК может быть сокращена, снижая концентрацию РНК в клетке.
Некодирующие регионы охватывают 99% генома человека [ 13 ] и аннотация на основе региона чрезвычайно полезна при выявлении вариантов в этих регионах. Этот подход может использоваться в данных WGS.
Аннотация на основе фильтров
[ редактировать ]Этот подход идентифицирует варианты, которые задокументированы в конкретных базах данных. [ 14 ] Варианты могут быть получены из DBSNP, 1000 Genomes Project или Suppled List. Дополнительную информацию можно получить с частоты вариантов из приведенных выше баз данных или прогнозируемых вредных баллов, созданных полифеном, CADD, Clinvar или многими другими. [ 1 ] Чем нечаще вариант появляется в общедоступной базе данных, тем более вредным он может быть. Результаты различных инструментов прогнозирования вредных баллов могут объединиться исследователем, чтобы сделать более точный вызов варианту.
Взятые вместе, эти подходы дополняют друг друга, чтобы отфильтровать более 4 миллионов вариантов в геноме человека. Обычные, низкие варианты баллов устранены, чтобы выявить редкие, высокие варианты оценки, которые могут быть причинными для врожденных заболеваний.
Техническая информация
[ редактировать ]Annovar-это инструмент командной строки, написанный на языке программирования PERL , и его можно запустить в любой операционной системе , в которой установлен интерпретатор Perl. [ 1 ] При использовании для некоммерческих целей он доступен бесплатно в виде пакета с открытым исходным кодом , который можно загрузить через веб-сайт Annovar. Annovar может обрабатывать большинство данных секвенирования следующего поколения , которые проходили через вариантное программное обеспечение.
Сценарий | Цель | Описание | Вход | Выход | Требования |
---|---|---|---|---|---|
annotate_variation.pl
|
вариант аннотатор | Основной сценарий, который функционально аннотирует генетические варианты с помощью (1) на основе генов, (2) на основе региона и/или (3) аннотации на основе фильтров. | .Avinput | .Avinput | Источники данных загружаются для аннотации, например, HG38, UCSC, 1000 Genomes Project. |
convert2annovar.pl
|
конвертер файла | Преобразует различные форматы файлов в пользовательский формат входного файла Annovar. | См. Раздел «Преобразование в формат входного файла Annovar». | .Avinput | |
table_annovar.pl
|
Автоматизированный вариант аннотатор | Обертка вокруг annotate_variation.pl Это может принимать формат VCF вместе с форматом Annovar, выполняет аннотацию и выводит файл, совместимый с Excel. Идеально подходит для начинающих.
|
.Avinput, CSV, TSV, VCF | CSV, TSV, VCF, TXT | Источники данных загружаются для аннотации, например, HG38, UCSC, 1000 Genomes Project. |
variants_reduction.pl
|
вариант редуктора | Выполняет пошаговое сокращение вариантов на большом наборе входных вариантов, чтобы сузить до подмножества функционально важных вариантов. Процедуры фильтрации включают в себя: применяет пошаговую процедуру фильтрации для идентификации подмножества вариантов, которые могут быть связаны с заболеванием. [ 2 ] Такие процедуры фильтрации включают: [ 2 ]
|
.Avinput | .Avinput | Источники данных аннотаций на основе генов и различные источники аннотационных данных на основе фильтров загружаются. |
Форматы файлов
[ редактировать ]Программное обеспечение Annovar принимает текстовые входные файлы, включая VCF (формат вариантов вызовов) , золотой стандарт для описания генетических локусов.
Основной сценарий аннотации программы, annotate_variation.pl
Требуется пользовательский формат входного файла, формат ввода Annovar (.avinput). Общие типы файлов могут быть преобразованы в формат ввода Annovar для аннотации с использованием предоставленного скрипта (см. Ниже). Это простой текстовый файл, в котором каждая строка в файле соответствует варианту, а в каждой строке представлены столбцы, определяемые в TAB Дополнительные столбцы [ 2 ]
Ввод файла Annovar содержит следующие базовые поля:
- Хр
- Начинать
- Конец
- Рефери
- Все
Для базового использования «вне коробки»:
Популярной функцией инструмента Annovar является использование table_annovar.pl
Скрипт, который упрощает рабочий процесс в один вызов в командной строке, учитывая, что источники данных для аннотации уже были загружены. Преобразование файла из файла VCF обрабатывается в вызове функции, за которым следует аннотация и вывод в файл, совместимый с Excel. Скрипт принимает ряд параметров для аннотации и выводит файл VCF с аннотациями в виде пары клавиш в INFO
столбец файла VCF для каждого генетического варианта, например, "genomic_function = exonic".
Преобразование в формат входного файла Annovar
[ редактировать ]Преобразование файла в формат ввода Annovar возможна с использованием сценария преобразования формата файла convert2annovar.pl
Полем Программа принимает общие форматы файлов, выведенные инструментами вызова UPSTREAM . Последующие сценарии функциональных аннотаций annotate_variation.pl
Используйте входной файл Annovar. Форматы файлов, которые принимаются convert2annovar.pl
Включите следующее: [ 2 ]
- Вариант формата вызова
- Samtools Genotype-Halling Format
- Формат экспорта Illumina из Genomestudio
- Твердый формат GFF-генотипов
- Полный формат варианта геномики
Генерирование входных файлов на основе конкретных вариантов, транскриптов или геномных областей:
При исследовании локусов -кандидатов, которые связаны с болезнями, с использованием вышеуказанных форматов вызовов в качестве входных файлов в Annovar является стандартным рабочим процессом для функциональной аннотации генетических вариантов, выведенных из конвейера с биоинформатикой вверх по течению. Annovar также можно использовать в других сценариях, таких как опрос набора генетических вариантов, представляющих интерес на основе списка идентификаторов DBSNP , а также вариантов в определенных геномных или экзомических областях. [ 2 ]
В случае идентификаторов DBSNP, предоставляя convert2annovar.pl
Скрипт Список идентификаторов (например, RS41534544, RS4308095, RS12345678) в текстовом файле вместе со ссылкой на опорный геном в качестве параметра, Annovar выведет входной файл Annovar с полями геномной координат для этих вариантов, который может быть использован для функционального файла. аннотация. [ 2 ]
В случае геномных областей можно обеспечить интересующий геномный диапазон (например, CHR1: 2000001-2000003), а также контрольный геном, представляющий интерес, а Annovar будет генерировать входной файл анновара всех генетических локусов, охватывающих этот диапазон. Кроме того, можно также указать размер вставки и удаления, в котором сценарий выберет все генетические локусы, где обнаруживается конкретный вставка или делеция конкретного размера. [ 2 ]
Наконец, если посмотреть на варианты в определенных экзонических регионах, пользователи могут генерировать входные файлы Annovar для всех возможных вариантов в экзонах (включая варианты сплайсинга), когда convert2annovar.pl
Скрипт предоставляется идентификатор транскрипта РНК (например, NM_022162) на основе стандартной номенклатуры HGV (Общество вариации генома человека). [ 2 ]
Выходной файл
[ редактировать ]Возможные выходные файлы представляют собой аннотированный файл .Avinput, CSV , TSV или VCF . В зависимости от принятой стратегии аннотации (см. Рисунок ниже), входные и выходные файлы будут отличаться. Можно настроить типы выходных файлов с учетом конкретного входного файла, предоставив программе соответствующий параметр.
Например, для table_annovar.pl
Программа, если входной файл является VCF, то выход также будет файл VCF. Если входной файл имеет тип формата ввода Annovar, то выход по умолчанию будет TSV, с опцией для вывода в CSV, если -csvout
параметр указан. Выбирая CSV или TSV в качестве типа выходного файла, пользователь может открыть файлы для просмотра аннотаций в Excel или другого программного приложения для электронных таблиц. Это популярная функция среди пользователей.
Выходной файл будет содержать все данные из исходного входного файла с дополнительными столбцами для желаемых аннотаций. Например, при аннотировании вариантов с такими характеристиками, как (1) геномная функция и (2) функциональная роль варианта кодирования, выходной файл будет содержать все столбцы из входного файла, следовали за дополнительными столбцами «genomic_function» (например, со значениями «экзонный» или «интронный») и «кодинг_variant_function» (например, с значениями «синонимичный SNV» или «несинонимный SNV»).

Эффективность системы
[ редактировать ]Способный на современном настольном компьютере (3 ГГц INTEL Xeon CPU, 8 ГБ памяти), для 4,7 миллиона вариантов, Annovar требует ~ 4 минуты для выполнения функциональной аннотации на основе генов или ~ 15 минут для выполнения пошагового «уменьшения вариантов». Говорят, что это практично для выполнения вариантных аннотаций и вариантов приоритетов на сотнях человеческих геномов за день. [ 2 ]
Анновар можно было бы ускорить, используя -thread
Аргумент, который позволяет многопоточности , чтобы входные файлы могли обрабатываться параллельно.
Данные ресурсы
[ редактировать ]Чтобы использовать Annovar для функциональной аннотации вариантов, наборы данных аннотации могут быть загружены с помощью annotate_variation.pl
Скрипт, который спасает их на местный диск. [ 1 ] Различные источники данных аннотации используются для трех основных типов аннотации (на основе генов, на основе региона и фильтров).
Это некоторые из источников данных для каждого типа аннотации:
Аннотация на основе генов
[ редактировать ]Региональная аннотация
[ редактировать ]- Кодировать
- Изготовленные на заказ базы данных, соответствующие GFF3 (общая формата функции версии 3)
Аннотация на основе фильтров
[ редактировать ]1000 геномов проект | LRT | Clinvar |
DBSNP | Мутация | Ярость |
Avsnp | Герп ++ | ЗАТЕМ |
DBNSFP | Экзак | Космический |
ПРОСЕЯТЬ | ESP (проект секвенирования Exome) | ICGC |
Полифен 2 | частота аллеля гномада | CLI60 |
Филоп | Полная частота аллеля геномики |
Учитывая большое количество источников данных для аннотации на основе фильтров, вот примеры, которые подмножны наборов данных будут использовать для нескольких наиболее распространенных вариантов использования. [ 14 ]
- Для частоты вариантов в данных целого экзома : [ 14 ]
- Exac: с частотами аллелей для всех этнических групп
- NHLBI-ESP: из 6500 экзомов используйте три группы населения
- Частота аллеля GNOMAD: с частотами аллелей для нескольких популяций
- Для специфичных для болезни вариантов: [ 14 ]
- Clinvar: с отдельными колонками для каждой области Clinvar для каждого варианта
- Космическая: соматические мутации от рака и частота возникновения в каждом подтипе рака
- ICGC: Мутации из международного консорциума генома рака
- NCI-60: панель опухолевой панели опухолевой клеток экзома.
Пример приложения
[ редактировать ]
Использование Annovar для приоритета генетических вариантов для выявления мутаций при редком генетическом заболевании
[ редактировать ]Annovar является одним из общих инструментов аннотации для выявления кандидатов и причинных мутаций и генов для редких генетических заболеваний.
Используя комбинацию аннотации на основе генов и на основе фильтров, за которым следует снижение вариантов, основанное на значениях аннотации вариантов, может быть идентифицирован причинный ген при редкой рецессивной менделевской болезни, называемой синдромом Миллера. [ 1 ]
Это будет включать синтезирование набора данных по всему геному в размере ~ 4,2 млн. Единых нуклеотидных вариантов (SNV ) и ~ 0,5 миллиона вставок и удалений ( Indels ). [ 1 ] две известные причинно -следственные мутации для синдрома Миллера (G152R и G202A в гене Dhodh ) Также включены [ 1 ]
Шаги по выявлению причинно -следственных вариантов заболевания с использованием Annovar: [ 1 ]
- Аннотация на основе генов для идентификации экзоновых/сплайсинговых вариантов комбинации SNV и индел (~ 4,7 миллиона вариантов), где идентифицируется 24 617 экзонных вариантов. [ 1 ]
- Поскольку синдром Миллера представляет собой редкое менделевское заболевание, представляют только экзоновые варианты, изменяющие белок, что составляет 11 166. [ 1 ] Из этого идентифицируются 4860 вариантов, которые падают в высококонсервативные геномные области [ 1 ]
- Как общедоступные базы данных, такие как DBSNP и 1000 Archive Project Archive, ранее сообщаемые варианты, которые часто являются общими, менее вероятно, что они будут содержать причинные варианты синдрома Миллера, которые редки. [ 1 ] Следовательно, варианты, обнаруженные в этих источниках данных, отфильтрованы и остаются 413 вариантов.
- Затем гены оцениваются на предмет того, существуют ли несколько вариантов в одном и том же гене, что и составные гетерозиготы и 23 гена остаются. [ 1 ]
- Наконец, «Непрочитанные» гены удаляются, те, которые имеют высокочастотные бессмысленные мутации (более 1% субъектов в проекте 1000 геномов ), которые подвержены ошибкам секвенирования и выравнивания в платформе секвенирования короткого чтения. [ 1 ] Эти гены считаются менее вероятной причиной редкой менделевской болезни . В результате отфильтрованы три гена, а 20 генов -кандидатов остались, включая причинный ген Dhodh [ 1 ]
Ограничения Анновара
[ редактировать ]Два ограничения анновара связаны с обнаружением общих заболеваний и более крупными структурными вариантными аннотациями. Эти проблемы присутствуют во всех текущих инструментах аннотации варианта.
Наиболее распространенные заболевания, такие как диабет и болезнь Альцгеймера, имеют несколько вариантов по всему геному, которые распространены в популяции. [ 15 ] [ 16 ] Ожидается, что эти варианты будут иметь низкие индивидуальные вредные баллы и вызывать заболевание, хотя накопление нескольких вариантов. Однако у Annovar есть схемы по умолчанию «уменьшение варианта», которые предоставляют небольшой список редких и высоко прогнозируемых вредных вариантов. [ 10 ] Эти настройки по умолчанию могут быть оптимизированы, чтобы выходные данные отобразили дополнительные варианты с уменьшением прогнозируемых вредных баллов. [ 2 ] Annovar в первую очередь используется для выявления вариантов, связанных с редкими заболеваниями, когда причинно -следственная мутация, как ожидается, будет редкой и очень вредной.
более крупные структурные варианты (SV), такие как хромосомные инверсии, транслокации и сложные SV, вызывают такие заболевания, как гемофилия А и Альцгеймер. Было показано, что [ 17 ] [ 18 ] Тем не менее, SV часто трудно аннотировать, потому что трудно назначить определенные вредные оценки большим мутированным геномным областям. В настоящее время Annovar может аннотировать только гены, содержащиеся в делециях или дубликациях, или небольшие инделы <50BP. Annovar не может вывести сложные SV и транслокации [ 10 ]
Альтернативные инструменты аннотации варианта
[ редактировать ]Существует также два других типа инструментов аннотации SNP, которые похожи на Annovar: SNP -эффект ( SNPEFF ) и предиктор варианта (VEP) . Многие из функций между Annovar, SNPEFF и VEP одинаковы, включая формат ввода и выходного файла, аннотации регуляторной области и знания вариантов. Тем не менее, основные различия заключаются в том, что Анновар не может аннотировать для потери прогнозов функции, тогда как SNPEFF и VEP могут. Кроме того, Annovar не может аннотировать микроРНК , тогда как VEP может. местоположение структурного связывания [ 19 ] Прогнозы местоположения структурного связывания микроРНК могут быть информативными в выявлении роли посттранскрипционных мутаций в патогенезе заболевания. [ 20 ] Потеря функциональных мутаций - это изменения в геноме, что приводит к общей дисфункции генного продукта. Таким образом, эти прогнозы могут быть чрезвычайно информативными в отношении диагностики заболеваний, особенно при редких моногенных заболеваниях. [ Цитация необходима ]
Сорт | Особенность | Вебар | Анновар | Snpeff |
Общий | Доступность | Бесплатно | Бесплатно (только академическое использование) | Бесплатно |
Вход | VCF | Да | Да | Да |
Варианты последовательности | Да | Да | Да | |
Структурные варианты | Да | Да | Да | |
Выход | VCF | Да | Да | Да |
Наборы транскриптов | Набор | Да | Да | Да |
Refseq | Да | Да | Да | |
Пользовательские базы данных | Да | Да | Да | |
Интерфейсы | Местный пакет | Да | Да | Да |
Интерфейс мгновенного прогнозирования | Да | Да | Нет | |
Типы последствий | Сплайсинг прогнозы | Да (через плагины) | Да (через внешние данные) | Да (экспериментальный) |
Прогнозирование потери функции | Да (через плагины) | Нет | Да | |
Не кодирование | Регулирующие особенности | Да | Да | Да |
Поддерживать несколько клеточных линий | Да | Нет | Да | |
Местоположение структуры miRNA | Да (через плагины) | Нет | Нет | |
Известные варианты | Отчет известных вариантов | Да | Да | Да |
Фильтр по частоте | Да | Да | Да | |
Клиническое значение | Да | Да | Да | |
Другие фильтры | Предварительные фильтры | Да | Да | Да |
*Таблица адаптирована из McLaren et al. (2016).
Ссылки
[ редактировать ]- ^ Подпрыгнуть до: а беременный в дюймовый и фон глин час я Дж k л м не а п Хаконарсон, Хакон; Ли, Миньяо ; Ван, Кай (2010-09-01). «Annovar: функциональная аннотация генетических вариантов из данных высокопроизводительной секвенирования» . Исследование нуклеиновых кислот . 38 (16): E164. doi : 10.1093/nar/gkq603 . ISSN 0305-1048 . PMC 2938201 . PMID 20601685 .
- ^ Подпрыгнуть до: а беременный в дюймовый и фон глин час я Дж k л "Annovar сайт" . www.openbioinformatics.org . Получено 2019-02-28 .
- ^ «Затраты на секвенирование ДНК: данные» . Национальный исследовательский институт генома человека (NHGRI) . Получено 2019-04-04 .
- ^ Эмерсон, Райан О.; Шервуд, Анна М.; Ридер, Марк Дж.; Guenthoer, Джейми; Уильямсон, Дэвид У.; Карлсон, Кристофер С.; Дречер, Чарльз У.; Тевари, Муниш; Билас, Джейсон Х. (декабрь 2013 г.). «Высокопроизводительное секвенирование рецепторов Т-клеток выявляет гомогенный репертуар лимфоцитов, инфильтрирующих опухоль при раке яичников» . Журнал патологии . 231 (4): 433–440. doi : 10.1002/path.4260 . ISSN 0022-3417 . PMC 5012191 . PMID 24027095 .
- ^ Блейни, Джейн К.; Паркс, Эйлин; Чжэн, Хуру; Таггарт, Лора; Браун, Фиона; Хаберленд, Валерия; Lightbody, Gaye (2018). «Обзор применения высокопроизводительного секвенирования в персонализированной медицине: барьеры и фасилитаторы будущего прогресса в области исследования и клинического применения» . Брифинги в биоинформатике . 20 (5): 1795–1811. doi : 10.1093/bib/bby051 . PMC 6917217 . PMID 30084865 .
- ^ Ссылка, генетика дома. "Что такое секвенирование целого экзома и секвенирование всего генома?" Полем Генетика дома ссылка . Получено 2019-04-04 .
- ^ Ссылка, генетика дома. "Что такое ассоциативные исследования по всему геному?" Полем Генетика дома ссылка . Получено 2019-04-04 .
- ^ Консорциум проекта 1000 геномов (октябрь 2015 г.). «Глобальная ссылка на генетическую вариацию человека» . Природа . 526 (7571): 68–74. Bibcode : 2015natur.526 ... 68t . doi : 10.1038/nature15393 . ISSN 1476-4687 . PMC 4750478 . PMID 26432245 .
{{cite journal}}
: CS1 Maint: числовые имена: список авторов ( ссылка ) - ^ Подпрыгнуть до: а беременный «Аннотация на основе генов - документация на анноваре» . Annovar.openbioinformatics.org . Получено 2019-02-28 .
- ^ Подпрыгнуть до: а беременный в Ян, Хуи; Ван, Кай (октябрь 2015). «Аннотация геномного варианта и приоритизация с анноваром и Ванноваром» . Природные протоколы . 10 (10): 1556–1566. doi : 10.1038/nprot.2015.105 . ISSN 1754-2189 . PMC 4718734 . PMID 26379229 .
- ^ Подпрыгнуть до: а беременный «Аннотация на основе региона - документация на анноваре» . Annovar.openbioinformatics.org . Получено 2019-02-28 .
- ^ Джордан, И. Кинг; Рогозин, Игорь Б.; Волк, Юрий I.; Кунин, Юджин В. (июнь 2002 г.). «Основные гены более эволюционно сохраняются, чем несущественные гены у бактерий» . Исследование генома . 12 (6): 962–968. doi : 10.1101/gr.87702 . ISSN 1088-9051 . PMC 1383730 . PMID 12045149 .
- ^ Ссылка, генетика дома. "Что такое некодирующая ДНК?" Полем Генетика дома ссылка . Получено 2019-03-01 .
- ^ Подпрыгнуть до: а беременный в дюймовый и «Аннотация на основе фильтров - документация на анноваре» . Annovar.openbioinformatics.org . Получено 2019-02-28 .
- ^ Wu, Yiming; Цзин, Рунью; Донг, Юнчэн; Куанг, Qifan; Ли, Ян; Хуан, Зиян; Ган, Вэй; Сюэ, Юэ; Li, Yizhou (2017-03-06). «Функциональная аннотация шестидесяти пяти SNP диабета 2 типа и его применения в прогнозировании риска» . Научные отчеты . 7 : 43709. Bibcode : 2017natsr ... 743709W . doi : 10.1038/srep43709 . ISSN 2045-2322 . PMC 5337961 . PMID 28262806 .
- ^ Emahazion, T.; Feuk, L.; Джобс, м.; Сойер, SL; Фредман, Д.; Сент -Клер, Д.; Принц, JA; Брукс, AJ (июль 2001 г.). «Исследования ассоциации SNP по болезни Альцгеймера подчеркивают проблемы для сложного анализа заболеваний». Тенденции в генетике . 17 (7): 407–413. doi : 10.1016/s0168-9525 (01) 02342-3 . ISSN 0168-9525 . PMID 11418222 .
- ^ Лакич, Делия; Казазян, Хейг Х.; Antonaraks, Stylios E.; Гичьера, Джейн (ноябрь 1993 г.). «Инверсии, дискризующие ген фактора VIII, являются распространенной причиной тяжелой гемофилии» Природа генетика 5 (3): 236–2 Doi : 10.1038/ ng1193-2 ISSN 1061-4 PMID 8275087 S2CID 25636383
- ^ Люпски, Джеймс Р. (июнь 2015 г.). «Структурный вариационный мутагенез генома человека: влияние на заболевание и эволюцию» . Экологический и молекулярный мутагенез . 56 (5): 419–436. Bibcode : 2015envmm..56..419L . doi : 10.1002/em.21943 . ISSN 0893-6692 . PMC 4609214 . PMID 25892534 .
- ^ Макларен, Уильям; Гил, Лоран; Охота, Сара Э.; Риат, Харприт Сингх; Ричи, Грэм Р.С.; Торманн, Анджа; Флицек, Пол; Каннингем, Фиона (2016-06-06). «Предсказатель эффекта варианта ансамбля» . Биология генома . 17 (1): 122. DOI : 10.1186/S13059-016-0974-4 . ISSN 1474-760x . PMC 4893825 . PMID 27268795 .
- ^ Цзян Q, Ван Y, Хао Y, Хуан Л., Тенг М., Чжан Х, Ли М., Ван Г., Лю Й (январь 2009 г.). «MIR2Disease: кураторская база данных вручную для дерегуляции микроРНК при заболевании человека» . Исследование нуклеиновых кислот . 37. 37 (выпуск базы данных): D98–104. doi : 10.1093/nar/gkn714 . PMC 2686559 . PMID 18927107 .