SNP-аннотация
Классификация | Биоинформатика |
---|---|
Подклассификация | Однонуклеотидный полиморфизм |
Тип используемых инструментов | Функциональные инструменты аннотаций |
Другие связанные темы | Геномный проект , Геномика |
Аннотация полиморфизма одного нуклеотида ( аннотация SNP ) — это процесс прогнозирования эффекта или функции отдельного SNP с использованием инструментов аннотации SNP. SNP В аннотации биологическая информация извлекается, собирается и отображается в четкой форме, доступной для запроса. Функциональная аннотация SNP обычно выполняется на основе доступной информации о последовательностях нуклеиновых кислот и белков . [1]
Введение
[ редактировать ]Однонуклеотидные полиморфизмы (SNP) играют важную роль в полногеномных исследованиях ассоциаций, поскольку они действуют как первичные биомаркеры . SNP в настоящее время являются маркером выбора из-за их большого количества практически во всех популяциях людей. Местоположение этих биомаркеров может иметь чрезвычайно важное значение с точки зрения прогнозирования функциональной значимости, генетического картирования и популяционной генетики . [3] Каждый SNP представляет собой замену нуклеотидов между двумя людьми в определенном месте. один SNP каждые 100–300 пар оснований SNP являются наиболее распространенным генетическим вариантом, обнаруживаемым у всех особей: у некоторых видов . [4] имеется огромное количество SNP Поскольку в геноме , существует явная необходимость расставить приоритеты SNP в соответствии с их потенциальным эффектом, чтобы ускорить генотипирование и анализ. [5]
Аннотирование большого количества SNP — сложный и сложный процесс, требующий вычислительных методов для обработки такого большого набора данных. Для аннотации SNP в различных организмах было разработано множество доступных инструментов: некоторые из них оптимизированы для использования с организмами, у которых плотно отобраны образцы SNP (например, люди ), но в настоящее время доступно мало инструментов, которые не являются видоспецифичными или поддерживают немодельные методы. данные организма. Большинство инструментов аннотации SNP обеспечивают прогнозируемые с помощью вычислений предполагаемые вредные эффекты SNP. Эти инструменты проверяют, находится ли SNP в функциональных геномных областях, таких как экзоны, сайты сплайсинга или сайты регуляции транскрипции, и прогнозируют потенциальные соответствующие функциональные эффекты, которые SNP может оказывать, используя различные подходы машинного обучения. Но инструменты и системы, которые отдают приоритет функционально значимым SNP, страдают от нескольких ограничений: во-первых, они исследуют предполагаемые вредные эффекты SNP в отношении одной биологической функции, которые предоставляют лишь частичную информацию о функциональной значимости SNP. Во-вторых, современные системы классифицируют SNP на вредные или нейтральные группы. [6]
Многие алгоритмы аннотации сосредоточены на однонуклеотидных вариантах (SNV), которые считаются более редкими, чем SNP, что определяется частотой их минорных аллелей (MAF). [7] [8] Как следствие, данные обучения для соответствующих методов прогнозирования могут различаться, и, следовательно, следует быть осторожным при выборе подходящего инструмента для конкретной цели. Для целей этой статьи «SNP» будет использоваться для обозначения как SNP, так и SNV, но читатели должны помнить о различиях.
SNP-аннотация
[ редактировать ]Для аннотации SNP используются многие виды генетической и геномной информации. В зависимости от различных функций, используемых каждым инструментом аннотации, методы аннотации SNP можно условно разделить на следующие категории:
Аннотация на основе генов
[ редактировать ]Геномная информация от окружающих геномных элементов является одной из наиболее полезных для интерпретации биологической функции наблюдаемого варианта. Информация об известном гене используется в качестве эталона для указания того, находится ли наблюдаемый вариант внутри гена или рядом с ним, а также имеет ли он потенциал нарушить последовательность белка и его функцию. Аннотация на основе генов основана на том факте, что несинонимичные мутации могут изменить последовательность белка и что мутация сайта сплайсинга может нарушить схему сплайсинга транскрипта. [9]
Аннотации, основанные на знаниях
[ редактировать ]Аннотация базы знаний выполняется на основе информации об атрибутах гена, функции белка и его метаболизме . В аннотациях этого типа больше внимания уделяется генетическим вариациям , которые нарушают домен функции белка, белок-белковое взаимодействие и биологический путь . Некодирующая область генома содержит множество важных регуляторных элементов, включая промотор , энхансер и инсулятор; любые изменения в этой регуляторной области могут изменить функциональность этого белка. [10] Мутация в ДНК может изменить последовательность РНК , а затем повлиять на вторичную структуру РНК , распознавание РНК-связывающего белка и активность связывания миРНК. [11] [12]
Функциональная аннотация
[ редактировать ]Этот метод главным образом идентифицирует вариантную функцию на основе информации о том, находятся ли вариантные локусы в известной функциональной области, несущей геномные или эпигеномные сигналы. Функции некодирующих вариантов обширны в отношении пораженной области генома и участвуют практически во всех процессах регуляции генов от транскрипционного до посттрансляционного уровня. [13]
Регуляция транскрипции генов
[ редактировать ]Процесс регуляции транскрипции генов зависит от многих пространственных и временных факторов в ядре, таких как глобальные или локальные состояния хроматина, расположение нуклеосом, связывание TF, активность энхансера/промотора. Вариант, который изменяет функцию любого из этих биологических процессов, может изменить регуляцию генов и вызвать фенотипические аномалии. [14] Генетические варианты, расположенные в дистальной регуляторной области, могут влиять на мотив связывания ТФ, регуляторов хроматина и других дистальных факторов транскрипции, что нарушает взаимодействие между энхансером/сайленсером и его геном-мишенью. [15]
Альтернативный сплайсинг
[ редактировать ]Альтернативный сплайсинг — один из важнейших компонентов, отражающих функциональную сложность генома. Модифицированный сплайсинг оказывает значительное влияние на фенотип, который имеет отношение к заболеванию или метаболизму лекарств. Изменение процесса сплайсинга может быть вызвано модификацией любого из компонентов механизма сплайсинга, например сайтов сплайсинга, усилителей сплайсинга или глушителей. [16] Модификация альтернативного сайта сплайсинга может привести к созданию другой формы белка, которая будет выполнять другую функцию. По оценкам, люди используют около 100 000 различных белков или более, поэтому некоторые гены должны быть способны кодировать гораздо больше, чем один белок. Альтернативный сплайсинг происходит чаще, чем считалось ранее, и его трудно контролировать; гены могут производить десятки тысяч различных транскриптов, что требует новой модели гена для каждого альтернативного сплайсинга.
Процессинг РНК и посттранскрипционная регуляция
[ редактировать ]Мутации в нетранслируемой области (UTR) влияют на многие посттранскрипционные регуляции . Многим молекулам РНК и цис-действующим регуляторным элементам необходимы отличительные структурные особенности для выполнения эффективных функций при регуляции генов. SNV могут изменять вторичную структуру молекул РНК, а затем нарушать правильное сворачивание РНК, такое как сворачивание тРНК/мРНК/днРНК и области узнавания связывания микроРНК. [17]
Перевод и посттрансляционные модификации
[ редактировать ]Однонуклеотидный вариант может также влиять на цис-действующие регуляторные элементы мРНК, ингибируя/способствуя инициации трансляции. Изменение области синонимичных кодонов вследствие мутации может повлиять на эффективность трансляции из-за систематических ошибок в использовании кодонов. Элонгация трансляции также может быть замедлена мутациями вдоль линии движения рибосом. На посттрансляционном уровне генетические варианты могут способствовать протеостазу и модификациям аминокислот. Однако механизмы воздействия вариантов в этой области сложны, и существует лишь несколько инструментов для прогнозирования влияния вариантов на модификации, связанные с трансляцией. [18]
Белковая функция
[ редактировать ]Несинонимичным является вариант экзонов, который изменяет аминокислотную последовательность, кодируемую геном, включая изменения одного основания и индели без сдвига рамки считывания. Была тщательно исследована функция несинонимичных вариантов белка, и было разработано множество алгоритмов для прогнозирования вредоносности и патогенеза однонуклеотидных вариантов (SNV). Классические инструменты биоинформатики, такие как SIFT, Polyphen и MutationTaster , успешно предсказывают функциональные последствия несинонимической замены. [19] [20] [21] [22] Веб-сервер PopViz обеспечивает генно-ориентированный подход для визуализации показателей прогнозирования мутационных повреждений (CADD, SIFT, PolyPhen-2) или популяционной генетики (частота второстепенных аллелей) в сравнении с положениями аминокислот всех кодирующих вариантов определенного гена человека. [23] PopViz также перекрестно связан с базой данных UniProt, где можно найти информацию о белковых доменах, а затем идентифицировать предсказанные вредные варианты, попадающие в эти белковые домены на графике PopViz. [23]
Эволюционная охрана и природный отбор
[ редактировать ]Подходы сравнительной геномики использовались для прогнозирования функциональных вариантов при предположении, что функциональный генетический локус должен быть консервативен у разных видов на обширном филогенетическом расстоянии. С другой стороны, некоторые адаптивные черты и популяционные различия обусловлены положительным отбором выгодных вариантов, и эти генетические мутации функционально релевантны фенотипам, специфичным для популяции. Функциональное прогнозирование влияния вариантов на различные биологические процессы имеет решающее значение для определения молекулярного механизма заболеваний/признаков и направления экспериментальной проверки. [24]
Список доступных инструментов аннотаций SNP
[ редактировать ]Для аннотирования огромных объемов доступных данных NGS в настоящее время доступно большое количество инструментов аннотирования SNP. Некоторые из них специфичны для конкретных SNP, тогда как другие носят более общий характер. Некоторые из доступных инструментов аннотации SNP: SNPeff, Ensembl Variant Effect Predictor (VEP), ANNOVAR, FATHMM, PhD-SNP, PolyPhen-2, SuSPect, F-SNP, AnnTools, SeattleSeq, SNPit, SCAN, Snap, SNPs&GO, LS-SNP, Snat, TREAT, TRAMS, Maviant, MutationTaster , SNPdat, Snpranker, NGS – SNP, SVA, VARIANT, SIFT, LIST-S2, PhD-SNP и FAST-SNP. Функции и подходы, используемые в инструментах аннотации SNP, перечислены ниже.
Инструменты | Описание | Использование внешних ресурсов | URL-адрес веб-сайта | Ссылки |
---|---|---|---|---|
ФиреРиск | Сопоставляет генетические варианты с экспериментальными и предсказанными белковыми структурами. | Предиктор вариантов эффектов , UniProt , Банк данных белков , SIFTS , Phyre2 для предсказанных структур | http://phyrerisk.bc.ic.ac.uk/home | |
Миссенс3D | Сообщает о структурном влиянии миссенс-варианта на PDB и координаты белка, предоставленные пользователем. Разработан для применения в экспериментальных и прогнозируемых белковых структурах. | Банк данных белков , Phyre2 для предсказанных структур | http://www.sbg.bio.ic.ac.uk/~missense3d/ | |
SNPeff | SnpEff аннотирует варианты на основе их геномного местоположения и прогнозирует эффекты кодирования. Использует подход интервального леса | ENSEMBL, UCSC и организмы, например FlyBase, WormBase и TAIR | http://snpeff.sourceforge.net/SnpEff_manual.html | [27] |
Ансамбль ВЭП | Определяет влияние вариантов (SNP, инсерций, делеций, CNV или структурных вариантов) на гены, транскрипты, белки и регуляторные области. | dbSNP, RefSeq, UniProt, COSMIC, PDBe, 1000 геномов, gnomAD, PubMed | https://www.ensembl.org/info/docs/tools/vep/index.html | [28] |
АННОВАР | Этот инструмент подходит для выявления небольшого подмножества функционально важных вариантов. Использует подход прогнозирования мутаций для аннотаций | UCSC, RefSeq и Ensembl | http://annovar.openbioinformatics.org/ | [29] |
Янновар | Это инструмент и библиотека для аннотации генома. | RefSeq, Ensembl, UCSC и т. д. | https://github.com/charite/jannovar | [30] |
кандидат наук-СНП | Метод на основе SVM, использующий информацию о последовательности, полученную алгоритмом BLAST. | UniRef90 | http://snps.biofold.org/phd-snp/ | [31] |
ПолиФен-2 | Подходит для прогнозирования разрушительных эффектов миссенс-мутаций. Использует сохранение последовательности, структуру для моделирования положения аминокислотной замены и аннотацию SWISS-PROT. | ЮниПрот | http://genetics.bwh.harvard.edu/pph2/ | [32] |
MutationTaster | Подходит для прогнозирования повреждающих эффектов всех внутригенных мутаций (на уровне ДНК и белка), включая InDels. | Ensembl, Проект 1000 геномов, ExAC, UniProt, ClinVar, phyloP, phastCons, nnsplice, полиадк (...) | http://www.mutationtaster.org/ | [33] |
Подозревать | Обученный SVM предиктор разрушительных эффектов миссенс-мутаций. Использует информацию о сохранении последовательности, структуре и сети (интерактоме) для моделирования фенотипического эффекта замены аминокислот. Принимает файл VCF | UniProt, PDB, Phyre2 для предсказанных структур, DOMINE и STRING для интерактома | http://www.sbg.bio.ic.ac.uk/suspect/index.html | [34] |
Ф-СНП | Вычислительное прогнозирование функциональных SNP для исследований ассоциаций заболеваний. | PolyPhen, SIFT, SNPeffect, SNPs3D, LS-SNP, ESEfinder, RescueESE, ESRSearch, PESX, Ensembl, TFSearch, Consite, GoldenPath, Ensembl, KinasePhos, OGPET, Sulfinator, GoldenPath | http://compbio.cs.queensu.ca/F-SNP/ | [35] |
AnnИнструменты | Дизайн для идентификации новых и SNP/SNV, INDEL и SV/CNV. AnnTools ищет совпадения с регуляторными элементами, локусами, связанными с заболеванием/признаками, известными сегментными дупликациями и областями, склонными к артефактам. | dbSNP, UCSC, GATK refGene, GAD, опубликованные списки общих структурных геномных вариаций, база данных геномных вариантов, списки консервативных TFB, микроРНК | http://anntools.sourceforge.net/ | [36] |
SNP | Анализирует потенциальное функциональное значение SNP, полученное в результате полногеномных исследований ассоциаций. | dbSNP, EntrezGene, браузер UCSC, HGMD, браузер ECR, Haplotter, SIFT | -/- | [37] |
СКАНИРОВАНИЕ | Использует физические и функциональные аннотации для классификации в соответствии с их положением относительно генов, а также в соответствии с паттернами неравновесия по сцеплению (LD) и влиянием на уровни экспрессии. | -/- | http://www.scandb.org/newinterface/about.html | [38] |
ЩЕЛЧОК | Нейросетевой метод прогнозирования функциональных эффектов несинонимичных SNP. | Ensembl, UCSC, Uniprot, UniProt, Pfam, DAS-CBS, MINT, BIND, KEGG, TreeFam | http://www.rostlab.org/services/SNAP | [39] |
SNP&GO | Метод на основе SVM с использованием информации о последовательности, аннотации генной онтологии и, если доступна, структуры белка. | UniRef90, ГО, ПАНТЕРА, ПДБ | http://snps.biofold.org/snps-and-go/ | [40] |
ЛС-СНП | Сопоставляет nsSNP с белковыми последовательностями, функциональными путями и сравнительными моделями структуры белков. | UniProtKB, браузер генома, dbSNP, PD | http://www.salilab.org/LS-SNP | [41] |
ОБРАЩАТЬСЯ | TREAT — это инструмент для удобной навигации и поиска вариантов как целевого повторного секвенирования, так и целого секвенирования экзома. | -/- | http://ndc.mayo.edu/mayo/research/biostat/stand-alone-packages.cfm | [42] |
СНПдат | Подходит для видов, неспецифичных или для поддержки данных о немодельных организмах. SNPdat не требует создания каких-либо локальных реляционных баз данных или предварительной обработки каких-либо обязательных входных файлов. | -/- | https://code.google.com/p/snpdat/downloads/ | [43] |
НГС – СНП | Аннотируйте SNP, сравнивая эталонную и нереференсную аминокислоту с каждым ортологом. | Ансамбль, NCBI и UniProt | http://stothard.afns.ualberta.ca/downloads/NGS-SNP/ | [44] |
СВА | Прогнозируемая биологическая функция выявленных вариантов | NCBI RefSeq, Ensembl, базы данных вариаций, UCSC, HGNC, GO, KEGG, HapMap, 1000 Genomes Project и DG | http://www.svaproject.org/ | [45] |
ВАРИАНТ | ВАРИАНТ увеличивает объем информации за пределами кодирующих областей, включая всю доступную информацию о регуляции, структуре ДНК, консервации, эволюционном давлении и т. д. Регуляторные варианты представляют собой признанную, но еще неизученную причину патологий. | dbSNP, 1000 геномов, варианты, связанные с заболеваниями, из GWAS, OMIM, COSMIC | http://variant.bioinfo.cipf.es/ | [46] |
ПРОСЕЯТЬ | SIFT — это программа, которая предсказывает, влияет ли замена аминокислот на функцию белка. SIFT использует гомологию последовательностей, чтобы предсказать, повлияет ли замена аминокислот на функцию белка. | PROT/TrEMBL или NCBI | http://blocks.fhcrc.org/sift/SIFT.html | [47] |
СПИСОК-S2 | LIST-S2 (Местная идентичность и общие таксоны, видоспецифичные) основан на предположении, что вариации, наблюдаемые у близкородственных видов, более значительны при оценке сохранения по сравнению с вариациями у отдаленно родственных видов. | Таксономия UniProt SwissProt/TrEMBL и NCBI | https://gsponerlab.msl.ubc.ca/software/list/ | [48] [49] |
ФАСТ-СНП | Веб-сервер, который позволяет пользователям эффективно идентифицировать и расставлять приоритеты SNP высокого риска в соответствии с их фенотипическими рисками и предполагаемыми функциональными эффектами. | NCBI dbSNP, Ensembl, TFSearch, PolyPhen, ESEfinder, RescueESE, FAS-ESS, SwissProt, UCSC Golden Path, NCBI Blast и HapMap | http://fastsnp.ibms.sinica.edu.tw/ | [50] |
ПАНТЕРА | PANTHER связывают эволюцию белковых последовательностей с эволюцией специфических белковых функций и биологических ролей. Источник белковых последовательностей, использованный для построения генеалогических деревьев белков, и использование ручного этапа курирования с помощью компьютера для лучшего определения кластеров семейств белков. | STKE, KEGG, MetaCyc, FREX и Reactome | http://www.pantherdb.org/ | [51] |
Мета-SNP | Метапредиктор на основе SVM, включающий 4 различных метода. | PhD-SNP, ПАНТЕРА, SIFT, SNAP | http://snps.biofold.org/meta-snp | [52] |
ПопВиз | Интегративная и интерактивная геноцентричная визуализация популяционной генетики и оценки прогнозирования мутационных повреждений вариантов генов человека. | gnomAD, Ensembl, UniProt, OMIM, UCSC, CADD, EIGEN, LINSIGHT, SIFT, PolyPhen-2, | http://shiva.rockefeller.edu/PopViz/ | [23] |
Алгоритмы, используемые в инструментах аннотаций
[ редактировать ]Инструменты аннотаций вариантов используют алгоритмы машинного обучения для прогнозирования вариантов аннотаций. Различные инструменты аннотаций используют разные алгоритмы. Общие алгоритмы включают в себя:
- Интервальный/случайный лес, например MutPred, SNPeff
- Нейронные сети – например, SNAP
- Машины опорных векторов — например, PhD-SNP, SNPs&GO.
- Байесовская классификация, например, PolyPhen-2.
Сравнение вариантов инструментов аннотации
[ редактировать ]Для вариантной аннотации доступно большое количество инструментов вариантной аннотации. Аннотации, созданные разными инструментами, не всегда согласуются друг с другом, поскольку определенные правила обработки данных различаются в разных приложениях. Честно говоря, невозможно провести идеальное сравнение имеющихся инструментов. Не все инструменты имеют одинаковые входные и выходные данные и одинаковые функции. Ниже приведена таблица основных инструментов аннотирования и их функциональной области.
Инструменты | Входной файл | Выходной файл | СНП | ИНДЕЛ | ЦНВ | ВЕБ или программа | Источник | |
---|---|---|---|---|---|---|---|---|
АнноВар | VCF, пайлап, Полная геномика,GFF3-SoliD,SOAPsnp, MAQ,КАСАВА | ТЕКСТ | Да | Да | Да | Программа | [53] | |
Янновар | ВЦФ | ВЦФ | Да | Да | Да | Java-программа | [54] | |
SNPeff | VCF, пайлап/TXT | VCF, ТХТ, HTML | Да | Да | Нет | Программа | [27] | |
Ансамбль ВЭП | Ensembl по умолчанию (координаты), VCF, идентификаторы вариантов, HGVS, SPDI, регионы в стиле REST | VCF, VEP, TXT, JSON | Да | Да | Да | Интернет, скрипт Perl, REST API | [55] | |
AnnИнструменты | VCF, пайлап, TXT | ВЦФ | Да | Да | Нет | Нет | [56] | |
СиэтлSeq | ВВКФ, МАК, КАСАВА, КРОВАТЬ ГАТК | VCF, СиэтлСек | Да | Да | Нет | Интернет | [57] | |
ВАРИАНТ | ВЦФ, GFF2, КРОВАТЬ | веб-отчет, TXT | Да | Да | Да | Интернет | [58] |
Приложение
[ редактировать ]Различные аннотации отражают различные аспекты вариантной функции. [60] Одновременное использование нескольких разнообразных функциональных аннотаций может повысить редких вариантов эффективность анализа ассоциаций в исследованиях секвенирования всего экзома и всего генома . [61] Были разработаны некоторые инструменты, позволяющие проводить функционально обоснованный анализ ассоциаций фенотип-генотип для распространенных и редких вариантов путем включения функциональных аннотаций в когорты в масштабе биобанка. [62] [63] [64] [65]
Выводы
[ редактировать ]Следующее поколение веб-серверов аннотаций SNP сможет воспользоваться растущим объемом данных в основных ресурсах биоинформатики и использовать интеллектуальные агенты для получения данных из различных источников по мере необходимости. С точки зрения пользователя, более эффективно отправить набор SNP и получить результаты за один шаг, что делает метасерверы наиболее привлекательным выбором. Однако, если инструменты аннотации SNP предоставляют разнородные данные, охватывающие последовательность, структуру, регуляцию, пути и т. д., они также должны предоставлять основу для интеграции данных в алгоритмы принятия решений и количественные меры достоверности, чтобы пользователи могли оценить, какие данные релевантны, а какие нет. .
Ссылки
[ редактировать ]- ^ Обур С., Рузе П. (2001). «Аннотация генома». Физиол растений. Биохим . 29 (3–4): 181–193. дои : 10.1016/S0981-9428(01)01242-6 .
- ^ Карчин Р. (январь 2009 г.). «Инструменты нового поколения для аннотации человеческих SNP» . Брифинги по биоинформатике . 10 (1): 35–52. дои : 10.1093/bib/bbn047 . ПМЦ 2638621 . ПМИД 19181721 .
- ^ Шен Т.Х., Карлсон К.С., Тарчи-Хорнох П. (август 2009 г.). «SNPit: система федеративной интеграции данных для функциональной аннотации SNP» . Компьютерные методы и программы в биомедицине . 95 (2): 181–189. дои : 10.1016/j.cmpb.2009.02.010 . ПМК 2680224 . ПМИД 19327864 .
- ^ NC Oraguzie, EHA Rikkerink, SE Gardiner, HN de Silva (ред.), «Картирование ассоциаций растений», Springer, 2007
- ^ Каприотти Э., Нерт Н.Л., Канн М.Г., Бромберг Ю. (июль 2012 г.). «Биоинформатика для интерпретации генома личности» . Брифинги по биоинформатике . 13 (4): 495–512. дои : 10.1093/нагрудник/bbr070 . ПМЦ 3404395 . ПМИД 22247263 .
- ^ П.Х. Ли, Х. Шаткей, «Рейтинг однонуклеотидных полиморфизмов по потенциальным вредным эффектам», Лаборатория вычислительной биологии и машинного обучения, Школа вычислительной техники, Королевский университет, Кингстон, Онтарио, Канада.
- ^ «Однонуклеотидный полиморфизм» , Arc.Ask3.Ru , 12 августа 2019 г. , получено 3 сентября 2019 г.
- ^ «Частота минорных аллелей» , Arc.Ask3.Ru , 12 августа 2019 г. , получено 3 сентября 2019 г.
- ^ MJ Ли, Дж. Ван, «Текущая тенденция аннотирования вариаций отдельных нуклеотидов у людей - тематическое исследование SNVrap», Elsevier, 2014, стр. 1–9.
- ^ Ван З., Герштейн М., Снайдер М. (январь 2009 г.). «RNA-Seq: революционный инструмент для транскриптомики» . Обзоры природы. Генетика . 10 (1): 57–63. дои : 10.1038/nrg2484 . ПМЦ 2949280 . ПМИД 19015660 .
- ^ Халворсен М., Мартин Дж.С., Бродвей С., Ледерах А. (август 2010 г.). «Мутации, связанные с заболеванием, которые изменяют структурный ансамбль РНК» . ПЛОС Генетика . 6 (8): e1001074. дои : 10.1371/journal.pgen.1001074 . ПМЦ 2924325 . ПМИД 20808897 .
- ^ Ван Ю, Цюй К., Чжан К.К., Флинн Р.А., Мэнор О, Оуян З. и др. (январь 2014 г.). «Ландшафт и вариации вторичной структуры РНК в транскриптоме человека» . Природа . 505 (7485): 706–709. Бибкод : 2014Natur.505..706W . дои : 10.1038/nature12946 . ПМЦ 3973747 . ПМИД 24476892 .
- ^ Сауна ЗЭ, Кимчи-Сарфати С (август 2011 г.). «Понимание вклада синонимических мутаций в болезни человека». Обзоры природы. Генетика . 12 (10): 683–691. дои : 10.1038/nrg3051 . ПМИД 21878961 . S2CID 8358824 .
- ^ Ли MJ, Ян Б, Шам ПК, Ван Дж (май 2015 г.). «Изучение функции генетических вариантов в некодирующих геномных регионах: подходы к выявлению регуляторных вариантов человека, влияющих на экспрессию генов» . Брифинги по биоинформатике . 16 (3): 393–412. дои : 10.1093/bib/bbu018 . ПМИД 24916300 .
- ^ Френч Дж.Д., Гуссаини М., Эдвардс С.Л., Мейер К.Б., Михаилиду К., Ахмед С. и др. (апрель 2013 г.). «Функциональные варианты локуса риска 11q13 рака молочной железы регулируют экспрессию циклина D1 посредством энхансеров дальнего действия» . Американский журнал генетики человека . 92 (4): 489–503. дои : 10.1016/j.ajhg.2013.01.002 . ПМЦ 3617380 . ПМИД 23540573 .
- ^ Фабер К., Глаттинг К.Х., Мюллер П.Дж., Риш А., Хотц-Вагенблатт А. (2011). «Пологеномное предсказание модифицирующих сплайсинг SNP в генах человека с использованием нового конвейера анализа под названием AASsites» . БМК Биоинформатика . 12 (Приложение 4): S2. дои : 10.1186/1471-2105-12-s4-s2 . ПМК 3194194 . ПМИД 21992029 .
- ^ Кумар В., Вестра Х.Дж., Карьялайнен Дж., Жернакова Д.В., Эско Т., Хрдличкова Б. и др. (2013). «Генетические вариации, связанные с заболеваниями человека, влияют на экспрессию большой межгенной некодирующей РНК» . ПЛОС Генетика . 9 (1): e1003201. дои : 10.1371/journal.pgen.1003201 . ПМЦ 3547830 . ПМИД 23341781 .
- ^ MJ Ли, Дж. Ван, «Текущая тенденция аннотирования вариаций отдельных нуклеотидов у людей - тематическое исследование SNVrap», Elsevier, 2014, стр. 1–9.
- ^ Дж. Ву, Р. Цзян, «Прогнозирование вредного несинонимического однонуклеотидного полиморфизма для заболеваний человека», The Scientific World Journal, 2013, 10 страниц.
- ^ Сим Н.Л., Кумар П., Ху Дж., Хеникофф С., Шнайдер Г., Нг ПК (июль 2012 г.). «Веб-сервер SIFT: прогнозирование влияния аминокислотных замен на белки» . Исследования нуклеиновых кислот . 40 (проблема с веб-сервером): W452–W457. дои : 10.1093/нар/gks539 . ПМЦ 3394338 . ПМИД 22689647 .
- ^ Аджубей И.А., Шмидт С., Пешкин Л., Раменский В.Е., Герасимова А., Борк П. и др. (апрель 2010 г.). «Метод и сервер для прогнозирования разрушительных миссенс-мутаций» . Природные методы . 7 (4): 248–249. дои : 10.1038/nmeth0410-248 . ПМЦ 2855889 . ПМИД 20354512 .
- ^ Шварц Дж. М., Рёдельспергер К., Шуэльке М., Зеелов Д. (август 2010 г.). «MutationTaster оценивает болезнетворный потенциал изменений последовательности». Природные методы . 7 (8): 575–576. дои : 10.1038/nmeth0810-575 . ПМИД 20676075 . S2CID 26892938 .
- ^ Jump up to: а б с Чжан П., Биджио Б., Рапапорт Ф., Чжан С.Ю., Казанова Дж.Л., Абель Л. и др. (декабрь 2018 г.). «PopViz: веб-сервер для визуализации частот второстепенных аллелей и оценок ущерба генетических вариаций человека» . Биоинформатика . 34 (24): 4307–4309. doi : 10.1093/биоинформатика/bty536 . ПМК 6289133 . ПМИД 30535305 .
- ^ MJ Ли, Дж. Ван, «Текущая тенденция аннотирования вариаций отдельных нуклеотидов у людей - тематическое исследование SNVrap», Elsevier, 2014, стр. 1–9.
- ^ Ofoegbu TC, Дэвид А., Келли Л.А., Мезулис С., Ислам С.А., Мерсманн С.Ф. и др. (июнь 2019 г.). «PhyreRisk: динамическое веб-приложение, объединяющее геномику, протеомику и трехмерные структурные данные для интерпретации генетических вариантов человека» . Журнал молекулярной биологии . 431 (13): 2460–2466. дои : 10.1016/j.jmb.2019.04.043 . ПМК 6597944 . ПМИД 31075275 .
- ^ Иттисопонписан С., Ислам С.А., Ханна Т., Алхузими Э., Дэвид А., Штернберг М.Дж. (май 2019 г.). «Могут ли предсказанные трехмерные структуры белка дать надежную информацию о том, связаны ли миссенс-варианты с заболеванием?» . Журнал молекулярной биологии . 431 (11): 2197–2212. дои : 10.1016/j.jmb.2019.04.009 . ПМК 6544567 . ПМИД 30995449 .
- ^ Jump up to: а б Чинголани П., Платтс А., Ван Л.Л., Кун М., Нгуен Т., Ван Л. и др. (2012). «Программа для аннотирования и прогнозирования эффектов однонуклеотидных полиморфизмов, SnpEff: SNP в геноме штамма Drosophila melanogaster w1118; iso-2; iso-3» . Летать . 6 (2): 80–92. дои : 10.4161/fly.19695 . ПМЦ 3679285 . ПМИД 22728672 .
- ^ Макларен В., Гил Л., Хант С.Э., Риат Х.С., Ричи Г.Р., Торманн А. и др. (июнь 2016 г.). «Прогноз эффекта ансамблевого варианта» . Геномная биология . 17 (1): 122. дои : 10.1186/s13059-016-0974-4 . ПМЦ 4893825 . ПМИД 27268795 .
- ^ Ван К., Ли М., Хаконарсон Х. (сентябрь 2010 г.). «ANNOVAR: функциональная аннотация генетических вариантов на основе данных высокопроизводительного секвенирования» . Исследования нуклеиновых кислот . 38 (16): е164. дои : 10.1093/нар/gkq603 . ПМК 2938201 . ПМИД 20601685 .
- ^ Йегер М., Ван К., Бауэр С., Смедли Д., Кравиц П., Робинсон П.Н. (май 2014 г.). «Jannovar: Java-библиотека для аннотаций exome» . Человеческая мутация . 35 (5): 548–555. дои : 10.1002/humu.22531 . ПМИД 24677618 . S2CID 10822001 .
- ^ Каприотти Э., Калабрезе Р., Касадио Р. (ноябрь 2006 г.). «Прогнозирование возникновения генетических заболеваний человека, связанных с одноточечными мутациями белков, с помощью машин опорных векторов и эволюционной информации» . Биоинформатика . 22 (22): 2729–2734. doi : 10.1093/биоинформатика/btl423 . ПМИД 16895930 .
- ^ Аджубей И., Иордан Д.М., Сюняев С.Р. (январь 2013 г.). «Прогнозирование функционального эффекта миссенс-мутаций человека с использованием PolyPhen-2» . Современные протоколы генетики человека . Глава 7: Раздел 7.20. дои : 10.1002/0471142905.hg0720s76 . ПМК 4480630 . ПМИД 23315928 .
- ^ Шварц Дж. М., Рёдельспергер К., Шуэльке М., Зеелов Д. (август 2010 г.). «MutationTaster оценивает болезнетворный потенциал изменений последовательности». Природные методы . 7 (8): 575–576. дои : 10.1038/nmeth0810-575 . ПМИД 20676075 . S2CID 26892938 .
- ^ Йейтс CM, Филипп I, Келли Л.А., Штернберг MJ (июль 2014 г.). «SuSPect: улучшенное предсказание фенотипа варианта одной аминокислоты (SAV) с использованием сетевых функций» . Журнал молекулярной биологии . 426 (14): 2692–2701. дои : 10.1016/j.jmb.2014.04.026 . ПМЦ 4087249 . ПМИД 24810707 .
- ^ Ли П.Х., Шаткай Х. (январь 2008 г.). «F-SNP: предсказанные с помощью вычислений функциональные SNP для исследований ассоциаций заболеваний» . Исследования нуклеиновых кислот . 36 (Проблема с базой данных): D820–D824. дои : 10.1093/нар/gkm904 . ПМК 2238878 . ПМИД 17986460 .
- ^ Макаров В., О'Грэйди Т., Кай Дж., Лим Дж., Буксбаум Дж.Д., Юн С. (март 2012 г.). «AnnTools: комплексный и универсальный набор инструментов для аннотирования геномных вариантов» . Биоинформатика . 28 (5): 724–725. doi : 10.1093/биоинформатика/bts032 . ПМЦ 3289923 . ПМИД 22257670 .
- ^ Шен Т.Х., Карлсон К.С., Тарчи-Хорнох П. (август 2009 г.). «SNPit: система федеративной интеграции данных для функциональной аннотации SNP» . Компьютерные методы и программы в биомедицине . 95 (2): 181–189. дои : 10.1016/j.cmpb.2009.02.010 . ПМК 2680224 . ПМИД 19327864 .
- ^ Гамазон Э.Р., Чжан В., Конкашбаев А., Дуань С., Кистнер Э.О., Николае Д.Л. и др. (январь 2010 г.). «СКАНИРОВАНИЕ: SNP и аннотация номера копии» . Биоинформатика . 26 (2): 259–262. doi : 10.1093/биоинформатика/btp644 . ПМК 2852202 . ПМИД 19933162 .
- ^ Бромберг Ю., Рост Б. (2007). «SNAP: прогнозирование влияния несинонимичных полиморфизмов на функцию» . Исследования нуклеиновых кислот . 35 (11): 3823–3835. дои : 10.1093/нар/gkm238 . ПМК 1920242 . ПМИД 17526529 .
- ^ Калабрезе Р., Каприотти Э., Фариселли П., Мартелли П.Л., Касадио Р. (август 2009 г.). «Функциональные аннотации улучшают прогностическую оценку мутаций в белках, связанных с болезнями человека» . Человеческая мутация . 30 (8): 1237–1244. дои : 10.1002/humu.21047 . ПМИД 19514061 . S2CID 33900765 .
- ^ Карчин Р., Дикханс М., Келли Л., Томас Д.Д., Пипер У., Эсвар Н. и др. (июнь 2005 г.). «LS-SNP: крупномасштабная аннотация кодирования несинонимичных SNP на основе нескольких источников информации» . Биоинформатика . 21 (12): 2814–2820. doi : 10.1093/биоинформатика/bti442 . ПМИД 15827081 .
- ^ Асманн Ю.В., Мидда С., Хоссейн А., Бахети С., Ли Ю., Чай Х.С. и др. (январь 2012 г.). «TREAT: инструмент биоинформатики для вариантов аннотаций и визуализации данных целевого секвенирования и секвенирования экзома» . Биоинформатика . 28 (2): 277–278. doi : 10.1093/биоинформатика/btr612 . ПМЦ 3259432 . ПМИД 22088845 .
- ^ Доран А.Г., Криви СиДжей (февраль 2013 г.). «Snpdat: простое и быстрое аннотирование результатов проектов открытия snp de novo для модельных и немодельных организмов» . БМК Биоинформатика . 14:45 . дои : 10.1186/1471-2105-14-45 . ПМЦ 3574845 . ПМИД 23390980 .
- ^ Грант-младший, Арантес А.С., Ляо X, Стотхард П. (август 2011 г.). «Углубленная аннотация SNP, возникающая в результате проектов повторного секвенирования с использованием NGS-SNP» . Биоинформатика . 27 (16): 23.00–23.01. doi : 10.1093/биоинформатика/btr372 . ПМК 3150039 . ПМИД 21697123 .
- ^ Ге Д., Руццо Е.К., Шианна К.В., Хе М., Пелак К., Хайнцен Э.Л. и др. (июль 2011 г.). «SVA: программное обеспечение для аннотирования и визуализации секвенированных геномов человека» . Биоинформатика . 27 (14): 1998–2000. doi : 10.1093/биоинформатика/btr317 . ПМК 3129530 . ПМИД 21624899 .
- ^ Медина И, Де Мария А, Бледа М, Салаверт Ф, Алонсо Р, Гонсалес С.И., Допазо Дж (июль 2012 г.). «ВАРИАНТ: командная строка, веб-сервис и веб-интерфейс для быстрой и точной функциональной характеристики вариантов, обнаруженных с помощью секвенирования следующего поколения» . Исследования нуклеиновых кислот . 40 (проблема с веб-сервером): W54–W58. дои : 10.1093/nar/gks572 . ПМЦ 3394276 . ПМИД 22693211 .
- ^ Нг ПК, Хеникофф С (июль 2003 г.). «SIFT: Прогнозирование изменений аминокислот, влияющих на функцию белка» . Исследования нуклеиновых кислот . 31 (13): 3812–3814. дои : 10.1093/nar/gkg509 . ПМК 168916 . ПМИД 12824425 .
- ^ Малхис Н., Джонс С.Дж., Гспонер Дж. (апрель 2019 г.). «Улучшенные меры эволюционного сохранения, использующие таксономические расстояния» . Природные коммуникации . 10 (1): 1556. Бибкод : 2019NatCo..10.1556M . дои : 10.1038/s41467-019-09583-2 . ПМК 6450959 . ПМИД 30952844 .
- ^ Малхис Н., Джейкобсон М., Джонс С.Дж., Гспонер Дж. (июль 2020 г.). «СПИСОК-S2: сортировка вредных миссенс-мутаций между видами на основе таксономии» . Исследования нуклеиновых кислот . 48 (П1): И154–161. дои : 10.1093/nar/gkaa288 . ПМК 7319545 . ПМИД 32352516 .
- ^ Юань Х.И., Чиу Дж.Дж., Ценг В.Х., Лю Ч.Х., Лю С.К., Линь Ю.Дж. и др. (июль 2006 г.). «FASTSNP: всегда актуальный и расширяемый сервис для анализа функций SNP и определения приоритетов» . Исследования нуклеиновых кислот . 34 (проблема с веб-сервером): W635–W641. дои : 10.1093/нар/gkl236 . ПМЦ 1538865 . ПМИД 16845089 .
- ^ Ми Х, Го Н, Кеджаривал А, Томас П.Д. (январь 2007 г.). «PANTHER версия 6: данные по последовательности белков и эволюции функций с расширенным представлением биологических путей» . Исследования нуклеиновых кислот . 35 (Проблема с базой данных): D247–D252. дои : 10.1093/nar/gkl869 . ПМК 1716723 . ПМИД 17130144 .
- ^ Каприотти Э., Альтман Р.Б., Бромберг Ю. (2013). «Коллективное суждение предсказывает однонуклеотидные варианты, связанные с заболеванием» . БМК Геномика . 14 (Приложение 3): S2. дои : 10.1186/1471-2164-14-S3-S2 . ПМЦ 3839641 . ПМИД 23819846 .
- ^ Ван К., Ли М., Хаконарсон Х. (сентябрь 2010 г.). «ANNOVAR: функциональная аннотация генетических вариантов на основе данных высокопроизводительного секвенирования» . Исследования нуклеиновых кислот . 38 (16): е164. дои : 10.1093/нар/gkq603 . ПМК 2938201 . ПМИД 20601685 .
- ^ «чарите/янновар» . Гитхаб . Проверено 25 сентября 2016 г.
- ^ Макларен В., Гил Л., Хант С.Э., Риат Х.С., Ричи Г.Р., Торманн А. и др. (июнь 2016 г.). «Прогноз эффекта ансамблевого варианта» . Геномная биология . 17 (1): 122. дои : 10.1186/s13059-016-0974-4 . ПМЦ 4893825 . ПМИД 27268795 .
- ^ Макаров В., О'Грэйди Т., Кай Дж., Лим Дж., Буксбаум Дж.Д., Юн С. (март 2012 г.). «AnnTools: комплексный и универсальный набор инструментов для аннотирования геномных вариантов» . Биоинформатика . 28 (5): 724–725. doi : 10.1093/биоинформатика/bts032 . ПМЦ 3289923 . ПМИД 22257670 .
- ^ «Входной файл списка вариантов для аннотации» . SeattleSeq Аннотация 151 .
- ^ Медина И, Де Мария А, Бледа М, Салаверт Ф, Алонсо Р, Гонсалес С.И., Допазо Дж (июль 2012 г.). «ВАРИАНТ: командная строка, веб-сервис и веб-интерфейс для быстрой и точной функциональной характеристики вариантов, обнаруженных с помощью секвенирования следующего поколения» . Исследования нуклеиновых кислот . 40 (проблема с веб-сервером): W54–W58. дои : 10.1093/nar/gks572 . ПМЦ 3394276 . ПМИД 22693211 .
- ^ Пабингер С., Дандер А., Фишер М., Снайдер Р., Сперк М., Ефремова М. и др. (март 2014 г.). «Обзор инструментов для вариантного анализа данных секвенирования генома следующего поколения» . Брифинги по биоинформатике . 15 (2): 256–278. дои : 10.1093/нагрудник/bbs086 . ПМК 3956068 . ПМИД 23341494 .
- ^ Ли П.Х., Ли С., Ли Икс, Ви Б., Двиведи Т., Дейли М. (январь 2018 г.). «Принципы и методы in silico определения приоритетов некодирующих регуляторных вариантов» . Генетика человека . 137 (1): 15–30. дои : 10.1007/s00439-017-1861-0 . ПМЦ 5892192 . ПМИД 29288389 .
- ^ Ли Х, Ли З, Чжоу Х, Гейнор С.М., Лю Ю, Чен Х и др. (сентябрь 2020 г.). «Динамическое включение нескольких функциональных аннотаций in silico расширяет возможности анализа ассоциаций редких вариантов в крупных масштабных исследованиях полногеномного секвенирования» . Природная генетика . 52 (9): 969–983. дои : 10.1038/s41588-020-0676-4 . ПМЦ 7483769 . ПМИД 32839606 .
- ^ Ватанабэ К., Таскесен Э., ван Боховен А., Постума Д. (ноябрь 2017 г.). «Функциональное картирование и аннотация генетических ассоциаций с FUMA» . Природные коммуникации . 8 (1): 1826. doi : 10.1038/s41467-017-01261-5 . ПМК 5705698 . ПМИД 29184056 .
- ^ Ли З., Ли Икс, Чжоу Х., Гейнор С.М., Сельварадж М.С., Арапоглу Т. и др. (декабрь 2022 г.). «Система обнаружения некодирующих ассоциаций редких вариантов в крупномасштабных исследованиях полногеномного секвенирования» . Природные методы . 19 (12): 1599–1611. дои : 10.1038/s41592-022-01640-x . ПМЦ 10008172 . ПМИД 36303018 . S2CID 243873361 .
- ^ «STAARpipeline: универсальный редкий вариант инструмента для данных полногеномного секвенирования в масштабе биобанка». Природные методы . 19 (12): 1532–1533. Декабрь 2022 г. doi : 10.1038/s41592-022-01641-w . ПМИД 36316564 . S2CID 253246835 .
- ^ Ли, Сихао; Быстрее, Корбин; Чжоу, Хуфэн; Гейнор, Шейла М.; Лю, Яову; Чен, Хан; Сельварадж, Маргарет Сунита; Сан, Райан; День, Рунак; Арнетт, Донна К.; Беляк, Лоуренс Ф.; Бис, Джошуа К.; Бланджеро, Джон; Бурвинкль, Эрик; Боуден, Дональд В.; Броуди, Дженнифер А.; Кейд, Брайан Э.; Корреа, Адольфо; Капплс, Л. Эдриенн; Карран, Джоан Э.; де Врис, Поль С.; Дуггирала, Равиндранат; Фридман, Барри И.; Геринг, Харальд Х.Х.; Го, Сюцин; Хесслер, Джеффри; Кальяни, Рита Р.; Куперберг, Чарльз; Крал, Брайан Г.; Ланге, Лесли А.; Маничайкул, Ани; Мартин, Лиза В.; МакГарви, Стивен Т.; Митчелл, Брэкстон Д.; Монтассер, Мэй Э.; Моррисон, Аланна С.; Насери, Таке; О'Коннелл, Джеффри Р.; Палмер, Николетт Д.; Пейзер, Патрисия А.; Псати, Брюс М.; Раффилд, Лаура М.; Редлайн, Сьюзен; Райнер, Александр П.; Реупена, Муагутутиа Сефуива; Райс, Кеннет М.; Рич, Стивен С.; Ситлани, Коллин М.; Смит, Дженнифер А.; Тейлор, Кент Д.; Васан, Рамачандран С.; Уиллер, Кристен Дж.; Уилсон, Джеймс Г.; Янек, Лиза Р.; Чжао, Вэй; Консорциум NHLBI Trans-Omics for Precision Medicine (TOPMed); Рабочая группа TOPMed по липидам; Роттер, Джером И.; Натараджан, Прадип; Пелосо, Джина М.; Ли, Жилин; Линь, Сихун (январь 2023 г.). «Мощный, масштабируемый и ресурсоэффективный метаанализ ассоциаций редких вариантов в крупных исследованиях полногеномного секвенирования» . Природная генетика . 55 (1): 154–164. дои : 10.1038/s41588-022-01225-6 . ПМЦ 10084891 . ПМИД 36564505 . S2CID 255084231 .