Jump to content

дбСНП

дбСНП
Содержание
Описание однонуклеотидного полиморфизма База данных
Организмы Мудрый человек
Контакт
Исследовательский центр Национальный центр биотехнологической информации
Первичное цитирование ПМИД   21097890
Дата выпуска 1998
Доступ
Формат данных АСН.1 , Фаста , XML
Веб-сайт NCBI .нлм .nih .gov /снп /
URL-адрес загрузки ftp://ftp.ncbi.nih.gov/snp/
веб-службы URL-адрес EUtils
МЫЛО

База данных однонуклеотидного полиморфизма [1] ( dbSNP ) — это бесплатный публичный архив генетических вариаций внутри и между различными видами, разработанный и размещенный Национальным центром биотехнологической информации (NCBI) в сотрудничестве с Национальным институтом исследования генома человека (NHGRI). Хотя название базы данных подразумевает коллекцию только одного класса полиморфизмов (т.е. однонуклеотидных полиморфизмов (SNP)), на самом деле она содержит ряд молекулярных вариаций: (1) SNP , (2) короткие делеционные и инсерционные полиморфизмы ( indels /DIP), (3) микросателлитные маркеры или короткие тандемные повторы (STR), (4) мультинуклеотидные полиморфизмы (MNP), (5) гетерозиготные последовательности и (6) названные варианты. [2] dbSNP принимает явно нейтральные полиморфизмы, полиморфизмы, соответствующие известным фенотипам, и области отсутствия вариаций. Он был создан в сентябре 1998 года для дополнения GenBank , коллекции общедоступных последовательностей нуклеиновых кислот и белков NCBI. [2]

В 2017 году NCBI прекратил поддержку всех нечеловеческих организмов в dbSNP. [3] По состоянию на сборку 153 (выпущенную в августе 2019 года) dbSNP собрал почти 2 миллиарда заявок, представляющих более 675 миллионов различных вариантов Homo sapiens .

a) Различные источники предоставляют данные, и каждому варианту присваивается уникальный идентификатор представленного номера SNP (ss#). б) dbSNP компилирует идентичные записи ss# в один эталонный кластер SNP (rs#), содержащий данные из каждого ss#. в) Пользователи могут получать данные для конкретных записей rs# и анализировать эти вариации. г) Данные dbSNP помогают клиническим и прикладным исследованиям. Идентификаторы ss# и rs# на этом рисунке приведены только в качестве примера. NCBI, Национальный центр биотехнологической информации; OMIM, Интернет-менделевское наследование у человека; GWAS, полногеномное исследование ассоциаций.

Цель [ править ]

dbSNP — это онлайн-ресурс, созданный для помощи исследователям -биологам . Его цель — действовать как единая база данных , содержащая все идентифицированные генетические вариации, которую можно использовать для исследования широкого спектра генетически обусловленных природных явлений. В частности, доступ к молекулярным вариациям, каталогизированным в dbSNP, помогает фундаментальным исследованиям, таким как физическое картирование, популяционная генетика , исследования эволюционных взаимоотношений, а также позволяет быстро и легко количественно оценить количество вариаций в заданном интересующем участке. Кроме того, dbSNP направляет прикладные исследования в области фармакогеномики и связи генетических вариаций с фенотипическими характеристиками. [4] Согласно веб-сайту NCBI, «долгосрочные инвестиции в такие новые и захватывающие исследования [dbSNP] обещают не только продвинуть биологию человека, но и произвести революцию в практике современной медицины».

Представление [ править ]

1. Источник [ править ]

Первоначально dbSNP принимает материалы для любого организма из самых разных источников, включая отдельные исследовательские лаборатории, совместные усилия по обнаружению полиморфизма, крупномасштабные центры секвенирования генома, другие базы данных SNP (например, консорциум SNP, HapMap и т. д.) и частные предприятия. [5] 1 сентября 2017 года dbSNP прекратил принимать данные о нечеловеческих вариантах, а два месяца спустя его интерактивные веб-сайты и соответствующие службы NCBI перестали предоставлять данные о нечеловеческих вариантах. Теперь dbSNP принимает и представляет только данные о человеческих вариантах.

2. Типы записей [ править ]

Каждому представленному варианту присваивается отправленный идентификационный номер SNP («ss#»). [5] Этот инвентарный номер является стабильным и уникальным идентификатором данного представления. Уникальные отправленные записи SNP также получают ссылочный идентификационный номер SNP («rs#»; «кластер refSNP»). Однако в dbSNP, скорее всего, будет отправлено более одной записи об вариациях, особенно для клинически значимых вариаций. Чтобы обеспечить это, dbSNP регулярно собирает идентичные отправленные записи SNP в одну эталонную запись SNP, которая также является уникальным и стабильным идентификатором (см. ниже). [4]

3. Как отправить [ изменить ]

Чтобы отправить варианты в dbSNP, необходимо сначала получить дескриптор отправителя, который идентифицирует лабораторию, ответственную за отправку. [4] Далее автору необходимо заполнить файл подачи, содержащий соответствующую информацию и данные. Представленные записи должны содержать десять основных частей информации, перечисленных в следующей таблице. [4] Другая информация, необходимая для подачи заявок, включает контактную информацию, информацию о публикации (название, журнал, авторы, год), тип молекулы (геномная ДНК , кДНК , митохондриальная ДНК, ДНК хлоропластов ) и организм. [4]

Элемент Объяснение
Контекст последовательности (обязательно) Важным компонентом отправки в dbSNP является однозначное местоположение отправляемого варианта. dbSNP теперь минимально требует, чтобы вы указали местоположение варианта в качестве заявленной позиции в последовательностях RefSeq или INSDC.
Аллели (обязательно) Аллели определяют каждый класс вариаций. dbSNP определяет однонуклеотидные варианты в своей схеме представления как G, A, T или C и не допускает неоднозначных кодов IUPAC, таких как N, в определении аллеля варианта.
Метод (обязательно) Каждый отправитель определяет в своей заявке методы либо как методы, используемые для анализа вариаций, либо как методы, используемые для оценки частот аллелей. dbSNP группирует методы по классам методов, чтобы упростить запросы, используя общую экспериментальную технику в качестве поля запроса. Заявитель предоставляет все остальные подробности методов в свободном текстовом описании метода.
Подтвержденное происхождение аллеля (обязательно) Заявитель может предоставить заявление (утверждение) с подтверждающими экспериментальными доказательствами того, что вариант имеет определенное аллельное происхождение. Утверждения для одного refSNP суммируются, и им присваивается значение атрибута «зародышевая линия» или «неизвестно».
Население (обязательно) Каждый отправитель определяет образцы популяции либо как группу, используемую для первоначального выявления вариаций, либо как группу, используемую для определения специфичных для популяции показателей частот аллелей. В некоторых экспериментальных планах эти популяции могут быть одними и теми же.
Размер выборки (необязательно) В dbSNP есть два поля размера выборки. В одном поле, SNPASSAY SAMPLE SIZE, указывается количество хромосом в образце, использованном для первоначального определения или обнаружения вариации. Другое поле размера выборки, SNPPOPUSE SAMPLE SIZE, сообщает количество хромосом, используемых в качестве знаменателя при вычислении оценок частот аллелей.
Частоты аллелей, специфичные для популяции (необязательно) Данные о частоте передаются в dbSNP в виде количества аллелей или объединенных частотных интервалов, в зависимости от точности экспериментального метода, использованного для проведения измерений. dbSNP содержит записи частот аллелей для конкретных образцов популяции, которые определяются каждым отправителем и используются при проверке представленных вариаций.
Частоты генотипов для конкретных популяций (необязательно) Подобно аллелям, генотипы имеют частоты в популяциях, которые могут быть отправлены в dbSNP, и используются для проверки представленных вариаций.
Отдельные генотипы dbSNP принимает отдельные генотипы из образцов, предоставленных донорами, которые согласились на размещение последовательности их ДНК в общедоступной базе данных (например, HapMap или проект 1000 Genomes).
Информация о проверке (необязательно) Анализы, проверенные непосредственно отправителем в разделе «ВАЛИДАЦИЯ», показывают тип доказательств, использованных для подтверждения отклонения.

Выпуск [ править ]

Новая информация, полученная dbSNP, периодически становится доступной общественности в виде серии «сборок» (т. е. пересмотров и выпусков данных). [4] Графика выпуска новых сборок нет; вместо этого сборки обычно выпускаются, когда становится доступной новая сборка генома, при условии, что с геномом связаны некоторые каталогизированные вариации. [6] Это происходит примерно каждые 3–4 месяца. Последовательности генома могут со временем улучшаться, поэтому эталонные SNP («refSNP») из предыдущих сборок, а также новые представленные SNP повторно сопоставляются с новой доступной последовательностью генома. Несколько отправленных SNP, если они сопоставлены с одним и тем же местоположением, группируются в один кластер refSNP, и ему присваивается ссылочный идентификационный номер SNP. Однако если будет обнаружено, что две записи кластера refSNP сопоставлены с одним и тем же местоположением (т. е. идентичны), dbSNP также объединит эти записи. В этом случае меньший идентификатор номера refSNP (т. е. самая ранняя запись) теперь будет представлять обе записи, а более крупные идентификаторы номера refSNP станут устаревшими. Эти устаревшие идентификаторы номеров refSNP больше не используются для новых записей. Когда происходит слияние двух записей refSNP, изменение отслеживается, и прежние идентификаторы номеров refSNP по-прежнему можно использовать в качестве поискового запроса. Этот процесс объединения идентичных записей уменьшает избыточность в dbSNP. [6]

Из вышеуказанных критериев слияния есть два исключения. Во-первых, вариации разных классов (например, SNP и DIP) не объединяются. Во-вторых, клинически важные refSNP, цитируемые в литературе, называются «драгоценными»; слияние, которое бы исключило такой refSNP, никогда не проводится, поскольку впоследствии оно может вызвать путаницу. [6]

Получение [ править ]

1. Как [ изменить ]

Поиск dbSNP можно выполнить с помощью инструмента поиска Entrez SNP. Для поиска можно использовать различные запросы: идентификатор номера ss, идентификатор номера refSNP, имя гена, экспериментальный метод, класс популяции, детали популяции, публикацию, маркер, аллель, хромосому, основание. положение, диапазон гетерозиготности или номер сборки. [6] [7] Кроме того, множество результатов можно получить одновременно с помощью пакетных запросов. [6] Поиск возвращает идентификаторы номеров refSNP, соответствующие термину запроса, и сводку доступной информации для этого кластера refSNP.

2. Инструменты/Данные [ править ]

Информация, доступная для кластера refSNP, включает в себя основную информацию из каждой отдельной заявки (см. «Представление»), а также информацию, доступную в результате объединения данных из нескольких заявок (например, гетерозиготность, частоты генотипов). Доступно множество инструментов для более глубокого изучения кластера refSNP. На карте показано положение вариации генома и других близлежащих вариаций. Другой инструмент, «Просмотр генов», сообщает о местоположении вариации внутри гена (если она есть в гене), старом и новом кодоне, аминокислотах, кодируемых обоими, а также о том, является ли изменение синонимичным или несинонимичным. Программа просмотра последовательностей показывает положение варианта по отношению к интронам , экзонам и другим отдаленным и близким вариантам. Также доступно трехмерное структурное картирование, которое показывает трехмерные изображения кодируемого белка.

dbSNP также связан со многими другими ресурсами NCBI, включая базы данных нуклеотидов , белков , генов , таксономии и структур, а также PubMed , UniSTS, PMC , OMIM и UniGene.

3. Статус проверки [ править ]

В статусе проверки перечислены категории доказательств, подтверждающих вариант. К ним относятся: (1) многочисленные независимые представления; (2) данные о частоте или генотипе; (3) подтверждение отправителя; (4) наблюдение всех аллелей как минимум в двух хромосомах; (5) генотипировано с помощью HapMap ; и (6) секвенированы в рамках проекта «1000 геномов» . [6]

с качеством данных Проблемы

Качество данных, найденных в dbSNP, было подвергнуто сомнению многими исследовательскими группами. [8] [9] [10] [11] [12] [13] которые подозревают высокий уровень ложноположительных результатов из-за ошибок генотипирования и определения оснований. Эти ошибки можно легко внести в dbSNP, если заявитель использует (1) некритическое биоинформатическое выравнивание очень похожих, но различных последовательностей ДНК и/или (2) ПЦР с праймерами , которые не могут различать похожие, но разные последовательности ДНК. [8] Митчелл и др. (2004) [9] рассмотрел четыре исследования [10] [11] [12] [13] и пришли к выводу, что dbSNP имеет частоту ложноположительных результатов от 15 до 17% для SNP, а также что частота минорных аллелей превышает 10% примерно для 80% SNP, которые не являются ложноположительными. Аналогичным образом, Musemeci et al. (2010) [8] заявляет, что целых 8,32% двуаллельных кодирующих SNP в dbSNP являются артефактами очень похожих последовательностей ДНК (т.е. паралогичных генов), и называет эти записи однонуклеотидными различиями (SND). Высокие показатели ошибок в dbSNP, возможно, неудивительны: из 23,7 миллионов записей refSNP для людей только 14,5 миллионов были проверены, а остальные 9,2 миллиона остаются кандидатами в SNP. Однако, по данным Musemeci et al. (2010), [8] даже код проверки, представленный в записи refSNP, полезен лишь частично: только проверка HapMap уменьшила количество SND (3% против 8%), но только принятие этого метода удаляет более половины реальных SNP в dbSNP. Эти авторы также отмечают, что один из источников материалов группы Ли изобилует ошибками: 20% этих материалов представляют собой SND (по сравнению с 8% материалов). Однако, как отмечают авторы, игнорирование всех этих материалов приведет к удалению многих реальных SNP.

Ошибки в dbSNP могут помешать исследованиям ассоциаций генов-кандидатов [14] и исследования на основе гаплотипов . [15] Ошибки также могут привести к увеличению ложных выводов в исследованиях ассоциаций: [8] Увеличение количества SNP, которые проверяются путем проверки ложных SNP, требует большего количества проверок гипотез. Однако эти ложные SNP на самом деле не могут быть связаны с признаками, поэтому уровень альфа снижается больше, чем это необходимо для тщательного теста, если тестировались только истинные SNP, и уровень ложноотрицательных результатов увеличится. Мусемечи и др. (2010) [8] предложили авторам исследований отрицательных ассоциаций проверить свои предыдущие исследования на предмет ложных SNP (SND), которые можно было бы исключить из анализа.

Как цитировать данные из dbSNP [ править ]

На отдельные последовательности можно ссылаться по их идентификационным номерам кластера refSNP (например, rs206437). На dbSNP следует ссылаться, используя Sherry et al. 2001 г. статья: Шерри С.Т., Уорд М.Х., Холодов М., Бейкер Дж., Фан Л., Смигельски Е.М., Сироткин К. (2001). dbSNP: база данных генетических вариаций NCBI. Исследования нуклеиновых кислот, 29: 308-311. [5]

См. также [ править ]

Ссылки [ править ]

  1. ^ Уилер Д.Л., Барретт Т., Бенсон Д.А. и др. (январь 2007 г.). «Ресурсы базы данных Национального центра биотехнологической информации» . Нуклеиновые кислоты Рез . 35 (Проблема с базой данных): D5–12. дои : 10.1093/нар/gkl1031 . ПМЦ   1781113 . ПМИД   17170002 .
  2. Перейти обратно: Перейти обратно: а б Шерри СТ, Уорд М; Сироткин, К. (1999). «dbSNP - база данных однонуклеотидных полиморфизмов и других классов незначительных генетических вариаций» . Геномные исследования . 9 (8): 677–679. дои : 10.1101/гр.9.8.677 . ПМИД   10447503 . S2CID   10775908 .
  3. ^ «Поэтапное прекращение поддержки данных генома организмов, не относящихся к человеку, в dbSNP и dbVar» . 09.05.2017 . Проверено 9 июля 2017 года .
  4. Перейти обратно: Перейти обратно: а б с д и ж Китс А; Шерри С. (2009). «База данных однонуклеотидного полиморфизма (dbSNP) вариаций нуклеотидных последовательностей» . Национальный центр биотехнологической информации (США). {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )
  5. Перейти обратно: Перейти обратно: а б с Шерри С.Т., Уорд М.Х., Холодов М., Бейкер Дж., Фан Л., Смигельски Э.М., Сироткин К. и др. (2001). «dbSNP: база данных генетических вариаций NCBI» . Нуклеиновые кислоты Рез . 29 (1): 308–311. дои : 10.1093/нар/29.1.308 . ПМК   29783 . ПМИД   11125122 .
  6. Перейти обратно: Перейти обратно: а б с д и ж НЦБИ (2010). «База данных однонуклеотидного полиморфизма (dbSNP): часто задаваемые вопросы» . Национальный центр биотехнологической информации (США). {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )
  7. ^ Филлипс, К. (2007). «Интернет-ресурсы для анализа SNP: обзор и карта маршрута». Молекулярная биотехнология . 35 (1): 65–97. дои : 10.1385/МБ:35:1:65 . ПМИД   17401150 . S2CID   8569553 .
  8. Перейти обратно: Перейти обратно: а б с д и ж Мусемечи Л., Артур Дж.В., Чунг Ф.С., Хоке С., Липпман С., Райхардт Дж.К. и др. (январь 2010 г.). «Одиночные нуклеотидные различия (SND) в базе данных dbSNP могут привести к ошибкам в исследованиях генотипирования и гаплотипирования» . Человеческая мутация . 31 (1): 67–73. дои : 10.1002/humu.21137 . ПМЦ   2797835 . ПМИД   19877174 .
  9. Перейти обратно: Перейти обратно: а б Митчелл А.А., Цвик М.Е., Чакраварти А., Катлер DJ и др. (2004). «Расхождения в показателях подтверждения dbSNP и распределении частот аллелей из-за различной частоты и закономерностей ошибок генотипирования» . Биоинформатика . 20 (7): 1022–1032. doi : 10.1093/биоинформатика/bth034 . ПМИД   14764571 .
  10. Перейти обратно: Перейти обратно: а б Карлсон К.С., Эберле М.А., Ридер М.Дж., Смит Дж.Д., Кругляк Л., Никерсон Д.А. и др. (2003). «Для полногеномных исследований ассоциаций у людей необходимы дополнительные SNP и анализ неравновесия по сцеплению» . Природная генетика . 33 (4): 518–521. дои : 10.1038/ng1128 . ПМИД   12652300 . S2CID   11640599 .
  11. Перейти обратно: Перейти обратно: а б Катлер Д.Д., Цвик М.Э., Карраскильо М.М., Йон К.Т., Тобин К.П., Кашук С., Мэтьюз Д.Д., Шах Н.А., Элклер Э.Э., Уоррингтон Дж.А., Чакраварти А. и др. (2001). «Высокопроизводительное обнаружение вариаций и генотипирование с использованием микрочипов» . Геномные исследования . 11 (11): 1913–1925. дои : 10.1101/гр.197201 . ПМК   311146 . ПМИД   11691856 .
  12. Перейти обратно: Перейти обратно: а б Габриэль С.Б.; Шаффнер С.Ф.; Нгуен Х; Мур Дж.М.; Рой Дж; Блюменштиль Б; Хиггинс Дж; ДеФеличе М; Лохнер А; Фаггарт М; Лю-Кордеро С.Н.; Ротими С; Адейемо А; Купер Р; Уорд Р; Лендер ES; Дейли М.Дж.; Альтшулер Д; и др. (2003). «Структура блоков гаплотипов в геноме человека» . Наука . 296 (5576): 2225–2229. дои : 10.1126/science.1069424 . ПМИД   12029063 . S2CID   10069634 .
  13. Перейти обратно: Перейти обратно: а б Райх Д.Э., Габриэль С.Б., Альтшулер Д. и др. (2003). «Качество и полнота баз данных SNP» . Природная генетика . 33 (4): 457–458. дои : 10.1038/ng1133 . ПМИД   12652301 . S2CID   6303430 .
  14. ^ Дворник В., Лонг Дж.Р., Сюн Д.Х., Лю П.Ю., Чжао Л.Дж., Шен Х., Чжан Ю.Ю., Лю Ю.Дж., Роча-Санчер С., Сяо П., Рекер Р.Р., Дэн Х.В. и др. (2004). «Текущие ограничения общедоступных данных SNP для изучения сложных заболеваний: тест десяти генов-кандидатов на ожирение и остеопороз» . БМК Генетика . 5 :4. дои : 10.1186/1471-2156-5-4 . ПМЦ   395827 . ПМИД   15113403 .
  15. ^ де Баккер П.И.; Еленский Р; Пер I; Габриэль С.Б.; Дейли М.Дж.; Альтшулер Д; и др. (2005). «Эффективность и мощь исследований генетических ассоциаций». Природная генетика . 37 (11): 1217–1223. дои : 10.1038/ng1669 . ПМИД   16244653 . S2CID   15464860 .

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 2e3a49b8817724b7c2c2a1b863a8ffe9__1701542280
URL1:https://arc.ask3.ru/arc/aa/2e/e9/2e3a49b8817724b7c2c2a1b863a8ffe9.html
Заголовок, (Title) документа по адресу, URL1:
dbSNP - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)