Архив чтения последовательности
![]() | |
Содержание | |
---|---|
Описание | Последовательности FASTQ Данные БАМа |
Организмы | все |
Контакт | |
Исследовательский центр | Национальный центр биотехнологической информации Европейский институт биоинформатики Банк данных ДНК Японии |
Доступ | |
Веб-сайт | www www след |
Архив чтения последовательностей ( SRA , ранее известный как Short Read Archive ) — это биоинформационная база данных , которая обеспечивает общедоступное хранилище данных секвенирования ДНК , особенно «коротких чтений», генерируемых высокопроизводительным секвенированием , длина которых обычно составляет менее 1000 пар оснований. в длину. [1] Архив является частью Международного сотрудничества по базам данных нуклеотидных последовательностей (INSDC) и создан в результате сотрудничества NCBI, Европейского института биоинформатики (EBI) и Банка данных ДНК Японии (DDBJ).
Архив был создан Национальным центром биотехнологической информации (NCBI) в 2007 году с целью предоставления хранилища данных, полученных в результате исследований RNA-Seq и ChIP-Seq, а также крупномасштабных исследований, включая проект «Микробиом человека» и « 1000 геномов» . Проект . [1] [2] Первоначально называвшееся «Архив короткого чтения», название было изменено в ожидании того, что будущие технологии секвенирования смогут производить более длинные чтения последовательностей. [3]

Объем данных, хранящихся в архиве чтения последовательностей, быстро растет. По состоянию на сентябрь 2010 года 65% SRA составляли геномные последовательности человека, а еще 16% относились к считыванию последовательностей метагенома человека . [6] Большая часть этих данных была передана в рамках проекта «1000 геномов». В июне 2011 года объем данных, содержащихся в SRA, превысил 100 терабаз ДНК. [2]
Предпочтительным форматом данных для файлов, отправляемых в SRA, является формат BAM , который способен хранить как выровненные, так и невыровненные чтения. [6] Внутри SRA опирается на набор инструментов NCBI SRA Toolkit, используемый во всех трех базах данных, входящих в INSDC, для обеспечения гибкого сжатия данных , доступа к API и преобразования в другие форматы, такие как FASTQ . [5]
NCBI объявила о своем плане закрыть NCBI SRA в феврале 2011 года из-за сокращения финансирования. [2] [7] Однако EBI и DDBJ объявили, что продолжат поддерживать SRA. [8] В октябре 2011 года NCBI объявил о продолжении финансирования SRA. [2]
Размещение данных в SRA требуется большинством финансирующих агентств и журналов открытого доступа . Журналы Nature Publishing Group требуют, чтобы данные секвенирования ДНК и РНК были доступны через SRA. [9]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б Уилер, Д.Л.; Барретт, Т; Бенсон, Д.А.; Брайант, Ш.; Канезе, К; Четвернин, В; Церковь, DM; Дикуччо, М; Эдгар, Р; Федерхен, С; Феоло, М; Гир, Л.Ю.; Хельмберг, В; Капустин Ю.; Ховайко О; Ландсман, Д; Липман, диджей; Мэдден, TL; Маглотт, Др. ; Миллер, В.; Остелл, Дж; Прюитт, К.Д.; Шулер, Грузия; Шамуэй, М; Секейра, Э; Шерри, Сент-Луис; Сироткин, К; Суворов А; Старченко Г; Татусов, Р.Л.; Татусова Т.А.; Вагнер, Л; Ященко Е (январь 2008 г.). «Ресурсы базы данных Национального центра биотехнологической информации» . Исследования нуклеиновых кислот . 36 (Проблема с базой данных): D13-21. дои : 10.1093/нар/gkm1000 . ПМК 2238880 . ПМИД 18045790 .
- ^ Jump up to: а б с д Гальперин, М.Ю.; Фернандес-Суарес, XM (5 декабря 2011 г.). «Выпуск базы данных исследований нуклеиновых кислот 2012 года и онлайн-коллекция баз данных по молекулярной биологии» . Исследования нуклеиновых кислот . 40 (Д1): Д1–Д8. дои : 10.1093/nar/gkr1196 . ПМК 3245068 . ПМИД 22144685 .
- ^ Остелл, Джим (2009). «Архив чтения последовательностей NCBI: основная инфраструктура» . Био-ИТ-Мир . Проверено 8 января 2013 г.
- ^ «Обзор NCBI SRA» . НКБИ. 1 января 2013 года . Проверено 8 января 2013 г.
- ^ Jump up to: а б Кодама, Ю.; Шамуэй, М.; Лейнонен, Р. (2011). «Архив чтения последовательности: взрывной рост данных секвенирования» . Исследования нуклеиновых кислот . 40 (Д1): Д54–Д56. дои : 10.1093/nar/gkr854 . ISSN 0305-1048 . ПМК 3245110 . ПМИД 22009675 .
- ^ Jump up to: а б Лейнонен Р; Сугавара Х; Шамвей М (январь 2011 г.). «Последовательность чтения архива» . Нуклеиновые кислоты Рез . 39 (Проблема с базой данных): D19–21. дои : 10.1093/нар/gkq1019 . ПМК 3013647 . ПМИД 21062823 .
- ^ Редакция GB (22 марта 2011 г.). «Закрытие NCBI SRA и последствия для долгосрочного будущего хранения геномных данных» . Геномная биология . 12 (3): 402. doi : 10.1186/gb-2011-12-3-402 . ПМК 3129670 . ПМИД 21418618 .
- ^ «DDBJ продолжит архивирование необработанных данных последовательностей» . www.ddbj.nig.ac.jp. Проверено 2 сентября 2014 г.
- ^ «Наличие данных и материалов: авторы и рецензенты @npg» . www.nature.com . Проверено 2 сентября 2014 г.
Внешние ссылки
[ редактировать ]- Европейский архив нуклеотидов , страница для поиска в SRA
- Домашняя страница SRA в NCBI.
- Представления ERA в EBI.
- Домашняя страница DRA на DDBJ.