Базы данных микрочипов
База данных микрочипов представляет собой хранилище, содержащее на микрочипах данные об экспрессии генов . Основными видами использования базы данных микрочипов являются хранение данных измерений, управление индексом с возможностью поиска и предоставление данных другим приложениям для анализа и интерпретации (либо напрямую, либо посредством пользовательских загрузок).
Базы данных микрочипов можно разделить на два отдельных класса:
- Прошедший экспертную оценку общедоступный репозиторий, соответствующий академическим или отраслевым стандартам и предназначенный для использования многими аналитическими приложениями и группами. Хорошим примером этого является Gene Expression Omnibus (GEO) от NCBI или ArrayExpress от EBI .
- Специализированный репозиторий, связанный в первую очередь с брендом конкретной организации (лаборатории, компании, университета, консорциума, группы), пакета приложений, темы или метода анализа, независимо от того, является ли он коммерческим, некоммерческим или академическим. Эти базы данных могут иметь одну или несколько из следующих характеристик:
- Для получения полного доступа может потребоваться подписка или лицензия.
- Контент может исходить в основном от конкретной группы (например, SMD или UPSC-BASE), проекта Иммунологического генома.
- Могут существовать ограничения на то, кто может использовать данные или для каких целей данные могут использоваться.
- Для предоставления новых данных может потребоваться специальное разрешение или же может вообще не быть очевидного процесса.
- Только определенные приложения могут быть оснащены для использования данных, часто также связанных с одним и тем же объектом (например, caArray в NCI специализируется на caBIG ),
- Для стандартных приложений или анализа может потребоваться дальнейшая обработка или переформатирование данных.
- Они утверждают, что решают «насущную потребность» в стандартном централизованном хранилище данных микрочипов. (См., например, YMD, последнее обновление в 2003 г.),
- Есть претензия на постепенное улучшение по сравнению с одним из общедоступных репозиториев.
- метаанализа Приложение , которое включает исследования из одной или нескольких общедоступных баз данных (например, Gemma в основном использует исследования GEO ; NextBio использует различные источники).
Некоторые из наиболее известных общедоступных и курируемых баз данных микрочипов :
База данных | Объем | Экспериментальные наборы микрочипов | Примеры профилей | На сегодняшний день |
---|---|---|---|---|
МассивТрек | ArrayTrack хранит как общедоступные, так и частные данные, включая данные тестов MAQC, со встроенными инструментами анализа. | 1622 | 50,093 | февраль 2012 г. |
НЦИ Мадб | Хранит данные NCI со встроенными инструментами анализа и статистики. | ? | 105,000 | март 2012 г. |
База данных ИммГен | Открытый доступ ко всем клеткам иммунной системы; данные экспрессии, дифференциальная экспрессия, корегулируемые кластеры, регуляция | 267 | 1059 | январь 2012 г. |
Генный исследователь | Поисковая система по экспрессии генов, основанная на вручную тщательно отобранных, хорошо аннотированных общедоступных и запатентованных наборах данных микрочипов и секвенирования РНК. | 3228 | 232,855 | Октябрь 2016 г. |
Омнибус экспрессии генов - NCBI | любое кураторское MIAME исследование молекулярного изобилия, соответствующее требованиям | 25859 | 641770 | 28 октября 2011 г. |
ArrayExpress в EBI | Любые курируемые MIAME или MINSEQE. транскриптомные данные, соответствующие | 24838 | 708914 | 28 октября 2011 г. |
База данных Стэнфордских микрочипов | частная и опубликованная база данных микрочипов и содержания молекул (ныне несуществующая) | 82542 | ? | 23 октября 2011 г. |
Атлас генома рака (TCGA) | сбор данных об экспрессии различных видов рака | 21229 | ? | 30 августа 2013 г. |
система GeneNetwork | Стандартные массивы открытого доступа, массивы экзонов и данные секвенирования РНК для генетического анализа (исследования eQTL) с пакетом анализа | ~100 | ~10000 | июль 2010 г. |
UNC modENCODE База данных микрочипов | Клиент Nimblegen, массив на 2,1 миллиона человек | ~6 | 180 | 17 июля 2009 г. |
UPSC-БАЗА | данные, полученные с помощью микроматричного анализа в Центре науки о растениях Умео (UPSC). | ~100 | ? | 15 ноября 2007 г. |
База данных UPenn RAD | MIAME Государственные и частные исследования, соответствующие требованиям , связанные с ArrayExpress | ~100 | ~2500 | 1 сентября 2007 г. |
База данных микрочипов UNC | предоставляет услуги по хранению, поиску, анализу и визуализации данных микрочипов | ~31 | 2093 | 1 апреля 2007 г. |
База данных MUSC | База данных представляет собой хранилище данных микрочипов ДНК, полученных исследователями MUSC, а также исследователями мирового исследовательского сообщества. | ~45 | 555 | 1 апреля 2007 г. |
caArray в NCI | Данные о раке, подготовленные для анализа на caBIG | 41 | 1741 | 15 ноября 2006 г. |
См. также
[ редактировать ]- Биологическая база данных
- Список биологических баз данных
- ДНК-микрочип
- Методы микроматричного анализа
Внешние ссылки
[ редактировать ]- ArrayExpress: краткий обзор поезда EBI Online
- Изучение данных функциональной геномики с помощью архива ArrayExpress на EBI Train Online
- Исследование закономерностей экспрессии генов с помощью Атласа экспрессии генов на EBI Train OnLine
- ArrayExpress:Отправка данных с помощью MAGE-TAB в EBI Train OnLine
- ArrayExplorer — бесплатный инструмент для сравнения микроматриц.