Анализ обогащения генного набора
Анализ обогащения набора генов (GSEA) (также называемый анализом функционального обогащения или анализом обогащения путей ) — это метод идентификации классов генов или белков , которые чрезмерно представлены в большом наборе генов или белков и могут иметь связь с различными фенотипами. (например, различные модели роста организма или заболевания). В методе используются статистические подходы для выявления значительно обогащенных или обедненных групп генов. Технологии транскриптомики и результаты протеомики часто идентифицируют тысячи генов, которые используются для анализа. [1]
Исследователи, проводящие высокопроизводительные эксперименты , в ходе которых получают наборы генов (например, гены, которые по-разному экспрессируются в разных условиях), часто хотят получить функциональный профиль этого набора генов, чтобы лучше понять лежащие в основе биологические процессы. Это можно сделать путем сравнения входного набора генов с каждым из интервалов (терминов) в онтологии генов — для каждого интервала можно выполнить статистический тест , чтобы увидеть, обогащен ли он входными генами.
Фон
[ редактировать ]После завершения проекта «Геном человека » проблема его интерпретации и анализа осталась. Для поиска генов, связанных с заболеваниями, использовались микрочипы ДНК для измерения уровня экспрессии генов в различных клетках. Были проведены микрочипы тысяч различных генов и сравнены результаты двух разных категорий клеток, например, нормальных клеток и раковых клеток. Однако этот метод сравнения недостаточно чувствителен, чтобы обнаружить тонкие различия между экспрессией отдельных генов, поскольку заболевания обычно затрагивают целые группы генов. [2] Множественные гены связаны с одним биологическим путем, поэтому именно аддитивные изменения в экспрессии внутри наборов генов приводят к различиям в фенотипической экспрессии. Разработан анализ обогащения набора генов. [2] сосредоточить внимание на изменениях экспрессии в группах априорно определенных наборов генов. Таким образом, этот метод решает проблему необнаружимых небольших изменений в экспрессии отдельных генов. [3]
Методы
[ редактировать ]Анализ обогащения набора генов использует априорные наборы генов, которые были сгруппированы вместе по их участию в одном и том же биологическом пути или по проксимальному расположению на хромосоме. [1] Базу данных этих предопределенных наборов можно найти в базе данных молекулярных сигнатур (MSigDB). [4] [5] В GSEA микрочипы ДНК, или теперь RNA-Seq , по-прежнему выполняются и сравниваются между двумя категориями клеток, но вместо того, чтобы сосредотачиваться на отдельных генах в длинном списке, основное внимание уделяется набору генов. [1] Исследователи анализируют, попадают ли большинство генов в наборе в крайности этого списка: верхняя и нижняя часть списка соответствуют наибольшим различиям в экспрессии между двумя типами клеток. Если набор генов попадает либо в верхнюю (чрезмерно экспрессируемую), либо в нижнюю (недостаточную) экспрессию, считается, что это связано с фенотипическими различиями.
В методе, который обычно называют стандартным GSEA, аналитический процесс состоит из трех этапов. [1] [2] Общие шаги кратко изложены ниже:
- Рассчитайте показатель обогащения (ES), который представляет собой количество, на которое гены в наборе перепредставлены либо вверху, либо внизу списка. Эта оценка представляет собой статистику типа Колмогорова-Смирнова . [1] [2]
- Оцените статистическую значимость ES. Этот расчет выполняется с помощью теста перестановки на основе фенотипа, чтобы получить нулевое распределение для ES. Значение P определяется путем сравнения с нулевым распределением. [1] [2]
- Скорректируйте проверку нескольких гипотез, если одновременно анализируется большое количество наборов генов. Оценки обогащения для каждого набора нормализуются и уровень ложного обнаружения . рассчитывается [1] [2]
Это можно описать как:
Где это ранг гена, — степень, обычно равная 1 (если бы она была равна 0, это было бы эквивалентно критерию Колмогорова-Смирнова).
Ограничения и предлагаемые альтернативы
[ редактировать ]МОРЕ
[ редактировать ]Когда в 2003 году впервые была предложена система GSEA, возникли некоторые неотложные опасения по поводу ее методологии. Эта критика привела к использованию корреляционно-взвешенного теста Колмогорова-Смирнова , нормализованного ES и расчета частоты ложных открытий, которые в настоящее время являются факторами, которые в настоящее время определяют стандарт GSEA. [6] Однако теперь GSEA также подвергается критике за то, что ее нулевое распределение является излишним и слишком сложным, чтобы его можно было рассчитать, а также за то, что ее статистика, подобная Колмогорову – Смирнову, не так чувствительна, как оригинал. [6] В качестве альтернативы был предложен метод, известный как Simpler Enrichment Analysis (SEA). Этот метод предполагает независимость генов и использует более простой подход для расчета t-теста. Однако считается, что эти предположения на самом деле слишком упрощают, и корреляцию генов нельзя игнорировать. [6]
СГСЭ
[ редактировать ]Еще одним ограничением анализа обогащения набора генов является то, что результаты очень зависят от алгоритма, который кластеризует гены, и количества тестируемых кластеров. [7] Обогащение спектрального набора генов (SGSE) — это предлагаемый тест без надзора. Основатели метода утверждают, что это лучший способ найти связи между наборами генов MSigDB и данными микрочипов. Общие шаги включают в себя:
1. Расчет связи между главными компонентами и наборами генов. [7]
2. Использование взвешенного Z-метода для расчета связи между наборами генов и спектральной структурой данных. [7]
Инструменты
[ редактировать ]GSEA использует сложную статистику, поэтому для проведения расчетов требуется компьютерная программа. GSEA стала стандартной практикой, и существует множество веб-сайтов и загружаемых программ, которые предоставляют наборы данных и проводят анализ.
ДОЛЖЕН
[ редактировать ]Инструмент обогащения мульти-онтологий (MOET): MOET — это веб-инструмент анализа онтологий, который обеспечивает функциональность для нескольких онтологий, включая болезни, GO, пути, фенотипы и химические объекты (ChEBI) для нескольких видов, включая крысу, мышь, человека. , бонобо, белка, собака, свинья, шиншилла, голый землекоп и верветка (зеленая мартышка). Он выводит загружаемый график и список статистически перепредставленных терминов в списке генов пользователя, используя гипергеометрическое распределение. MOET также отображает соответствующую поправку Бонферрони и соотношение шансов на странице результатов. Он прост в использовании, а результаты предоставляются несколькими щелчками мыши за секунды; установка программного обеспечения или навыки программирования не требуются. Кроме того, MOET обновляется еженедельно, предоставляя пользователю самые последние данные для анализа.
НАСКАР
[ редактировать ]NASQAR (Ресурс для анализа последовательностей нуклеиновых кислот) — это веб-платформа с открытым исходным кодом для высокопроизводительного анализа и визуализации данных секвенирования. [8] [9] Пользователи могут выполнять GSEA с помощью популярного пакета ClusterProfiler на основе R. [10] в простом и удобном веб-приложении. NASQAR в настоящее время поддерживает обогащение GO Term и KEGG Pathway всеми организмами, поддерживаемыми базой данных Org.Db. [11]
ПлантРегКарта
[ редактировать ]GO . Доступна аннотация генной онтологии (GO) для 165 видов растений и анализ обогащения [12]
MSigDB
[ редактировать ]В базе данных молекулярных сигнатур содержится обширная коллекция аннотированных наборов генов, которые можно использовать с большинством программного обеспечения GSEA.
Броуд Институт
[ редактировать ]Веб -сайт Broad Institute создан в сотрудничестве с MSigDB и содержит загружаемое программное обеспечение GSEA, а также общее руководство для новичков в использовании этого аналитического метода. [13]
Веб-дизайн
[ редактировать ]Веб-дизайн [14] представляет собой веб-инструментарий для анализа набора генов. Он поддерживает три хорошо зарекомендовавших себя и взаимодополняющих метода анализа обогащения, включая анализ чрезмерного представления (ORA), анализ обогащения набора генов (GSEA) и анализ на основе топологии сети (NTA). Анализ можно проводить по 12 организмам и 321 251 функциональной категории с использованием 354 идентификаторов генов из различных баз данных и технологических платформ.
Обогатитель
[ редактировать ]Обогатитель [15] [16] [17] представляет собой инструмент анализа обогащения набора генов млекопитающих. Он содержит фоновые библиотеки для регуляции транскрипции, путей и белковых взаимодействий, онтологии, включая онтологии GO и фенотипов человека и мыши, сигнатуры клеток, обработанных лекарствами, наборы генов, связанные с заболеваниями человека, а также экспрессию генов в различных клетках и тканях. Энрихр был разработан лабораторией Мааян Медицинской школы Икан на горе Синай. [18] Фоновые библиотеки взяты из более чем 200 ресурсов и содержат более 450 000 аннотированных наборов генов. Доступ к инструменту осуществляется через API, и он предоставляет различные способы визуализации результатов.
ГенSCF
[ редактировать ]GeneSCF — это инструмент функционального обогащения в режиме реального времени с поддержкой нескольких организмов. [19] и предназначен для преодоления проблем, связанных с использованием устаревших ресурсов и баз данных. [20] Преимущества использования GeneSCF: анализ в реальном времени, пользователям не нужно зависеть от инструментов обогащения для получения обновлений, вычислительным биологам легко интегрировать GeneSCF со своим конвейером NGS, он поддерживает несколько организмов, анализ обогащения для нескольких списков генов с использованием базы данных из нескольких источников. за один запуск можно получить или загрузить полные термины/пути/функции GO со связанными генами в виде простой таблицы в текстовом файле. [21] [22]
ДЭЙВИД
[ редактировать ]DAVID — это база данных для аннотаций, визуализации и комплексных открытий, инструмент биоинформатики , который объединяет информацию из большинства основных источников биоинформатики с целью высокопроизводительного анализа больших списков генов . [23] DAVID выходит за рамки стандартного GSEA благодаря дополнительным функциям, таким как переключение между идентификаторами гена и белка в масштабе всего генома. [23] однако аннотации, используемые DAVID, не обновлялись с октября 2016 года по декабрь 2021 года. [24] что может оказать существенное влияние на практическую интерпретацию результатов. [25] Однако последнее обновление было выполнено в 2021 году. [24]
Метаскейп
[ редактировать ]Metascape — это портал для анализа списка генов, ориентированный на биологов. [26] Metascape объединяет анализ обогащения путей, анализ белковых комплексов и метаанализ с несколькими списками в один цельный рабочий процесс, доступный через значительно упрощенный пользовательский интерфейс. Metascape поддерживает точность анализа, ежемесячно обновляя 40 баз знаний. Metascape представляет результаты с использованием простых для интерпретации графиков, электронных таблиц и презентаций издательского качества и доступен бесплатно. [27]
АмиГО 2
[ редактировать ]Консорциум Gene Ontology (GO) также разработал собственный онлайн-инструмент для обогащения терминов GO. [28] позволяя анализировать обогащение конкретных видов по сравнению с полной базой данных, более крупнозернистыми снимками GO или пользовательскими ссылками. [29]
БОЛЬШОЙ
[ редактировать ]В 2010 году Джилл Беджерано из Стэнфордского университета выпустил инструмент обогащения аннотаций геномных областей (GREAT), программное обеспечение, которое использует преимущества регуляторных доменов для лучшего связывания терминов онтологии генов с генами. [30] Его основная цель — выявить пути и процессы, которые в значительной степени связаны с активностью регулирования факторов. Этот метод картирует гены с регуляторными областями с помощью гипергеометрического теста над генами, определяя проксимальные регуляторные домены генов. Это делается путем использования общей доли генома, связанной с данным термином онтологии, в качестве ожидаемой доли входных областей, случайно связанных с этим термином. Обогащение рассчитывается по всем регуляторным регионам, и для проверки GREAT было проведено несколько экспериментов, один из которых представлял собой анализ обогащения, выполненный на 8 наборах данных ChIP-seq . [31]
FunRich
[ редактировать ]Инструмент анализа функционального обогащения (FunRich) [32] в основном используется для функционального обогащения и сетевого анализа данных Omics . [33]
FuncAssociate
[ редактировать ]Инструмент FuncAssociate позволяет анализировать онтологию генов и настраиваемый анализ обогащения. Он позволяет вводить упорядоченные наборы, а также файлы взвешенного пространства генов для фона. [34]
ИнтерМайн
[ редактировать ]Экземпляры InterMine автоматически предоставляют анализ обогащения [35] для загруженных наборов генов и других биологических объектов.
ТоппГенный люкс
[ редактировать ]ToppGene — это универсальный портал для анализа пополнения списка генов и определения приоритетности генов-кандидатов.на основе функциональных аннотаций и сети взаимодействий белков. [36] Разработано и поддерживается Отделом биомедицинской информатики Медицинского центра детской больницы Цинциннати .
QuSAGE
[ редактировать ]Количественный анализ набора генов (QuSAGE) — это вычислительный метод анализа обогащения набора генов. [37] QuSAGE повышает мощность за счет учета межгенных корреляций и количественной оценки активности набора генов с помощью полной функции плотности вероятности (PDF). Из этого PDF-файла значения P и доверительные интервалы можно легко извлечь . Сохранение PDF-файла также позволяет проводить постфактум-анализ (например, попарное сравнение активности набора генов), сохраняя при этом статистическую прослеживаемость. Тернер и др. расширил применимость QuSAGE для продольных исследований , добавив функциональность для общих линейных смешанных моделей. [38] QuSAGE использовался Консорциумом проекта иммунологии человека NIH/NIAID для идентификации исходных транскрипционных сигнатур, которые были связаны с ответами на вакцинацию человека от гриппа . [39] QuSAGE доступен в виде пакета R/Bioconductor и поддерживается лабораторией Кляйнштейна Йельской медицинской школы .
Blast2GO
[ редактировать ]Blast2GO — это биоинформатическая платформа для функциональной аннотации и анализа наборов геномных данных. [40] Этот инструмент позволяет выполнять анализ обогащения набора генов ( GSEA ), [41] среди других функций.
г: Профилировщик
[ редактировать ]g:Profiler — это широко используемый набор инструментов для поиска биологических категорий, обогащенных списками генов, преобразований между идентификаторами генов и сопоставлений с их ортологами. Миссия g:Profiler — предоставлять надежные услуги, основанные на актуальных высококачественных данных в удобной форме для многих типов доказательств, пространств идентификаторов и организмов. g:Profiler использует Ensembl в качестве основного источника данных и следует ежеквартальному циклу выпуска, одновременно обновляя другие источники данных. g:Profiler предоставляет современный адаптивный интерактивный веб-интерфейс, стандартизированный API, пакет R gprofiler2 и библиотеки. Результаты предоставляются через интерактивный и настраиваемый интерфейс. Результаты можно загрузить в виде готовых к публикации визуализаций или текстовых файлов с разделителями. g:Profiler поддерживает около 500 видов и штаммов, включая позвоночных, растения, грибы, насекомых и паразитов. Поддерживая пользовательские файлы GMT, загружаемые пользователем, g:Profiler способен анализировать данные любого организма. Все предыдущие версии сохраняются для обеспечения воспроизводимости и прозрачности. g:Profiler доступен бесплатно для всех пользователей по адресу https://biit.cs.ut.ee/gprofiler .
Приложения
[ редактировать ]Полногеномные исследования ассоциаций
[ редактировать ]Однонуклеотидные полиморфизмы , или SNP, представляют собой мутации одного основания, которые могут быть связаны с заболеваниями. Одно изменение основания может повлиять на белок, образующийся в результате экспрессии этого гена; однако оно также может вообще не оказать никакого эффекта. Полногеномные исследования ассоциаций (GWAS) представляют собой сравнение здоровых и больных генотипов с целью найти SNP, которые чрезмерно представлены в геномах заболеваний и могут быть связаны с этим заболеванием. До GSEA точность полногеномных исследований ассоциаций SNP была серьезно ограничена из-за большого количества ложноположительных результатов. [42] Теория о том, что SNP, вызывающие заболевание, как правило, группируются в набор генов, участвующих в одном и том же биологическом пути, лежит в основе метода GSEA-SNP. Такое применение GSEA не только помогает в обнаружении SNP, связанных с заболеваниями, но и помогает пролить свет на соответствующие пути и механизмы заболеваний. [42]
Спонтанные преждевременные роды
[ редактировать ]Методы обогащения набора генов привели к открытию новых подозрительных генов и биологических путей, связанных со спонтанными преждевременными родами . [43] Последовательности экзома женщин, перенесших СПТБ, сравнивали с последовательностями женщин из проекта «1000 геномов» с использованием инструмента, который оценивал возможные варианты, вызывающие заболевание. Гены с более высокими оценками затем были пропущены через различные программы, чтобы сгруппировать их в наборы генов на основе путей и онтологических групп. Это исследование показало, что варианты были в значительной степени сгруппированы в наборы, связанные с несколькими путями, все из которых подозреваются в SPTB. [43]
Профилирование раковых клеток
[ редактировать ]Анализ обогащения набора генов можно использовать для понимания изменений, которые клетки претерпевают во время канцерогенеза и метастазирования . В исследовании микрочипы были выполнены на метастазах почечно-клеточного рака , первичных опухолях почек и нормальной ткани почек, а данные были проанализированы с использованием GSEA. [44] Этот анализ показал значительные изменения экспрессии генов, участвующих в путях, которые ранее не были связаны с прогрессированием рака почки. Благодаря этому исследованию GSEA предоставила потенциальные новые цели для терапии почечно-клеточного рака.
Шизофрения
[ редактировать ]GSEA можно использовать для понимания молекулярных механизмов сложных расстройств. Шизофрения — это в значительной степени наследственное заболевание, но оно также очень сложное, и в возникновении заболевания участвуют многие гены, взаимодействующие по множеству путей, а также взаимодействие этих генов с факторами окружающей среды. Например, на эпигенетические изменения, такие как метилирование ДНК , влияет окружающая среда, но они также по своей сути зависят от самой ДНК. Метилирование ДНК является наиболее хорошо изученным эпигенетическим изменением и недавно было проанализировано с помощью GSEA в отношении промежуточных фенотипов, связанных с шизофренией. [45] Исследователи ранжировали гены по их корреляции между паттернами метилирования и каждым из фенотипов. Затем они использовали GSEA для поиска обогащения генов, на которые, по прогнозам, будут воздействовать микроРНК при прогрессировании заболевания. [45]
Депрессия
[ редактировать ]GSEA может помочь предоставить молекулярные доказательства связи биологических путей с заболеваниями. Предыдущие исследования показали, что симптомы долгосрочной депрессии коррелируют с изменениями иммунного ответа и воспалительных путей. [46] В подтверждение этого были предприняты генетические и молекулярные доказательства. Исследователи взяли образцы крови у страдающих депрессией и использовали данные об экспрессии всего генома вместе с GSEA, чтобы найти различия в экспрессии в наборах генов, связанных с воспалительными путями. Это исследование показало, что люди с наиболее тяжелыми симптомами депрессии также имели значительные различия в экспрессии этих наборов генов, и этот результат подтверждает гипотезу ассоциации. [46]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б с д и ж г час Субраманиан А., Тамайо П., Мута В.К., Мукерджи С., Эберт Б.Л., Джилетт М.А. и др. (октябрь 2005 г.). «Анализ обогащения генного набора: основанный на знаниях подход к интерпретации профилей экспрессии в масштабах всего генома» . Труды Национальной академии наук Соединенных Штатов Америки . 102 (43): 15545–15550. дои : 10.1073/pnas.0506580102 . ПМЦ 1239896 . ПМИД 16199517 .
- ^ Jump up to: а б с д и ж г Моота В.К., Линдгрен К.М., Эрикссон К.Ф., Субраманиан А., Сихаг С., Лехар Дж. и др. (июль 2003 г.). «Гены, чувствительные к PGC-1альфа, участвующие в окислительном фосфорилировании, координально подавляются при диабете у человека». Природная генетика . 34 (3): 267–273. дои : 10.1038/ng1180 . ПМИД 12808457 . S2CID 13940856 .
- ^ Малеки Ф., Овенс К., Хоган DJ, Кусалик А.Дж. (2020). «Анализ набора генов: проблемы, возможности и будущие исследования» . Границы генетики . 11 : 654. дои : 10.3389/fgene.2020.00654 . ПМЦ 7339292 . ПМИД 32695141 .
- ^ Либерзон А., Биргер С., Торвальдсдоттир Х., Ганди М., Месиров Дж.П., Тамайо П. (декабрь 2015 г.). «Коллекция наборов отличительных генов Базы данных молекулярных сигнатур (MSigDB)» . Клеточные системы . 1 (6): 417–425. дои : 10.1016/j.cels.2015.12.004 . ПМЦ 4707969 . ПМИД 26771021 .
- ^ «База данных молекулярных сигнатур (MSigDB) 3.0 (доступна загрузка в формате PDF)» . Исследовательские ворота .
- ^ Jump up to: а б с Тамайо П., Стейнхардт Г., Либерзон А., Месиров Дж.П. (февраль 2016 г.). «Ограничения простого анализа обогащения набора генов, предполагающего независимость генов» . Статистические методы в медицинских исследованиях . 25 (1): 472–487. arXiv : 1110.4128 . дои : 10.1177/0962280212460441 . ПМЦ 3758419 . ПМИД 23070592 .
- ^ Jump up to: а б с Frost HR, Ли З., Мур Дж. Х. (март 2015 г.). «Обогащение спектрального набора генов (SGSE)» . БМК Биоинформатика . 16 (1): 70. дои : 10.1186/s12859-015-0490-7 . ПМК 4365810 . ПМИД 25879888 .
- ^ Юсиф А., Дру Н., Роу Дж., Халфан М., Гунсалус К.С. (июнь 2020 г.). «NASQAR: веб-платформа для высокопроизводительного анализа и визуализации данных секвенирования» . БМК Биоинформатика . 21 (1): 267. bioRxiv 10.1101/709980 . дои : 10.1186/s12859-020-03577-4 . ПМЦ 7322916 . ПМИД 32600310 .
- ^ «NASQAR: Ресурс для анализа последовательностей нуклеиновых кислот» .
- ^ Ю Джи, Ван ЛГ, Хан Ю, Хэ Чью (май 2012 г.). «clusterProfiler: пакет R для сравнения биологических тем среди кластеров генов» . Омикс . 16 (5): 284–287. дои : 10.1089/omi.2011.0118 . ПМЦ 3339379 . ПМИД 22455463 .
- ^ «Пакеты Bioconductor Org.Db» .
- ^ «PlantRegMap: Платформа данных и анализа данных регулирования предприятий @ CBI, PKU» . plantregmap.cbi.pku.edu.cn . Архивировано из оригинала 8 февраля 2017 г. Проверено 19 октября 2016 г.
- ^ «GSEA | Настольное руководство» . Software.broadinstitute.org .
- ^ «WebGestalt (веб-инструментарий для анализа GEne SeT AnaLysis Toolkit)» . www.webgestalt.org .
- ^ Чен, EY; Тан, СМ; Коу, Ю.; Дуань, К.; Ван, З.; Мейреллес, Г.В.; Кларк, Северная Каролина; Мааян, А. (2013). «Чен Э.Ю., Тан С.М., Коу Ю., Дуань К., Ван З., Мейреллес Г.В., Кларк Н.Р., Мааян А. Энричр: интерактивный и совместный инструмент анализа обогащения списка генов HTML5. BMC Bioinformatics. 2013; 128 (14)» . БМК Биоинформатика . 14 :128. дои : 10.1186/1471-2105-14-128 . ПМК 3637064 . ПМИД 23586463 .
- ^ Кулешов М.В.; Джонс, MR; Руйяр, AD; Фернандес, штат Нью-Йорк; Дуань, К.; Ван, З.; Коплев С.; Дженкинс, СЛ; Ягодник, К.М.; Лахманн, А.; Макдермотт, М.Г.; Монтейро, CD; Гундерсен, Г.В.; Мааян, А. (2016). «Кулешов М.В., Джонс М.Р., Руйяр А.Д., Фернандес Н.Ф., Дуан К., Ван З., Коплев С., Дженкинс С.Л., Ягодник К.М., Лахманн А., Макдермотт М.Г., Монтейро К.Д., Гундерсен Г.В., Мааян А. Энрихр: комплексный ген установите обновление веб-сервера анализа обогащения 2016 Nucleic Acids Research 2016" . Исследования нуклеиновых кислот . 44 (П1): П90-7. дои : 10.1093/nar/gkw377 . ПМЦ 4987924 . ПМИД 27141961 .
- ^ Се, З.; Бейли, А.; Кулешов М.В.; Кларк DJB; Евангелиста, JE; Дженкинс, СЛ; Лахманн, А.; Войцехович, МЛ; Кропивницкий, Э.; Ягодник, К.М.; Чон, М.; Мааян, А. (2021). «Се З, Бейли А., Кулешов М.В., Кларк Д.Б., Евангелиста Дж.Э., Дженкинс С.Л., Лахманн А., Войцехович М.Л., Кропивницкий Е., Ягодник К.М., Чон М. и Мааян А. Открытие знаний о генном наборе с помощью Enrichr. Текущие протоколы .1 е90 2021" . Текущие протоколы . 1 (3): е90. дои : 10.1002/cpz1.90 . ПМЦ 8152575 . ПМИД 33780170 .
- ^ «Лаборатория Мааяна - Биология вычислительных систем - Медицинская школа Икана на горе Синай» . labs.icahn.mssm.edu . 19 сентября 2023 г.
- ^ Субхаш С., Кандури С. (сентябрь 2016 г.). «GeneSCF: инструмент функционального обогащения в реальном времени с поддержкой нескольких организмов» . БМК Биоинформатика . 17 (1): 365. дои : 10.1186/s12859-016-1250-z . ПМК 5020511 . ПМИД 27618934 .
- ^ Вади Л., Мейер М., Вайзер Дж., Штайн Л.Д., Рейманд Дж. (август 2016 г.). «Влияние устаревших аннотаций генов на анализ обогащения путей» . Природные методы . 13 (9): 705–706. дои : 10.1038/nmeth.3963 . ПМЦ 7802636 . ПМИД 27575621 . S2CID 19548133 .
- ^ «GeneSCF::Кластеризация набора генов на основе функциональной аннотации» . Genescf.kandurilab.org .
- ^ «Кластеризация набора генов на основе функциональной аннотации (GeneSCF)» . www.biostars.org .
- ^ Jump up to: а б Хуан Д.А., Шерман Б.Т., Лемпицки Р.А. (2009). «Систематический и интегративный анализ больших списков генов с использованием ресурсов биоинформатики DAVID». Протоколы природы . 4 (1): 44–57. дои : 10.1038/nprot.2008.211 . ПМИД 19131956 . S2CID 10418677 .
- ^ Jump up to: а б Информация о выпуске и версии DAVID , Ресурсы по биоинформатике DAVID 6.8
- ^ Хуанг Д.А., Шерман Б.Т., Лемпицки Р.А. (1 декабря 2008 г.). «Систематический и интегративный анализ больших списков генов с использованием ресурсов биоинформатики DAVID». Протоколы природы . 4 (1): 44–57. дои : 10.1038/nprot.2008.211 . ПМИД 19131956 . S2CID 10418677 .
- ^ Чжоу Ю, Чжоу Б, Паче Л, Чанг М, Ходабахши А.Х., Танасейчук О и др. (апрель 2019 г.). «Metascape предоставляет биологическому ресурсу для анализа наборов данных системного уровня» . Природные коммуникации . 10 (1): 1523. Бибкод : 2019NatCo..10.1523Z . дои : 10.1038/s41467-019-09234-6 . ПМК 6447622 . ПМИД 30944313 .
- ^ «Метаскейп» . Metascape.org . Проверено 20 декабря 2019 г.
- ^ Консорциум онтологий генов. «АмиГО 2: Добро пожаловать» . amigo.geneontology.org .
- ^ Генная онтология, Консорциум (январь 2015 г.). «Консорциум генной онтологии: будущее» . Исследования нуклеиновых кислот . 43 (Проблема с базой данных): D1049–D1056. дои : 10.1093/nar/gku1179 . ПМЦ 4383973 . ПМИД 25428369 .
- ^ «ОТЛИЧНЫЙ вклад: инструмент обогащения геномных областей аннотаций, лаборатория Беджерано, Стэнфордский университет» . bejerano.stanford.edu .
- ^ «GREAT улучшает функциональную интерпретацию цис-регуляторных регионов» (PDF) .
- ^ "FunRich :: Скачать" . funrich.org .
- ^ Патан М., Киртикумар С., Анг К.С., Гангода Л., Квек С.И., Уильямсон Н.А. и др. (август 2015 г.). «FunRich: автономный инструмент функционального обогащения и сетевого анализа с открытым доступом». Протеомика . 15 (15): 2597–2601. дои : 10.1002/pmic.201400515 . ПМИД 25921073 . S2CID 28583044 .
- ^ Берриз Г.Ф., Бивер Дж.Э., Ченик С., Тасан М., Рот Ф.П. (ноябрь 2009 г.). «Программное обеспечение нового поколения для функционального анализа тенденций» . Биоинформатика . 25 (22): 3043–3044. doi : 10.1093/биоинформатика/btp498 . ПМК 2800365 . ПМИД 19717575 .
- ^ «Статистика виджетов пополнения списка — документация InterMine» .
- ^ Чен Дж., Бардес Э.Э., Аронов Б.Дж., Джегга А.Г. (июль 2009 г.). «ToppGene Suite для анализа обогащения списка генов и определения приоритетности генов-кандидатов» . Исследования нуклеиновых кислот . 37 (проблема с веб-сервером): W305–W311. дои : 10.1093/нар/gkp427 . ПМК 2703978 . ПМИД 19465376 .
- ^ Яари Г., Болен Ч.Р., Такар Дж., Кляйнштейн С.Х. (октябрь 2013 г.). «Количественный анализ экспрессии генов: метод количественной оценки дифференциальной экспрессии набора генов, включая корреляции между генами» . Исследования нуклеиновых кислот . 41 (18): е170. дои : 10.1093/нар/gkt660 . ПМК 3794608 . ПМИД 23921631 .
- ^ Тернер Дж. А., Болен Ч. Р., Бланкеншип Д. М. (август 2015 г.). «Количественный анализ набора генов, обобщенный для повторных измерений, корректировки искажающих факторов и непрерывных ковариат» . БМК Биоинформатика . 16 : 272. дои : 10.1186/s12859-015-0707-9 . ПМЦ 4551517 . ПМИД 26316107 .
- ^ Эйви, Стефан; и др. (август 2017 г.). «Мультикогортный анализ выявляет исходные транскрипционные предикторы ответов на вакцинацию против гриппа» . Наука Иммунология . 2 (14): eaal4656. doi : 10.1126/sciimmunol.aal4656 . ПМЦ 5800877 . ПМИД 28842433 .
- ^ Конеса А., Гетц С., Гарсиа-Гомес Х.М., Терол Дж., Талон М., Роблес М. (сентябрь 2005 г.). «Blast2GO: универсальный инструмент для аннотирования, визуализации и анализа в исследованиях функциональной геномики» . Биоинформатика . 21 (18): 3674–3676. doi : 10.1093/биоинформатика/bti610 . ПМИД 16081474 .
- ^ «Рисунок 3: Тепловые карты анализа обогащения набора генов (GSEA) DEG на основе данных RNAseq в ответ на абиотические стрессы» . www.nature.com . Проверено 5 сентября 2018 г.
- ^ Jump up to: а б Холден М., Денг С., Войновски Л., Кулле Б. (декабрь 2008 г.). «GSEA-SNP: применение анализа обогащения набора генов к данным SNP из полногеномных исследований ассоциаций» . Биоинформатика . 24 (23): 2784–2785. doi : 10.1093/биоинформатика/btn516 . ПМИД 18854360 .
- ^ Jump up to: а б Манук Т.А., Уоткинс С., Эсплин М.С., Парри С., Чжан Х., Хуан Х., Биджио-младший, Буковски Р., Сааде Г., Эндрюс В., Болдуин Д. (2016). «242: Исследование обогащения набора генов вариаций материнского экзома при спонтанных преждевременных родах (СПТБ)» . Американский журнал акушерства и гинекологии . 214 (1): С142–С143. дои : 10.1016/j.ajog.2015.10.280 .
- ^ Марушке М., Хакенберг О.В., Кочзан Д., Циммерманн В., Штиф К.Г., Бюхнер А. (январь 2014 г.). «Профилирование экспрессии метастатического почечно-клеточного рака с использованием анализа обогащения набора генов» . Международный журнал урологии . 21 (1): 46–51. дои : 10.1111/iju.12183 . ПМИД 23634695 . S2CID 33377555 .
- ^ Jump up to: а б Хасс Дж., Уолтон Э., Райт С., Бейер А., Шольц М., Тернер Дж. и др. (июнь 2015 г.). «Связь между метилированием ДНК и промежуточными фенотипами, связанными с шизофренией - анализ обогащения набора генов» . Прогресс нейропсихофармакологии и биологической психиатрии . 59 : 31–39. дои : 10.1016/j.pnpbp.2015.01.006 . ПМК 4346504 . ПМИД 25598502 .
- ^ Jump up to: а б Эловаинио М., Тайпале Т., Сеппяля И., Мононен Н., Райтохарью Э., Йокела М. и др. (декабрь 2015 г.). «Активные иммуновоспалительные пути связаны с давними симптомами депрессии: данные анализа обогащения набора генов в исследовании молодых финнов». Журнал психиатрических исследований . 71 : 120–125. doi : 10.1016/j.jpsychires.2015.09.017 . ПМИД 26473696 .
Дальнейшее чтение
[ редактировать ]- Субраманиан А., Тамайо П., Мута В.К., Мукерджи С., Эберт Б.Л., Джилетт М.А. и др. (октябрь 2005 г.). «Анализ обогащения генного набора: основанный на знаниях подход к интерпретации профилей экспрессии в масштабах всего генома» . Труды Национальной академии наук Соединенных Штатов Америки . 102 (43): 15545–15550. дои : 10.1073/pnas.0506580102 . ПМЦ 1239896 . ПМИД 16199517 .
- Рейманд Дж., Иссерлин Р., Вуазен В., Кучера М., Таннус-Лопес С., Ростамианфар А. и др. (февраль 2019 г.). «Анализ обогащения путей и визуализация данных омики с использованием g:Profiler, GSEA, Cytoscape и EnrichmentMap» . Протоколы природы . 14 (2): 482–517. дои : 10.1038/s41596-018-0103-9 . ПМК 6607905 . ПМИД 30664679 .
- Чикко Д., Агапито Дж. (август 2022 г.). «Девять быстрых советов по анализу обогащения путей» . PLOS Вычислительная биология . 18 (8): e1010348. дои : 10.1371/journal.pcbi.1010348 . ПМЦ 9371296 . ПМИД 35951505 . S2CID 251494694 .