Расширение терминов онтологии генов
![]() | В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
Gene Ontology ( GO ) Обогащение терминов — это метод интерпретации наборов генов с использованием системы классификации Gene Ontology , в которой гены назначаются набору предопределенных ячеек в зависимости от их функциональных характеристик. Например, ген FasR классифицируется как рецептор , участвующий в апоптозе и расположенный на плазматической мембране .
Исследователи, проводящие высокопроизводительные эксперименты, в ходе которых получают наборы генов (например, гены, которые по-разному экспрессируются в разных условиях), часто хотят получить функциональный профиль этого набора генов, чтобы лучше понять лежащие в основе биологические процессы . Это можно сделать путем сравнения входного набора генов с каждым интервалом (терминами) в GO — для каждого интервала можно выполнить статистический тест , чтобы увидеть, обогащен ли он входными генами.
Результатом анализа обычно является ранжированный список терминов GO, каждый из которых связан со значением p . [1]
Фон
[ редактировать ]Генная онтология
[ редактировать ]Онтология генов (GO) предоставляет систему для иерархической классификации генов или продуктов генов в терминах, организованных в виде графовой структуры (или онтологии ). Эти термины объединены в три категории: молекулярная функция (описывающая молекулярную активность гена), биологический процесс (описывающий более широкую клеточную или физиологическую роль, выполняемую геном, координируемую с другими генами) и клеточный компонент (описывающий расположение в клетка , в которой продукт гена выполняет свою функцию). Каждый ген можно описать (аннотировать) несколькими терминами. GO активно используется для классификации генов человека, модельных организмов и множества других видов.
Используя GO, можно получить набор терминов, используемых для описания любого гена, или, наоборот, по заданному термину вернуть набор генов, аннотированных к этому термину. Для последнего запроса используется иерархическая система GO для получения полных результатов. Например, запрос термина GO для обозначения ядра должен возвращать гены, аннотированные к термину «ядерная мембрана».
Интерпретация данных с высокой пропускной способностью
[ редактировать ]Определенные типы высокопроизводительных экспериментов (например, секвенирование РНК ) возвращают наборы генов, которые сверх- или недостаточно экспрессируются. GO можно использовать для функционального профиля этого набора генов и для определения того, какие термины GO появляются чаще, чем можно было бы ожидать случайно при изучении набора терминов, аннотированных к входным генам. Например, эксперимент может сравнить экспрессию генов в здоровых клетках и раковых клетках. Функциональное профилирование можно использовать для выяснения основных клеточных механизмов, связанных с раковым заболеванием. Это также называется обогащением терминов или чрезмерным представлением терминов, поскольку мы проверяем, является ли термин GO статистически обогащенным для данного набора генов.
Методы
[ редактировать ]Существует множество методов обогащения терминов с помощью GO. Методы могут различаться в зависимости от типа применяемого статистического теста, наиболее распространенным из которых является точный критерий Фишера / гипергеометрический тест . Некоторые методы используют байесовскую статистику. [2] Существует также вариабельность типов поправок, применяемых для множественных сравнений , наиболее распространенной из которых является поправка Бонферрони .
Методы также различаются по входным данным: некоторые используют неранжированные наборы генов, другие — ранжированные наборы генов, а более сложные методы позволяют связать каждый ген с величиной (например, уровнем экспрессии), избегая произвольных ограничений.
Инструменты
[ редактировать ]- MOET: веб-инструмент для обогащения набора генов в базе данных генома крыс для мультионтологического и многовидового анализа. [3]
- PlantRegMap: аннотация GO для 165 видов и анализ обогащения терминов GO
- PLAZA Workbench: анализ обогащения различных видов растений с помощью GO, InterPro и MapMan.
- Консорциум генной онтологии (GOC) предоставляет инструмент для обогащения терминов. [4]
- Срок обогащения
- FunRich [5] — это бесплатный автономный инструмент анализа функционального обогащения на базе Windows.
- Бласт2ГО , [6] это независимое от платформы настольное приложение для выполнения анализа функционального обогащения, а также функционального аннотирования новых данных о последовательностях.
Ссылки
[ редактировать ]- ^ Ри, С.Ю.; Вуд, В; Долински, К; Драгич, С (2008). «Использование и неправильное использование аннотаций онтологии гена». Обзоры природы Генетика . 9 (7): 509–15. дои : 10.1038/nrg2363 . ПМИД 18475267 . S2CID 15599098 .
- ^ Бауэр, С; Ганьер, Дж; Робинсон, ПН (2010). «Байесовский подход: анализ набора генов на основе моделей данных в масштабе генома» . Исследования нуклеиновых кислот . 38 (11): 3523–32. дои : 10.1093/nar/gkq045 . ПМЦ 2887944 . ПМИД 20172960 .
- ^ Веди М, Налаболу Х.С., Лин К.В., Хоффман М.Дж., Смит Дж.Р., Броди К., Де Понс Дж.Л., Демос В.М., Гибсон А.С., Хейман Г.Т., Хилл М.Л., Калдунски М.Л., Ламерс Л., Лауледеркинд С.Дж., Торат К., Тота Дж., Тутай М., Тутай М.А., Ван С.Дж., Захер С., Дуинелл М.Р., Квитек А.Е. (апрель 2022 г.). «MOET: веб-инструмент для обогащения набора генов в базе данных генома крыс для мультионтологического и многовидового анализа» . Генетика . 220 (4). doi : 10.1093/genetics/iyac005 . ПМЦ 8982048 . ПМИД 35380657 .
- ^ Карбон С., Ирландия А., Мангалл С.Дж., Шу С., Маршалл Б., Льюис С. (2008). «AmiGO: Онлайн-доступ к данным онтологий и аннотаций» . Биоинформатика . 25 (2). Хаб АмиГО; Рабочая группа по веб-присутствию: 288–9. doi : 10.1093/биоинформатика/btn615 . ПМК 2639003 . ПМИД 19033274 .
- ^ Патан, М; Киртикумар, С; Анг, CS; Гангода, Л; Кек, CY; Уильямсон, Северная Каролина; Мурадов, Д; Зибер, О.М.; Симпсон, Р.Дж.; Салим, А; Бачич, А; Хилл, А; Страуд, окружной прокурор; Райан, Монтана; Агбинья, Дж.И.; Мариадассон, Дж. М.; Берджесс, AW; Мативанан, С. (2015). «Техническое описание: автономный инструмент функционального обогащения и сетевого анализа взаимодействия с открытым доступом». Протеомика . 15 (15): 2597–601. дои : 10.1002/pmic.201400515 . ПМИД 25921073 . S2CID 28583044 .
- ^ Гетц, С; Гарсиа-Гомес, Х.М.; Терол, Дж; Уильямс, Т.Д.; Нагарадж, Ш.; Нуэда, MJ; Роблес, М; Талон, М; Допазо, Дж; Конеса, А. (июнь 2008 г.). «Высокопроизводительная функциональная аннотация и интеллектуальный анализ данных с помощью пакета Blast2GO» . Исследования нуклеиновых кислот . 36 (10): 3420–35. дои : 10.1093/нар/gkn176 . ПМЦ 2425479 . ПМИД 18445632 .