Генная онтология
Содержание | |
---|---|
Описание | Ресурс с контролируемым словарным запасом для описания функций генов и генных продуктов. |
Контакт | |
Первичное цитирование | ПМИД 36866529 |
Доступ | |
Веб-сайт | генонтология |
Разнообразный | |
Лицензия | Лицензия CC BY 4.0 |
Генная Онтология ( GO ) – это крупная биоинформатическая инициатива, направленная на унификацию представления атрибутов генов и генных продуктов для всех видов . [1] Более конкретно, цель проекта: 1) поддерживать и развивать контролируемый словарь атрибутов генов и генных продуктов; 2) аннотировать гены и генные продукты, а также усваивать и распространять данные аннотаций; и 3) предоставить инструменты для легкого доступа ко всем аспектам данных, предоставленных проектом, и для обеспечения функциональной интерпретации экспериментальных данных с использованием GO, например, посредством анализа обогащения. [2] [3] GO является частью более крупной классификации, Открытых биомедицинских онтологий , и является одним из первых кандидатов в члены OBO Foundry . [4]
В то время как номенклатура генов фокусируется на генах и генных продуктах, Онтология генов фокусируется на функциях генов и генных продуктов. GO также расширяет усилия, используя язык разметки, чтобы сделать данные (не только о генах и их продуктах, но и о выбранных атрибутах) машиночитаемыми и сделать это унифицированным для всех видов способом (в то время как номенклатура генов соглашения различаются в зависимости от биологического таксона ).
История [ править ]
Онтология генов была первоначально создана в 1998 году консорциумом исследователей, изучающих геномы трех модельных организмов : Drosophila melanogaster (плодовая мушка), Mus musculus (мышь) и Saccharomyces cerevisiae (пивные или пекарские дрожжи). [5] Многие другие базы данных модельных организмов присоединились к Консорциуму генных онтологий, внося свой вклад не только в данные аннотаций, но и в разработку онтологий и инструментов для просмотра и применения данных. Многие крупные базы данных о растениях, животных и микроорганизмах вносят свой вклад в этот проект. [6] По состоянию на июль 2019 года ГО содержит 44 945 терминов; существует 6 408 283 аннотации к 4 467 различным биологическим организмам. [6] Существует значительный объем литературы по разработке и использованию ГО, и он стал стандартным инструментом в арсенале биоинформатики . Их цели имеют три аспекта: построение онтологии генов, присвоение онтологии генам/генным продуктам и разработка программного обеспечения и баз данных для первых двух объектов.
Также начинают появляться некоторые анализы Онтологии генов с использованием формальных, независимых от предметной области свойств классов (метасвойств). Например, сейчас существует онтологический анализ биологических онтологий. [7]
Термины и онтология [ править ]
С практической точки зрения онтология — это представление того, о чем мы знаем. «Онтологии» состоят из представлений вещей, которые можно обнаружить или непосредственно наблюдать, а также отношений между этими вещами.В биологии и смежных областях не существует универсальной стандартной терминологии, и использование терминов может быть специфичным для конкретного вида, области исследований или даже конкретной исследовательской группы. Это затрудняет коммуникацию и обмен данными. Проект Gene Ontology предоставляет онтологию определенных терминов, представляющих свойства генных продуктов . Онтология охватывает три области:
- клеточный компонент , части клетки или ее внеклеточной среды;
- молекулярная функция, элементарная активность продукта гена на молекулярном уровне, такая как связывание или катализ ;
- биологический процесс , операции или наборы молекулярных событий с определенным началом и концом, относящиеся к функционированию интегрированных живых единиц: клеток, тканей , органов и организмов .
Каждый термин GO в онтологии имеет имя термина, которое может быть словом или строкой слов; уникальный буквенно-цифровой идентификатор; определение с цитированием источников; и онтология, указывающая домен, к которому он принадлежит. Термины также могут иметь синонимы, которые классифицируются как точно эквивалентные названию термина, более широкие, более узкие или родственные; ссылки на эквивалентные понятия в других базах данных; и комментарии по значению или использованию термина. Онтология GO структурирована как ориентированный ациклический граф , и каждый термин имеет определенные отношения с одним или несколькими другими терминами в том же домене, а иногда и с другими доменами. Словарь GO разработан так, чтобы быть нейтральным к видам и включает термины, применимые к прокариотам и эукариотам , одно- и многоклеточным организмам .
GO не статичен, и дополнения, исправления и изменения предлагаются и запрашиваются членами исследовательских и аннотирующих сообществ, а также теми, кто непосредственно участвует в проекте GO. [8] Например, аннотатор может запросить конкретный термин для обозначения метаболического пути, или раздел онтологии может быть пересмотрен с помощью экспертов сообщества (например, [9] ). Предлагаемые изменения проверяются редакторами онтологий и при необходимости реализуются.
Файлы онтологии и аннотаций GO находятся в свободном доступе на веб-сайте GO в ряде форматов или доступны онлайн с помощью браузера GO AmiGO . [6] Проект Gene Ontology также предоставляет загружаемые сопоставления своих терминов с другими системами классификации.
Пример термина [ изменить ]
- идентификатор: GO:0000016
- название: активность лактазы
- онтология: молекулярная_функция
- def: «Катализ реакции: лактоза + H2O=D-глюкоза + D-галактоза». [ЭК:3.2.1.108]
- синоним: «активность лактазно-флоризингидролазы» ШИРОКИЙ [EC:3.2.1.108]
- синоним: «активность лактозогалактогидролазы» ТОЧНО [EC:3.2.1.108]
- xref: EC:3.2.1.108
- xref: MetaCyc:LACTASE-RXN
- xref: Реактом: 20536
- is_a: GO:0004553 ! гидролазная активность, гидролизующая О-гликозильные соединения
Источник данных: [10]
Аннотация [ править ]
Аннотация генома включает в себя практику сбора данных о продукте гена, и для этого в аннотациях GO используются термины из GO. Аннотации кураторов GO интегрируются и распространяются на веб-сайте GO, где их можно скачать напрямую или просмотреть онлайн с помощью AmiGO. [11] Помимо идентификатора генного продукта и соответствующего термина GO, аннотации GO содержат как минимум следующие данные:Ссылка , использованная для создания аннотации (например, журнальная статья); Код доказательства, обозначающий тип доказательства, на котором основана аннотация; Дата и автор аннотации
В аннотацию GO также может быть включена вспомогательная информация, в зависимости от термина GO и используемых доказательств, а также дополнительная информация, такая как условия, при которых функция наблюдается.
Код свидетельства происходит из контролируемого словаря кодов, Онтологии кода свидетельства, охватывающего как ручные, так и автоматизированные методы аннотации. [12] Например, «Прослеживаемое заявление автора» (TAS) означает, что куратор прочитал опубликованную научную статью, и метаданные этой аннотации содержат ссылку на эту статью; «Вывод на основе сходства последовательностей» (ISS) означает, что куратор-человек рассмотрел результаты поиска по сходству последовательностей и подтвердил, что они биологически значимы. Аннотации из автоматизированных процессов (например, переназначение аннотаций, созданных с использованием другого словаря аннотаций) получают код, полученный из электронных аннотаций (IEA). В 2010 году более 98% всех аннотаций GO были выведены вычислительным путем, а не кураторами, но по состоянию на 2 июля 2019 года только около 30% всех аннотаций GO были выведены вычислительным путем. [13] [14] Поскольку эти аннотации не проверяются человеком, Консорциум GO считает их немного менее надежными и, как правило, относятся к более высокому уровню и менее подробным терминам. Полные наборы данных аннотаций можно загрузить с веб-сайта GO. Для поддержки разработки аннотаций Консорциум GO проводит семинары и обучает новые группы кураторов и разработчиков.
Многие алгоритмы машинного обучения были разработаны и реализованы для прогнозирования аннотаций генной онтологии. [15] [16]
Пример аннотации [ править ]
- Генный продукт: актин, альфа сердечной мышцы 1, UniProtKB:P68032.
- Термин ГО: сокращение сердца; GO:0060047 (биологический процесс)
- Код доказательства: Выведено на основе мутантного фенотипа (IMP).
- Ссылка: ПМИД 17611253
- Назначено: UniProtKB, 6 июня 2008 г.
Источник данных: [17]
Инструменты [ править ]
Существует большое количество инструментов, доступных как онлайн, так и для загрузки, которые используют данные, предоставленные проектом GO. [18] Подавляющее большинство из них поступает от третьих лиц; Консорциум GO разрабатывает и поддерживает два инструмента: AmiGO и OBO-Edit.
Друг [19] [11] — это веб-приложение, которое позволяет пользователям запрашивать, просматривать и визуализировать онтологии и данные аннотаций генных продуктов. Он также имеет инструмент BLAST , [20] инструменты, позволяющие анализировать большие наборы данных, [21] [22] и интерфейс для прямого запроса к базе данных GO. [23] AmiGO можно использовать онлайн на веб-сайте GO для доступа к данным, предоставленным Консорциумом GO, или загрузить и установить для локального использования в любой базе данных, использующей схему базы данных GO (например, [24] ). Это бесплатное программное обеспечение с открытым исходным кодом , доступное как часть дистрибутива программного обеспечения go-dev. [25]
OBO-Edit — это независимый от платформы редактор онтологий с открытым исходным кодом, разработанный и поддерживаемый Консорциумом Gene Ontology. [26] Он реализован на Java и использует графо-ориентированный подход для отображения и редактирования онтологий. OBO-Edit включает в себя комплексный интерфейс поиска и фильтрации с возможностью отображать подмножества терминов, чтобы сделать их визуально различимыми; Пользовательский интерфейс также можно настроить в соответствии с предпочтениями пользователя. OBO-Edit также имеет модуль рассуждения , который может выводить ссылки, которые не были явно указаны, на основе существующих отношений и их свойств. Хотя OBO-Edit был разработан для биомедицинских онтологий, его можно использовать для просмотра, поиска и редактирования любой онтологии. Он доступен для бесплатного скачивания. [25]
Consortium[editКонсорциум
Консорциум генной онтологии — это совокупность биологических баз данных и исследовательских групп, активно участвующих в проекте генной онтологии. [14] Сюда входит ряд баз данных модельных организмов и баз данных многовидовых белков , группы разработчиков программного обеспечения и специальная редакция.
См. также [ править ]
- Blast2GO
- База данных сравнительной токсикогеномики
- ДЭВИД биоинформатика
- Интерфером
- Национальный центр биомедицинской онтологии
- Критическая оценка аннотации функции
Ссылки [ править ]
- ^ Консорциум генной онтологии (январь 2008 г.). «Проект Генной Онтологии в 2008 году» . Исследования нуклеиновых кислот . 36 (Проблема с базой данных): D440–4. дои : 10.1093/нар/gkm883 . ПМК 2238979 . ПМИД 17984083 .
- ^ Дессимо, Кристоф ; Шкунца, Нивес, ред. (2017). Справочник по онтологии генов . Методы молекулярной биологии. Том. 1446. дои : 10.1007/978-1-4939-3743-1 . ISBN 9781493937431 . ISSN 1064-3745 . S2CID 3708801 .
- ^ Годе, Паскаль; Шкунка, Нивес; Ху, Джеймс С.; Дессимо, Кристоф (2017). «Букварь по онтологии генов». Справочник по онтологии генов . Методы молекулярной биологии. Том. 1446. стр. 25–37. дои : 10.1007/978-1-4939-3743-1_3 . ISBN 978-1-4939-3741-7 . ISSN 1064-3745 . ПМК 6377150 . ПМИД 27812933 .
- ^ Смит Б, Эшбернер М, Росс С, Бард Дж, Баг В, Цестерс В, Голдберг Л.Дж., Эйлбек К., Ирландия А, Мангалл С.Дж., Леонтис Н., Рокка-Серра П., Руттенберг А., Сансоне С.А., Шойерманн Р.Х., Шах Н., Ветцель П.Л., Льюис С. (ноябрь 2007 г.). «The OBO Foundry: скоординированная эволюция онтологий для поддержки интеграции биомедицинских данных» . Природная биотехнология . 25 (11): 1251–5. дои : 10.1038/nbt1346 . ПМК 2814061 . ПМИД 17989687 .
- ^ Эшбернер М, Болл К.А., Блейк Дж.А. , Ботштейн Д., Батлер Х., Черри Дж.М., Дэвис А.П., Долински К., Дуайт С.С., Эппиг Дж.Т., Харрис М.А., Хилл Д.П., Иссель-Тарвер Л., Касарскис А., Льюис С., Матезе Дж.К., Ричардсон Дж. Э., Рингвальд М., Рубин Г. М., Шерлок Дж. (май 2000 г.). «Онтология генов: инструмент для объединения биологии. Консорциум генной онтологии» . Природная генетика . 25 (1): 25–9. дои : 10.1038/75556 . ПМК 3037419 . ПМИД 10802651 .
- ^ Перейти обратно: а б с «Ресурс генной онтологии» . Консорциум онтологий генов.
- ^ Деб, Б. (2012). «Онтологический анализ некоторых биологических онтологий» . Границы генетики . 3 : 269. дои : 10.3389/fgene.2012.00269 . ПМК 3509948 . ПМИД 23226158 .
- ^ Лавинг, Рут К. (2017). «Какой вклад научное сообщество в онтологию генов?». В Дессимозе, С; Скунка, Н. (ред.). Справочник по онтологии генов . Методы молекулярной биологии. Том. 1446. Спрингер (Нью-Йорк). стр. 85–93. дои : 10.1007/978-1-4939-3743-1_7 . ISBN 978-1-4939-3741-7 . ISSN 1064-3745 . ПМИД 27812937 . S2CID 4924457 .
- ^ Диль А.Д., Ли Дж.А., Шойерманн Р.Х., Блейк Дж.А. (апрель 2007 г.). «Разработка онтологий биологических систем: иммунология» . Биоинформатика . 23 (7): 913–5. doi : 10.1093/биоинформатика/btm029 . ПМИД 17267433 .
- ^ «Руководство по AmiGO 2: Страница терминов» . Wiki Консорциума онтологии генов . 10 июля 2013 г.
- ^ Перейти обратно: а б AmiGO — текущий официальный веб-набор инструментов для поиска и просмотра базы данных Gene Ontology.
- ^ «Онтология кода доказательств» . Онтология кода доказательств.
- ^ дю Плесси Л., Скунка Н., Дессимоз С. (ноябрь 2011 г.). «Что, где, как и почему в онтологии генов — учебник для биоинформатиков» . Брифинги по биоинформатике . 12 (6): 723–35. дои : 10.1093/нагрудник/bbr002 . ПМК 3220872 . ПМИД 21330331 .
- ^ Перейти обратно: а б «Консорциум ГО» . Архивировано из оригинала 2 июля 2014 г. Проверено 16 марта 2009 г.
- ^ Пиноли П., Чикко Д., Массероли М. (июнь 2013 г.). «Вычислительные алгоритмы для прогнозирования аннотации онтологии генов» . БМК Биоинформатика . 16 (6): С4. дои : 10.1186/1471-2105-16-S6-S4 . ПМЦ 4416163 . ПМИД 25916950 .
- ^ Коццетто, Доменико; Джонс, Дэвид Т. (2017). «Вычислительные методы переноса аннотаций из последовательности». В Дессимозе, С; Скунка, Н. (ред.). Справочник по онтологии генов . Методы молекулярной биологии. Том. 1446. Спрингер (Нью-Йорк). стр. 55–67. дои : 10.1007/978-1-4939-3743-1_5 . ISBN 978-1-4939-3741-7 . ISSN 1064-3745 . ПМИД 27812935 .
- ^ Консорциум GO (16 марта 2009 г.). «AmiGO: Ассоциации P68032» .
- ^ Москера Х.Л., Санчес-Пла А (июль 2008 г.). «SerbGO: в поисках лучшего инструмента GO» . Исследования нуклеиновых кислот . 36 (проблема с веб-сервером): W368–71. дои : 10.1093/нар/gkn256 . ПМЦ 2447766 . ПМИД 18480123 .
- ^ Карбон С., Ирландия А., Мангалл С.Дж., Шу С., Маршалл Б., Льюис С. (январь 2009 г.). «AmiGO: онлайн-доступ к данным онтологий и аннотаций» . Биоинформатика . 25 (2). Хаб АмиГО; Рабочая группа по веб-присутствию: 288–9. doi : 10.1093/биоинформатика/btn615 . ПМК 2639003 . ПМИД 19033274 .
- ^ «Инструмент AmiGO BLAST» . Архивировано из оригинала 20 августа 2011 г. Проверено 13 марта 2009 г.
- ^ Инструмент расширения терминов AmiGO. Архивировано 7 апреля 2008 г. в Wayback Machine ; находит важные общие термины GO в наборе аннотаций
- ^ AmiGO Slimmer. Архивировано 29 сентября 2011 г. в Wayback Machine ; отображает подробные аннотации до терминов высокого уровня
- ^ GOOSE. Архивировано 1 марта 2009 г. в Wayback Machine , GO Online SQL Environment; позволяет выполнять прямые SQL-запросы к базе данных GO.
- ^ Консорциум онтологии растений (16 марта 2009 г.). «Консорциум онтологии растений» . Проверено 16 марта 2009 г.
- ^ Перейти обратно: а б «Загрузка онтологии генов на SourceForge» . Проверено 16 марта 2009 г.
- ^ Дэй-Рихтер Дж., Харрис М.А., Гендель М., Льюис С. (август 2007 г.). «OBO-Edit — редактор онтологий для биологов» . Биоинформатика . 23 (16): 2198–200. doi : 10.1093/биоинформатика/btm112 . ПМИД 17545183 .
Внешние ссылки [ править ]
- AmiGO — текущий официальный веб-набор инструментов для поиска и просмотра базы данных Gene Ontology.
- Консорциум генной онтологии - официальный сайт
- PlantRegMap — аннотация GO для 165 видов растений и анализ обогащения GO