Jump to content

Генная онтология

Генная онтология
Содержание
Описание Ресурс с контролируемым словарным запасом для описания функций генов и генных продуктов.
Контакт
Первичное цитирование ПМИД   36866529
Доступ
Веб-сайт генонтология .org
Разнообразный
Лицензия Лицензия CC BY 4.0

Генная Онтология ( GO ) – это крупная биоинформатическая инициатива, направленная на унификацию представления атрибутов генов и генных продуктов для всех видов . [1] Более конкретно, цель проекта: 1) поддерживать и развивать контролируемый словарь атрибутов генов и генных продуктов; 2) аннотировать гены и генные продукты, а также усваивать и распространять данные аннотаций; и 3) предоставить инструменты для легкого доступа ко всем аспектам данных, предоставленных проектом, и для обеспечения функциональной интерпретации экспериментальных данных с использованием GO, например, посредством анализа обогащения. [2] [3] GO является частью более крупной классификации, Открытых биомедицинских онтологий , и является одним из первых кандидатов в члены OBO Foundry . [4]

В то время как номенклатура генов фокусируется на генах и генных продуктах, Онтология генов фокусируется на функциях генов и генных продуктов. GO также расширяет усилия, используя язык разметки, чтобы сделать данные (не только о генах и их продуктах, но и о выбранных атрибутах) машиночитаемыми и сделать это унифицированным для всех видов способом (в то время как номенклатура генов соглашения различаются в зависимости от биологического таксона ).

История [ править ]

Онтология генов была первоначально создана в 1998 году консорциумом исследователей, изучающих геномы трех модельных организмов : Drosophila melanogaster (плодовая мушка), Mus musculus (мышь) и Saccharomyces cerevisiae (пивные или пекарские дрожжи). [5] Многие другие базы данных модельных организмов присоединились к Консорциуму генных онтологий, внося свой вклад не только в данные аннотаций, но и в разработку онтологий и инструментов для просмотра и применения данных. Многие крупные базы данных о растениях, животных и микроорганизмах вносят свой вклад в этот проект. [6] По состоянию на июль 2019 года ГО содержит 44 945 терминов; существует 6 408 283 аннотации к 4 467 различным биологическим организмам. [6] Существует значительный объем литературы по разработке и использованию ГО, и он стал стандартным инструментом в арсенале биоинформатики . Их цели имеют три аспекта: построение онтологии генов, присвоение онтологии генам/генным продуктам и разработка программного обеспечения и баз данных для первых двух объектов.

Также начинают появляться некоторые анализы Онтологии генов с использованием формальных, независимых от предметной области свойств классов (метасвойств). Например, сейчас существует онтологический анализ биологических онтологий. [7]

Термины и онтология [ править ]

С практической точки зрения онтология — это представление того, о чем мы знаем. «Онтологии» состоят из представлений вещей, которые можно обнаружить или непосредственно наблюдать, а также отношений между этими вещами.В биологии и смежных областях не существует универсальной стандартной терминологии, и использование терминов может быть специфичным для конкретного вида, области исследований или даже конкретной исследовательской группы. Это затрудняет коммуникацию и обмен данными. Проект Gene Ontology предоставляет онтологию определенных терминов, представляющих свойства генных продуктов . Онтология охватывает три области:

Каждый термин GO в онтологии имеет имя термина, которое может быть словом или строкой слов; уникальный буквенно-цифровой идентификатор; определение с цитированием источников; и онтология, указывающая домен, к которому он принадлежит. Термины также могут иметь синонимы, которые классифицируются как точно эквивалентные названию термина, более широкие, более узкие или родственные; ссылки на эквивалентные понятия в других базах данных; и комментарии по значению или использованию термина. Онтология GO структурирована как ориентированный ациклический граф , и каждый термин имеет определенные отношения с одним или несколькими другими терминами в том же домене, а иногда и с другими доменами. Словарь GO разработан так, чтобы быть нейтральным к видам и включает термины, применимые к прокариотам и эукариотам , одно- и многоклеточным организмам .

GO не статичен, и дополнения, исправления и изменения предлагаются и запрашиваются членами исследовательских и аннотирующих сообществ, а также теми, кто непосредственно участвует в проекте GO. [8] Например, аннотатор может запросить конкретный термин для обозначения метаболического пути, или раздел онтологии может быть пересмотрен с помощью экспертов сообщества (например, [9] ). Предлагаемые изменения проверяются редакторами онтологий и при необходимости реализуются.

Файлы онтологии и аннотаций GO находятся в свободном доступе на веб-сайте GO в ряде форматов или доступны онлайн с помощью браузера GO AmiGO . [6] Проект Gene Ontology также предоставляет загружаемые сопоставления своих терминов с другими системами классификации.

Пример термина [ изменить ]

идентификатор: GO:0000016
название: активность лактазы
онтология: молекулярная_функция
def: «Катализ реакции: лактоза + H2O=D-глюкоза + D-галактоза». [ЭК:3.2.1.108]
синоним: «активность лактазно-флоризингидролазы» ШИРОКИЙ [EC:3.2.1.108]
синоним: «активность лактозогалактогидролазы» ТОЧНО [EC:3.2.1.108]
xref: EC:3.2.1.108
xref: MetaCyc:LACTASE-RXN
xref: Реактом: 20536
is_a: GO:0004553 ! гидролазная активность, гидролизующая О-гликозильные соединения

Источник данных: [10]

Аннотация [ править ]

Аннотация генома включает в себя практику сбора данных о продукте гена, и для этого в аннотациях GO используются термины из GO. Аннотации кураторов GO интегрируются и распространяются на веб-сайте GO, где их можно скачать напрямую или просмотреть онлайн с помощью AmiGO. [11] Помимо идентификатора генного продукта и соответствующего термина GO, аннотации GO содержат как минимум следующие данные:Ссылка , использованная для создания аннотации (например, журнальная статья); Код доказательства, обозначающий тип доказательства, на котором основана аннотация; Дата и автор аннотации

В аннотацию GO также может быть включена вспомогательная информация, в зависимости от термина GO и используемых доказательств, а также дополнительная информация, такая как условия, при которых функция наблюдается.

Код свидетельства происходит из контролируемого словаря кодов, Онтологии кода свидетельства, охватывающего как ручные, так и автоматизированные методы аннотации. [12] Например, «Прослеживаемое заявление автора» (TAS) означает, что куратор прочитал опубликованную научную статью, и метаданные этой аннотации содержат ссылку на эту статью; «Вывод на основе сходства последовательностей» (ISS) означает, что куратор-человек рассмотрел результаты поиска по сходству последовательностей и подтвердил, что они биологически значимы. Аннотации из автоматизированных процессов (например, переназначение аннотаций, созданных с использованием другого словаря аннотаций) получают код, полученный из электронных аннотаций (IEA). В 2010 году более 98% всех аннотаций GO были выведены вычислительным путем, а не кураторами, но по состоянию на 2 июля 2019 года только около 30% всех аннотаций GO были выведены вычислительным путем. [13] [14] Поскольку эти аннотации не проверяются человеком, Консорциум GO считает их немного менее надежными и, как правило, относятся к более высокому уровню и менее подробным терминам. Полные наборы данных аннотаций можно загрузить с веб-сайта GO. Для поддержки разработки аннотаций Консорциум GO проводит семинары и обучает новые группы кураторов и разработчиков.

Многие алгоритмы машинного обучения были разработаны и реализованы для прогнозирования аннотаций генной онтологии. [15] [16]

Пример аннотации [ править ]

Генный продукт: актин, альфа сердечной мышцы 1, UniProtKB:P68032.
Термин ГО: сокращение сердца; GO:0060047 (биологический процесс)
Код доказательства: Выведено на основе мутантного фенотипа (IMP).
Ссылка: ПМИД   17611253
Назначено: UniProtKB, 6 июня 2008 г.

Источник данных: [17]

Инструменты [ править ]

Существует большое количество инструментов, доступных как онлайн, так и для загрузки, которые используют данные, предоставленные проектом GO. [18] Подавляющее большинство из них поступает от третьих лиц; Консорциум GO разрабатывает и поддерживает два инструмента: AmiGO и OBO-Edit.

Друг [19] [11] — это веб-приложение, которое позволяет пользователям запрашивать, просматривать и визуализировать онтологии и данные аннотаций генных продуктов. Он также имеет инструмент BLAST , [20] инструменты, позволяющие анализировать большие наборы данных, [21] [22] и интерфейс для прямого запроса к базе данных GO. [23] AmiGO можно использовать онлайн на веб-сайте GO для доступа к данным, предоставленным Консорциумом GO, или загрузить и установить для локального использования в любой базе данных, использующей схему базы данных GO (например, [24] ). Это бесплатное программное обеспечение с открытым исходным кодом , доступное как часть дистрибутива программного обеспечения go-dev. [25]

OBO-Edit — это независимый от платформы редактор онтологий с открытым исходным кодом, разработанный и поддерживаемый Консорциумом Gene Ontology. [26] Он реализован на Java и использует графо-ориентированный подход для отображения и редактирования онтологий. OBO-Edit включает в себя комплексный интерфейс поиска и фильтрации с возможностью отображать подмножества терминов, чтобы сделать их визуально различимыми; Пользовательский интерфейс также можно настроить в соответствии с предпочтениями пользователя. OBO-Edit также имеет модуль рассуждения , который может выводить ссылки, которые не были явно указаны, на основе существующих отношений и их свойств. Хотя OBO-Edit был разработан для биомедицинских онтологий, его можно использовать для просмотра, поиска и редактирования любой онтологии. Он доступен для бесплатного скачивания. [25]

Consortium[editКонсорциум

Консорциум генной онтологии — это совокупность биологических баз данных и исследовательских групп, активно участвующих в проекте генной онтологии. [14] Сюда входит ряд баз данных модельных организмов и баз данных многовидовых белков , группы разработчиков программного обеспечения и специальная редакция.

См. также [ править ]

Ссылки [ править ]

  1. ^ Консорциум генной онтологии (январь 2008 г.). «Проект Генной Онтологии в 2008 году» . Исследования нуклеиновых кислот . 36 (Проблема с базой данных): D440–4. дои : 10.1093/нар/gkm883 . ПМК   2238979 . ПМИД   17984083 .
  2. ^ Дессимо, Кристоф ; Шкунца, Нивес, ред. (2017). Справочник по онтологии генов . Методы молекулярной биологии. Том. 1446. дои : 10.1007/978-1-4939-3743-1 . ISBN  9781493937431 . ISSN   1064-3745 . S2CID   3708801 . Значок открытого доступа
  3. ^ Годе, Паскаль; Шкунка, Нивес; Ху, Джеймс С.; Дессимо, Кристоф (2017). «Букварь по онтологии генов». Справочник по онтологии генов . Методы молекулярной биологии. Том. 1446. стр. 25–37. дои : 10.1007/978-1-4939-3743-1_3 . ISBN  978-1-4939-3741-7 . ISSN   1064-3745 . ПМК   6377150 . ПМИД   27812933 .
  4. ^ Смит Б, Эшбернер М, Росс С, Бард Дж, Баг В, Цестерс В, Голдберг Л.Дж., Эйлбек К., Ирландия А, Мангалл С.Дж., Леонтис Н., Рокка-Серра П., Руттенберг А., Сансоне С.А., Шойерманн Р.Х., Шах Н., Ветцель П.Л., Льюис С. (ноябрь 2007 г.). «The OBO Foundry: скоординированная эволюция онтологий для поддержки интеграции биомедицинских данных» . Природная биотехнология . 25 (11): 1251–5. дои : 10.1038/nbt1346 . ПМК   2814061 . ПМИД   17989687 .
  5. ^ Эшбернер М, Болл К.А., Блейк Дж.А. , Ботштейн Д., Батлер Х., Черри Дж.М., Дэвис А.П., Долински К., Дуайт С.С., Эппиг Дж.Т., Харрис М.А., Хилл Д.П., Иссель-Тарвер Л., Касарскис А., Льюис С., Матезе Дж.К., Ричардсон Дж. Э., Рингвальд М., Рубин Г. М., Шерлок Дж. (май 2000 г.). «Онтология генов: инструмент для объединения биологии. Консорциум генной онтологии» . Природная генетика . 25 (1): 25–9. дои : 10.1038/75556 . ПМК   3037419 . ПМИД   10802651 .
  6. ^ Перейти обратно: а б с «Ресурс генной онтологии» . Консорциум онтологий генов.
  7. ^ Деб, Б. (2012). «Онтологический анализ некоторых биологических онтологий» . Границы генетики . 3 : 269. дои : 10.3389/fgene.2012.00269 . ПМК   3509948 . ПМИД   23226158 .
  8. ^ Лавинг, Рут К. (2017). «Какой вклад научное сообщество в онтологию генов?». В Дессимозе, С; Скунка, Н. (ред.). Справочник по онтологии генов . Методы молекулярной биологии. Том. 1446. Спрингер (Нью-Йорк). стр. 85–93. дои : 10.1007/978-1-4939-3743-1_7 . ISBN  978-1-4939-3741-7 . ISSN   1064-3745 . ПМИД   27812937 . S2CID   4924457 .
  9. ^ Диль А.Д., Ли Дж.А., Шойерманн Р.Х., Блейк Дж.А. (апрель 2007 г.). «Разработка онтологий биологических систем: иммунология» . Биоинформатика . 23 (7): 913–5. doi : 10.1093/биоинформатика/btm029 . ПМИД   17267433 .
  10. ^ «Руководство по AmiGO 2: Страница терминов» . Wiki Консорциума онтологии генов . 10 июля 2013 г.
  11. ^ Перейти обратно: а б AmiGO — текущий официальный веб-набор инструментов для поиска и просмотра базы данных Gene Ontology.
  12. ^ «Онтология кода доказательств» . Онтология кода доказательств.
  13. ^ дю Плесси Л., Скунка Н., Дессимоз С. (ноябрь 2011 г.). «Что, где, как и почему в онтологии генов — учебник для биоинформатиков» . Брифинги по биоинформатике . 12 (6): 723–35. дои : 10.1093/нагрудник/bbr002 . ПМК   3220872 . ПМИД   21330331 .
  14. ^ Перейти обратно: а б «Консорциум ГО» . Архивировано из оригинала 2 июля 2014 г. Проверено 16 марта 2009 г.
  15. ^ Пиноли П., Чикко Д., Массероли М. (июнь 2013 г.). «Вычислительные алгоритмы для прогнозирования аннотации онтологии генов» . БМК Биоинформатика . 16 (6): С4. дои : 10.1186/1471-2105-16-S6-S4 . ПМЦ   4416163 . ПМИД   25916950 .
  16. ^ Коццетто, Доменико; Джонс, Дэвид Т. (2017). «Вычислительные методы переноса аннотаций из последовательности». В Дессимозе, С; Скунка, Н. (ред.). Справочник по онтологии генов . Методы молекулярной биологии. Том. 1446. Спрингер (Нью-Йорк). стр. 55–67. дои : 10.1007/978-1-4939-3743-1_5 . ISBN  978-1-4939-3741-7 . ISSN   1064-3745 . ПМИД   27812935 .
  17. ^ Консорциум GO (16 марта 2009 г.). «AmiGO: Ассоциации P68032» .
  18. ^ Москера Х.Л., Санчес-Пла А (июль 2008 г.). «SerbGO: в поисках лучшего инструмента GO» . Исследования нуклеиновых кислот . 36 (проблема с веб-сервером): W368–71. дои : 10.1093/нар/gkn256 . ПМЦ   2447766 . ПМИД   18480123 .
  19. ^ Карбон С., Ирландия А., Мангалл С.Дж., Шу С., Маршалл Б., Льюис С. (январь 2009 г.). «AmiGO: онлайн-доступ к данным онтологий и аннотаций» . Биоинформатика . 25 (2). Хаб АмиГО; Рабочая группа по веб-присутствию: 288–9. doi : 10.1093/биоинформатика/btn615 . ПМК   2639003 . ПМИД   19033274 .
  20. ^ «Инструмент AmiGO BLAST» . Архивировано из оригинала 20 августа 2011 г. Проверено 13 марта 2009 г.
  21. ^ Инструмент расширения терминов AmiGO. Архивировано 7 апреля 2008 г. в Wayback Machine ; находит важные общие термины GO в наборе аннотаций
  22. ^ AmiGO Slimmer. Архивировано 29 сентября 2011 г. в Wayback Machine ; отображает подробные аннотации до терминов высокого уровня
  23. ^ GOOSE. Архивировано 1 марта 2009 г. в Wayback Machine , GO Online SQL Environment; позволяет выполнять прямые SQL-запросы к базе данных GO.
  24. ^ Консорциум онтологии растений (16 марта 2009 г.). «Консорциум онтологии растений» . Проверено 16 марта 2009 г.
  25. ^ Перейти обратно: а б «Загрузка онтологии генов на SourceForge» . Проверено 16 марта 2009 г.
  26. ^ Дэй-Рихтер Дж., Харрис М.А., Гендель М., Льюис С. (август 2007 г.). «OBO-Edit — редактор онтологий для биологов» . Биоинформатика . 23 (16): 2198–200. doi : 10.1093/биоинформатика/btm112 . ПМИД   17545183 .

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: ca202f1c9d09729b7a861594f6dbbe3f__1716553800
URL1:https://arc.ask3.ru/arc/aa/ca/3f/ca202f1c9d09729b7a861594f6dbbe3f.html
Заголовок, (Title) документа по адресу, URL1:
Gene Ontology - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)