КЕГГ
Содержание | |
---|---|
Описание | Биоинформатический ресурс для расшифровки генома |
Организмы | Все |
Контакт | |
Исследовательский центр | Киотский университет |
Лаборатория | Лаборатории Канеиса |
Первичное цитирование | ПМИД 10592173 |
Дата выпуска | 1995 |
Доступ | |
Веб-сайт | www |
веб-службы URL-адрес | ОТДЫХ см. KEGG API |
Инструменты | |
Интернет | КЕГГ картограф |
KEGG ( Киотская энциклопедия генов и геномов ) представляет собой собрание баз данных, посвященных геномам , биологическим путям , болезням , лекарствам и химическим веществам . KEGG используется для исследований и обучения в области биоинформатики , включая анализ данных в области геномики , метагеномики , метаболомики и других омических исследований, моделирования и симуляции в системной биологии , а также трансляционных исследований при разработке лекарств .
Проект базы данных KEGG был инициирован в 1995 году Минору Канехисой , профессором Института химических исследований Киотского университета , в рамках действующей тогда японской программы генома человека . [1] [2] Предвидя потребность в компьютеризированном ресурсе, который можно было бы использовать для биологической интерпретации данных о последовательностях генома , он начал разработку базы данных KEGG PATHWAY. Это коллекция нарисованных вручную карт путей KEGG, отражающих экспериментальные знания о метаболизме и различных других функциях клетки и организма . Каждая карта путей содержит сеть молекулярных взаимодействий и реакций и предназначена для связи генов в геноме с генными продуктами (в основном белками ) на этом пути. Это позволило провести анализ под названием «Картирование путей KEGG», в ходе которого содержание генов в геноме сравнивается с базой данных KEGG PATHWAY, чтобы определить, какие пути и связанные с ними функции могут быть закодированы в геноме.
По словам разработчиков, KEGG — это «компьютерное представление» биологической системы . [3] Он объединяет строительные блоки и схемы соединений системы, а точнее, генетические строительные блоки генов и белков, химические строительные блоки малых молекул и реакций, а также схемы соединений молекулярных взаимодействий и реакционных сетей. Эта концепция реализована в следующих базах данных KEGG, которые разделены на системную, геномную, химическую и медицинскую информацию. [4]
- Информация о системе
- ПУТЬ: карты путей клеточных и организменных функций.
- МОДУЛЬ: модули или функциональные единицы генов.
- BRITE: иерархические классификации биологических объектов
- Геномная информация
- ГЕНОМ: полные геномы
- ГЕНЫ: гены и белки в полных геномах.
- ОРТОЛОГИЯ: группы ортологов генов в полных геномах.
- Химическая информация
- СОЕДИНЕНИЕ, ГЛИКАН: химические соединения и гликаны.
- РЕАКЦИЯ, RPAIR, RCLASS: химические реакции.
- ФЕРМЕНТ: номенклатура ферментов
- Информация о здоровье
- БОЛЕЗНИ: болезни человека
- ПРЕПАРАТ: разрешенные препараты
- ENVIRON: необработанные лекарства и вещества, полезные для здоровья
Базы данных [ править ]
Информация о системе [ править ]
База данных KEGG PATHWAY, база данных электрических схем, является ядром ресурса KEGG. Это коллекция карт путей, объединяющая множество объектов, включая гены, белки, РНК, химические соединения, гликаны и химические реакции, а также гены болезней и мишени лекарств, которые хранятся в виде отдельных записей в других базах данных KEGG. Карты маршрутов разделены на следующие разделы:
- Метаболизм
- Обработка генетической информации ( транскрипция , трансляция , репликация и репарация и т. д.)
- Обработка информации окружающей среды ( мембранный транспорт , передача сигнала и т. д.)
- Клеточные процессы ( рост клеток , гибель клеток , клеточных мембран и т. д.) функции
- Системы организма ( иммунная система , эндокринная система , нервная система и др.)
- человека Болезни
- Разработка лекарств
В разделе «Метаболизм» помимо обычных карт метаболических путей представлены эстетически нарисованные глобальные карты, показывающие общую картину обмена веществ. Глобальные карты низкого разрешения можно использовать, например, для сравнения метаболических способностей различных организмов в геномных исследованиях и различных образцов окружающей среды в метагеномных исследованиях. Напротив, модули KEGG в базе данных KEGG MODULE представляют собой локализованные схемы соединений с более высоким разрешением, представляющие более узкие функциональные единицы в карте путей, такие как подпути, консервативные среди определенных групп организмов и молекулярных комплексов. Модули KEGG определяются как характерные наборы генов, которые можно связать с конкретными метаболическими способностями и другими фенотипическими особенностями, чтобы их можно было использовать для автоматической интерпретации данных генома и метагенома.
Еще одна база данных, дополняющая KEGG PATHWAY, — это база данных KEGG BRITE. Это база данных онтологий , содержащая иерархические классификации различных объектов, включая гены, белки, организмы, болезни, лекарства и химические соединения. В то время как KEGG PATHWAY ограничивается молекулярными взаимодействиями и реакциями этих объектов, KEGG BRITE включает в себя множество различных типов отношений.
Геномная информация [ править ]
Через несколько месяцев после начала проекта KEGG в 1995 году первый отчет о полностью секвенированном бактериальном геноме. был опубликован [5] С тех пор все опубликованные полные геномы аккумулируются в KEGG как эукариотов , так и прокариотов . База данных KEGG GENES содержит информацию на уровне генов/белков, а база данных KEGG GENOME содержит информацию об этих геномах на уровне организма. База данных KEGG GENES состоит из наборов генов для полных геномов, и генам в каждом наборе даны аннотации в форме установления соответствий схемам соединений карт путей KEGG, модулей KEGG и иерархий BRITE.
Эти соответствия производятся с использованием концепции ортологов . Карты путей KEGG составлены на основе экспериментальных данных на конкретных организмах, но они предназначены для применимости и к другим организмам, поскольку разные организмы, такие как человек и мышь, часто имеют одинаковые пути, состоящие из функционально идентичных генов, называемых ортологичными генами или ортологи. Все гены в базе данных KEGG GENES группируются в такие ортологи в базе данных KEGG ORTHOLOGY (KO). Поскольку узлам (генным продуктам) карт путей KEGG, а также модулям KEGG и иерархиям BRITE присваиваются идентификаторы KO, соответствия устанавливаются после того, как гены в геноме аннотируются идентификаторами KO с помощью процедуры аннотации генома в KEGG. [4]
Химическая информация [ править ]
Карты метаболических путей KEGG составлены для представления двух аспектов метаболической сети: геномной сети того, как закодированные в геноме ферменты соединяются, чтобы катализировать последовательные реакции, и химической сети того, как химические структуры субстратов и продуктов трансформируются этими реакциями. [6] Набор генов ферментов в геноме будет идентифицировать сети взаимоотношений ферментов при наложении на карты путей KEGG, которые, в свою очередь, характеризуют сети трансформации химической структуры, позволяя интерпретировать потенциалы биосинтеза и биодеградации организма. Альтернативно, набор метаболитов, идентифицированных в метаболоме, приведет к пониманию ферментативных путей и задействованных ферментных генов.
Базы данных в категории химической информации, которые в совокупности называются KEGG LIGAND, организованы путем сбора знаний о химической сети. В начале проекта KEGG KEGG LIGAND состоял из трех баз данных: KEGG COMPOUND для химических соединений, KEGG REACTION для химических реакций и KEGG ENZYME для реакций по номенклатуре ферментов. [7] В настоящее время существуют дополнительные базы данных: KEGG GLYCAN для гликанов. [8] и две вспомогательные базы данных реакций, называемые RPAIR (выравнивание пар реагентов) и RCLASS (класс реакции). [9] KEGG COMPOUND также был расширен за счет включения в него, таких как ксенобиотики помимо метаболитов, различных соединений, .
Информация о здоровье [ править ]
В KEGG болезни рассматриваются как нарушенные состояния биологической системы, вызванные возмущающими факторами генетических факторов и факторов окружающей среды, а лекарства рассматриваются как различные типы возмущающих факторов. [10] База данных KEGG PATHWAY включает не только нормальные, но и нарушенные состояния биологических систем. Однако для большинства заболеваний невозможно составить карты путей развития заболеваний, поскольку молекулярные механизмы недостаточно изучены. Альтернативный подход использован в базе данных KEGG DISEASE, которая просто каталогизирует известные генетические факторы и факторы окружающей среды заболеваний. Эти каталоги могут в конечном итоге привести к созданию более полных электрических схем заболеваний.
База данных KEGG DRUG содержит активные ингредиенты в одобренных препаратов Японии, США и Европе. Они различаются химическими структурами и/или химическими компонентами и связаны с молекулами- мишенями , метаболизирующими ферментами и другой информацией о сети молекулярных взаимодействий в картах путей KEGG и иерархиях BRITE. Это позволяет проводить комплексный анализ взаимодействия лекарств с геномной информацией. Необработанные лекарственные средства и другие вещества, полезные для здоровья, не входящие в категорию одобренных лекарств, хранятся в базе данных KEGG ENVIRON. Базы данных категории медицинской информации называются KEGG MEDICUS и включают в себя также вкладыши ко всем лекарствам, продаваемым в Японии.
Модель подписки [ править ]
В июле 2011 года KEGG представила модель подписки для загрузки по FTP из-за значительного сокращения государственного финансирования. KEGG по-прежнему доступен бесплатно через свой веб-сайт, но модель подписки вызвала дискуссии об устойчивости баз данных биоинформатики. [11] [12]
См. также [ править ]
- База данных сравнительной токсикогеномики - CTD объединяет пути KEGG с токсикогеномными данными и данными о заболеваниях.
- ConsensusPathDB , база данных молекулярных функциональных взаимодействий, объединяющая информацию из KEGG.
- Генная онтология (GO)
- ПабМед
- Юнипрот
- База данных генных заболеваний
Ссылки [ править ]
- ^ Канехиса М., Гото С. (2000). «KEGG: Киотская энциклопедия генов и геномов» . Нуклеиновые кислоты Рез . 28 (1): 27–30. дои : 10.1093/нар/28.1.27 . ПМЦ 102409 . ПМИД 10592173 .
- ^ Канехиса М (1997). «База данных для постгеномного анализа». Тенденции Жене . 13 (9): 375–6. дои : 10.1016/S0168-9525(97)01223-7 . ПМИД 9287494 .
- ^ Канехиса М., Гото С., Хаттори М., Аоки-Киношита К.Ф., Ито М., Кавасима С., Катаяма Т., Араки М., Хиракава М. (2006). «От геномики к химической геномике: новые разработки в KEGG» . Нуклеиновые кислоты Рез . 34 (Проблема с базой данных): D354–7. дои : 10.1093/nar/gkj102 . ПМЦ 1347464 . ПМИД 16381885 .
- ↑ Перейти обратно: Перейти обратно: а б Канехиса М., Гото С., Сато Ю., Кавасима М., Фурумичи М., Танабэ М. (2014). «Данные, информация, знания и принципы: вернемся к метаболизму в KEGG» . Нуклеиновые кислоты Рез . 42 (Проблема с базой данных): D199–205. дои : 10.1093/нар/gkt1076 . ПМЦ 3965122 . ПМИД 24214961 .
- ^ Флейшманн Р.Д., Адамс М.Д., Уайт О., Клейтон Р.А., Киркнесс Э.Ф., Керлаваж А.Р., Балт С.Дж., Томб Дж.Ф., Догерти Б.А., Меррик Дж.М. и др. (1995). «Полногеномное случайное секвенирование и сборка Haemophilus influenzae Rd». Наука . 269 (5223): 496–512. Бибкод : 1995Sci...269..496F . дои : 10.1126/science.7542800 . ПМИД 7542800 . S2CID 10423613 .
- ^ Канехиса М (2013). «Химическая и геномная эволюция сетей реакций, катализируемых ферментами». ФЭБС Летт . 587 (17): 2731–7. дои : 10.1016/j.febslet.2013.06.026 . hdl : 2433/178762 . ПМИД 23816707 . S2CID 40074657 .
- ^ Гото С., Нисиока Т., Канехиса М. (1999). «База данных LIGAND по ферментам, соединениям и реакциям» . Нуклеиновые кислоты Рез . 27 (1): 377–9. дои : 10.1093/нар/27.1.377 . ПМК 148189 . ПМИД 9847234 .
- ^ Хасимото К., Гото С., Кавано С., Аоки-Киношита К.Ф., Уэда Н., Хамадзима М., Кавасаки Т., Канехиса М. (2006). «KEGG как ресурс информатики гликома» . Гликобиология . 16 (5): 63р–70р. дои : 10.1093/гликоб/cwj010 . ПМИД 16014746 .
- ^ Муто А., Котера М., Токимацу Т., Накагава З., Гото С., Канехиса М. (2013). «Модульная архитектура метаболических путей, выявленная консервативными последовательностями реакций» . Модель J Chem Inf . 53 (3): 613–22. дои : 10.1021/ci3005379 . ПМК 3632090 . ПМИД 23384306 .
- ^ Канехиса М., Гото С., Фурумичи М., Танабэ М., Хиракава М. (2010). «KEGG для представления и анализа молекулярных сетей, связанных с болезнями и лекарствами» . Нуклеиновые кислоты Рез . 38 (Проблема с базой данных): D355–60. дои : 10.1093/нар/gkp896 . ПМК 2808910 . ПМИД 19880382 .
- ^ Гальперин М.Ю., Фернандес-Суарес Х.М. (2012). «Выпуск базы данных исследований нуклеиновых кислот 2012 года и онлайн-коллекция баз данных по молекулярной биологии» . Нуклеиновые кислоты Рез . 40 (Проблема с базой данных): D1–8. дои : 10.1093/nar/gkr1196 . ПМК 3245068 . ПМИД 22144685 .
- ^ Хайден, ЕС (2013). «Популярная база данных растений, взимающая с пользователей плату» . Природа . дои : 10.1038/nature.2013.13642 . S2CID 211729309 .
Внешние ссылки [ править ]
- сайт КЕГГ
- Зеркальный сайт GenomeNet
- Запись о KEGG в MetaBase