Генная сеть
в этой статье Использование внешних ссылок может не соответствовать политике и рекомендациям Википедии . ( декабрь 2021 г. ) |
Разработчик(и) | Команда разработчиков GeneNetwork, Университет Теннесси |
---|---|
Первоначальный выпуск | 15 января 1994 г |
Стабильная версия | 2.0 / 29 мая 2016 г |
Репозиторий | github |
Написано в | JavaScript , HTML , Python , CSS , CoffeeScript , PHP |
Лицензия | Я беру с собой Генеральную общественную лицензию |
Веб-сайт | www |
GeneNetwork — это комбинированная база данных и данных с открытым исходным кодом биоинформатических программный ресурс для анализа для системной генетики . [1] Этот ресурс используется для изучения сетей регуляции генов , которые связывают различия в последовательностях ДНК с соответствующими различиями в экспрессии генов и белков, а также с вариациями таких характеристик, как здоровье и риск заболеваний. Наборы данных в GeneNetwork обычно состоят из больших коллекций генотипов (например, SNP ) и фенотипов групп людей, включая людей, линии мышей и крыс, а также таких разнообразных организмов, как Drosophila melanogaster , Arabidopsis thaliana и ячмень . [2] Включение генотипов делает практичным проведение веб- картирования генов для обнаружения тех областей геномов, которые способствуют различиям между людьми в уровнях мРНК, белка и метаболитов, а также различиям в клеточных функциях, анатомии, физиологии и поведении. .
История
[ редактировать ]Разработка GeneNetwork началась в Центре медицинских наук Университета Теннесси в 1994 году как веб-версия Портативного словаря генома мыши (1994) . [3] GeneNetwork — это первый и самый продолжительный непрерывно действующий веб-сервис в области биомедицинских исследований [см. https://en.wikipedia.org/wiki/List_of_websites_founded_before_1995 ]. В 1999 году Портативный генный словарь был объединен с картографической программой Кеннета Ф. Мэнли Map Manager QT для создания онлайн-системы для генетического анализа в реальном времени. [4] В начале 2003 года были включены первые большие Affymetrix наборы данных об экспрессии генов (мРНК всего мозга мыши и гемопоэтические стволовые клетки), и система была переименована в WebQTL. [5] [6] GeneNetwork в настоящее время разрабатывается международной группой разработчиков и имеет зеркала и сайты разработки в Европе, Азии и Австралии. Производственные службы размещаются в системах Центра медицинских наук Университета Теннесси с резервным экземпляром в Европе.
Текущая производственная версия GeneNetwork (также известная как GN2) была выпущена в 2016 году. [7] Текущая версия GeneNetwork использует ту же базу данных, что и ее предшественница GN1, но имеет гораздо более модульный и удобный в обслуживании открытый исходный код (доступен на GitHub ). GeneNetwork теперь также имеет важные новые функции, включая поддержку:
- Генетически сложные популяции с использованием линейной смешанной модели, реализованной с помощью обновленной версии GEMMA , [8]
- Модули R/qtl со множеством вариантов картирования, включая картирование 4-сторонних перекрестков и гетерогенного запаса.
- Анализ сети взвешенной корреляции , также известный как WGCNA
- Cytoscape Сетевой дисплей
- Картирование локусов коррелирующих признаков [9]
- Браузер генома для отображения генетических и геномных данных на основе Biodalliance.
- Связанные модули с веб-сервером байесовской сети , [10] для причинно-следственного моделирования
Организация и использование
[ редактировать ]GeneNetwork состоит из двух основных компонентов:
- Огромные коллекции генетических, геномных и фенотипических данных для больших групп людей.
- Сложное программное обеспечение для статистического анализа и картирования генов, которое позволяет анализировать молекулярные и клеточные сети и отношения генотипа к фенотипу.
Для каждой семьи или популяции обычно получают четыре уровня данных:
- Последовательности ДНК и генотипы
- Данные о молекулярной экспрессии часто генерируются с использованием массивов , секвенирования РНК , эпигеномных, протеомных, метаболомных и метагеномных методов (молекулярные фенотипы).
- Стандартные количественные фенотипы , которые часто являются частью типичной медицинской документации (например, биохимический анализ крови, масса тела)
- Файлы аннотаций и метаданные для признаков и наборов данных.
Объединенные типы данных хранятся вместе в реляционной базе данных и файловом сервере IPSF, концептуально организованы и сгруппированы по видам, когортам и семействам. Система реализована как стек LAMP (программный пакет) . Код и упрощенная версия базы данных MariaDB доступны на GitHub .
GeneNetwork в основном используется исследователями, но также успешно применяется на курсах бакалавриата и магистратуры по генетике и биоинформатике (см. пример на YouTube ), биоинформатике, физиологии и психологии. [11] Исследователи и студенты обычно извлекают наборы генотипов и фенотипов из одной или нескольких семей и используют встроенные статистические и картографические функции для изучения отношений между переменными и построения сетей ассоциаций. Ключевые этапы включают анализ следующих факторов:
- Диапазон изменения признаков
- Ковариация между признаками (диаграммы рассеяния и корреляции, анализ главных компонент)
- Архитектура более крупных сетей признаков
- Количественное картирование локуса признаков и причинно-следственные модели связи между различиями последовательностей и различиями фенотипов
Источники данных
[ редактировать ]Наборы данных о признаках и молекулярной экспрессии предоставляются исследователями напрямую или извлекаются из таких репозиториев, как Национальный центр биотехнологической информации Gene Expression Omnibus. Данные охватывают множество клеток и тканей — от отдельных популяций клеток иммунной системы, конкретных тканей (сетчатка, префронтальная кора) до целых систем (весь мозг, легкие, мышцы, сердце, жир, почки, цветы, целые эмбрионы растений). . Типичный набор данных охватывает сотни полностью генотипированных людей и может также включать технические и биологические повторы. Генотипы и фенотипы обычно берутся из рецензируемых статей. GeneNetwork включает файлы аннотаций для нескольких платформ профилирования РНК (Affymetrix, Illumina и Agilent). РНК-секвенирование и количественные протеомные, метаболомные, эпигенетические и метагеномные данные также доступны для нескольких видов, включая мышь и человека.
Инструменты и возможности
[ редактировать ]На сайте представлены инструменты для широкого спектра функций: от простого графического отображения вариаций экспрессии генов или других фенотипов, диаграмм рассеяния пар признаков (Пирсона или рангового порядка), построения как простых, так и сложных сетевых графиков, анализа. основных компонентов и синтетических признаков, картирование QTL с использованием маркерной регрессии, картирование интервалов и парное сканирование для эпистатических взаимодействий. Большинство функций работают с 100 признаками, а некоторые функции работают со всем транскриптомом .
Базу данных можно просматривать и искать на главной странице поиска . онлайн- учебник Доступен . Пользователи также могут загружать первичные наборы данных в виде текстовых файлов Excel или, в случае сетевых графиков, в формате SBML . По состоянию на 2017 год GN2 доступен в виде бета-версии.
Код
[ редактировать ]GeneNetwork — это проект с открытым исходным кодом, выпущенный под лицензией Affero General Public License (AGPLv3). Большая часть кода написана на Python, но включает модули и другой код, написанный на C, R и JavaScript. Код в основном Python 2.4. GN2 в основном написан на Python 2.7 в среде Flask с HTML-шаблонами Jinja 2), но в ближайшие несколько лет запланирован переход на Python 3.X. GN2 вызывает множество статистических процедур, написанных на языке программирования R. Оригинальный исходный код от 2010 года вместе с компактной базой данных доступен на SourceForge . Хотя GN1 активно поддерживался на GitHub в 2019 году , с 2020 года вся работа сосредоточена на GN2 .
См. также
[ редактировать ]- Вычислительная геномика
- Цитоскейп
- KEGG (Киотская энциклопедия генов и геномов)
- Реактом
- WikiPathways
Ссылки
[ редактировать ]- ^ Морахан, Дж; Уильямс, RW (2007). «Системная генетика: следующее поколение генетических исследований?». Расшифровка геномного контроля иммунных реакций . Симпозиумы Фонда Новартис. Том. 281. стр. 181–8, обсуждение 188–91, 208–9. дои : 10.1002/9780470062128.ch15 . ISBN 9780470062128 . ПМИД 17534074 .
{{cite book}}
:|journal=
игнорируется ( помогите ) - ^ Друка, А; Друка, я; Сентено, АГ; Ли, Х; Солнце, З; Томас, WT; Бонар, Н; Стеффенсон, Би Джей; Ульрих, SE; Кляйнхофс, Андрис; Уайз, Роджер П.; Клоуз, Тимоти Дж; Потокина, Елена; Ло, Цзевэй; Вагнер, Карола; Швейцер, Гюнтер Ф; Маршалл, Дэвид Ф; Кирси, Майкл Дж; Уильямс, Роберт В.; Во, Робби (2008). «На пути к системному генетическому анализу ячменя: интеграция данных фенотипа, экспрессии и генотипа в GeneNetwork» . БМК Генетика . 9:73 . дои : 10.1186/1471-2156-9-73 . ПМЦ 2630324 . ПМИД 19017390 .
- ^ Уильямс, RW (1994). «Портативный словарь генома мыши: персональная база данных для картирования генов и молекулярной биологии». Геном млекопитающих . 5 (6): 372–5. дои : 10.1007/bf00356557 . ПМИД 8043953 . S2CID 655396 .
- ^ Чеслер, Э.Дж.; Лу, Л; Ван, Дж; Уильямс, RW; Мэнли, К.Ф. (2004). «WebQTL: быстрый исследовательский анализ экспрессии генов и генетических сетей мозга и поведения». Природная неврология . 7 (5): 485–6. дои : 10.1038/nn0504-485 . ПМИД 15114364 . S2CID 20241963 .
- ^ Чеслер, Э.Дж.; Лу, Л; Шоу, С; Цюй, Ю; Гу, Дж; Ван, Дж; Сюй, ХК; Маунтц, доктор юридических наук; и др. (2005). «Комплексный анализ экспрессии генов обнаруживает полигенные и плейотропные сети, которые модулируют функцию нервной системы». Природная генетика . 37 (3): 233–42. дои : 10.1038/ng1518 . ПМИД 15711545 . S2CID 13189340 .
- ^ Быстрых, Л; Версинг, Э; Донтье, Б; Саттон, С; Плетчер, Монтана; Уилтшир, Т; Су, А.И.; Велленга, Э; и др. (2005). «Раскрытие регуляторных путей, влияющих на функцию гемопоэтических стволовых клеток, с помощью «генетической геномики» ». Природная генетика . 37 (3): 225–32. дои : 10.1038/ng1497 . ПМИД 15711547 . S2CID 5622506 .
- ^ Слоан, З. (2016). «GeneNetwork: основа для веб-генетики» . Журнал программного обеспечения с открытым исходным кодом . 1 (2): 25. Бибкод : 2016JOSS....1...25S . дои : 10.21105/joss.00025 .
- ^ Чжоу, X (2014). «Эффективные многомерные алгоритмы линейной смешанной модели для полногеномных исследований ассоциаций» . Природные методы . 11 (2): 407–9. дои : 10.1038/nmeth.2848 . ПМК 4211878 . ПМИД 24531419 .
- ^ Арендс, Д. (2016). «Картирование локусов корреляционных признаков (CTL): вывод сети фенотипов в зависимости от генотипа» . Журнал программного обеспечения с открытым исходным кодом . 1 (6): 87. Бибкод : 2016JOSS....1...87A . дои : 10.21105/joss.00087 .
- ^ Зибарт, JD (2013). «Веб-сервер байесовской сети: комплексный инструмент для моделирования биологических сетей» . Биоинформатика . 29 (2 1): 2803–3. doi : 10.1093/биоинформатика/btt472 . ПМИД 23969134 .
- ^ Гришэм, В; Шоттлер, Северная Каролина; Валли-Марилл, Дж; Бек, Л; Битти, Дж (2010). «Преподавание биоинформатики и нейроинформатики с использованием бесплатных веб-инструментов» . CBE: Образование в области наук о жизни . 9 (2): 98–107. дои : 10.1187/cbe.09-11-0079 . ПМЦ 2879386 . ПМИД 20516355 .
Внешние ссылки
[ редактировать ]- Связанные ресурсы
Другие системы генетики и сетевые базы данных