Генные карты
Содержание | |
---|---|
Типы данных захвачен | Гены человека и модельные ортологи |
Организмы | Мудрый человек |
Контакт | |
Исследовательский центр | Краунский центр генома человека, WIS |
Первичное цитирование | ПМИД 9097728 |
Доступ | |
Формат данных | HTML |
Веб-сайт | www |
GeneCards — это база данных человеческих генов , которая предоставляет геномную , протеомную , транскриптомную , генетическую и функциональную информацию обо всех известных и предсказанных человеческих генах. [1] [2] [3] [4] Он разрабатывается и поддерживается Центром генома человека Crown при Институте науки Вейцмана в сотрудничестве с LifeMap Sciences.
Целью базы данных является предоставление комплексного представления текущей доступной биомедицинской информации об искомом гене, включая его псевдонимы и идентификаторы, кодируемые белки , связанные с ним заболевания и вариации, его функции, соответствующие публикации и многое другое. [1] [5] [6] База данных GeneCards обеспечивает доступ к бесплатным веб- ресурсам о более чем 350 000 известных и предсказанных генах человека, интегрированных из более чем 150 ресурсов данных, таких как HGNC , Ensembl и NCBI . Основной список генов основан на NCBI, Ensembl и утвержденных символах генов, опубликованных Комитетом по номенклатуре генов HUGO (HGNC). [7] [8] Информация тщательно собирается и отбирается из этих баз данных с помощью механизма интеграции.
Со временем в базе данных GeneCards был разработан набор инструментов (VarElect, GeneALaCart и т. д.), которые обладают более специализированными возможностями использования базы данных. С 1998 года база данных GeneCards широко используется сообществами биоинформатики , геномики и медицины уже более 24 лет. [7] [8]
История
[ редактировать ]С 1980-х годов информации о последовательностях становится все больше; впоследствии многие лаборатории это поняли и стали хранить такую информацию в центральных хранилищах — первичной базе данных. [9] Однако информация, предоставляемая базами данных первичных последовательностей (базами данных более низкого уровня), сосредоточена на различных аспектах. Чтобы собрать эти разрозненные данные, Центр генома человека Crown Института Вейцмана в 1997 году разработал базу данных под названием «GeneCards». Эта база данных в основном касалась информации о геноме человека, человеческих генах, функциях кодируемых белков и связанных с ними заболеваниях, хотя она с этого времени расширился. [1]
Рост
[ редактировать ]Первоначально база данных GeneCards имела две основные функции: предоставление интегрированной биомедицинской информации о гене в формате «карточки» и текстовую поисковую систему . С 1998 года в базу данных интегрировано больше ресурсов данных и типов данных, таких как экспрессия белков и информация о генных сетях. Он также улучшил скорость и сложность поисковой системы и расширился от догмы, ориентированной на гены , до анализа набора генов. Версия 3 базы данных собирает информацию из более чем 90 ресурсов базы данных на основе сводного списка генов. Он также добавил набор инструментов GeneCards, ориентированных на более конкретные цели. «GeneNote и GeneAnnot для анализа транскриптома , GeneLoc для геномных местоположений и маркеров, GeneALaCart для пакетных запросов и GeneDecks для поиска функциональных партнеров и для дистилляции наборов генов». База данных обновляется в течение трехлетнего цикла планирования, внедрения, разработки, полуавтоматического контроля качества и развертывания. Используемые технологии включают в себя Eclipse , Apache , Perl , XML , PHP , Propel, Java , R и MySQL . [7] [8]
Текущие расширения GeneCards
[ редактировать ]Источник: [7]
- Модели животных
- тканей Профилирование протеомики
- РНК гены
- Картирование идентификаторов генов и белков
- Онлайн-аналитическая обработка (OLAP)
Доступность
[ редактировать ]![]() | Этот раздел нуждается в расширении . Вы можете помочь, добавив к нему . ( февраль 2016 г. ) |
организации могут свободно получить доступ к GeneCards Некоммерческие для образовательных и исследовательских целей на https://www.genecards.org/ и на академических зеркальных сайтах . Коммерческое использование требует лицензии. [ нужна ссылка ]
GeneCards Suite
[ редактировать ]ДжинДексс
[ редактировать ]GeneDecks — это новый инструмент анализа для идентификации похожих или партнерских генов, который обеспечивает метрику сходства путем выделения общих дескрипторов между генами на основе уникального богатства комбинаторных аннотаций генов человека GeneCards.
- Комбинаторная аннотация : Используя GeneDecks, можно получить набор похожих генов для конкретного гена с выбранной комбинаторной аннотацией . В сводной таблице ранжированы различные уровни сходства между идентифицированными генами и геном-зондом.
- Унификация аннотаций . Различные источники данных часто предлагают аннотации с разнородной системой именования. обнаружения пространства генов GeneCards Унификация аннотаций GeneDecks основана на сходстве алгоритмов .
- Охота за партнерами : в Partner Hunter от GeneDecks пользователи задают ген-запрос, и система ищет похожие гены на основе комбинаторного сходства взвешенных атрибутов.
- Дистилляция набора . В программе Set Distiller пользователи предоставляют набор генов, а система ранжирует атрибуты по степени их совместного использования в данном наборе генов. Как и Partner Hunter, он позволяет проводить сложные исследования множества наборов генов различного происхождения для обнаружения и выяснения соответствующих биологических закономерностей, тем самым улучшая систематическое изучение геномики и системной биологии. [8] [10] [11]
ДжинАЛаКарт
[ редактировать ]GeneALaCart — это механизм пакетных запросов, ориентированный на набор генов, основанный на популярной базе данных GeneCards. Это позволяет получать информацию о нескольких генах в пакетном запросе. [7] [12]
ДжинЛок
[ редактировать ]Член костюма GeneLoc представляет интегрированную карту хромосом человека , что очень важно для разработки специального чипа захвата , основанного на данных, интегрированных алгоритмом GeneLoc. GeneLoc включает дополнительные ссылки на GeneCards, секвенирование генома человека NCBI, UniGene и ресурсы по картированию. [7] [13]
Использование
[ редактировать ]![]() | Этот раздел написан как руководство или руководство . ( апрель 2019 г. ) |
Поиск
[ редактировать ]Сначала введите поисковый запрос в поле на главной странице. Методы поиска включают ключевые слова, только символ, символ/псевдоним/идентификатор и символ/псевдоним. [5] Опция поиска по умолчанию — поиск по ключевым словам. Когда пользователь выполняет поиск по ключевым словам, отображаются MicroCard и MiniCard. Однако когда пользователь выполняет поиск только по символу, он будет перенаправлен на GeneCard. [14] Поиск можно продолжить, нажав расширенный поиск, где пользователь может напрямую выбрать раздел, категорию, GIFtS, источник символов и наборы генов. Разделы включают псевдонимы и описания, расстройства, лекарства и соединения, экспрессию в тканях человека, функции, геномное расположение, геномные варианты, ортологи, паралоги, пути и взаимодействия, белковые домены/семейства, белки, публикации, сводки и транскрипты. Опция по умолчанию — поиск по всем разделам. [5] Категории включают в себя кодирование белков , псевдогены , гены РНК, генетические локусы , кластеры генов и без категорий. Опция по умолчанию — поиск по всем категориям. [5] GIFtS — это оценка предполагаемой функциональности GeneCards, которая дает объективные цифры, показывающие уровень знаний о функциональности генов человека. Он включает в себя высокий, средний, низкий и пользовательский диапазон. [4] [15] Источники символов включают HGNC ( Комитет по номенклатуре генов HUGO ), EntrezGene (генно-ориентированная информация в NCBI), Ensembl, гены РНК GeneCards, CroW21 и так далее. [5]
Кроме того, пользователь может выбрать поиск «Все карты GeneCard» или «Внутри генного подмножества», что будет более конкретным и приоритетным.
Во-вторых, на странице результатов поиска отображаются все соответствующие мини-карты. На странице отображаются символ, описание, категория, GIFtS, идентификатор GC и оценка. [5] Пользователь может нажать кнопку «плюс» для каждой мини-карты, чтобы открыть мини-карту. Кроме того, пользователь может щелкнуть непосредственно по символу, чтобы просмотреть подробную информацию о конкретной GeneCard.
Содержание GeneCards
[ редактировать ]Источник: [5]
Для конкретной GeneCard (пример: GeneCard для TGFB1 ), он состоит из следующего содержания.
- Заголовок : заголовок состоит из символа гена, категории (т. е. кодирования белка), GIFtS (т. е. 74) и GCID (GC19M041837). Различные категории имеют разные цвета для выражения: кодирующий белок, псевдоген, ген РНК, кластер генов , генетический локус и неклассифицированный. На заднем плане указаны источники символов: утвержденные HGNC гены, база данных EntrezGene, база данных генов Ensembl или гены, сгенерированные GeneCards.
- Псевдонимы : Псевдонимы, как следует из названия, отображают синонимы и псевдонимы гена в соответствии с различными источниками, такими как HGNC. В правом столбце показано, как псевдонимы связаны с ресурсами, а также указаны предыдущие идентификаторы GC.
- Резюме : Левый столбец такой же, как и в столбце «Псевдонимы», где показаны источники. В правом столбце приведена краткая информация о функции гена, его локализации и влиянии на фенотип из различных источников.
- Геномные взгляды : Помимо источников, в этом разделе приведены эталонные последовательности ДНК, регуляторные элементы, эпигенетика, хромосомные группы и геномное расположение различных источников. Красная линия на изображении указывает место установки GeneLoc. В частности, если интегрированное местоположение GeneLoc отличается от местоположения в Entrez Gene, оно отображается зеленым цветом; Синий отображается, когда интегрированное местоположение GeneLoc отличается от местоположения в Ensembl. Подробности о дополнении можно узнать по ссылкам в разделе.
- Белки : в этом разделе представлена аннотированная информация о генах, включая рекомендуемое название, размер, субъединицу, субклеточное расположение и вторичные образцы. посттрансляционные модификации, данные об экспрессии белков, белки REF SEQ, белки ENSEMBL, подробности о белках реактома, продукты рекомбинантных белков человека, онтология генов , продукты антител и продукты анализа. Кроме того, представлены
- Белковые домены/семейства : в этом разделе показана аннотированная информация о белковых доменах и семействах.
- Функция : раздел функций описывает функцию гена, включая: фенотипы человека , связанные мишени, кшРНК для человека и/или мыши/крысы, микроРНК генные мишени РНКи , продукты , микроРНК для ортологов человека и/или мыши/крысы, редактирование генов , клоны , Клеточные линии , модели животных, in situ . гибридизации анализы
- Пути и взаимодействия : в этом разделе показаны унифицированные пути и взаимодействия GeneCards, полученные из разных источников. Унифицированные пути GeneCards собраны в суперпути, которые отображают связь между различными путями. Взаимодействие отображает взаимодействующее лицо и детали взаимодействия.
- Лекарства и соединения : в этом разделе карты GeneCard связаны с лекарствами и соединениями. Соединения показывают химический состав, действие и номер CAS. В DrugBank указаны соединения, синонимы, номер CAS (номер в реестре химических рефератов), тип (транспортер/мишень/носитель/фермент), действия и идентификаторы PubMed. HMDB и Novoseek показывают взаимосвязь химических соединений, которая включает соединение, синонимы, номер CAS и идентификаторы PubMed (статьи, связанные с соединением). BitterDB отображает соединение, номер CAS и SMILES ( упрощенную спецификацию ввода строки молекулярного ввода ). ФармГКБ предоставляет лекарственное средство/соединение и его аннотацию.
- Транскрипты : этот раздел состоит из эталонных последовательностей мРНК, кластера Unigene и репрезентативной последовательности, продуктов микроРНК, продуктов ингибирующей РНК, продуктов клонирования, продуктов праймеров и дополнительных последовательностей мРНК. Кроме того, пользователь может получить структуру экзонов из GeneLoc.
- Выражение : В левом столбце показаны ресурсы данных. В этот раздел включены изображения и данные экспрессии, аналогичные гены, массивы ПЦР, праймеры для анализа гибридизации человека и in situ.
- Ортологи : в этом разделе приведены ортологи определенного гена из ряда видов. В таблице отображен соответствующий организм, таксономическая классификация, ген, описание, сходство с человеком, тип ортологии и детали. Он связан с генным деревом ENSEMBL, генным деревом TreeFam и Aminode . [16]
- Паралоги : в этом разделе отображаются паралоги и псевдогены для определенного гена.
- Геномные варианты : геномные варианты демонстрируют результаты SNP/вариантов NCBI, отчет о неравновесии по сцеплению HapMap, структурные вариации, базу данных мутаций генов человека (HGMD), праймеры QIAGEN SeqTarget для ПЦР дальнего действия в массивах ПЦР с мутациями рака человека, мыши и крысы и SABiosciences. В таблице в этом разделе указаны идентификатор SNP, действительный, клиническая значимость, Chr pos, последовательность для геномных данных, AAChg, тип и дополнительные данные для данных, связанных с транскрипцией, частота аллелей , популяция, общая выборка и многое другое для частот аллелей. Для Valid разные символы представляют разные методы проверки. «C» означает дополнительный кластер; «А» — аллель by-2hit-2; «F» — по частоте; «H» — это карта счастья, а «О» — это другая поп-музыка. Клиническое значение может быть одним из следующих: непатогенный, патогенный, лекарственный ответ, гистосовместимость, вероятно-непатогенный, вероятно-патогенный, непроверенный, неизвестный и др. Тип должен быть одним из следующих: nonsynon, syn, cds, spl, utr, int, exc, loc, stg, ds500, spa, spd, us2k, us5k, PupaSUITE Обозначения.
- Расстройства/болезни : Показывает расстройства/заболевания, связанные с данным геном.
- Публикации : отображает публикации, связанные с геном.
- Внешний поиск : поиск дополнительной информации в PubMed , OMIM и NCBI.
- Геномные базы данных : другие базы данных и специализированные базы данных.
- Интеллектуальная собственность : В этом разделе представлена патентная информация и лицензируемые технологии.
- Продукты
Приложения
[ редактировать ]GeneCards широко используется в биологической и биомедицинской областях. Например, Шах извлек данные о ранней ишемической болезни сердца из GeneCards, чтобы идентифицировать гены, которые способствуют заболеванию . Подтверждено, что хромосомы 3q13, 1q25 и т. д. оказывают влияние, и в этой статье дополнительно обсуждается взаимосвязь между патологическими генами и сыворотки липопротеинами с помощью GeneCard. [17]
Другим примером является исследование синтетической смертности от рака . Синтетическая летальность возникает, когда мутация одного гена не влияет на функцию клетки , а мутация дополнительного гена приводит к гибели клетки. Это исследование было направлено на поиск новых методов лечения рака путем блокирования смертности от лекарств. GeneCards использовался при сравнении данных данного целевого гена со всеми возможными генами. В этом процессе оценка совместного использования аннотаций рассчитывалась с помощью программы GeneDecks Partner Hunter (теперь называемой Genes Like Me), чтобы получить паралогию. Мишени инактивации были выделены после экспериментов на микрочипах резистентных и нерезистентных нейробластомы . клеточных линий [7]
Ссылки
[ редактировать ]- ^ Jump up to: а б с Ребхан М., Чалифа-Каспи В., Прилуски Дж., Ланцет Д. (апрель 1997 г.). «GeneCards: интеграция информации о генах, белках и болезнях». Тенденции в генетике . 13 (4): 163. дои : 10.1016/S0168-9525(97)01103-7 . ПМИД 9097728 .
- ^ Ребхан М., Чалифа-Каспи В., Прилуски Дж., Ланцет Д. (1998). «GeneCards: новый справочник по функциональной геномике с автоматизированным анализом данных и поддержкой переформулирования запросов» . Биоинформатика . 14 (8): 656–64. дои : 10.1093/биоинформатика/14.8.656 . ПМИД 9789091 .
- ^ Сафран М., Соломон И., Шмуэли О., Лапидот М., Шен-Орр С., Адато А. и др. (ноябрь 2002 г.). «GeneCards 2002: к полному объектно-ориентированному сборнику генов человека» . Биоинформатика . 18 (11): 1542–3. doi : 10.1093/биоинформатика/18.11.1542 . ПМИД 12424129 .
- ^ Jump up to: а б Харель А., Ингер А., Стельцер Г., Стрихман-Алмашану Л., Дала И., Сафран М., Ланцет Д. (октябрь 2009 г.). «ПОДАРКИ: анализ ландшафта аннотаций с помощью GeneCards» . БМК Биоинформатика . 10 (1): 348. дои : 10.1186/1471-2105-10-348 . ПМЦ 2774327 . ПМИД 19852797 .
- ^ Jump up to: а б с д и ж г «Генные карты» . Генные карты. Архивировано из оригинала 14 октября 2013 г. Проверено 18 октября 2013 г.
- ^ «Генные карты» . Проверено 19 октября 2013 г.
- ^ Jump up to: а б с д и ж г Стельцер Г., Дала И., Штейн Т.И., Сатанауэр Ю., Розен Н., Натив Н. и др. (октябрь 2011 г.). «In-silico геномика человека с помощью GeneCards» . Геномика человека . 5 (6): 709–17. дои : 10.1186/1479-7364-5-6-709 . ПМЦ 3525253 . ПМИД 22155609 .
- ^ Jump up to: а б с д Сафран М., Дала И., Александр Дж., Розен Н., Ини Штейн Т., Шмойш М. и др. (август 2010 г.). «GeneCards Версия 3: интегратор генов человека» . База данных . 2010 : baq020. дои : 10.1093/база данных/baq020 . ПМЦ 2938269 . ПМИД 20689021 .
- ^ Эттвуд Т.К., диджей Парри-Смит (1999). Введение в биоинформатику . Харлоу Лонгман.
- ^ «ДжинДекс» . Генные карты. Архивировано из оригинала 14 октября 2013 г. Проверено 20 октября 2013 г.
- ^ Стельцер Г., Ингер А., Олендер Т., Ини-Штайн Т., Дала И., Харел А. и др. (декабрь 2009 г.). «GeneDecks: поиск паралогов и дистилляция набора генов с аннотацией GeneCards» (PDF) . Омикс . 13 (6): 477–87. дои : 10.1089/omi.2009.0069 . ПМИД 20001862 . S2CID 33116814 . Архивировано из оригинала (PDF) 10 февраля 2020 г.
- ^ «ГенАЛаКарт» . Генные карты. Архивировано из оригинала 30 сентября 2013 г. Проверено 20 октября 2013 г.
- ^ «ДжинЛок» . Генные карты . Проверено 20 октября 2013 г.
- ^ Шридхар Г.Р., Дивакар Ч.Х., Хануман Т., Рао А.А. (2006). «Биоинформатический подход к извлечению информации из генов» . Журнал диабета в развивающихся странах . 26 (4): 149–51. дои : 10.4103/0973-3930.33179 .
- ^ Чалифа-Каспи В., Шмуэли О., Бенджамин-Родриг Х., Розен Н., Шмойш М., Янай И. и др. (декабрь 2003 г.). «GeneAnnot: взаимодействие GeneCards с высокопроизводительными сборниками экспрессии генов» . Брифинги по биоинформатике . 4 (4): 349–60. дои : 10.1093/нагрудник/4.4.349 . ПМИД 14725348 .
- ^ Чанг КТ, Го Дж, ди Ронза А, Сардиелло М (январь 2018 г.). «Аминоды: выявление эволюционных ограничений в протеоме человека» . Научные отчеты . 8 (1): 1357. Бибкод : 2018НатСР...8.1357С . doi : 10.1038/s41598-018-19744-w . ПМЦ 5778061 . ПМИД 29358731 .
- ^ Шах Ш., Краус В.Е., Кроссман Д.С., Грейнджер С.Б., Хейнс Дж.Л., Джонс С.Дж. и др. (ноябрь 2006 г.). «Липиды сыворотки в исследовании ишемической болезни сердца GENECARD идентифицируют локусы количественных признаков и фенотипические подмножества на хромосомах 3q и 5q». Анналы генетики человека . 70 (Часть 6): 738–48. дои : 10.1111/j.1469-1809.2006.00288.x . ПМИД 17044848 . S2CID 24239757 .