ГенРИФ
GeneRIF — или Gene Reference Into Function это короткое (255 символов или меньше) заявление о функции гена. GeneRIFs предоставляют простой механизм , позволяющий ученым добавлять функциональные аннотации генов , описанных в базе данных Entrez Gene. На практике функция строится довольно широко. Например, существуют GeneRIF, в которых обсуждается роль гена в заболевании, GeneRIF, которые направляют зрителя к обзорной статье о гене, и GeneRIF, в которых обсуждается структура гена. Однако заявленное намерение состоит в том, чтобы GeneRIF касались функции генов. В настоящее время создано более полумиллиона генРИФ для генов почти 1000 различных видов. [1]
GeneRIF всегда связаны с определенными записями в базе данных Entrez Gene. Каждый GeneRIF имеет указатель на PubMed ID (тип идентификатора документа) научной публикации, которая предоставляет доказательства утверждения, сделанного GeneRIF. GeneRIF часто извлекаются непосредственно из документа, который идентифицируется идентификатором PubMed, очень часто из его названия или из его последнего предложения.
GeneRIF обычно создаются индексаторами NCBI , но отправить GeneRIF может любой желающий.Для обработки необходимо, чтобы для конкретного гена существовал действительный идентификатор гена, или сотрудники отдела генной обработки должны присвоить виду общий идентификатор гена . Последний случай реализуется через записи в Gene с символом NEWENTRY. требуются только три типа информации После того, как идентификатор гена идентифицирован, для подачи заявки :
- краткая фраза, описывающая функцию или функции (длиной менее 255 символов , желательно больше, чем повтор названия статьи);
- опубликованный документ, описывающий эту функцию, реализованный путем предоставления идентификатора PubMed цитирования в PubMed;
- действующий адрес электронной почты (который останется конфиденциальным).
Пример
[ редактировать ]Вот несколько GeneRIF, взятых из Entrez Gene для GeneID 7157, человеческого гена TP53 .Идентификаторы документов PubMed не включены в примеры. Обратите внимание на широкую вариативность в отношении наличия или отсутствия знаков препинания и заглавных букв в начале предложения.
- p53 и c-erbB-2 могут играть независимую роль в канцерогенезе рака желчного пузыря.
- Деградация эндогенного HIPK2 зависит от присутствия функционального белка p53.
- Аллели кодона 72 р53 влияют на реакцию на противораковые препараты в клетках пожилых людей путем регулирования ингибитора клеточного цикла p21WAF1.
- Анализ логистической регрессии показал, что р53 и ЦОГ-2 являются зависимыми предикторами канцерогенеза поджелудочной железы, а также обратную связь с неопластической прогрессией между р53 и ЦОГ-2.
GeneRIFs представляют собой необычный тип текстового жанра, и недавно они стали предметом ряда статей сообщества специалистов по обработке естественного языка.
Внешние ссылки
[ редактировать ]- Веб-страница NCBI с описанием GeneRIF
- Митчелл Дж.А., Аронсон А.Р., Морк Дж.Г., Фолк Л.С., Хамфри С.М., Уорд Дж.М. (2003). «Индексация генов: характеристика и анализ GeneRIFs NLM» . AMIA Annu Symp Proc : 460–4. ПМК 1480312 . ПМИД 14728215 .
Ссылки
[ редактировать ]- Уильям Херш, Рави Теджа Бхупатираджу (2003). Обзор трека TREC Genomics (PDF) . Архивировано из оригинала (PDF) 12 мая 2005 г. Документ, описывающий «общую задачу» конференции по поиску текста, включающую автоматическое предсказание GeneRIF.
- Лу, Чжиюн; К. Бретоннель Коэн; Лоуренс Хантер (2006). Поиск GeneRIF с помощью аннотаций Gene Ontology (PDF) . Учеб. Тихоокеанский симпозиум по биокомпьютингу, 2006 г., стр. 52–63. Архивировано из оригинала (PDF) 13 февраля 2006 г. Статья Лу и др., описывающая систему, которая автоматически предлагает GeneRIF.