Jump to content

Проект консенсуса CDS

Проект CCDS
Содержание
Описание Сближение к стандартному набору аннотаций генов
Контакт
Исследовательский центр Национальный центр биотехнологической информации
Европейский институт биоинформатики
Калифорнийский университет, Санта-Крус
Wellcome Trust Sanger Institute
Авторы Ким Д. Прюитт
Первичное цитирование Прюитт К.Д. и др. (2009) [1]
Дата выпуска 2009
Доступ
Веб-сайт https://www.ncbi.nlm.nih.gov/projects/CCDS/CcdsBrowse.cgi
Разнообразный
Версия CCDS, выпуск 24

Проект «Консенсусная кодирующая последовательность» (CCDS) — это совместная работа по поддержанию набора данных кодирующих белок областей, которые одинаково аннотированы на сборках эталонных геномов человека и мыши. Проект CCDS отслеживает идентичные белковые аннотации в эталонных геномах мыши и человека с помощью стабильного идентификатора (CCDS ID) и гарантирует, что они последовательно представлены Национальным центром биотехнологической информации (NCBI) , Ensembl и UCSC Genome Browser . [1] Целостность набора данных CCDS поддерживается посредством строгого тестирования качества и постоянной ручной обработки . [2]

Мотивация и предыстория

[ редактировать ]

Биологические и биомедицинские исследования стали полагаться на точную и последовательную аннотацию генов и их продуктов на сборках генома. Справочные аннотации геномов доступны из различных источников, каждый из которых имеет свои независимые цели и политику, что приводит к некоторым вариациям аннотаций.

Проект CCDS был создан для определения золотого стандарта набора аннотаций генов, кодирующих белки, которые одинаково аннотированы на сборках эталонных геномов человека и мыши участвующими группами аннотаций. Наборы генов CCDS, полученные консенсусом различных партнеров. [2] теперь состоят из более чем 18 000 человеческих и более 20 000 мышиных генов (см. историю выпусков CCDS ). все чаще представляет все больше альтернативных событий сплайсинга . Набор данных CCDS с каждым новым выпуском [3]

Содействующие группы

[ редактировать ]

В число участвующих групп аннотаций входят: [3]

  • Национальный центр биотехнологической информации (NCBI)
  • Европейский институт биоинформатики (EBI)
  • Wellcome Trust Sanger Institute (WTSI)
  • Комитет по генной номенклатуре HUGO (HGNC)
  • Информатика генома мыши (MGI)

Ручную аннотацию предоставляют:

  • Эталонная последовательность ( RefSeq ) в NCBI
  • Анализ и аннотация человека и позвоночных (HAVANA) на WTSI

Определение набора генов CCDS

[ редактировать ]

«Консенсус» определяется как области кодирования белка, которые совпадают в стартовом кодоне, стоп-кодоне и соединениях сплайсинга и для которых прогноз соответствует критериям обеспечения качества. [1] Сочетание ручных и автоматических аннотаций генома, предоставленных (NCBI). и Ensembl (который включает ручные аннотации HAVANA) сравниваются для выявления аннотаций с совпадающими геномными координатами.

Тестирование качества

[ редактировать ]

Чтобы гарантировать высокое качество CDS, проводятся многочисленные тесты обеспечения качества (QA) (Таблица 1). Все тесты выполняются после этапа сравнения аннотаций каждой сборки CCDS и не зависят от тестов качества отдельных групп аннотаций, выполняемых перед сравнением аннотаций. [3]

Таблица 1. Примеры типов тестов качества CCDS, выполняемых до принятия кандидатов CCDS [3]
Тест качества Цель теста
Подчиняется НПРО Проверяет транскрипты, которые могут подвергаться нонсенс-опосредованному распаду (NMD).
Низкое качество Проверяет низкую склонность к кодированию
Несогласованные сайты сплайсинга Проверяет неканонические сайты сплайсинга.
Предсказанный псевдоген Проверяет гены, которые, по прогнозам UCSC, являются псевдогенами.
Слишком короткий Проверяет транскрипты или белки, которые необычно короткие, обычно <100 аминокислот.
Ортолог не найден/не сохранился Проверяет гены, которые не консервативны и/или не входят в кластер HomoloGene.
Начало или остановка CDS не совмещены Проверяет наличие стартового или стоп-кодона в эталонной последовательности генома.
Внутренний стоп Проверяет наличие внутреннего стоп-кодона в геномной последовательности.
NCBI: длина белка ансамбля разная Проверяет, имеет ли белок, кодируемый NCBI RefSeq, ту же длину, что и белок EBI/WTSI.
NCBI:Ensembl с низким процентом идентичности Проверяет общую идентичность белков NCBI и EBI/WTSI на >99 %.
Джин снят с производства Проверяет, недействителен ли GeneID.

Аннотации, не прошедшие тесты контроля качества, проходят ручную проверку, которая может улучшить результаты или принять решение об отклонении совпадений аннотаций на основании неудачного контроля качества.

Процесс проверки

[ редактировать ]

База данных CCDS уникальна тем, что процесс проверки должен выполняться несколькими сотрудниками, и соглашение должно быть достигнуто до внесения каких-либо изменений. Это стало возможным благодаря системе координации сотрудников, которая включает в себя поток рабочего процесса и форумы для анализа и обсуждения. База данных CCDS управляет внутренним веб-сайтом, который служит нескольким целям, включая общение с кураторами, голосование соавторов, предоставление специальных отчетов и отслеживание статуса представлений CCDS. Когда сотрудничающий член группы CCDS идентифицирует идентификатор CCDS, который может нуждаться в проверке, для принятия окончательного решения используется процесс голосования.

Ручное курирование

[ редактировать ]

Скоординированное ручное курирование поддерживается веб-сайтом с ограниченным доступом и списком адресов электронной почты для обсуждения. Рекомендации по курированию CCDS были созданы для решения конкретных конфликтов, которые наблюдались чаще. Установление руководящих принципов курирования CCDS помогло сделать процесс курирования CCDS более эффективным за счет сокращения количества противоречивых голосов и времени, затрачиваемого на обсуждение для достижения консенсусного соглашения. Ссылку на рекомендации CCDS по курированию можно найти здесь .

Политика курирования, установленная для набора данных CCDS, была интегрирована в рекомендации по аннотациям RefSeq и HAVANA, и, таким образом, новые аннотации, предоставленные обеими группами, с большей вероятностью будут согласованными и приведут к добавлению идентификатора CCDS. Эти стандарты касаются конкретных проблемных областей, не являются исчерпывающим набором рекомендаций по аннотированию и не ограничивают политику аннотирования какой-либо сотрудничающей группы. [2] Примеры включают стандартизированные рекомендации по выбору кодона инициации и интерпретации вышестоящих ORF и транскриптов, которые, по прогнозам, будут кандидатами на нонсенс-опосредованный распад . Курирование происходит непрерывно, и любой из сотрудничающих центров может пометить идентификатор CCDS как потенциальное обновление или отзыв.

Противоречивые мнения разрешаются путем консультаций с научными экспертами или другими группами по курированию аннотаций, такими как Комитет по номенклатуре генов HUGO (HGNC) и Информатика генома мыши (MGI) . Если конфликт не может быть разрешен, сотрудники соглашаются отозвать идентификатор CCDS до тех пор, пока не станет доступна дополнительная информация.

Проблемы курирования и рекомендации по аннотированию

[ редактировать ]

Нонсенс-опосредованный распад (NMD): NMD — самый мощный процесс наблюдения за мРНК . NMD устраняет дефектную мРНК, прежде чем ее можно будет транслировать в белок. [4] Это важно, поскольку если дефектная мРНК транслируется, укороченный белок может вызвать заболевание. были предложены различные механизмы Для объяснения НМД ; одна из них представляет собой модель комплекса экзонных соединений (EJC). В этой модели, если стоп-кодон находится на >50 нт выше последнего соединения экзон-экзон, предполагается, что транскрипт является кандидатом NMD . [2] Сотрудники CCDS используют консервативный метод, основанный на модели EJC, для скрининга транскриптов мРНК. Любые транскрипты, определенные как кандидаты NMD, исключаются из набора данных CCDS, за исключением следующих ситуаций: [2]

  1. все транскрипты в одном конкретном локусе оцениваются как кандидаты на NMD, однако ранее известно, что этот локус является областью, кодирующей белок;
  2. существуют экспериментальные данные, свидетельствующие о том, что функциональный белок образуется из транскрипта-кандидата NMD .

Ранее NMD считали транскрипты-кандидаты как RefSeq , так и HAVANA транскриптами, кодирующими белки, и, таким образом, эти транскрипты-кандидаты NMD были представлены в наборе данных CCDS. Группа RefSeq и проект HAVANA впоследствии пересмотрели свою политику аннотаций.

Несколько стартовых сайтов внутрикадрового перевода: Инициации трансляции способствуют многочисленные факторы, такие как расположенные выше открытые рамки считывания (uORF), вторичная структура и контекст последовательности вокруг сайта инициации трансляции. Общий стартовый сайт определен в консенсусной последовательности Козака: (GCC) GCCACCAUGG у позвоночных. Последовательность в скобках (GCC) представляет собой мотив с неизвестным биологическим воздействием. [5] Существуют вариации в консенсусной последовательности Козака, например, G или A наблюдаются на три нуклеотида выше (в положении -3) от AUG. Основания между позициями -3 и +4 последовательности Козака оказывают наиболее существенное влияние на эффективность трансляции. Следовательно, последовательность (A/G)NNAUGG определяется как сильный сигнал Козака в проекте CCDS.

Согласно механизму сканирования малая субъединица рибосомы может инициировать трансляцию с первого достигнутого стартового кодона. Существуют исключения из модели сканирования:

  1. когда место инициации не окружено сильным сигналом Козака, что приводит к утечке сканирования. Таким образом, рибосома пропускает этот AUG и инициирует трансляцию с нижестоящего стартового сайта;
  2. когда более короткая ORF может позволить рибосоме повторно инициировать трансляцию в нижестоящей ORF . [5]

Согласно рекомендациям CCDS по аннотациям, самая длинная ORF должна быть аннотирована, за исключением случаев, когда есть экспериментальные доказательства того, что для инициации трансляции используется внутренний стартовый сайт. Кроме того, другие типы новых данных, такие как данные профиля рибосом, [6] может быть использован для идентификации стартовых кодонов. Набор данных CCDS записывает один сайт инициации трансляции для каждого идентификатора CCDS. Любые альтернативные стартовые сайты могут использоваться для перевода и будут указаны в публичном сообщении CCDS.

Открытые рамки считывания вверх по течению: Инициирующие кодоны AUG, расположенные внутри лидеров транскриптов, известны как восходящие AUG (uAUG). Иногда uAUG связаны с u ORF . u ORF обнаруживаются примерно в 50% транскриптов человека и мыши. [7] Существование U ORF является еще одной проблемой для набора данных CCDS. Механизм сканирования для инициации трансляции предполагает, что небольшие субъединицы рибосомы (40S) связываются на 5'-конце возникающего транскрипта мРНК и сканируют первый стартовый кодон AUG. [5] Возможно, что сначала распознается uAUG, а затем транслируется соответствующий uORF. Транслированная u ORF может быть кандидатом на NMD , хотя исследования показали, что некоторые u ORF могут избегать NMD . Средний предел размера U ORF , которые могут избежать NMD, составляет примерно 35 аминокислот . [2] [8] Также было высказано предположение, что u ORF ингибируют трансляцию нижестоящего гена, захватывая комплекс инициации рибосомы и вызывая рибосомы диссоциацию от транскрипта мРНК до того, как она достигнет областей, кодирующих белок. [4] [7] В настоящее время ни в одном исследовании не сообщалось о глобальном влиянии u ORF на регуляцию трансляции.

Текущие рекомендации по аннотациям CCDS разрешают включение транскриптов мРНК u , содержащих ORF , если они соответствуют следующим двум биологическим требованиям: [2]

  1. имеет транскрипт мРНК сильный сигнал Козака;
  2. транскрипт мРНК либо состоит из ≥ 35 аминокислот , либо перекрывается с первичной открытой рамкой считывания .

Транскрипты чтения: Транскрипты сквозного считывания также известны как соединенные гены или совместно транскрибируемые гены. Транскрипты сквозного считывания определяются как транскрипты, объединяющие по крайней мере часть одного экзона каждого из двух или более различных известных (партнерских) генов, которые лежат на одной и той же хромосоме в одной и той же ориентации. [9] Биологическая функция считываемых транскриптов и соответствующих им белковых молекул остается неизвестной. Однако определение гена сквозного чтения в наборе данных CCDS заключается в том, что отдельные гены-партнеры должны быть разными, а транскрипты сквозного чтения должны иметь общий ≥ 1 экзон (или ≥ 2 сайта сплайсинга, за исключением случая общего терминального гена). экзон) с каждым из отдельных более коротких локусов. [2] Транскрипты не считаются транскриптами для прочтения в следующих случаях:

  1. когда транскрипты производятся из перекрывающихся генов , но не имеют одних и тех же сайтов сплайсинга;
  2. когда транскрипты транслируются с генов, которые имеют вложенные структуры относительно друг друга. В данном случае сотрудники CCDS и HGNC согласились, что транскрипт считывания будет представлен как отдельный локус.

Качество эталонной последовательности генома: Поскольку набор данных CCDS создан для представления геномных аннотаций человека и мыши, проблемы качества эталонных последовательностей генома человека и мыши становятся еще одной проблемой. Проблемы с качеством возникают, когда эталонный геном неправильно собран. Таким образом, неправильно собранный геном может содержать преждевременные стоп-кодоны , индели со сдвигом рамки или, вероятно, полиморфные псевдогены . Как только эти проблемы качества выявлены, сотрудники CCDS сообщают о них Консорциуму геномных ссылок, который изучает их и вносит необходимые исправления.

Доступ к данным CCDS

[ редактировать ]

Проект CCDS доступен на странице набора данных NCBI CCDS (здесь) , где представлены ссылки для загрузки по FTP и интерфейс запросов для получения информации о последовательностях и местоположениях CCDS. Отчеты CCDS можно получить с помощью интерфейса запросов, который расположен в верхней части страницы набора данных CCDS. Пользователи могут выбирать различные типы идентификаторов, такие как идентификатор CCDS, идентификатор гена, символ гена, идентификатор нуклеотида и идентификатор белка, для поиска конкретной информации CCDS. [1] Отчеты CCDS (рис. 1) представлены в табличном формате со ссылками на конкретные ресурсы, такие как исторический отчет, Entrez Gene. [10] или повторно запросите набор данных CCDS. Таблица идентификаторов последовательностей представляет информацию о транскриптах в VEGA , Ensembl и Blink . Таблица расположения хромосом включает геномные координаты каждого отдельного экзона конкретной кодирующей последовательности. В этой таблице также приведены ссылки на несколько различных браузеров генома, которые позволяют визуализировать структуру региона кодирования. [1] Точная нуклеотидная последовательность и белковая последовательность конкретной кодирующей последовательности также отображаются в разделе данных последовательности CCDS.

Рисунок 1. Скриншот набора данных CCDS, показывающий отчет для белка Itm2a (CCDS 30349).

Текущие приложения

[ редактировать ]

Набор данных CCDS является неотъемлемой частью GENCODE. проекта аннотации генов [11] и он используется в качестве стандарта для высококачественного определения кодирующих экзонов в различных областях исследований, включая клинические исследования, крупномасштабные эпигеномные исследования, проекты экзомов и дизайн массивов экзонов. [3] Из-за согласованной аннотации экзонов CCDS независимыми группами аннотаций экзомные проекты, в частности, рассматривали экзоны, кодирующие CCDS, в качестве надежных мишеней для последующих исследований (например, для обнаружения однонуклеотидных вариантов ), и эти экзоны использовались в качестве мишеней кодирующей области в коммерчески доступные экзома . наборы [12]

История выпусков CCDS

[ редактировать ]

Размер набора данных CCDS продолжал увеличиваться как за счет обновлений аннотаций вычислительного генома, которые объединяют новые наборы данных, представленных в Международное сотрудничество по базам данных нуклеотидных последовательностей (INSDC ), так и за счет продолжающихся мероприятий по курированию, которые дополняют или улучшают эту аннотацию. В таблице 2 приведены основные статистические данные для каждой сборки CCDS, где общедоступными идентификаторами CCDS являются все те, которые не находились на рассмотрении или не ожидали обновления или отзыва на момент текущей даты выпуска.

Таблица 2. Сводная статистика по предыдущим выпускам CCDS.
Выпускать Разновидность Имя сборки Количество общедоступных идентификаторов CCDS Количество идентификаторов генов Текущая дата выпуска
1 Мудрый человек NCBI35 13,740 12,950 14 марта 2007 г.
2 Мускулистые мышцы MGSCv36 13,218 13,012 28 ноября 2007 г.
3 Мудрый человек NCBI36 17,494 15,805 1 мая 2008 г.
4 Мускулистые мышцы MGSCv37 17, 082 16,888 24 января 2011 г.
5 Мудрый человек NCBI36 19,393 17,053 2 сентября 2009 г.
6 Мудрый человек ГРЧ37 22,912 18,174 20 апреля 2011 г.
7 Мускулистые мышцы MGSCv37 21,874 19,507 14 августа 2012 г.
8 Мудрый человек ГРЧ37.п2 25,354 18,407 6 сентября 2011 г.
9 Мудрый человек ГРЧ37.п5 26,254 18,474 25 октября 2012 г.
10 Мускулистые мышцы GRCm38 22,934 19,945 5 августа 2013 г.
11 Мудрый человек ГРЧ37.п9 27,377 18,535 29 апреля 2013 г.
12 Мудрый человек ГРЧ37.п10 27,655 18,607 24 октября 2013 г.
13 Мускулистые мышцы GRCm38.p1 23,010 19,990 7 апреля 2014 г.
14 Мудрый человек ГРЧ37.п13 28,649 18,673 29 ноября 2013 г.
15 Мудрый человек ГРЧ37.п13 28,897 18,681 7 августа 2014 г.
16 Мускулистые мышцы GRCm38.p2 23,835 20,079 10 сентября 2014 г.
17 Мудрый человек ГРЧ38 30,461 18,800 10 сентября 2014 г.
18 Мудрый человек ГРЧ38.п2 31,371 18,826 12 мая 2015 г.
19 Мускулистые мышцы GRCm38.p3 24,834 20,215 30 июля 2015 г.
20 Мудрый человек ГРЧ38.п7 32,524 18,892 8 сентября 2016 г.
21 Мускулистые мышцы GRCm38.p4 25,757 20,354 8 декабря 2016 г.
22 Мудрый человек ГРЧ38.п12 33,397 19,033 14 июня 2018 г.
23 Мускулистые мышцы GRCm38.p6 27,219 20,486 24 октября 2019 г.
24 Мудрый человек ГРЧ38.п14 35,608 19,107 26 октября 2022 г.

Полный набор статистики выпусков можно найти на официальном сайте CCDS на странице «Релизы и статистика» .

Перспективы на будущее

[ редактировать ]

Долгосрочные цели включают добавление атрибутов, которые указывают, где аннотация транскрипта также идентична (включая UTR ), и указывают варианты сплайсинга с разными UTR , которые имеют одинаковый идентификатор CCDS. Ожидается также, что по мере того, как станут доступны более полные и высококачественные данные о последовательностях геномов других организмов, аннотации этих организмов могут войти в сферу представления CCDS.

Набор CCDS станет более полным по мере того, как независимые группы кураторов договариваются о случаях, в которых они изначально различаются, по мере того, как происходит дополнительная экспериментальная проверка слабо поддерживаемых генов, а также по мере того, как методы автоматического аннотирования продолжают совершенствоваться. Коммуникация между сотрудничающими группами CCDS продолжается и позволит устранить разногласия и выявить улучшения между циклами обновления CCDS. Ожидается, что обновления для людей будут происходить примерно каждые 6 месяцев, а выпуски для мышей — ежегодно. [3]

См. также

[ редактировать ]
  1. ^ Jump up to: а б с д и Прюитт К.Д. , Харроу Дж., Харт Р.А., Валлин С., Дикханс М., Маглотт Д.Р. , Сирл С., Фаррелл К.М., Лавленд Дж.Э., Рюф Б.Дж., Харт Э., Сунер М.М., Ландрум М.Дж., Акен Б., Эйлинг С., Берч Р., Фернандес- Банет Дж., Черри Дж.Л., Карвен В., Дикуччо М., Келлис М., Ли Дж., Лин М.Ф., Шустер М., Шкеда А., Амид С., Браун Дж., Духанина О., Фрэнкиш А., Харт Дж., Майдак Б.Л., Мадж Дж., Мерфи М.Р. , Мерфи Т., Раджан Дж., Раджпут Б., Риддик Л.Д., Сноу С., Стюард С., Уэбб Д., Вебер Дж.А., Уилминг Л., Ву В., Бирни Э., Хаусслер Д., Хаббард Т., Остелл Дж., Дурбин Р., Липман Д. (2009). ). «Проект консенсусной кодирующей последовательности (CCDS): идентификация общего набора генов, кодирующих белки для геномов человека и мыши» . Геном Рез . 19 (7): 1316–23. дои : 10.1101/гр.080531.108 . ПМК   2704439 . ПМИД   19498102 .
  2. ^ Jump up to: а б с д и ж г час Харт, РА; Фаррелл, CM; Лавленд, Дж. Э.; Сунер, ММ; Уилминг, Л; Акен, Б; Баррелл, Д; Франкиш, А; Валлин, К; Сирл, С; Диканс, М; Харроу, Дж; Прюитт, К.Д. (2012). «Отслеживание и координация международных усилий по курированию проекта CCDS» . База данных . 2012 : bas008. дои : 10.1093/база данных/bas008 . ПМК   3308164 . ПМИД   22434842 .
  3. ^ Jump up to: а б с д и ж Фаррелл, CM; О'Лири, Северная Каролина; Харт, РА; Лавленд, Дж. Э.; Уилминг, LG; Валлин, К; Диханс, М; Баррелл, Д; Сирл, С.М.; Акен, Б; Хиатт, С.М.; Франкиш, А; Сунер, ММ; Раджпут, Б; Стюард, Калифорния; Браун, Греция; Беннет, Р.; Мерфи, М; Ву, В; Кей, член парламента; Харт, Дж; Раджан, Дж; Вебер, Дж; Снег, С; Риддик, LD; Хант, Т; Уэбб, Д; Томас, М; Тамез, П; Рангвала, Ш.; МакГарви, КМ; Пуджар, С; Шкеда, А; Мадж, Дж. М.; Гонсале, Дж. М.; Гилберт, Дж. Г.; Тревайон, С.Дж.; Баетч, Р; Харроу, Дж.Л.; Хаббард, Т; Остелл, Дж. М.; Хаусслер, Д; Прюитт, К.Д. (2014). «Текущий статус и новые возможности базы данных последовательностей консенсусного кодирования» . Нуклеиновые кислоты Рез . 42 (Д1): Д865–Д872. дои : 10.1093/нар/gkt1059 . ПМЦ   3965069 . ПМИД   24217909 .
  4. ^ Jump up to: а б Альбертс, Б; Джонсон, А; Льюис, Дж; Рафф, М; Робертс, К; Уолтер, П. (2002). Молекулярная биология клетки, 5-е изд . Нью-Йорк: Garland Science.
  5. ^ Jump up to: а б с Козак, М (2002). «Расширяя возможности механизма сканирования для инициации трансляции» . Джин . 299 (1–2): 1–34. дои : 10.1016/S0378-1119(02)01056-9 . ПМЦ   7126118 . ПМИД   12459250 .
  6. ^ Инголия, Северная Каролина; Брар, Джорджия; Рускин, С; Макгичи, AM; Вайсман, Дж. С. (2014). «Пологеномная аннотация и количественная оценка трансляции с помощью профилирования рибосом» . Курс. Протокол. Мол. Биол . Глава 4: 4.18.1–4.18.19. дои : 10.1002/0471142727.mb0418s103 . ISBN  9780471142720 . ПМЦ   3775365 . ПМИД   23821443 .
  7. ^ Jump up to: а б Кальво, SE; Пальярни, диджей; Моота, В.К. (2009). «Вышестоящие открытые рамки считывания вызывают повсеместное снижение экспрессии белков и являются полиморфными у людей» (PDF) . Учеб. Натл. акад. наук. США . 106 (18): 7507–12. Бибкод : 2009PNAS..106.7507C . дои : 10.1073/pnas.0810916106 . ПМЦ   2669787 . ПМИД   19372376 .
  8. ^ Сильва, Алабама; Перейра, ФЕК; Моргадо, А; Конг, Дж; Мартинс, Р; Фаустино, П; Либхабер, SA; Ромао, Л. (2006). «Канонический UPF1-зависимый нонсенс-опосредованный распад мРНК ингибируется в транскриптах, несущих короткую открытую рамку считывания, независимо от контекста последовательности» . РНК . 12 (12): 2160–70. дои : 10.1261/rna.201406 . ПМЦ   1664719 . ПМИД   17077274 .
  9. ^ Пракаш, Тулика; Шарма, Винит К.; Адати, Наоки; Одзава, Рицуко; Кумар, Навин; Нисида, Юичиро; Фудзикаке, Такаёси; Такеда, Тадаюки; Тейлор, Тодд Д.; Михалак, Павел (12 октября 2010 г.). «Экспрессия соединенных генов: еще один механизм регуляции генов у эукариот» . ПЛОС ОДИН . 5 (10): e13284. Бибкод : 2010PLoSO...513284P . дои : 10.1371/journal.pone.0013284 . ПМЦ   2953495 . ПМИД   20967262 .
  10. ^ Маглотт, Д .; Остелл, Дж.; Прюитт, К.Д.; Татусова Т. (28 ноября 2010 г.). «Энтрез Джин: генно-ориентированная информация в NCBI» . Нуклеиновые кислоты Рез . 39 (База данных): D52–D57. дои : 10.1093/nar/gkq1237 . ПМК   3013746 . ПМИД   21115458 .
  11. ^ Харроу, Дж.; Франкиш, А.; Гонсалес, Дж. М.; Тапанари, Э.; Диканс, М.; Кокочински Ф.; Акен, БЛ; Баррелл, Д.; Задисса, А.; Сирл, С.; Барнс, И.; Бигнелл, А.; Бойченко В.; Хант, Т.; Кей, М.; Мукерджи, Г.; Раджан, Дж.; Деспасио-Рейес, Г.; Сондерс, Г.; Стюард, К.; Харт, Р.; Лин, М.; Ховальд, К.; Танзер, А.; Дерриен, Т.; Краст, Дж.; Уолтерс, Н.; Баласубраманян, С.; Пей, Б.; Тресс, М.; Родригес, Дж. М.; Эзкурдия, И.; ван Барен, Дж.; Брент, М.; Хаусслер, Д.; Келлис, М.; Валенсия, А.; Реймонд, А.; Герштейн, М.; Гиго, Р.; Хаббард, Ти Джей (5 сентября 2012 г.). «GENCODE: эталонная аннотация генома человека для проекта ENCODE» . Геном Рез . 22 (9): 1760–1774. дои : 10.1101/гр.135350.111 . ПМЦ   3431492 . ПМИД   22955987 .
  12. ^ Парла, Дженнифер С; Иосифов, Иван; Грабилл, Ян; Спектор, Мона С; Крамер, Мелисса; МакКомби, В. Ричард (2011). «Сравнительный анализ захвата экзома» . Геном Биол . 12 (9): R97. дои : 10.1186/gb-2011-12-9-r97 . ПМК   3308060 . ПМИД   21958622 .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 26501ad87f2dce9144e55fabf90ad287__1709648880
URL1:https://arc.ask3.ru/arc/aa/26/87/26501ad87f2dce9144e55fabf90ad287.html
Заголовок, (Title) документа по адресу, URL1:
Consensus CDS Project - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)