Jump to content

Тег выраженной последовательности

В генетике метка экспрессируемой последовательности ( EST ) представляет собой короткую подпоследовательность последовательности кДНК . [1] EST могут использоваться для идентификации транскриптов генов и сыграли важную роль в открытии генов и определении их последовательности. [2] Идентификация ЭБТ прошла быстрыми темпами: в настоящее время в общедоступных базах данных доступно около 74,2 миллиона ЭБТ (например, GenBank, 1 января 2013 г., все виды). Подходы EST в значительной степени были вытеснены полногеномным и транскриптомным секвенированием, а также метагеномным секвенированием.

EST получается в результате однократного секвенирования кДНК клонированной . кДНК, используемые для генерации EST, обычно представляют собой отдельные клоны из библиотеки кДНК . Полученная последовательность представляет собой фрагмент относительно низкого качества, длина которого ограничена современной технологией примерно 500–800 нуклеотидами . Поскольку эти клоны состоят из ДНК, комплементарной мРНК, EST представляют собой части экспрессируемых генов. Они могут быть представлены в базах данных либо как последовательность кДНК/мРНК, либо как обратный комплемент мРНК, матричная цепь .

Можно сопоставить EST с конкретными местоположениями хромосом, используя методы физического картирования , такие как радиационное гибридное картирование , картирование HAPPY или FISH . Альтернативно, если геном организма, породившего EST, секвенирован, можно сопоставить последовательность EST с этим геномом с помощью компьютера.

Современное понимание набора генов человека (по состоянию на 2006 г.) ) включает существование тысяч генов, основанное исключительно на данных EST. В этом отношении EST стали инструментом для уточнения предсказанных транскриптов этих генов, что приводит к предсказанию их белковых продуктов и, в конечном итоге, их функций. Более того, ситуация, в которой получены эти EST (ткань, орган, болезненное состояние – например, рак ), дает информацию об условиях, в которых действует соответствующий ген. EST содержат достаточно информации, чтобы позволить создавать точные зонды для микрочипов ДНК , которые затем можно использовать для определения профилей экспрессии генов .

Некоторые авторы используют термин «EST» для описания генов, о которых мало или вообще нет дополнительной информации, кроме метки. [3]

В 1979 году команды из Гарварда и Калифорнийского технологического института расширили основную идею создания ДНК-копий мРНК in vitro до амплификации библиотеки таких мРНК в бактериальных плазмидах. [4]

В 1982 году Грег Сатклифф и его коллеги исследовали идею выбора случайных или полуслучайных клонов из такой библиотеки кДНК для секвенирования. [5]

В 1983 году Путни и др. секвенировали 178 клонов из библиотеки кДНК мышц кролика. [6]

В 1991 году Адамс и его коллеги ввели термин EST и инициировали проект более систематического секвенирования (начиная с 600 кДНК головного мозга). [2]

Источники данных и аннотации

[ редактировать ]

dbEST — это подразделение Genbank, созданное в 1992 году. Что касается GenBank , данные в dbEST напрямую предоставляются лабораториями по всему миру и не контролируются.

ИС-контиги

[ редактировать ]

Из-за способа секвенирования EST многие отдельные метки экспрессируемых последовательностей часто представляют собой частичные последовательности, соответствующие одной и той же мРНК организма. Стремясь уменьшить количество экспрессируемых меток последовательностей для последующего анализа обнаружения генов, несколько групп собрали экспрессированные метки последовательностей в контиги EST . Примеры ресурсов, предоставляющих контиги EST, включают: индексы генов TIGR, [7] унигенный [8] и СТЕК [9]

Создание контигов EST нетривиально и может привести к появлению артефактов (контигов, содержащих два различных генных продукта). Когда доступна полная последовательность генома организма и аннотированы транскрипты, можно обойти сборку контигов и напрямую сопоставить транскрипты с EST. Этот подход используется в системе TissueInfo (см. ниже) и позволяет легко связать аннотации в геномной базе данных с информацией о ткани, предоставленной данными EST.

Информация о ткани

[ редактировать ]

Высокопроизводительный анализ EST часто сталкивается с аналогичными проблемами управления данными. Первая проблема заключается в том, что тканевое происхождение библиотек EST описано простым языком в dbEST. [10] Это затрудняет написание программ, которые могут однозначно определить, что две библиотеки EST были секвенированы из одной и той же ткани. Аналогичным образом, болезненные состояния ткани не аннотируются удобным для вычислений способом. Например, раковое происхождение библиотеки часто путают с названием ткани (например, название ткани « глиобластома » указывает на то, что библиотека EST была секвенирована из ткани головного мозга и болезненным состоянием является рак). [11] За заметным исключением рака, болезненное состояние часто не регистрируется в записях dbEST. Проект TissueInfo был запущен в 2000 году, чтобы помочь решить эти проблемы. Проект предоставляет тщательно подобранные данные (обновляемые ежедневно) для устранения неоднозначности происхождения тканей и болезненного состояния (рак/нерак), предлагает онтологию тканей, которая связывает ткани и органы отношениями «является частью» (т. е. формализует знание о том, что гипоталамус является частью мозга). (и этот мозг является частью центральной нервной системы) и распространяет программное обеспечение с открытым исходным кодом для связывания аннотаций транскриптов секвенированных геномов с профилями экспрессии в тканях, рассчитанными с использованием данных в dbEST. [12]

См. также

[ редактировать ]
  1. ^ Информационный бюллетень по EST . Национальный центр биотехнологической информации .
  2. ^ Перейти обратно: а б Адамс, доктор медицинских наук, Келли Дж.М., Гокейн Дж.Д. и др. (июнь 1991 г.). «Комплементарное секвенирование ДНК: метки экспрессируемых последовательностей и проект генома человека». Наука . 252 (5013): 1651–6. Бибкод : 1991Sci...252.1651A . дои : 10.1126/science.2047873 . ПМИД   2047873 . S2CID   13436211 .
  3. ^ дбEST
  4. ^ Сим Г.К., Кафатос ФК, Джонс К.В., Келер МД, Эфстратиадис А., Маниатис Т. (декабрь 1979 г.). «Использование библиотеки кДНК для исследований эволюции и экспрессии в развитии мультигенных семейств хориона» . Клетка . 18 (4): 1303–16. дои : 10.1016/0092-8674(79)90241-1 . ПМИД   519770 .
  5. ^ Сатклифф Дж.Г., Милнер Р.Дж., Блум Ф.Е., Лернер Р.А. (август 1982 г.). «Общая последовательность из 82 нуклеотидов, уникальная для РНК мозга» . Proc Natl Acad Sci США . 79 (16): 4942–6. Бибкод : 1982PNAS...79.4942S . дои : 10.1073/pnas.79.16.4942 . ПМК   346801 . ПМИД   6956902 .
  6. ^ Путни С.Д., Херлихи В.К., Шиммель П. (1983). «Новый тропонин Т и клоны кДНК 13 различных мышечных белков, обнаруженные с помощью дробовика». Природа . 302 (5910): 718–21. Бибкод : 1983Natur.302..718P . дои : 10.1038/302718a0 . ПМИД   6687628 . S2CID   4364361 .
  7. ^ Ли Ю., Цай Дж., Сункара С. и др. (январь 2005 г.). «Индексы генов TIGR: кластеризация и сборка EST и известных генов, а также интеграция с геномами эукариот» . Нуклеиновые кислоты Рез . 33 (Проблема с базой данных): D71–4. дои : 10.1093/nar/gki064 . ПМК   540018 . ПМИД   15608288 .
  8. ^ Стэнтон Дж.А., Макгрегор А.Б., Грин Д.П. (2003). «Идентификация экспрессии генов, обогащенных тканями, в тканях мышей с использованием базы данных NIH UniGene». Приложение Биоинформ . 2 (3 Приложения): S65–73. ПМИД   15130819 .
  9. ^ Кристоффельс А., ван Гелдер А., Грейлинг Г., Миллер Р., Хид Т., Хид В. (январь 2001 г.). «STACK: База знаний по выравниванию тегов последовательностей и консенсусу» . Нуклеиновые кислоты Рез . 29 (1): 234–8. дои : 10.1093/нар/29.1.234 . ПМК   29830 . ПМИД   11125101 .
  10. ^ Скрабанек Л., Кампань Ф (ноябрь 2001 г.). «TissueInfo: высокопроизводительная идентификация профилей и специфичности экспрессии тканей» . Нуклеиновые кислоты Рез . 29 (21): E102–2. дои : 10.1093/нар/29.21.e102 . ПМК   60201 . ПМИД   11691939 .
  11. ^ Кампань Ф, Скрабанек Л (2006). «Анализ меток экспрессируемых последовательностей идентифицирует маркеры рака, представляющие клинический интерес» . БМК Биоинформатика . 7 : 481. дои : 10.1186/1471-2105-7-481 . ПМЦ   1635568 . ПМИД   17078886 .
  12. ^ : Институт вычислительной биомедицины :: TissueInfo. Архивировано 4 июня 2008 г., в Wayback Machine.
[ редактировать ]

Информация о ткани

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: b26b200faa15ffd6a2f99a67e8b71ed5__1701587220
URL1:https://arc.ask3.ru/arc/aa/b2/d5/b26b200faa15ffd6a2f99a67e8b71ed5.html
Заголовок, (Title) документа по адресу, URL1:
Expressed sequence tag - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)