Тег выраженной последовательности
В генетике метка экспрессируемой последовательности ( EST ) представляет собой короткую подпоследовательность последовательности кДНК . [1] EST могут использоваться для идентификации транскриптов генов и сыграли важную роль в открытии генов и определении их последовательности. [2] Идентификация ЭБТ прошла быстрыми темпами: в настоящее время в общедоступных базах данных доступно около 74,2 миллиона ЭБТ (например, GenBank, 1 января 2013 г., все виды). Подходы EST в значительной степени были вытеснены полногеномным и транскриптомным секвенированием, а также метагеномным секвенированием.
EST получается в результате однократного секвенирования кДНК клонированной . кДНК, используемые для генерации EST, обычно представляют собой отдельные клоны из библиотеки кДНК . Полученная последовательность представляет собой фрагмент относительно низкого качества, длина которого ограничена современной технологией примерно 500–800 нуклеотидами . Поскольку эти клоны состоят из ДНК, комплементарной мРНК, EST представляют собой части экспрессируемых генов. Они могут быть представлены в базах данных либо как последовательность кДНК/мРНК, либо как обратный комплемент мРНК, матричная цепь .
Можно сопоставить EST с конкретными местоположениями хромосом, используя методы физического картирования , такие как радиационное гибридное картирование , картирование HAPPY или FISH . Альтернативно, если геном организма, породившего EST, секвенирован, можно сопоставить последовательность EST с этим геномом с помощью компьютера.
Современное понимание набора генов человека (по состоянию на 2006 г.) [update]) включает существование тысяч генов, основанное исключительно на данных EST. В этом отношении EST стали инструментом для уточнения предсказанных транскриптов этих генов, что приводит к предсказанию их белковых продуктов и, в конечном итоге, их функций. Более того, ситуация, в которой получены эти EST (ткань, орган, болезненное состояние – например, рак ), дает информацию об условиях, в которых действует соответствующий ген. EST содержат достаточно информации, чтобы позволить создавать точные зонды для микрочипов ДНК , которые затем можно использовать для определения профилей экспрессии генов .
Некоторые авторы используют термин «EST» для описания генов, о которых мало или вообще нет дополнительной информации, кроме метки. [3]
История
[ редактировать ]В 1979 году команды из Гарварда и Калифорнийского технологического института расширили основную идею создания ДНК-копий мРНК in vitro до амплификации библиотеки таких мРНК в бактериальных плазмидах. [4]
В 1982 году Грег Сатклифф и его коллеги исследовали идею выбора случайных или полуслучайных клонов из такой библиотеки кДНК для секвенирования. [5]
В 1983 году Путни и др. секвенировали 178 клонов из библиотеки кДНК мышц кролика. [6]
В 1991 году Адамс и его коллеги ввели термин EST и инициировали проект более систематического секвенирования (начиная с 600 кДНК головного мозга). [2]
Источники данных и аннотации
[ редактировать ]дбЕСТ
[ редактировать ]dbEST — это подразделение Genbank, созданное в 1992 году. Что касается GenBank , данные в dbEST напрямую предоставляются лабораториями по всему миру и не контролируются.
ИС-контиги
[ редактировать ]Из-за способа секвенирования EST многие отдельные метки экспрессируемых последовательностей часто представляют собой частичные последовательности, соответствующие одной и той же мРНК организма. Стремясь уменьшить количество экспрессируемых меток последовательностей для последующего анализа обнаружения генов, несколько групп собрали экспрессированные метки последовательностей в контиги EST . Примеры ресурсов, предоставляющих контиги EST, включают: индексы генов TIGR, [7] унигенный [8] и СТЕК [9]
Создание контигов EST нетривиально и может привести к появлению артефактов (контигов, содержащих два различных генных продукта). Когда доступна полная последовательность генома организма и аннотированы транскрипты, можно обойти сборку контигов и напрямую сопоставить транскрипты с EST. Этот подход используется в системе TissueInfo (см. ниже) и позволяет легко связать аннотации в геномной базе данных с информацией о ткани, предоставленной данными EST.
Информация о ткани
[ редактировать ]Высокопроизводительный анализ EST часто сталкивается с аналогичными проблемами управления данными. Первая проблема заключается в том, что тканевое происхождение библиотек EST описано простым языком в dbEST. [10] Это затрудняет написание программ, которые могут однозначно определить, что две библиотеки EST были секвенированы из одной и той же ткани. Аналогичным образом, болезненные состояния ткани не аннотируются удобным для вычислений способом. Например, раковое происхождение библиотеки часто путают с названием ткани (например, название ткани « глиобластома » указывает на то, что библиотека EST была секвенирована из ткани головного мозга и болезненным состоянием является рак). [11] За заметным исключением рака, болезненное состояние часто не регистрируется в записях dbEST. Проект TissueInfo был запущен в 2000 году, чтобы помочь решить эти проблемы. Проект предоставляет тщательно подобранные данные (обновляемые ежедневно) для устранения неоднозначности происхождения тканей и болезненного состояния (рак/нерак), предлагает онтологию тканей, которая связывает ткани и органы отношениями «является частью» (т. е. формализует знание о том, что гипоталамус является частью мозга). (и этот мозг является частью центральной нервной системы) и распространяет программное обеспечение с открытым исходным кодом для связывания аннотаций транскриптов секвенированных геномов с профилями экспрессии в тканях, рассчитанными с использованием данных в dbEST. [12]
См. также
[ редактировать ]- Экспрессия генов
- Комплементарная ДНК (кДНК)
- Транскриптомика
- Клоны кДНК ИЗОБРАЖЕНИЯ
- Полногеномное секвенирование (WGS)
Ссылки
[ редактировать ]- ^ Информационный бюллетень по EST . Национальный центр биотехнологической информации .
- ^ Перейти обратно: а б Адамс, доктор медицинских наук, Келли Дж.М., Гокейн Дж.Д. и др. (июнь 1991 г.). «Комплементарное секвенирование ДНК: метки экспрессируемых последовательностей и проект генома человека». Наука . 252 (5013): 1651–6. Бибкод : 1991Sci...252.1651A . дои : 10.1126/science.2047873 . ПМИД 2047873 . S2CID 13436211 .
- ^ дбEST
- ^ Сим Г.К., Кафатос ФК, Джонс К.В., Келер МД, Эфстратиадис А., Маниатис Т. (декабрь 1979 г.). «Использование библиотеки кДНК для исследований эволюции и экспрессии в развитии мультигенных семейств хориона» . Клетка . 18 (4): 1303–16. дои : 10.1016/0092-8674(79)90241-1 . ПМИД 519770 .
- ^ Сатклифф Дж.Г., Милнер Р.Дж., Блум Ф.Е., Лернер Р.А. (август 1982 г.). «Общая последовательность из 82 нуклеотидов, уникальная для РНК мозга» . Proc Natl Acad Sci США . 79 (16): 4942–6. Бибкод : 1982PNAS...79.4942S . дои : 10.1073/pnas.79.16.4942 . ПМК 346801 . ПМИД 6956902 .
- ^ Путни С.Д., Херлихи В.К., Шиммель П. (1983). «Новый тропонин Т и клоны кДНК 13 различных мышечных белков, обнаруженные с помощью дробовика». Природа . 302 (5910): 718–21. Бибкод : 1983Natur.302..718P . дои : 10.1038/302718a0 . ПМИД 6687628 . S2CID 4364361 .
- ^ Ли Ю., Цай Дж., Сункара С. и др. (январь 2005 г.). «Индексы генов TIGR: кластеризация и сборка EST и известных генов, а также интеграция с геномами эукариот» . Нуклеиновые кислоты Рез . 33 (Проблема с базой данных): D71–4. дои : 10.1093/nar/gki064 . ПМК 540018 . ПМИД 15608288 .
- ^ Стэнтон Дж.А., Макгрегор А.Б., Грин Д.П. (2003). «Идентификация экспрессии генов, обогащенных тканями, в тканях мышей с использованием базы данных NIH UniGene». Приложение Биоинформ . 2 (3 Приложения): S65–73. ПМИД 15130819 .
- ^ Кристоффельс А., ван Гелдер А., Грейлинг Г., Миллер Р., Хид Т., Хид В. (январь 2001 г.). «STACK: База знаний по выравниванию тегов последовательностей и консенсусу» . Нуклеиновые кислоты Рез . 29 (1): 234–8. дои : 10.1093/нар/29.1.234 . ПМК 29830 . ПМИД 11125101 .
- ^ Скрабанек Л., Кампань Ф (ноябрь 2001 г.). «TissueInfo: высокопроизводительная идентификация профилей и специфичности экспрессии тканей» . Нуклеиновые кислоты Рез . 29 (21): E102–2. дои : 10.1093/нар/29.21.e102 . ПМК 60201 . ПМИД 11691939 .
- ^ Кампань Ф, Скрабанек Л (2006). «Анализ меток экспрессируемых последовательностей идентифицирует маркеры рака, представляющие клинический интерес» . БМК Биоинформатика . 7 : 481. дои : 10.1186/1471-2105-7-481 . ПМЦ 1635568 . ПМИД 17078886 .
- ^ : Институт вычислительной биомедицины :: TissueInfo. Архивировано 4 июня 2008 г., в Wayback Machine.
Внешние ссылки
[ редактировать ]- «EST: открытие генов стало проще» . Научный букварь . НКБИ. 29 марта 2004 г. Архивировано из оригинала 28 февраля 2007 г.
- Понтиус, Джоан У.; Вагнер, Лукас; Шулер, Грегори Д. (2003) [2002]. «21 UniGene: унифицированный взгляд на транскриптом § теги экспрессируемых последовательностей (EST)» . В Макинтайре, Дж; Остелл, Дж. (ред.). Справочник НЦБИ . Национальный центр биотехнологической информации. НБК21101.
Эта публикация предназначена только для исторической справки, и информация может быть устаревшей.
- Фридель, CC1; Ян, К.Х.; Соммер, С; Радд, С; Мьюз, Х.В.; Тетко И.В. (15 апреля 2005 г.). «Машины опорных векторов для разделения коллекций смешанных растительных патогенов EST на основе использования кодонов (ECLAT)» . Биоинформатика . 21 (8): 1383–8. doi : 10.1093/биоинформатика/bti200 . ПМИД 15585526 .
{{cite journal}}
: CS1 maint: числовые имена: список авторов ( ссылка )- «ЭКЛАТ» . МИПС . Архивировано из оригинала 27 сентября 2008 г.
Сервер для классификации EST из смешанных пулов EST (из зараженных грибком растений) с использованием кодонов.
- «ЭКЛАТ» . МИПС . Архивировано из оригинала 27 сентября 2008 г.
- "дбЕСТ" . ГенБанк .
- «Сводка dbEST» . Генбанк . 1 января 2013 г. Архивировано из оригинала 7 июня 2019 г.
- Ранганатан, Шоба. «Биоинформатика» .
- «Веб-ресурсы для данных и анализа EST» . Архивировано из оригинала 29 августа 2007 года.
Информация о ткани
[ редактировать ]- «Информация о ткани» . Вики .
- «Информация о ткани» . Архивировано из оригинала 4 июня 2008 г.
Кураторское происхождение тканей EST, онтология тканей, программное обеспечение с открытым исходным кодом.
- Скрабанек Л., Кампань Ф (1 ноября 2001 г.). «TissueInfo: высокопроизводительная идентификация профилей и специфичности экспрессии тканей» . Нуклеиновые кислоты Рез . 29 (21): E102–2. дои : 10.1093/нар/29.21.e102 . ПМК 60201 . ПМИД 11691939 .