Серийный анализ экспрессии генов

Серийный анализ экспрессии генов ( SAGE ) — это транскриптомный метод, используемый молекулярными биологами для создания снимка популяции информационных РНК в интересующем образце в виде небольших меток, соответствующих фрагментам этих транскриптов. С тех пор было разработано несколько вариантов, в первую очередь более надежная версия LongSAGE. [2] РЛ-МУДРЕЦ [3] и самый последний SuperSAGE. [4] Многие из них усовершенствовали технику за счет захвата более длинных меток, что позволяет более уверенно идентифицировать исходный ген.
Обзор
[ редактировать ]Вкратце, эксперименты SAGE проходят следующим образом:
- мРНК используют входного образца (например, опухоли ) выделяют и транскриптазу и биотинилированные обратную праймеры для синтеза кДНК из мРНК .
- кДНК связывается с шариками стрептавидина посредством взаимодействия с биотином, прикрепленным к праймерам, а затем расщепляется с помощью эндонуклеазы рестрикции, называемой якорным ферментом (AE). Местоположение сайта расщепления и, следовательно, длина оставшейся кДНК, связанной с шариком, будет варьироваться для каждой отдельной кДНК (мРНК).
- Расщепленную кДНК ниже сайта расщепления затем отбрасывают, а оставшиеся неподвижные фрагменты кДНК выше сайта расщепления делят пополам и подвергают воздействию одного из двух адаптерных олигонуклеотидов (А или В), содержащих несколько компонентов в следующем порядке выше места присоединения. сайт: 1) липкие концы с участком разреза AE, позволяющие прикрепиться к расщепленной кДНК; 2) Сайт узнавания эндонуклеазы рестрикции, известной как мечущий фермент (ТЕ), который разрезает примерно 15 нуклеотидов ниже своего сайта узнавания (внутри исходной последовательности кДНК/мРНК); 3) Короткая последовательность праймера, уникальная для адаптера A или B, которая позже будет использоваться для дальнейшей амплификации посредством ПЦР.
- После лигирования адаптера кДНК расщепляют с помощью ТЕ для удаления их из шариков, оставляя только короткую «метку» длиной около 11 нуклеотидов исходной кДНК (15 нуклеотидов минус 4, соответствующие сайту узнавания AE).
- Расщепленные метки кДНК затем восстанавливаются с помощью ДНК-полимеразы для получения фрагментов кДНК с тупыми концами.
- Эти фрагменты метки кДНК (с прикрепленными праймерами-адаптерами и сайтами узнавания AE и TE) лигируются, соединяя две последовательности метки вместе и фланкируя адаптеры A и B на обоих концах. Эти новые конструкции, называемые ditags , затем амплифицируются с помощью ПЦР с использованием специфических праймеров A и B.
- Затем дитаги расщепляются с использованием исходного AE и позволяют им соединиться с другими дитагами, которые будут лигированы с образованием конкатемера кДНК , в котором каждый дитаг разделяется сайтом узнавания AE.
- Эти конкатемеры затем трансформируются в бактерии для амплификации посредством репликации бактерий.
- Конкатемеры кДНК затем можно выделить и секвенировать с помощью современных высокопроизводительных секвенаторов ДНК , а эти последовательности можно проанализировать с помощью компьютерных программ, которые количественно определяют повторяемость отдельных меток.
Анализ
[ редактировать ]Выходные данные SAGE представляют собой список тегов коротких последовательностей и количество раз, когда они наблюдаются. Используя базы данных последовательностей, исследователь обычно может с некоторой уверенностью определить, из какой исходной мРНК (и, следовательно, из какого гена ) была извлечена метка.
Статистические методы можно применять к спискам меток и подсчета из разных образцов, чтобы определить, какие гены экспрессируются более высоко. Например, образец нормальной ткани можно сравнить с соответствующей опухолью, чтобы определить, какие гены имеют тенденцию быть более (или менее) активными.
История
[ редактировать ]В 1979 году команды из Гарварда и Калифорнийского технологического института расширили основную идею создания ДНК-копий мРНК in vitro до амплификации библиотеки таких мРНК в бактериальных плазмидах. [5] В 1982–1983 годах идея отбора случайных или полуслучайных клонов из такой библиотеки кДНК для секвенирования была исследована Грегом Сатклиффом и его коллегами. [6] и Путни и др. которые секвенировали 178 клонов из библиотеки кДНК мышц кролика. [7] В 1991 году Адамс и его коллеги ввели термин « метка экспрессируемой последовательности» (EST) и инициировали более систематическое секвенирование кДНК в качестве проекта (начав с 600 кДНК головного мозга). [8] Идентификация ЭБТ шла быстрыми темпами, миллионы ЭБТ теперь доступны в общедоступных базах данных (например, GenBank ).
В 1995 году идея уменьшить длину метки со 100 до 800 п.н. до длины метки от 10 до 22 п.н. помогла снизить стоимость исследований мРНК. [9] В этом году оригинальный протокол SAGE был опубликован Виктором Велкулеску в Онкологическом центре Университета Джонса Хопкинса . [9] Хотя SAGE изначально был задуман для использования в исследованиях рака, он успешно использовался для описания транскриптома других заболеваний и у самых разных организмов.
Сравнение с микрочипами ДНК
[ редактировать ]Общая цель метода аналогична микрочипу ДНК . Однако отбор проб SAGE основан на секвенировании выходной мРНК, а не на гибридизации выходной мРНК с зондами, поэтому уровни транскрипции измеряются более количественно, чем с помощью микроматрицы. Кроме того, последовательности мРНК не обязательно должны быть известны априори , поэтому можно обнаружить неизвестные гены или варианты генов. Эксперименты на микрочипах гораздо дешевле проводить, поэтому в крупномасштабных исследованиях SAGE обычно не используется. Количественная оценка экспрессии генов является более точной в SAGE, поскольку она включает прямой подсчет количества транскриптов, тогда как интенсивность пятен в микрочипах падает в недискретных градиентах и склонна к фоновому шуму.
Варианты протоколов
[ редактировать ]клонирование микроРНК
[ редактировать ]МикроРНК , или сокращенно микроРНК, представляют собой небольшие (~22 нуклеотида) сегменты РНК, которые, как было обнаружено, играют решающую роль в регуляции генов. Один из наиболее часто используемых методов клонирования и идентификации микроРНК внутри клетки или ткани был разработан в лаборатории Бартеля и опубликован в статье Lau et al. (2001). С тех пор появилось несколько вариантов протоколов, но большинство из них имеют один и тот же базовый формат. Процедура очень похожа на SAGE: выделяют малую РНК, затем к каждой добавляют линкеры, и РНК преобразуется в кДНК с помощью RT-PCR . После этого линкеры, содержащие внутренние сайты рестрикции, расщепляются соответствующим ферментом рестрикции, а липкие концы лигируются вместе в конкатамеры. После конкатенации фрагменты лигируются в плазмиды и используются для трансформации бактерий с целью создания множества копий плазмиды, содержащей вставки. Затем их можно секвенировать для идентификации присутствующей микроРНК, а также для анализа уровней экспрессии данной микроРНК путем подсчета количества раз, когда она присутствует, аналогично SAGE.
LongSAGE и RL-SAGE
[ редактировать ]LongSAGE был более надежной версией оригинального SAGE, разработанного в 2002 году, который имел более высокую производительность и использовал 20 мкг мРНК для создания библиотеки кДНК, состоящей из тысяч тегов. [10] Robust LongSage (RL-SAGE) Дальнейшее улучшение протокола LongSAGE с возможностью создания библиотеки с размером вставки 50 нг мРНК , что намного меньше, чем у предыдущего размера вставки LongSAGE 2 мкг мРНК. [10] и использование меньшего количества дитаг-полимеразных цепных реакций ( ПЦР ) для получения полной библиотеки кДНК . [11]
СуперSAGE
[ редактировать ]SuperSAGE является производным SAGE, который использует эндонуклеазу типа III EcoP15I фага P1 каждого транскрипта для вырезания меток последовательности длиной 26 п.н. из кДНК , увеличивая размер метки как минимум на 6 п.н. по сравнению с предшествующими методами SAGE и LongSAGE. [12] Более длинный размер тега позволяет более точно отнести тег к соответствующему транскрипту, поскольку каждая дополнительная база значительно увеличивает точность аннотации.
формируются так называемые дитаги с тупыми концами Как и в исходном протоколе SAGE, с помощью тегов . Однако SuperSAGE позволяет избежать систематической ошибки, наблюдаемой во время менее случайного дитаг-лигирования LongSAGE 20 п.н. [13] Путем прямого секвенирования с использованием методов высокопроизводительного секвенирования ( секвенирование нового поколения , т.е. пиросеквенирование ) можно анализировать сотни тысяч или миллионы меток одновременно, создавая очень точные и количественные профили экспрессии генов . Таким образом, профилирование экспрессии генов на основе меток, также называемое «цифровым профилированием экспрессии генов» (DGE), сегодня может обеспечить наиболее точные профили транскрипции, которые преодолевают ограничения микрочипов . [14] [15]
Секвенирование 3'-конца мРНК, массовый анализ концов кДНК
[ редактировать ]В середине 2010-х годов было разработано несколько методов в сочетании с секвенированием следующего поколения, которые используют принцип «метки» для «цифрового профилирования экспрессии генов», но без использования мечущего фермента. Подход «MACE» (=массовый анализ концов кДНК) генерирует теги где-то в последних 1500 битах в секунду транскрипта. Этот метод больше не зависит от ферментов рестрикции и тем самым позволяет избежать систематической ошибки, связанной с отсутствием или расположением сайта рестрикции внутри кДНК. Вместо этого кДНК фрагментируется случайным образом, и 3'-концы секвенируются от 5'-конца молекулы кДНК, несущей поли-А-хвост. Длина последовательности тега может быть выбрана свободно. Благодаря этому теги можно объединять в контиги, а аннотацию тегов можно значительно улучшить. Поэтому MACE также используется для анализа немодельных организмов. Кроме того, более длинные контиги можно проверять на наличие полиморфизма. Поскольку UTR демонстрируют большое количество полиморфизмов между особями, подход MACE может применяться для определения аллелей, профилирования экспрессии аллель-специфичных генов и поиска молекулярных маркеров для селекции. Кроме того, подход позволяет определить альтернативное полиаденилирование транскриптов. Поскольку MACE требует только 3'-концов транскриптов, даже частично деградировавшую РНК можно анализировать с меньшей погрешностью, зависящей от деградации. Подход MACE использует уникальные молекулярные идентификаторы, позволяющие выявить систематическую ошибку ПЦР. [16]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Шафи, Томас; Лоу, Рохан (2017). «Строение генов эукариот и прокариот» . Викижурнал медицины . 4 (1). дои : 10.15347/wjm/2017.002 . ISSN 2002-4436 .
- ^ Саха С. и др. (2002). «Использование транскриптома для аннотирования генома». Нат Биотехнология . 20 (5): 508–12. дои : 10.1038/nbt0502-508 . ПМИД 11981567 . S2CID 12709815 .
- ^ Гауда М; Джантасуриярат С; Дин Р.А.; Ван Гл. (2004). «Robust-LongSAGE (RL-SAGE): существенно улучшенный метод LongSAGE для открытия генов и анализа транскриптома» . Физиол растений . 134 (3): 890–7. дои : 10.1104/стр.103.034496 . ПМЦ 389912 . ПМИД 15020752 .
- ^ Мацумура Х; Ито А; Сайто Х; Зимний П; Каль Г; Рейтер М; Крюгер Д.Х.; Тераучи Р. (2005). «СуперСЭЙДЖ» . Клеточная микробиол . 7 (1): 11–8. дои : 10.1111/j.1462-5822.2004.00478.x . ПМИД 15617519 . S2CID 221579149 .
- ^ Сим ГК; Кафатос ФК; Джонс CW; Келер, доктор медицинских наук; Эфстратиадис А; Маниатис Т. (декабрь 1979 г.). «Использование библиотеки кДНК для исследований эволюции и экспрессии в развитии мультигенных семейств хориона» . Клетка . 18 (4): 1303–16. дои : 10.1016/0092-8674(79)90241-1 . ПМИД 519770 .
- ^ Сатклифф Дж.Г.; Милнер Р.Дж.; Блум ФЭ; Лернер Р.А. (август 1982 г.). «Общая последовательность из 82 нуклеотидов, уникальная для РНК мозга» . Proc Natl Acad Sci США . 79 (16): 4942–6. Бибкод : 1982PNAS...79.4942S . дои : 10.1073/pnas.79.16.4942 . ПМК 346801 . ПМИД 6956902 .
- ^ Путни С.Д.; Херлихи туалет; Шиммель П. (1983). «Новый тропонин Т и клоны кДНК 13 различных мышечных белков, обнаруженные с помощью дробовика». Природа . 302 (5910): 718–21. Бибкод : 1983Natur.302..718P . дои : 10.1038/302718a0 . ПМИД 6687628 . S2CID 4364361 .
- ^ Адамс, доктор медицинских наук, Келли Дж.М., Гокейн Дж.Д. и др. (июнь 1991 г.). «Комплементарное секвенирование ДНК: метки экспрессируемых последовательностей и проект генома человека». Наука . 252 (5013): 1651–6. Бибкод : 1991Sci...252.1651A . дои : 10.1126/science.2047873 . ПМИД 2047873 . S2CID 13436211 .
- ^ Перейти обратно: а б Велкулеску В.Е.; Чжан Л; Фогельштейн Б; Кинцлер К.В. (1995). «Серийный анализ экспрессии генов». Наука . 270 (5235): 484–7. Бибкод : 1995Sci...270..484В . дои : 10.1126/science.270.5235.484 . ПМИД 7570003 . S2CID 16281846 .
- ^ Перейти обратно: а б Саха С. и др. (2002). «Использование транскриптома для аннотирования генома». Nat Biotechnol 20(5): 508-512.
- ^ Гауда, М. и др. (2004). «Robust-LongSAGE (RL-SAGE): существенно улучшенный метод LongSAGE для открытия генов и анализа транскриптома». Растительная Физиол 134(3): 890-897.
- ^ Мацумура, Х.; Райх, С.; Ито, А.; Сайто, Х.; Камун, С.; Зима, П.; Каль, Г.; Рейтер, М.; Крюгер, Д.; Тераучи, Р. (2003). «Анализ экспрессии генов взаимодействия растения-хозяина и патогена с помощью SuperSAGE» . Труды Национальной академии наук . 100 (26): 15718–15723. Бибкод : 2003PNAS..10015718M . дои : 10.1073/pnas.2536670100 . ПМК 307634 . ПМИД 14676315 .
- ^ Гауда, Малали; Джантасуриярат, Чатчаван; Дин, Ральф А.; Ван, Го-Лян (01 марта 2004 г.). «Robust-LongSAGE (RL-SAGE): существенно улучшенный метод LongSAGE для обнаружения генов и анализа транскриптома» . Физиология растений . 134 (3): 890–897. дои : 10.1104/стр.103.034496 . ISSN 1532-2548 . ПМЦ 389912 . ПМИД 15020752 .
- ^ Шендюр, Дж. (2008). «Начало конца микрочипов?». Природные методы . 5 (7): 585–7. дои : 10.1038/nmeth0708-585 . ПМИД 18587314 . S2CID 29682662 .
- ^ Мацумура, Х.; Бин Насир, КХ; Ёсида, К.; Ито, А.; Каль, Дж.Н.; Крюгер, Д.Х.; Тераучи, Р. (2006). «Массив SuperSAGE: прямое использование тегов транскриптов из 26 пар оснований в массивах олигонуклеотидов». Природные методы . 3 (6): 469–74. дои : 10.1038/nmeth882 . ПМИД 16721381 . S2CID 19160070 .
- ^ Завада, Адам (январь 2014 г.). «Массовый анализ концов кДНК (MACE) и профилирование экспрессии микроРНК идентифицирует проатерогенные пути при хронической болезни почек» . Эпигенетика . 9 (1): 161–172. дои : 10.4161/epi.26931 . ПМЦ 3928179 . ПМИД 24184689 .