Секвенирование красителя Illumina
Секвенирование красителем Illumina — это метод, используемый для определения ряда пар оснований в ДНК , также известный как секвенирование ДНК . Концепция обратимой терминированной химии была изобретена Бруно Канардом и Саймоном Сарфати в Институте Пастера в Париже. [1] [2] Его разработали Шанкар Баласубраманян и Дэвид Кленерман из Кембриджского университета. [3] который впоследствии основал Solexa, компанию, позже приобретенную Illumina . Этот метод секвенирования основан на обратимых красителях-терминаторах, которые позволяют идентифицировать отдельные нуклеотиды, когда они промываются по цепям ДНК. Его также можно использовать для полногеномного секвенирования и секвенирования областей, транскриптома анализа , метагеномики малых РНК , обнаружения , профилирования метилирования и полногеномного анализа взаимодействия белка и нуклеиновой кислоты . [4] [5]
Обзор
[ редактировать ]Это работает в три основных этапа: амплификация, упорядочивание и анализ. Процесс начинается с очищенной ДНК. ДНК фрагментируется, и добавляются адаптеры, содержащие сегменты, которые действуют как контрольные точки во время амплификации, секвенирования и анализа. Модифицированную ДНК загружают в проточную ячейку, где будут происходить амплификация и секвенирование. Проточная ячейка содержит нанолунки, которые распределяют фрагменты и помогают избежать переполнения. [6] Каждая нанолунка содержит олигонуклеотиды, которые обеспечивают точку крепления адаптеров. Как только фрагменты прикрепятся, начинается фаза, называемая генерацией кластера. На этом этапе создается около тысячи копий каждого фрагмента ДНК с помощью ПЦР с мостиковой амплификацией . Далее на чип наносятся праймеры и модифицированные нуклеотиды. Эти нуклеотиды обладают обратимым блокатором флуоресценции, поэтому ДНК-полимераза может добавлять к фрагменту ДНК только один нуклеотид за раз. [6] После каждого раунда синтеза камера фотографирует чип. Компьютер определяет, какое основание было добавлено, по длине волны флуоресцентной метки и записывает это для каждого пятна на чипе. После каждого раунда невключившиеся молекулы смываются. Затем используется этап химического деблокирования для удаления 3'-блокирующей группы флуоресцентного конца. Процесс продолжается до тех пор, пока не будет секвенирована полная молекула ДНК. [5] С помощью этой технологии тысячи мест по всему геному секвенируются одновременно посредством массового параллельного секвенирования .
Процедура
[ редактировать ]Геномная библиотека
[ редактировать ]После очистки ДНК необходимо создать библиотеку ДНК, геномную библиотеку. Существует два способа создания геномной библиотеки: обработка ультразвуком и тагментация. При тагментации транспозазы случайным образом разрезают ДНК на фрагменты размером от 50 до 500 п.о. и одновременно добавляют адаптеры. [6] Генетическая библиотека также может быть создана с помощью обработки ультразвуком для фрагментации геномной ДНК. Обработка ультразвуком фрагментирует ДНК до одинаковых размеров с помощью ультразвуковых звуковых волн. Правый и левый адаптеры должны быть прикреплены ДНК-полимеразой Т7 и ДНК-лигазой Т4 после обработки ультразвуком. Пряди, к которым не удалось перевязать адаптеры, смывают. [7]
Адаптеры
[ редактировать ]Адаптеры содержат три разных сегмента: последовательность, комплементарную твердой подложке (олигонуклеотиды на проточной кювете), последовательность штрих-кода (индексы) и сайт связывания для праймера секвенирования. [6] Индексы обычно имеют длину шесть пар оснований и используются во время анализа последовательности ДНК для идентификации образцов. Индексы позволяют одновременно обрабатывать до 96 различных выборок, это также называется мультиплексированием. Во время анализа компьютер сгруппирует все чтения с одним и тем же индексом. [8] [9] Illumina использует подход «последовательность путем синтеза». [9] Этот процесс происходит внутри стеклянной проточной кюветы с акриламидным покрытием. [10] Проточная ячейка имеет олигонуклеотиды (короткие нуклеотидные последовательности), покрывающие нижнюю часть ячейки и служащие прочной опорой, удерживающей нити ДНК на месте во время секвенирования. Когда фрагментированная ДНК промывается проточной кюветой, соответствующий адаптер прикрепляется к комплементарной твердой подложке.
Мостовое усиление
[ редактировать ]После подключения можно начать создание кластера. Цель состоит в том, чтобы создать сотни идентичных нитей ДНК. Некоторые будут передней прядью; в остальном наоборот. Поэтому используются правый и левый адаптеры. Кластеры генерируются посредством мостового усиления. ДНК-полимераза движется вдоль цепи ДНК, создавая комплементарную ей цепь. Исходную прядь смывают, оставляя только обратную прядь. На вершине обратной пряди находится переходная последовательность. Нить ДНК изгибается и прикрепляется к олигонуклеотиду, комплементарному верхней адаптерной последовательности. Полимеразы прикрепляются к обратной цепи, и образуется ее комплементарная цепь (идентичная исходной). Теперь двухцепочечная ДНК денатурирована, так что каждая цепь может отдельно прикрепляться к олигонуклеотидной последовательности, закрепленной на проточной ячейке. Одна будет обратной прядью; другой, вперед. Этот процесс называется мостовой амплификацией, и он происходит одновременно для тысяч кластеров по всей проточной кювете. [11]
Клональная амплификация
[ редактировать ]Снова и снова нити ДНК изгибаются и прикрепляются к твердой основе. ДНК-полимераза синтезирует новую цепь для создания двухцепочечного сегмента, который будет денатурирован так, что все цепи ДНК в одной области происходят из одного источника (клональная амплификация). Клональная амплификация важна для целей контроля качества. Если обнаружено, что цепь имеет нечетную последовательность, ученые могут проверить обратную цепь, чтобы убедиться, что она имеет дополнение той же странности. Прямая и обратная нити действуют как ограничители, защищающие от артефактов. Поскольку при секвенировании Illumina используется ДНК-полимераза, наблюдались ошибки замены оснований. [12] особенно на 3'-конце. [13] Парные конечные чтения в сочетании с генерацией кластера могут подтвердить наличие ошибки. Обратные и прямые цепи должны дополнять друг друга, все обратные чтения должны соответствовать друг другу, а все прямые чтения должны соответствовать друг другу. Если чтение недостаточно похоже на свои аналоги (с которыми оно должно быть клоном), возможно, произошла ошибка. В некоторых лабораторных анализах использовался минимальный порог сходства в 97%. [13]
Последовательность путем синтеза
[ редактировать ]В конце клональной амплификации все обратные цепи смываются с проточной кюветы, оставляя только прямые цепи. Праймер прикрепляется к участку связывания праймера адаптера прямых цепей, а полимераза добавляет флуоресцентно меченный dNTP к цепи ДНК. За один раунд можно добавить только одно основание, поскольку флуорофор действует как блокирующая группа; однако группа блокировки является обратимой. [6] Благодаря четырехцветной химии каждая из четырех баз имеет уникальное излучение, и после каждого раунда машина записывает, какая база была добавлена. После регистрации цвета флуорофор смывают, а другой дНТФ промывают проточную кювету, и процесс повторяется.
Начиная с запуска NextSeq, а затем и MiniSeq, компания Illumina представила новый химический метод двухцветного секвенирования. Нуклеотиды различаются либо по одному из двух цветов (красный или зеленый), либо по отсутствию цвета («черный»), либо по сочетанию обоих цветов (оранжевый как смесь красного и зеленого).
После прочтения цепи ДНК только что добавленная цепь смывается. Затем праймер с индексом 1 прикрепляется, полимеризует последовательность индекса 1 и смывается. Нить снова образует мост, и 3'-конец цепи ДНК прикрепляется к олигонуклеотиду на проточной ячейке. Праймер с индексом 2 прикрепляется, полимеризует последовательность и смывается.
Полимераза секвенирует комплементарную цепь поверх дугообразной цепи. Они разделяются, и 3'-конец каждой нити блокируется. Прямая цепь смывается, и процесс секвенирования путем синтеза повторяется для обратной цепи.
Анализ данных
[ редактировать ]Секвенирование происходит одновременно для миллионов кластеров, и каждый кластер содержит около 1000 идентичных копий вставки ДНК. [12] Данные последовательности анализируются путем поиска фрагментов с перекрывающимися областями, называемыми контигами , и их выравнивания. Если эталонная последовательность известна, контиги затем сравниваются с ней для идентификации варианта.
Этот поэтапный процесс позволяет ученым увидеть полную последовательность, даже если нефрагментированная последовательность никогда не запускалась; однако, поскольку длина чтения Illumina не очень велика [13] (Секвенирование HiSeq может обеспечить длину считывания около 90 п.о. [8] ), может возникнуть проблема с разрешением коротких тандемных повторяющихся областей. [8] [12] Кроме того, если последовательность создана заново и ссылка не существует, повторяющиеся области могут вызвать большие трудности при сборке последовательности. [12] Дополнительные трудности включают замены оснований (особенно на 3'-конце ридов). [13] ) из-за неточных полимераз, химерных последовательностей и систематической ошибки ПЦР, все из которых могут способствовать созданию неправильной последовательности. [13]
Сравнение с другими методами секвенирования
[ редактировать ]Этот метод предлагает несколько преимуществ по сравнению с традиционными методами секвенирования, такими как секвенирование по Сэнгеру . Секвенирование по Сэнгеру требует двух реакций: одной для прямого праймера, а другой для обратного праймера. В отличие от Illumina, при секвенировании по Сэнгеру для определения последовательности фрагмента ДНК используются флуоресцентно меченные дидезоксинуклеозидтрифосфаты (ddNTP). В ddNTP отсутствует 3'-ОН-группа, и они навсегда прекращают синтез ДНК. [6] В каждую реакционную пробирку добавляются dNTP и ddNTP, а также ДНК-полимераза и праймеры. Соотношение ddNTP к dNTP имеет значение, поскольку ДНК-матрица должна быть полностью синтезирована, а избыток ddNTP приведет к созданию множества фрагментов одинакового размера и положения матрицы ДНК. Когда ДНК-полимераза добавляет ddNTP, фрагмент терминируется и синтезируется новый фрагмент. Каждый синтезированный фрагмент на один нуклеотид длиннее предыдущего. После полного синтеза матрицы ДНК фрагменты разделяют с помощью капиллярного электрофореза. В нижней части капиллярной трубки лазер возбуждает флуоресцентно меченные ddNTP, а камера фиксирует излучаемый цвет.
Благодаря автоматизированному характеру секвенирования красителей Illumina можно секвенировать несколько цепей одновременно и быстро получать фактические данные секвенирования. При секвенировании по Сэнгеру одновременно можно секвенировать только одну цепь, и это происходит относительно медленно. Illumina использует только ДНК-полимеразу , а не множество дорогостоящих ферментов, необходимых для других методов секвенирования (например, пиросеквенирования ). [14]
Ссылки
[ редактировать ]- ^ CA 2158975 , Канард, Бруно и Сарфати, Саймон, «Новые производные, используемые для секвенирования нуклеиновых кислот», опубликовано 13 октября 1994 г., передано Институту Пастера.
- ^ Канард Б., Сарфати Р.С. (октябрь 1994 г.). «Флуоресцентные субстраты ДНК-полимеразы с обратимыми 3'-метками». Джин . 148 (1): 1–6. дои : 10.1016/0378-1119(94)90226-7 . ПМИД 7523248 .
- ^ «История секвенирования Illumina» . Архивировано из оригинала 12 октября 2014 года.
- ^ «Illumina — Секвенирование и решения на основе массивов для генетических исследований» . www.illumina.com .
- ^ Перейти обратно: а б Мейер М., Кирхер М. (июнь 2010 г.). «Подготовка библиотеки секвенирования Illumina для захвата и секвенирования мультиплексированных мишеней». Протоколы Колд-Спринг-Харбора . 2010 (6): pdb.prot5448. дои : 10.1101/pdb.prot5448 . ПМИД 20516186 .
- ^ Перейти обратно: а б с д и ж Кларк, Дэвид П. (2 ноября 2018 г.). Молекулярная биология . Паздерник, Нанетт Джин, МакГи, Мишель Р. (Третье изд.). Лондон. ISBN 978-0-12-813289-0 . OCLC 1062496183 .
{{cite book}}
: CS1 maint: отсутствует местоположение издателя ( ссылка ) - ^ Перейти обратно: а б «Технология секвенирования Illumina» . Ютуб . Проверено 24 сентября 2015 г.
- ^ Перейти обратно: а б с Фэн Ю.Дж., Лю Ц.Ф., Чен М.Ю., Лян Д., Чжан П. (январь 2016 г.). «Параллельное секвенирование ампликонов с метками относительно длинных продуктов ПЦР с использованием платформы Illumina HiSeq и сборки транскриптома». Ресурсы молекулярной экологии . 16 (1): 91–102. дои : 10.1111/1755-0998.12429 . ПМИД 25959587 . S2CID 36882760 .
- ^ Перейти обратно: а б Illumina, Inc. «Мультиплексное секвенирование с помощью системы анализатора генома Illumina» (PDF) . Проверено 25 сентября 2015 г.
- ^ Куэйл М.А., Смит М., Коупленд П., Отто Т.Д., Харрис С.Р., Коннор Т.Р. и др. (июль 2012 г.). «Рассказ о трех платформах секвенирования следующего поколения: сравнение секвенаторов Ion Torrent, Pacific Biosciences и Illumina MiSeq» . БМК Геномика . 13 :341. дои : 10.1186/1471-2164-13-341 . ПМЦ 3431227 . ПМИД 22827831 .
- ^ Кларк, Дэвид П.; Паздерник, Нанетт Дж.; МакГи, Мишель Р. (2019). Молекулярная биология . Академическая ячейка. стр. 253–255. ISBN 9780128132883 .
- ^ Перейти обратно: а б с д Морозова О., Марра М.А. (ноябрь 2008 г.). «Применение технологий секвенирования нового поколения в функциональной геномике». Геномика . 92 (5): 255–64. дои : 10.1016/j.ygeno.2008.07.001 . ПМИД 18703132 .
- ^ Перейти обратно: а б с д и Чон Ю.С., Пак СК, Лим Дж., Чун Дж., Ким Б.С. (январь 2015 г.). «Улучшенный конвейер для уменьшения ошибочной идентификации по последовательностям 16S рРНК с использованием платформы Illumina MiSeq». Журнал микробиологии . 53 (1): 60–9. дои : 10.1007/s12275-015-4601-y . ПМИД 25557481 . S2CID 17210846 .
- ^ Ронаги, Мостафа; Улен, Матиас; Нюрен, Пол (17 июля 1998 г.). «Метод секвенирования на основе пирофосфата реального времени» . Наука . 281 (5375): 363–365. дои : 10.1126/science.281.5375.363 . ISSN 0036-8075 . ПМИД 9705713 .