Дуплексное секвенирование
![]() | Эта статья может быть слишком технической для понимания большинства читателей . ( январь 2021 г. ) |

Дуплексное секвенирование — это библиотек метод подготовки и анализа для платформ секвенирования следующего поколения (NGS), в котором используется случайная маркировка двухцепочечной ДНК для обнаружения мутаций с более высокой точностью и меньшим уровнем ошибок.
используются вырожденные молекулярные метки В этом методе помимо адаптеров секвенирования для распознавания считываний, происходящих из каждой цепи ДНК. Поскольку две цепи комплементарны, истинные мутации обнаруживаются в одном и том же положении в обеих цепях. Напротив, ошибки ПЦР или секвенирования приводят к мутациям только в одной цепи и, таким образом, могут быть расценены как техническая ошибка. Дуплексное секвенирование теоретически может обнаруживать мутации с частотой всего 5 x 10. −8 — это более чем в 10 000 раз выше по точности по сравнению с традиционными методами секвенирования нового поколения. [1] [2]
Предполагаемая частота ошибок стандартных платформ секвенирования нового поколения составляет 10. −2 до 10 −3 за каждый базовый вызов. При такой частоте ошибок миллиарды базовых вызовов, генерируемых NGS, приведут к миллионам ошибок. Ошибки, возникающие во время подготовки проб и секвенирования, такие как ошибки полимеразной цепной реакции , секвенирования и анализа изображений. Хотя частота ошибок платформ NGS приемлема в некоторых приложениях, таких как обнаружение клональных вариантов , это является основным ограничением для приложений, требующих более высокой точности для обнаружения низкочастотных вариантов, таких как обнаружение внутриорганного мозаицизма , субклональных вариантов в генетических вариантах. гетерогенные виды рака или циркулирующая опухолевая ДНК. [3] [4] [5]
Было разработано несколько стратегий подготовки библиотек, которые повышают точность платформ NGS, таких как молекулярное штрих-кодирование и метод кольцевого консенсусного секвенирования. [6] [7] [8] [9] Как и платформы NGS, данные, генерируемые этими методами, происходят из одной цепи ДНК, и поэтому ошибки, возникающие во время ПЦР-амплификации , обработки тканей , экстракции ДНК , гибридизационного захвата (где используется) или самого секвенирования ДНК, по-прежнему можно отличить как верный вариант. Метод дуплексного секвенирования решает эту проблему, используя комплементарную природу двух цепей ДНК и подтверждая только те варианты, которые присутствуют в обеих цепях ДНК. Поскольку вероятность возникновения двух дополнительных ошибок в одном и том же месте обеих цепей чрезвычайно низка, дуплексное секвенирование значительно увеличивает точность секвенирования. [1] [6] [8] [10]
Экспериментальный рабочий процесс
[ редактировать ]Маркированные адаптеры для дуплексного секвенирования можно использовать в сочетании с большинством адаптеров NGS. В разделе рисунков и рабочего процесса этой статьи в качестве примера используются адаптеры секвенирования Illumina, соответствующие оригинальному опубликованному протоколу. [1] [2]

Адаптерный отжиг
[ редактировать ]На этом этапе используются два олигонуклеотида (рис. 1: адаптерные олигонуклеотиды). Один из олигонуклеотидов содержит 12-нуклеотидную одноцепочечную случайную меточную последовательность, за которой следует фиксированная 5'-нуклеотидная последовательность (черная последовательность на рисунке 1). На этом этапе олигонуклеотиды отжигаются . в комплементарной области путем инкубации в необходимых временных условиях [1] [2]
Синтез адаптера
[ редактировать ]Адаптеры, которые успешно отжигаются , удлиняются и синтезируются ДНК-полимеразой, образуя двухцепочечный адаптер, содержащий комплементарные метки (рис. 1). [1] [2]
3'-дТ-хвост
[ редактировать ]Удлиненные двухцепочечные адаптеры расщепляются HpyCH4III в специфическом сайте рестрикции , расположенном на 3'-стороне меточной последовательности, и приводят к образованию выступающего конца 3'-dT, который будет лигирован с выступающим 3'-dA в библиотеках ДНК в адаптера этап лигирования (рис. 1). [1] [2]
Подготовка библиотеки
[ редактировать ]Двухцепочечную ДНК разрезают с помощью одного из этих методов: обработки ультразвуком , ферментативного расщепления или распыления. Фрагменты подбираются по размеру с помощью бусин Ampure XP. Выбор размера на основе геля не рекомендуется, поскольку это может привести к плавлению двойных нитей ДНК и повреждению ДНК из-за воздействия УФ-излучения . Размер выбранных фрагментов ДНК подвергается 3'-концу dA-хвоста. [1] [2]
Лигирование адаптера
[ редактировать ]На этом этапе два меченых адаптера лигируются от 3'-dT-хвостов к 3'-dA-хвостам с обеих сторон фрагментов библиотеки двухцепочечной ДНК. В результате этого процесса образуются двухцепочечные фрагменты библиотеки, которые содержат по две случайные метки (α и β) на каждой стороне, которые являются обратным дополнением друг друга (рис. 1 и 2). Соотношение «ДНК:адаптер» имеет решающее значение для успеха лигирования. [1] [2]
Вставка адаптеров секвенирования в меченные библиотеки
[ редактировать ]На последнем этапе подготовки библиотеки дуплексного секвенирования адаптеры секвенирования Illumina добавляются к меченным двухцепочечным библиотекам путем ПЦР-амплификации с использованием праймеров, содержащих адаптеры секвенирования. Во время ПЦР-амплификации обе комплементарные цепи ДНК амплифицируются и образуют два типа ПЦР-продуктов. Продукт 1 происходит от цепи 1, которая имеет уникальную последовательность меток (называемую α на рис. 2) рядом с адаптером Illumina 1, а продукт 2 имеет уникальную метку (называемую β на рис. 2) рядом с адаптером Illumina 1. (В каждой цепочке , тег α является обратным дополнением тега β и наоборот). Библиотеки, содержащие дуплексные метки и адаптеры Illumina, секвенируются с использованием системы Illumina TruSeq. Считывания, происходящие из каждой цепи ДНК, образуют группу ридов (семейств тегов), которые имеют один и тот же тег. Обнаруженные семейства прочтений будут использоваться на следующем этапе для анализа данных секвенирования. [1] [2]
Соображения
[ редактировать ]Эффективность лигирования адаптера
[ редактировать ]Эффективность лигирования адаптера очень важна для успешного дуплексного секвенирования. Дополнительное количество библиотек или адаптеров может повлиять на баланс ДНК и адаптеров, что приведет к неэффективному лигированию и избыточному количеству димеров праймеров соответственно. Поэтому важно поддерживать оптимальное соотношение молярной концентрации ДНК к адаптеру (0,05). [2]
Отметить размер семьи
[ редактировать ]Эффективность дуплексного секвенирования зависит от конечного числа DCS, которое напрямую связано с количеством прочтений в каждом семействе (размером семейства). Если размер семейства слишком мал, DCS не может быть собрана, а если слишком много операций чтения используют один и тот же тег, выход данных будет низким. Размер семейства определяется количеством ДНК-матрицы, необходимой для ПЦР-амплификации, и фракцией выделенной дорожки секвенирования. Оптимальный размер семейства тегов составляет от 6 до 12 членов. Чтобы получить оптимальный размер семьи, необходимо отрегулировать количество ДНК-матрицы и выделенной фракции дорожки секвенирования. Следующая формула учитывает наиболее важные переменные, которые могут повлиять на глубину покрытия (N=40DG÷R), где «N» — количество чтений, «D» — желаемая глубина покрытия, «G» — размер ДНК-мишень в паре оснований, а «R» — конечная длина чтения.
Вычислительный рабочий процесс
[ редактировать ]Фильтрация и обрезка
[ редактировать ]Каждое считывание дуплексного секвенирования содержит фиксированную 5-нуклеотидную последовательность (показана на рисунках черным цветом), расположенную выше 12-нуклеотидной меточной последовательности. Считывания фильтруются, если они не имеют ожидаемой последовательности из 5 нуклеотидов или содержат более девяти одинаковых или неоднозначных оснований в каждой метке. Две 12-нуклеотидные метки на каждом конце считывания объединяются и перемещаются в заголовок считывания. Образуются два семейства прочтений, происходящих из двух цепей ДНК. Одно семейство содержит чтения с заголовком αβ, происходящим из цепи 1, а второе содержит чтения с заголовком βα, происходящим из цепи 2 (рис. 2). Затем чтения обрезаются путем удаления фиксированной последовательности из 5 пар оснований и 4 подверженных ошибкам нуклеотидов, расположенных в местах лигирования и восстановления концов. [1] [2] Остальные чтения собираются в консенсусные последовательности с использованием сборок SSCS и DCS.
сборка ССКС
[ редактировать ]Обрезанные последовательности из предыдущего шага выравниваются по эталонному геному с помощью выравнивателя Берроуза-Уиллера (BWA), а некартированные чтения удаляются. Выровненные прочтения, которые имеют одинаковую последовательность тегов из 24 пар оснований и геномную область, обнаруживаются и группируются (семейства αβ и βα на рисунке 2). Каждая группа представляет собой «семейство тегов». Семейства меток, состоящие менее чем из трех членов, не анализируются. Для удаления ошибок, возникающих при ПЦР-амплификации или секвенировании, из анализа отфильтровываются мутации, которые поддерживаются менее чем 70% членов (чтений). Затем для каждого семейства генерируется консенсусная последовательность с использованием идентичных последовательностей в каждой позиции остальных прочтений. Консенсусная последовательность называется SSCS. Это увеличивает точность NGS примерно в 20 раз; однако этот метод основан на информации о секвенировании отдельных цепей ДНК и, следовательно, чувствителен к ошибкам, возникающим в первом раунде или перед амплификацией ПЦР. [1] [2]
РСУ в сборе
[ редактировать ]Чтения последнего шага перестраиваются в соответствии с эталонным геномом. В этом методе пары семейств SSCS, имеющие дополнительные теги, будут сгруппированы (семейства αβ и βα на рисунке 2). Эти чтения происходят из двух комплементарных цепей ДНК. Последовательности с высокой степенью достоверности выбираются на основе идеально совпадающих вызовов оснований каждого семейства. Последняя последовательность называется DCS. Истинные мутации — это те, которые идеально совпадают между комплементарными SSCS. На этом этапе отфильтровываются оставшиеся ошибки, возникшие во время первого раунда ПЦР-амплификации или во время подготовки проб. [1] [2]
Преимущества
[ редактировать ]Снижение частоты ошибок секвенирования
[ редактировать ]Высокая частота ошибок (0,01–0,001) стандартных платформ NGS, введенных во время подготовки образцов или секвенирования, является основным ограничением для обнаружения вариантов, присутствующих в небольшой фракции клеток. Благодаря системе дуплексной маркировки и использованию информации в обеих цепях ДНК дуплексное секвенирование значительно снизило частоту ошибок секвенирования примерно в 10 миллионов раз с использованием как метода SSCS, так и DCS. [1] [2] [10]
Повышение точности вызова вариантов
[ редактировать ]Трудно точно идентифицировать редкие варианты с использованием стандартных методов NGS с частотой мутаций (10 −2 до 10 −3 ). Ошибки, возникающие на ранних этапах подготовки проб, можно обнаружить как редкие варианты. Примером таких ошибок является трансверсия C>A/G>T , обнаруживаемая на низких частотах с использованием данных глубокого секвенирования или целевого захвата и возникающая из-за окисления ДНК во время подготовки проб. [11] Эти типы ложноположительных вариантов отфильтровываются методом дуплексного секвенирования, поскольку мутации должны точно совпадать в обеих цепях ДНК, чтобы быть подтвержденными как истинные мутации. Дуплексное секвенирование теоретически может обнаружить мутации с частотой всего 10 −8 по сравнению с 10 −2 скорость стандартных методов NGS. [1] [2] [10]
Применимо к большинству платформ NGS.
[ редактировать ]Еще одним преимуществом дуплексного секвенирования является то, что его можно использовать в сочетании с большинством платформ NGS без внесения существенных изменений в стандартные протоколы.
Ограничения
[ редактировать ]Расходы
[ редактировать ]Поскольку дуплексное секвенирование обеспечивает значительно более высокую точность секвенирования и использует информацию в обеих цепях ДНК, этот метод требует гораздо большей глубины секвенирования и, следовательно, является дорогостоящим подходом. В настоящее время затраты ограничивают его применение целевым секвенированием и секвенированием ампликонов и не будут применимы для подходов полногеномного секвенирования. Однако применение дуплексного секвенирования для более крупных мишеней ДНК станет более осуществимым, когда стоимость NGS снизится.
Практическое применение
[ редактировать ]Дуплексное секвенирование — это новый метод, и его эффективность изучалась в ограниченных приложениях, таких как обнаружение точечных мутаций с использованием целевого секвенирования захвата. [12] Необходимо провести дополнительные исследования, чтобы расширить применение и осуществимость дуплексного секвенирования для более сложных образцов с большим количеством мутаций, инделей и вариаций числа копий .
Приложения
[ редактировать ]Обнаружение вариантов с низкими частотами
[ редактировать ]Дуплексное секвенирование и значительное повышение точности секвенирования оказали важное влияние на такие приложения, как обнаружение редких генетических вариантов человека, обнаружение субклональных мутаций, участвующих в механизмах устойчивости к терапии при генетически гетерогенных раковых заболеваниях, скрининг вариантов циркулирующей опухолевой ДНК как не -инвазивный биомаркер и пренатальный скрининг генетических аномалий у плода.
Обнаружение номера копии
[ редактировать ]Еще одним применением дуплексного секвенирования является определение количества копий ДНК/РНК путем оценки относительной частоты вариантов. Примером может служить метод подсчета молекул матрицы ПЦР с применением к секвенированию нового поколения. [1]
Анализ и программное обеспечение
[ редактировать ]Список необходимых инструментов и пакетов для анализа SSCS и DCS можно найти в Интернете.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б с д и ж г час я дж к л м н тот М.В. Шмитт, С.Р. Кеннеди, Дж. Дж. Солк и др. «Обнаружение ультраредких мутаций методом секвенирования нового поколения» . Учеб. Натл. акад. наук, том. 109 нет. 36. 2012. ПМИД 22853953 .
- ^ Jump up to: а б с д и ж г час я дж к л м н С.Р. Кеннеди, М.В. Шмитт, Э.Дж. Фокс, Б.Ф. Корн и др. «Обнаружение ультранизкочастотных мутаций методом дуплексного секвенирования» . Nature Protoc., vol. 9 нет. 11, 2586–606. 2014. ПМИД 25299156 .
- ^ TE Друли, FLM Vallania, DJ Wegner и др. «Количественная оценка редких аллельных вариантов из объединенной геномной ДНК», Nature Methods, vol. 6, нет. 4, стр. 263–265, 2009. ПМИД 19252504 .
- ^ Н. МакГранахан и К. Суонтон. «Биологическое и терапевтическое влияние внутриопухолевой гетерогенности на эволюцию рака» Cancer Cell, vol. 27, нет. 1, стр. 15–26, 2015. ПМИД 25584892 .
- ^ C Беттегоуда, М. Саусен, Р. Дж. Лири и др. «Обнаружение циркулирующей опухолевой ДНК на ранних и поздних стадиях злокачественных новообразований человека» . Sci Transl Med, том. 6, нет. 224, с. 224ра24, 2014. ПМИД 24553385 .
- ^ Jump up to: а б Б.Е. Майнер, Р.Дж. Штёгер, А.Ф. Берден и др. «Молекулярные штрих-коды обнаруживают избыточность и загрязнение в ПЦР с бисульфитом» [ мертвая ссылка ] . Нуклеиновые кислоты Res, vol. 32, нет. 17, с. е135, 2004. ПМИД 15459281 .
- ^ М.Л. Макклоски, Р. Стогер, Р.С. Хансен и др. «Кодирование ПЦР-продуктов с помощью пакетных штампов и штрих-кодов» , Biochem. Генет., том. 45, нет. 11–12, стр. 761–767, 2007. ПМИД 17955361 .
- ^ Jump up to: а б Д.И. Лу, Дж. А. Хуссманн, Р. М. Макби и др. «Ошибки высокопроизводительного секвенирования ДНК уменьшаются на порядки с помощью кругового секвенирования» . Proc Natl Acad Sci USA, vol. 110 нет. 49, 19872–19877, 2013. ПМИД 24243955 .
- ^ А.Я. Маслов, В. Киспе-Тинтайя, Т. Горбачева, Р.Р. Уайт и Дж. Вийг, «Высокопроизводительное секвенирование при обнаружении мутаций: новое поколение тестов на генотоксичность?» , Мутат. Рез., том. 776, стр. 136–43, 2015. ПМИД 25934519 .
- ^ Jump up to: а б с Э. Дж. Фокс, К. С. Рейд-Бейлисс, М. Дж. Эмонд и др. «Точность платформ секвенирования следующего поколения» . Приложение Next Gener Seq, стр. 1–9, 2015 г. ПМИД 25699289 .
- ^ М. Костелло, Т. Дж. Пью, Т. Дж. Феннелл и др. «Обнаружение и характеристика артефактных мутаций в данных секвенирования с целевым захватом с глубоким охватом из-за окислительного повреждения ДНК во время подготовки образцов» . Нуклеиновые кислоты Рез., вып. 41, нет. 6, стр. 1–12, 2013. ПМИД 23303777 .
- ^ М.В. Шмитт, Э.Дж. Фокс, М.Дж. Приндл и др. «Секвенирование небольших геномных мишеней с высокой эффективностью и предельной точностью» . Nat Methods, том. 12, нет. 5, стр. 423–425, 2015. ПМИД 2584963 .