Дуплексное секвенирование

Дуплексное секвенирование — это библиотек метод подготовки и анализа для платформ секвенирования следующего поколения (NGS), в котором используется случайная маркировка двухцепочечной ДНК для обнаружения мутаций с более высокой точностью и меньшим уровнем ошибок.

используются вырожденные молекулярные метки В этом методе помимо адаптеров секвенирования для распознавания считываний, происходящих из каждой цепи ДНК. Поскольку две цепи комплементарны, истинные мутации обнаруживаются в одном и том же положении в обеих цепях. Напротив, ошибки ПЦР или секвенирования приводят к мутациям только в одной цепи и, таким образом, могут быть расценены как техническая ошибка. Дуплексное секвенирование теоретически может обнаруживать мутации с частотой всего 5 x 10. ⁻⁸ — это более чем в 10 000 раз выше по точности по сравнению с традиционными методами секвенирования нового поколения. ^[1]^[2]

Предполагаемая частота ошибок стандартных платформ секвенирования нового поколения составляет 10. ⁻² до 10 ⁻³ за каждый базовый вызов. При такой частоте ошибок миллиарды базовых вызовов, генерируемых NGS, приведут к миллионам ошибок. Ошибки, возникающие во время подготовки проб и секвенирования, такие как ошибки полимеразной цепной реакции , секвенирования и анализа изображений. Хотя частота ошибок платформ NGS приемлема в некоторых приложениях, таких как обнаружение клональных вариантов , это является основным ограничением для приложений, требующих более высокой точности для обнаружения низкочастотных вариантов, таких как обнаружение внутриорганного мозаицизма , субклональных вариантов в генетических вариантах. гетерогенные виды рака или циркулирующая опухолевая ДНК. ^[3]^[4]^[5]

Было разработано несколько стратегий подготовки библиотек, которые повышают точность платформ NGS, таких как молекулярное штрих-кодирование и метод кольцевого консенсусного секвенирования. ^[6]^[7]^[8]^[9] Как и платформы NGS, данные, генерируемые этими методами, происходят из одной цепи ДНК, и поэтому ошибки, возникающие во время ПЦР-амплификации , обработки тканей , экстракции ДНК , гибридизационного захвата (где используется) или самого секвенирования ДНК, по-прежнему можно отличить как верный вариант. Метод дуплексного секвенирования решает эту проблему, используя комплементарную природу двух цепей ДНК и подтверждая только те варианты, которые присутствуют в обеих цепях ДНК. Поскольку вероятность возникновения двух дополнительных ошибок в одном и том же месте обеих цепей чрезвычайно низка, дуплексное секвенирование значительно увеличивает точность секвенирования. ^[1]^[6]^[8]^[10]

Экспериментальный рабочий процесс

Маркированные адаптеры для дуплексного секвенирования можно использовать в сочетании с большинством адаптеров NGS. В разделе рисунков и рабочего процесса этой статьи в качестве примера используются адаптеры секвенирования Illumina, соответствующие оригинальному опубликованному протоколу. ^[1]^[2]

Адаптерный отжиг

На этом этапе используются два олигонуклеотида (рис. 1: адаптерные олигонуклеотиды). Один из олигонуклеотидов содержит 12-нуклеотидную одноцепочечную случайную меточную последовательность, за которой следует фиксированная 5'-нуклеотидная последовательность (черная последовательность на рисунке 1). На этом этапе олигонуклеотиды отжигаются . в комплементарной области путем инкубации в необходимых временных условиях ^[1]^[2]

Синтез адаптера

Адаптеры, которые успешно отжигаются , удлиняются и синтезируются ДНК-полимеразой, образуя двухцепочечный адаптер, содержащий комплементарные метки (рис. 1). ^[1]^[2]

3'-дТ-хвост

Удлиненные двухцепочечные адаптеры расщепляются HpyCH4III в специфическом сайте рестрикции , расположенном на 3'-стороне меточной последовательности, и приводят к образованию выступающего конца 3'-dT, который будет лигирован с выступающим 3'-dA в библиотеках ДНК в адаптера этап лигирования (рис. 1). ^[1]^[2]

Подготовка библиотеки

Двухцепочечную ДНК разрезают с помощью одного из этих методов: обработки ультразвуком , ферментативного расщепления или распыления. Фрагменты подбираются по размеру с помощью бусин Ampure XP. Выбор размера на основе геля не рекомендуется, поскольку это может привести к плавлению двойных нитей ДНК и повреждению ДНК из-за воздействия УФ-излучения . Размер выбранных фрагментов ДНК подвергается 3'-концу dA-хвоста. ^[1]^[2]

Лигирование адаптера

На этом этапе два меченых адаптера лигируются от 3'-dT-хвостов к 3'-dA-хвостам с обеих сторон фрагментов библиотеки двухцепочечной ДНК. В результате этого процесса образуются двухцепочечные фрагменты библиотеки, которые содержат по две случайные метки (α и β) на каждой стороне, которые являются обратным дополнением друг друга (рис. 1 и 2). Соотношение «ДНК:адаптер» имеет решающее значение для успеха лигирования. ^[1]^[2]

Вставка адаптеров секвенирования в меченные библиотеки

На последнем этапе подготовки библиотеки дуплексного секвенирования адаптеры секвенирования Illumina добавляются к меченным двухцепочечным библиотекам путем ПЦР-амплификации с использованием праймеров, содержащих адаптеры секвенирования. Во время ПЦР-амплификации обе комплементарные цепи ДНК амплифицируются и образуют два типа ПЦР-продуктов. Продукт 1 происходит от цепи 1, которая имеет уникальную последовательность меток (называемую α на рис. 2) рядом с адаптером Illumina 1, а продукт 2 имеет уникальную метку (называемую β на рис. 2) рядом с адаптером Illumina 1. (В каждой цепочке , тег α является обратным дополнением тега β и наоборот). Библиотеки, содержащие дуплексные метки и адаптеры Illumina, секвенируются с использованием системы Illumina TruSeq. Считывания, происходящие из каждой цепи ДНК, образуют группу ридов (семейств тегов), которые имеют один и тот же тег. Обнаруженные семейства прочтений будут использоваться на следующем этапе для анализа данных секвенирования. ^[1]^[2]

Соображения

Эффективность лигирования адаптера

Эффективность лигирования адаптера очень важна для успешного дуплексного секвенирования. Дополнительное количество библиотек или адаптеров может повлиять на баланс ДНК и адаптеров, что приведет к неэффективному лигированию и избыточному количеству димеров праймеров соответственно. Поэтому важно поддерживать оптимальное соотношение молярной концентрации ДНК к адаптеру (0,05). ^[2]

Отметить размер семьи

Эффективность дуплексного секвенирования зависит от конечного числа DCS, которое напрямую связано с количеством прочтений в каждом семействе (размером семейства). Если размер семейства слишком мал, DCS не может быть собрана, а если слишком много операций чтения используют один и тот же тег, выход данных будет низким. Размер семейства определяется количеством ДНК-матрицы, необходимой для ПЦР-амплификации, и фракцией выделенной дорожки секвенирования. Оптимальный размер семейства тегов составляет от 6 до 12 членов. Чтобы получить оптимальный размер семьи, необходимо отрегулировать количество ДНК-матрицы и выделенной фракции дорожки секвенирования. Следующая формула учитывает наиболее важные переменные, которые могут повлиять на глубину покрытия (N=40DG÷R), где «N» — количество чтений, «D» — желаемая глубина покрытия, «G» — размер ДНК-мишень в паре оснований, а «R» — конечная длина чтения.

Вычислительный рабочий процесс

Фильтрация и обрезка

Каждое считывание дуплексного секвенирования содержит фиксированную 5-нуклеотидную последовательность (показана на рисунках черным цветом), расположенную выше 12-нуклеотидной меточной последовательности. Считывания фильтруются, если они не имеют ожидаемой последовательности из 5 нуклеотидов или содержат более девяти одинаковых или неоднозначных оснований в каждой метке. Две 12-нуклеотидные метки на каждом конце считывания объединяются и перемещаются в заголовок считывания. Образуются два семейства прочтений, происходящих из двух цепей ДНК. Одно семейство содержит чтения с заголовком αβ, происходящим из цепи 1, а второе содержит чтения с заголовком βα, происходящим из цепи 2 (рис. 2). Затем чтения обрезаются путем удаления фиксированной последовательности из 5 пар оснований и 4 подверженных ошибкам нуклеотидов, расположенных в местах лигирования и восстановления концов. ^[1]^[2] Остальные чтения собираются в консенсусные последовательности с использованием сборок SSCS и DCS.

сборка ССКС

Обрезанные последовательности из предыдущего шага выравниваются по эталонному геному с помощью выравнивателя Берроуза-Уиллера (BWA), а некартированные чтения удаляются. Выровненные прочтения, которые имеют одинаковую последовательность тегов из 24 пар оснований и геномную область, обнаруживаются и группируются (семейства αβ и βα на рисунке 2). Каждая группа представляет собой «семейство тегов». Семейства меток, состоящие менее чем из трех членов, не анализируются. Для удаления ошибок, возникающих при ПЦР-амплификации или секвенировании, из анализа отфильтровываются мутации, которые поддерживаются менее чем 70% членов (чтений). Затем для каждого семейства генерируется консенсусная последовательность с использованием идентичных последовательностей в каждой позиции остальных прочтений. Консенсусная последовательность называется SSCS. Это увеличивает точность NGS примерно в 20 раз; однако этот метод основан на информации о секвенировании отдельных цепей ДНК и, следовательно, чувствителен к ошибкам, возникающим в первом раунде или перед амплификацией ПЦР. ^[1]^[2]

РСУ в сборе

Чтения последнего шага перестраиваются в соответствии с эталонным геномом. В этом методе пары семейств SSCS, имеющие дополнительные теги, будут сгруппированы (семейства αβ и βα на рисунке 2). Эти чтения происходят из двух комплементарных цепей ДНК. Последовательности с высокой степенью достоверности выбираются на основе идеально совпадающих вызовов оснований каждого семейства. Последняя последовательность называется DCS. Истинные мутации — это те, которые идеально совпадают между комплементарными SSCS. На этом этапе отфильтровываются оставшиеся ошибки, возникшие во время первого раунда ПЦР-амплификации или во время подготовки проб. ^[1]^[2]

Преимущества

Снижение частоты ошибок секвенирования

Высокая частота ошибок (0,01–0,001) стандартных платформ NGS, введенных во время подготовки образцов или секвенирования, является основным ограничением для обнаружения вариантов, присутствующих в небольшой фракции клеток. Благодаря системе дуплексной маркировки и использованию информации в обеих цепях ДНК дуплексное секвенирование значительно снизило частоту ошибок секвенирования примерно в 10 миллионов раз с использованием как метода SSCS, так и DCS. ^[1]^[2]^[10]

Повышение точности вызова вариантов

Трудно точно идентифицировать редкие варианты с использованием стандартных методов NGS с частотой мутаций (10 ⁻² до 10 ⁻³). Ошибки, возникающие на ранних этапах подготовки проб, можно обнаружить как редкие варианты. Примером таких ошибок является трансверсия C>A/G>T , обнаруживаемая на низких частотах с использованием данных глубокого секвенирования или целевого захвата и возникающая из-за окисления ДНК во время подготовки проб. ^[11] Эти типы ложноположительных вариантов отфильтровываются методом дуплексного секвенирования, поскольку мутации должны точно совпадать в обеих цепях ДНК, чтобы быть подтвержденными как истинные мутации. Дуплексное секвенирование теоретически может обнаружить мутации с частотой всего 10 ⁻⁸ по сравнению с 10 ⁻² скорость стандартных методов NGS. ^[1]^[2]^[10]

Применимо к большинству платформ NGS.

Еще одним преимуществом дуплексного секвенирования является то, что его можно использовать в сочетании с большинством платформ NGS без внесения существенных изменений в стандартные протоколы.

Ограничения

Расходы

Поскольку дуплексное секвенирование обеспечивает значительно более высокую точность секвенирования и использует информацию в обеих цепях ДНК, этот метод требует гораздо большей глубины секвенирования и, следовательно, является дорогостоящим подходом. В настоящее время затраты ограничивают его применение целевым секвенированием и секвенированием ампликонов и не будут применимы для подходов полногеномного секвенирования. Однако применение дуплексного секвенирования для более крупных мишеней ДНК станет более осуществимым, когда стоимость NGS снизится.

Практическое применение

Дуплексное секвенирование — это новый метод, и его эффективность изучалась в ограниченных приложениях, таких как обнаружение точечных мутаций с использованием целевого секвенирования захвата. ^[12] Необходимо провести дополнительные исследования, чтобы расширить применение и осуществимость дуплексного секвенирования для более сложных образцов с большим количеством мутаций, инделей и вариаций числа копий .

Приложения

Обнаружение вариантов с низкими частотами

Дуплексное секвенирование и значительное повышение точности секвенирования оказали важное влияние на такие приложения, как обнаружение редких генетических вариантов человека, обнаружение субклональных мутаций, участвующих в механизмах устойчивости к терапии при генетически гетерогенных раковых заболеваниях, скрининг вариантов циркулирующей опухолевой ДНК как не -инвазивный биомаркер и пренатальный скрининг генетических аномалий у плода.

Обнаружение номера копии

Еще одним применением дуплексного секвенирования является определение количества копий ДНК/РНК путем оценки относительной частоты вариантов. Примером может служить метод подсчета молекул матрицы ПЦР с применением к секвенированию нового поколения. ^[1]

Анализ и программное обеспечение

Список необходимых инструментов и пакетов для анализа SSCS и DCS можно найти в Интернете.

См. также

Ссылки

^ Jump up to: ^а ^б ^с ^д ^и ^ж ^г ^час ^я ^дж ^к ^л ^м ^н ^тот М.В. Шмитт, С.Р. Кеннеди, Дж. Дж. Солк и др. «Обнаружение ультраредких мутаций методом секвенирования нового поколения» . Учеб. Натл. акад. наук, том. 109 нет. 36. 2012. ПМИД 22853953 .
^ Jump up to: ^а ^б ^с ^д ^и ^ж ^г ^час ^я ^дж ^к ^л ^м ^н С.Р. Кеннеди, М.В. Шмитт, Э.Дж. Фокс, Б.Ф. Корн и др. «Обнаружение ультранизкочастотных мутаций методом дуплексного секвенирования» . Nature Protoc., vol. 9 нет. 11, 2586–606. 2014. ПМИД 25299156 .
^ TE Друли, FLM Vallania, DJ Wegner и др. «Количественная оценка редких аллельных вариантов из объединенной геномной ДНК», Nature Methods, vol. 6, нет. 4, стр. 263–265, 2009. ПМИД 19252504 .
^ Н. МакГранахан и К. Суонтон. «Биологическое и терапевтическое влияние внутриопухолевой гетерогенности на эволюцию рака» Cancer Cell, vol. 27, нет. 1, стр. 15–26, 2015. ПМИД 25584892 .
^ C Беттегоуда, М. Саусен, Р. Дж. Лири и др. «Обнаружение циркулирующей опухолевой ДНК на ранних и поздних стадиях злокачественных новообразований человека» . Sci Transl Med, том. 6, нет. 224, с. 224ра24, 2014. ПМИД 24553385 .
^ Jump up to: ^а ^б Б.Е. Майнер, Р.Дж. Штёгер, А.Ф. Берден и др. «Молекулярные штрих-коды обнаруживают избыточность и загрязнение в ПЦР с бисульфитом» ^{[ мертвая ссылка ]}. Нуклеиновые кислоты Res, vol. 32, нет. 17, с. е135, 2004. ПМИД 15459281 .
^ М.Л. Макклоски, Р. Стогер, Р.С. Хансен и др. «Кодирование ПЦР-продуктов с помощью пакетных штампов и штрих-кодов» , Biochem. Генет., том. 45, нет. 11–12, стр. 761–767, 2007. ПМИД 17955361 .
^ Jump up to: ^а ^б Д.И. Лу, Дж. А. Хуссманн, Р. М. Макби и др. «Ошибки высокопроизводительного секвенирования ДНК уменьшаются на порядки с помощью кругового секвенирования» . Proc Natl Acad Sci USA, vol. 110 нет. 49, 19872–19877, 2013. ПМИД 24243955 .
^ А.Я. Маслов, В. Киспе-Тинтайя, Т. Горбачева, Р.Р. Уайт и Дж. Вийг, «Высокопроизводительное секвенирование при обнаружении мутаций: новое поколение тестов на генотоксичность?» , Мутат. Рез., том. 776, стр. 136–43, 2015. ПМИД 25934519 .
^ Jump up to: ^а ^б ^с Э. Дж. Фокс, К. С. Рейд-Бейлисс, М. Дж. Эмонд и др. «Точность платформ секвенирования следующего поколения» . Приложение Next Gener Seq, стр. 1–9, 2015 г. ПМИД 25699289 .
^ М. Костелло, Т. Дж. Пью, Т. Дж. Феннелл и др. «Обнаружение и характеристика артефактных мутаций в данных секвенирования с целевым захватом с глубоким охватом из-за окислительного повреждения ДНК во время подготовки образцов» . Нуклеиновые кислоты Рез., вып. 41, нет. 6, стр. 1–12, 2013. ПМИД 23303777 .
^ М.В. Шмитт, Э.Дж. Фокс, М.Дж. Приндл и др. «Секвенирование небольших геномных мишеней с высокой эффективностью и предельной точностью» . Nat Methods, том. 12, нет. 5, стр. 423–425, 2015. ПМИД 2584963 .

[ds2012-1] Jump up to: ^а ^б ^с ^д ^и ^ж ^г ^час ^я ^дж ^к ^л ^м ^н ^тот М.В. Шмитт, С.Р. Кеннеди, Дж. Дж. Солк и др. «Обнаружение ультраредких мутаций методом секвенирования нового поколения» . Учеб. Натл. акад. наук, том. 109 нет. 36. 2012. ПМИД 22853953 .

[ds2014-2] Jump up to: ^а ^б ^с ^д ^и ^ж ^г ^час ^я ^дж ^к ^л ^м ^н С.Р. Кеннеди, М.В. Шмитт, Э.Дж. Фокс, Б.Ф. Корн и др. «Обнаружение ультранизкочастотных мутаций методом дуплексного секвенирования» . Nature Protoc., vol. 9 нет. 11, 2586–606. 2014. ПМИД 25299156 .

[3] TE Друли, FLM Vallania, DJ Wegner и др. «Количественная оценка редких аллельных вариантов из объединенной геномной ДНК», Nature Methods, vol. 6, нет. 4, стр. 263–265, 2009. ПМИД 19252504 .

[4] Н. МакГранахан и К. Суонтон. «Биологическое и терапевтическое влияние внутриопухолевой гетерогенности на эволюцию рака» Cancer Cell, vol. 27, нет. 1, стр. 15–26, 2015. ПМИД 25584892 .

[5] C Беттегоуда, М. Саусен, Р. Дж. Лири и др. «Обнаружение циркулирующей опухолевой ДНК на ранних и поздних стадиях злокачественных новообразований человека» . Sci Transl Med, том. 6, нет. 224, с. 224ра24, 2014. ПМИД 24553385 .

[miner-6] Jump up to: ^а ^б Б.Е. Майнер, Р.Дж. Штёгер, А.Ф. Берден и др. «Молекулярные штрих-коды обнаруживают избыточность и загрязнение в ПЦР с бисульфитом» ^{[ мертвая ссылка ]}. Нуклеиновые кислоты Res, vol. 32, нет. 17, с. е135, 2004. ПМИД 15459281 .

[7] М.Л. Макклоски, Р. Стогер, Р.С. Хансен и др. «Кодирование ПЦР-продуктов с помощью пакетных штампов и штрих-кодов» , Biochem. Генет., том. 45, нет. 11–12, стр. 761–767, 2007. ПМИД 17955361 .

[lou-8] Jump up to: ^а ^б Д.И. Лу, Дж. А. Хуссманн, Р. М. Макби и др. «Ошибки высокопроизводительного секвенирования ДНК уменьшаются на порядки с помощью кругового секвенирования» . Proc Natl Acad Sci USA, vol. 110 нет. 49, 19872–19877, 2013. ПМИД 24243955 .

[9] А.Я. Маслов, В. Киспе-Тинтайя, Т. Горбачева, Р.Р. Уайт и Дж. Вийг, «Высокопроизводительное секвенирование при обнаружении мутаций: новое поколение тестов на генотоксичность?» , Мутат. Рез., том. 776, стр. 136–43, 2015. ПМИД 25934519 .

[fox-10] Jump up to: ^а ^б ^с Э. Дж. Фокс, К. С. Рейд-Бейлисс, М. Дж. Эмонд и др. «Точность платформ секвенирования следующего поколения» . Приложение Next Gener Seq, стр. 1–9, 2015 г. ПМИД 25699289 .

[11] М. Костелло, Т. Дж. Пью, Т. Дж. Феннелл и др. «Обнаружение и характеристика артефактных мутаций в данных секвенирования с целевым захватом с глубоким охватом из-за окислительного повреждения ДНК во время подготовки образцов» . Нуклеиновые кислоты Рез., вып. 41, нет. 6, стр. 1–12, 2013. ПМИД 23303777 .

[12] М.В. Шмитт, Э.Дж. Фокс, М.Дж. Приндл и др. «Секвенирование небольших геномных мишеней с высокой эффективностью и предельной точностью» . Nat Methods, том. 12, нет. 5, стр. 423–425, 2015. ПМИД 2584963 .

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]