Jump to content

Дуплексное секвенирование

Обзор дуплексного секвенирования. Библиотеки с дуплексной меткой, содержащие адаптеры для секвенирования, амплифицируются и приводят к образованию двух типов продуктов, каждый из которых происходит из одной цепи ДНК. После секвенирования продуктов ПЦР сгенерированные прочтения делятся на семейства тегов на основе геномного положения, дуплексных тегов и соседнего адаптера секвенирования. Тег последовательности α является обратным дополнением тега последовательности β и наоборот.

Дуплексное секвенирование — это библиотек метод подготовки и анализа для платформ секвенирования следующего поколения (NGS), в котором используется случайная маркировка двухцепочечной ДНК для обнаружения мутаций с более высокой точностью и меньшим уровнем ошибок.

используются вырожденные молекулярные метки В этом методе помимо адаптеров секвенирования для распознавания считываний, происходящих из каждой цепи ДНК. Поскольку две цепи комплементарны, истинные мутации обнаруживаются в одном и том же положении в обеих цепях. Напротив, ошибки ПЦР или секвенирования приводят к мутациям только в одной цепи и, таким образом, могут быть расценены как техническая ошибка. Дуплексное секвенирование теоретически может обнаруживать мутации с частотой всего 5 x 10. −8 — это более чем в 10 000 раз выше по точности по сравнению с традиционными методами секвенирования нового поколения. [1] [2]

Предполагаемая частота ошибок стандартных платформ секвенирования нового поколения составляет 10. −2 до 10 −3 за каждый базовый вызов. При такой частоте ошибок миллиарды базовых вызовов, генерируемых NGS, приведут к миллионам ошибок. Ошибки, возникающие во время подготовки проб и секвенирования, такие как ошибки полимеразной цепной реакции , секвенирования и анализа изображений. Хотя частота ошибок платформ NGS приемлема в некоторых приложениях, таких как обнаружение клональных вариантов , это является основным ограничением для приложений, требующих более высокой точности для обнаружения низкочастотных вариантов, таких как обнаружение внутриорганного мозаицизма , субклональных вариантов в генетических вариантах. гетерогенные виды рака или циркулирующая опухолевая ДНК. [3] [4] [5]

Было разработано несколько стратегий подготовки библиотек, которые повышают точность платформ NGS, таких как молекулярное штрих-кодирование и метод кольцевого консенсусного секвенирования. [6] [7] [8] [9] Как и платформы NGS, данные, генерируемые этими методами, происходят из одной цепи ДНК, и поэтому ошибки, возникающие во время ПЦР-амплификации , обработки тканей , экстракции ДНК , гибридизационного захвата (где используется) или самого секвенирования ДНК, по-прежнему можно отличить как верный вариант. Метод дуплексного секвенирования решает эту проблему, используя комплементарную природу двух цепей ДНК и подтверждая только те варианты, которые присутствуют в обеих цепях ДНК. Поскольку вероятность возникновения двух дополнительных ошибок в одном и том же месте обеих цепей чрезвычайно низка, дуплексное секвенирование значительно увеличивает точность секвенирования. [1] [6] [8] [10]

Экспериментальный рабочий процесс

[ редактировать ]

Маркированные адаптеры для дуплексного секвенирования можно использовать в сочетании с большинством адаптеров NGS. В разделе рисунков и рабочего процесса этой статьи в качестве примера используются адаптеры секвенирования Illumina, соответствующие оригинальному опубликованному протоколу. [1] [2]

Рабочий процесс подготовки библиотеки дуплексного секвенирования: два адаптерных олигонуклеотида проходят несколько этапов (отжиг, синтез, dT-хвост) для создания двухцепочечных уникальных меток с 3'-dT-выступами. Затем адаптеры дуплексных меток лигируются с шаблонами двухцепочечной ДНК. Наконец, адаптеры секвенирования Illumina встраиваются во фрагменты меченой ДНК и образуют конечные библиотеки, содержащие адаптеры DS, адаптеры секвенирования Illumina и матричную ДНК.

Адаптерный отжиг

[ редактировать ]

На этом этапе используются два олигонуклеотида (рис. 1: адаптерные олигонуклеотиды). Один из олигонуклеотидов содержит 12-нуклеотидную одноцепочечную случайную меточную последовательность, за которой следует фиксированная 5'-нуклеотидная последовательность (черная последовательность на рисунке 1). На этом этапе олигонуклеотиды отжигаются . в комплементарной области путем инкубации в необходимых временных условиях [1] [2]

Синтез адаптера

[ редактировать ]

Адаптеры, которые успешно отжигаются , удлиняются и синтезируются ДНК-полимеразой, образуя двухцепочечный адаптер, содержащий комплементарные метки (рис. 1). [1] [2]

3'-дТ-хвост

[ редактировать ]

Удлиненные двухцепочечные адаптеры расщепляются HpyCH4III в специфическом сайте рестрикции , расположенном на 3'-стороне меточной последовательности, и приводят к образованию выступающего конца 3'-dT, который будет лигирован с выступающим 3'-dA в библиотеках ДНК в адаптера этап лигирования (рис. 1). [1] [2]

Подготовка библиотеки

[ редактировать ]

Двухцепочечную ДНК разрезают с помощью одного из этих методов: обработки ультразвуком , ферментативного расщепления или распыления. Фрагменты подбираются по размеру с помощью бусин Ampure XP. Выбор размера на основе геля не рекомендуется, поскольку это может привести к плавлению двойных нитей ДНК и повреждению ДНК из-за воздействия УФ-излучения . Размер выбранных фрагментов ДНК подвергается 3'-концу dA-хвоста. [1] [2]

Лигирование адаптера

[ редактировать ]

На этом этапе два меченых адаптера лигируются от 3'-dT-хвостов к 3'-dA-хвостам с обеих сторон фрагментов библиотеки двухцепочечной ДНК. В результате этого процесса образуются двухцепочечные фрагменты библиотеки, которые содержат по две случайные метки (α и β) на каждой стороне, которые являются обратным дополнением друг друга (рис. 1 и 2). Соотношение «ДНК:адаптер» имеет решающее значение для успеха лигирования. [1] [2]

Вставка адаптеров секвенирования в меченные библиотеки

[ редактировать ]

На последнем этапе подготовки библиотеки дуплексного секвенирования адаптеры секвенирования Illumina добавляются к меченным двухцепочечным библиотекам путем ПЦР-амплификации с использованием праймеров, содержащих адаптеры секвенирования. Во время ПЦР-амплификации обе комплементарные цепи ДНК амплифицируются и образуют два типа ПЦР-продуктов. Продукт 1 происходит от цепи 1, которая имеет уникальную последовательность меток (называемую α на рис. 2) рядом с адаптером Illumina 1, а продукт 2 имеет уникальную метку (называемую β на рис. 2) рядом с адаптером Illumina 1. (В каждой цепочке , тег α является обратным дополнением тега β и наоборот). Библиотеки, содержащие дуплексные метки и адаптеры Illumina, секвенируются с использованием системы Illumina TruSeq. Считывания, происходящие из каждой цепи ДНК, образуют группу ридов (семейств тегов), которые имеют один и тот же тег. Обнаруженные семейства прочтений будут использоваться на следующем этапе для анализа данных секвенирования. [1] [2]

Соображения

[ редактировать ]

Эффективность лигирования адаптера

[ редактировать ]

Эффективность лигирования адаптера очень важна для успешного дуплексного секвенирования. Дополнительное количество библиотек или адаптеров может повлиять на баланс ДНК и адаптеров, что приведет к неэффективному лигированию и избыточному количеству димеров праймеров соответственно. Поэтому важно поддерживать оптимальное соотношение молярной концентрации ДНК к адаптеру (0,05). [2]

Отметить размер семьи

[ редактировать ]

Эффективность дуплексного секвенирования зависит от конечного числа DCS, которое напрямую связано с количеством прочтений в каждом семействе (размером семейства). Если размер семейства слишком мал, DCS не может быть собрана, а если слишком много операций чтения используют один и тот же тег, выход данных будет низким. Размер семейства определяется количеством ДНК-матрицы, необходимой для ПЦР-амплификации, и фракцией выделенной дорожки секвенирования. Оптимальный размер семейства тегов составляет от 6 до 12 членов. Чтобы получить оптимальный размер семьи, необходимо отрегулировать количество ДНК-матрицы и выделенной фракции дорожки секвенирования. Следующая формула учитывает наиболее важные переменные, которые могут повлиять на глубину покрытия (N=40DG÷R), где «N» — количество чтений, «D» — желаемая глубина покрытия, «G» — размер ДНК-мишень в паре оснований, а «R» — конечная длина чтения.

Вычислительный рабочий процесс

[ редактировать ]

Фильтрация и обрезка

[ редактировать ]

Каждое считывание дуплексного секвенирования содержит фиксированную 5-нуклеотидную последовательность (показана на рисунках черным цветом), расположенную выше 12-нуклеотидной меточной последовательности. Считывания фильтруются, если они не имеют ожидаемой последовательности из 5 нуклеотидов или содержат более девяти одинаковых или неоднозначных оснований в каждой метке. Две 12-нуклеотидные метки на каждом конце считывания объединяются и перемещаются в заголовок считывания. Образуются два семейства прочтений, происходящих из двух цепей ДНК. Одно семейство содержит чтения с заголовком αβ, происходящим из цепи 1, а второе содержит чтения с заголовком βα, происходящим из цепи 2 (рис. 2). Затем чтения обрезаются путем удаления фиксированной последовательности из 5 пар оснований и 4 подверженных ошибкам нуклеотидов, расположенных в местах лигирования и восстановления концов. [1] [2] Остальные чтения собираются в консенсусные последовательности с использованием сборок SSCS и DCS.

сборка ССКС

[ редактировать ]

Обрезанные последовательности из предыдущего шага выравниваются по эталонному геному с помощью выравнивателя Берроуза-Уиллера (BWA), а некартированные чтения удаляются. Выровненные прочтения, которые имеют одинаковую последовательность тегов из 24 пар оснований и геномную область, обнаруживаются и группируются (семейства αβ и βα на рисунке 2). Каждая группа представляет собой «семейство тегов». Семейства меток, состоящие менее чем из трех членов, не анализируются. Для удаления ошибок, возникающих при ПЦР-амплификации или секвенировании, из анализа отфильтровываются мутации, которые поддерживаются менее чем 70% членов (чтений). Затем для каждого семейства генерируется консенсусная последовательность с использованием идентичных последовательностей в каждой позиции остальных прочтений. Консенсусная последовательность называется SSCS. Это увеличивает точность NGS примерно в 20 раз; однако этот метод основан на информации о секвенировании отдельных цепей ДНК и, следовательно, чувствителен к ошибкам, возникающим в первом раунде или перед амплификацией ПЦР. [1] [2]

РСУ в сборе

[ редактировать ]

Чтения последнего шага перестраиваются в соответствии с эталонным геномом. В этом методе пары семейств SSCS, имеющие дополнительные теги, будут сгруппированы (семейства αβ и βα на рисунке 2). Эти чтения происходят из двух комплементарных цепей ДНК. Последовательности с высокой степенью достоверности выбираются на основе идеально совпадающих вызовов оснований каждого семейства. Последняя последовательность называется DCS. Истинные мутации — это те, которые идеально совпадают между комплементарными SSCS. На этом этапе отфильтровываются оставшиеся ошибки, возникшие во время первого раунда ПЦР-амплификации или во время подготовки проб. [1] [2]

Преимущества

[ редактировать ]

Снижение частоты ошибок секвенирования

[ редактировать ]

Высокая частота ошибок (0,01–0,001) стандартных платформ NGS, введенных во время подготовки образцов или секвенирования, является основным ограничением для обнаружения вариантов, присутствующих в небольшой фракции клеток. Благодаря системе дуплексной маркировки и использованию информации в обеих цепях ДНК дуплексное секвенирование значительно снизило частоту ошибок секвенирования примерно в 10 миллионов раз с использованием как метода SSCS, так и DCS. [1] [2] [10]

Повышение точности вызова вариантов

[ редактировать ]

Трудно точно идентифицировать редкие варианты с использованием стандартных методов NGS с частотой мутаций (10 −2 до 10 −3 ). Ошибки, возникающие на ранних этапах подготовки проб, можно обнаружить как редкие варианты. Примером таких ошибок является трансверсия C>A/G>T , обнаруживаемая на низких частотах с использованием данных глубокого секвенирования или целевого захвата и возникающая из-за окисления ДНК во время подготовки проб. [11] Эти типы ложноположительных вариантов отфильтровываются методом дуплексного секвенирования, поскольку мутации должны точно совпадать в обеих цепях ДНК, чтобы быть подтвержденными как истинные мутации. Дуплексное секвенирование теоретически может обнаружить мутации с частотой всего 10 −8 по сравнению с 10 −2 скорость стандартных методов NGS. [1] [2] [10]

Применимо к большинству платформ NGS.

[ редактировать ]

Еще одним преимуществом дуплексного секвенирования является то, что его можно использовать в сочетании с большинством платформ NGS без внесения существенных изменений в стандартные протоколы.

Ограничения

[ редактировать ]

Поскольку дуплексное секвенирование обеспечивает значительно более высокую точность секвенирования и использует информацию в обеих цепях ДНК, этот метод требует гораздо большей глубины секвенирования и, следовательно, является дорогостоящим подходом. В настоящее время затраты ограничивают его применение целевым секвенированием и секвенированием ампликонов и не будут применимы для подходов полногеномного секвенирования. Однако применение дуплексного секвенирования для более крупных мишеней ДНК станет более осуществимым, когда стоимость NGS снизится.

Практическое применение

[ редактировать ]

Дуплексное секвенирование — это новый метод, и его эффективность изучалась в ограниченных приложениях, таких как обнаружение точечных мутаций с использованием целевого секвенирования захвата. [12] Необходимо провести дополнительные исследования, чтобы расширить применение и осуществимость дуплексного секвенирования для более сложных образцов с большим количеством мутаций, инделей и вариаций числа копий .

Приложения

[ редактировать ]

Обнаружение вариантов с низкими частотами

[ редактировать ]

Дуплексное секвенирование и значительное повышение точности секвенирования оказали важное влияние на такие приложения, как обнаружение редких генетических вариантов человека, обнаружение субклональных мутаций, участвующих в механизмах устойчивости к терапии при генетически гетерогенных раковых заболеваниях, скрининг вариантов циркулирующей опухолевой ДНК как не -инвазивный биомаркер и пренатальный скрининг генетических аномалий у плода.

Обнаружение номера копии

[ редактировать ]

Еще одним применением дуплексного секвенирования является определение количества копий ДНК/РНК путем оценки относительной частоты вариантов. Примером может служить метод подсчета молекул матрицы ПЦР с применением к секвенированию нового поколения. [1]

Анализ и программное обеспечение

[ редактировать ]

Список необходимых инструментов и пакетов для анализа SSCS и DCS можно найти в Интернете.

См. также

[ редактировать ]
  1. ^ Jump up to: а б с д и ж г час я дж к л м н тот М.В. Шмитт, С.Р. Кеннеди, Дж. Дж. Солк и др. «Обнаружение ультраредких мутаций методом секвенирования нового поколения» . Учеб. Натл. акад. наук, том. 109 нет. 36. 2012. ПМИД   22853953 .
  2. ^ Jump up to: а б с д и ж г час я дж к л м н С.Р. Кеннеди, М.В. Шмитт, Э.Дж. Фокс, Б.Ф. Корн и др. «Обнаружение ультранизкочастотных мутаций методом дуплексного секвенирования» . Nature Protoc., vol. 9 нет. 11, 2586–606. 2014. ПМИД   25299156 .
  3. ^ TE Друли, FLM Vallania, DJ Wegner и др. «Количественная оценка редких аллельных вариантов из объединенной геномной ДНК», Nature Methods, vol. 6, нет. 4, стр. 263–265, 2009. ПМИД   19252504 .
  4. ^ Н. МакГранахан и К. Суонтон. «Биологическое и терапевтическое влияние внутриопухолевой гетерогенности на эволюцию рака» Cancer Cell, vol. 27, нет. 1, стр. 15–26, 2015. ПМИД   25584892 .
  5. ^ C Беттегоуда, М. Саусен, Р. Дж. Лири и др. «Обнаружение циркулирующей опухолевой ДНК на ранних и поздних стадиях злокачественных новообразований человека» . Sci Transl Med, том. 6, нет. 224, с. 224ра24, 2014. ПМИД   24553385 .
  6. ^ Jump up to: а б Б.Е. Майнер, Р.Дж. Штёгер, А.Ф. Берден и др. «Молекулярные штрих-коды обнаруживают избыточность и загрязнение в ПЦР с бисульфитом» [ мертвая ссылка ] . Нуклеиновые кислоты Res, vol. 32, нет. 17, с. е135, 2004. ПМИД   15459281 .
  7. ^ М.Л. Макклоски, Р. Стогер, Р.С. Хансен и др. «Кодирование ПЦР-продуктов с помощью пакетных штампов и штрих-кодов» , Biochem. Генет., том. 45, нет. 11–12, стр. 761–767, 2007. ПМИД   17955361 .
  8. ^ Jump up to: а б Д.И. Лу, Дж. А. Хуссманн, Р. М. Макби и др. «Ошибки высокопроизводительного секвенирования ДНК уменьшаются на порядки с помощью кругового секвенирования» . Proc Natl Acad Sci USA, vol. 110 нет. 49, 19872–19877, 2013. ПМИД   24243955 .
  9. ^ А.Я. Маслов, В. Киспе-Тинтайя, Т. Горбачева, Р.Р. Уайт и Дж. Вийг, «Высокопроизводительное секвенирование при обнаружении мутаций: новое поколение тестов на генотоксичность?» , Мутат. Рез., том. 776, стр. 136–43, 2015. ПМИД   25934519 .
  10. ^ Jump up to: а б с Э. Дж. Фокс, К. С. Рейд-Бейлисс, М. Дж. Эмонд и др. «Точность платформ секвенирования следующего поколения» . Приложение Next Gener Seq, стр. 1–9, 2015 г. ПМИД   25699289 .
  11. ^ М. Костелло, Т. Дж. Пью, Т. Дж. Феннелл и др. «Обнаружение и характеристика артефактных мутаций в данных секвенирования с целевым захватом с глубоким охватом из-за окислительного повреждения ДНК во время подготовки образцов» . Нуклеиновые кислоты Рез., вып. 41, нет. 6, стр. 1–12, 2013. ПМИД   23303777 .
  12. ^ М.В. Шмитт, Э.Дж. Фокс, М.Дж. Приндл и др. «Секвенирование небольших геномных мишеней с высокой эффективностью и предельной точностью» . Nat Methods, том. 12, нет. 5, стр. 423–425, 2015. ПМИД   2584963 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: eb6a9ecef8e94bd80159c9ded5f4f4a2__1715678340
URL1:https://arc.ask3.ru/arc/aa/eb/a2/eb6a9ecef8e94bd80159c9ded5f4f4a2.html
Заголовок, (Title) документа по адресу, URL1:
Duplex sequencing - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)