Jump to content

2 базовая кодировка

Двухбазовая схема кодирования. При двухосновном кодировании каждой уникальной паре оснований на 3'-конце зонда присваивается один из четырех возможных цветов. Например, «АА» присвоен синему цвету, «АС» — зеленому и так далее для всех 16 уникальных пар. При секвенировании каждое основание в шаблоне секвенируется дважды, и полученные данные декодируются по этой схеме.

2 Base Encoding , также называемая SOLiD ( секвенирование путем лигирования и обнаружения олигонуклеотидов ), представляет собой технологию секвенирования нового поколения, разработанную Applied Biosystems и коммерчески доступную с 2008 года. Эти технологии генерируют сотни тысяч небольших считываний последовательностей одновременно. Хорошо известные примеры таких секвенирования ДНК методов включают пиросеквенирование 454 (введенное в 2005 г.), систему Solexa (введенную в 2006 г.) и систему SOLiD (введенную в 2007 г.). Эти методы снизили стоимость с 0,01 доллара США за базу в 2004 году до почти 0,0001 доллара США за базу в 2006 году и увеличили производительность секвенирования с 1 000 000 оснований на машину в день в 2004 году до более чем 100 000 000 оснований на машину в день в 2006 году.

Двухосновное кодирование основано на секвенировании лигированием, а не на секвенировании путем синтеза. [1] Однако вместо использования флуоресцентно-меченых 9-мерных зондов, которые различают только 6 оснований, при двухосновном кодировании используются преимущества флуоресцентно-меченых 8-мерных зондов, которые различают два 3-х главных основания, но их можно циклически повторять, как и в методе Мацевича, что дает больший результат. можно получить чтения размером более 6 п.н. (опубликовано 25-50 п.н., [2] 50 б.п. в NCBI в феврале 2008 г.). Кодировка с двумя базами позволяет считывать каждую базу дважды, не выполняя при этом двойную работу. [3] [4] [5] [6]

Общие характеристики

[ редактировать ]

Общие этапы, общие для многих из этих методов секвенирования следующего поколения, включают:

  1. Случайная фрагментация геномной ДНК
  2. Иммобилизация отдельных фрагментов ДНК на твердой основе, такой как шарик или плоская твердая поверхность.
  3. Амплификация фрагментов ДНК на твердой поверхности методом ПЦР и создание полимеразных колоний [7]
  4. Секвенирование и последующий опрос in situ после каждого цикла с использованием флуоресцентного сканирования или хемилюминесценции. [8]

В 1988 году Уайтли и др. продемонстрировали использование лигирования флуоресцентно меченных олигонуклеотидов для обнаружения вариантов ДНК. [9] В 1995 году Мацевич [10] продемонстрировали повторное лигирование олигонуклеотидов для обнаружения смежных вариантов ДНК. В 2003 году Дрессман и др. [11] продемонстрировали использование эмульсионной ПЦР для создания миллионов клонально амплифицированных шариков, на которых можно было бы проводить повторные анализы лигирования.В 2005 году Шендуре и др. выполнили процедуру секвенирования, в которой сочетались методы Уайтли и Дрессмана, заключающиеся в лигировании флуоресцентно меченных «вырожденных по 8 основаниям» 9-мерных зондов, которые различали разные основания в соответствии с меткой зондов и невырожденные основания. Этот процесс повторяли (без регенерации выдвижного конца, как в случае Мацевича) с использованием идентичных праймеров, но с зондами с метками, которые идентифицировали разные невырожденные основания для секвенирования считываний 6bp в направлении 5->3 и считываний 7bp в направлении 3->5.

Как это работает

[ редактировать ]

Система секвенирования SOLiD использует датчики с двойным базовым кодированием.

Основополагающая химия сводится к следующим этапам: [12]

- Шаг 1. Подготовка библиотеки. Этот шаг начинается с разрезания геномной ДНК на небольшие фрагменты. Затем добавляются два разных адаптера (например, А1 и А2). Полученная библиотека содержит фрагменты матричной ДНК, помеченные одним адаптером на каждом конце (А1-матрица-А2).

- Шаг 2. Эмульсионная ПЦР. На этом этапе эмульсионная реакция ПЦР (капли воды, суспендированные в масле) выполняется с использованием фрагментов ДНК из библиотеки, двух праймеров (P1 и P2), которые дополняют ранее использованные адаптеры (P1 с A1 и P2 с A2), другие компоненты реакции ПЦР и шарики размером 1 мкм в сочетании с одним из праймеров (например, P1) производят разбавление из библиотеки ДНК, чтобы максимально увеличить количество капель, содержащих один фрагмент ДНК и одну гранулу, в одной капле эмульсии.

В каждой капле матрица ДНК отжигается с шариком, связанным с P1, со стороны A1. Затем ДНК-полимераза будет простираться от P1, образуя комплементарную последовательность, что в конечном итоге приводит к получению гранулы, обогащенной продуктами ПЦР из одной матрицы. После реакции ПЦР матрицы денатурируются и отделяются от гранул. Дрессман и др. впервые описали эту технику в 2003 году.

- Шаг 3. Обогащение шариков. На практике только 30% шариков имеют целевую ДНК. Чтобы увеличить количество шариков, имеющих целевую ДНК, в раствор добавляют большие полистироловые шарики, покрытые А2. Таким образом, любой шарик, содержащий удлиненные продукты, будет связывать полистироловый шарик через свой конец P2. Полученный комплекс будет отделен от нецелевых шариков и расплавлен, чтобы диссоциировать целевые шарики от полистирола. Этот шаг может увеличить производительность этой системы с 30% до обогащения до 80% после обогащения.

После обогащения 3'-конец продуктов (конец P2) будет модифицирован, что сделает их способными к ковалентному связыванию на следующем этапе. Таким образом, продуктами этого этапа являются связанные с ДНК шарики с 3'-модификацией каждой цепи ДНК.

- Шаг 4. Нанесение шариков: на этом этапе продукты последнего этапа наносятся на предметное стекло. Бусины прикрепляются к поверхности стекла случайным образом посредством ковалентных связей 3'-модифицированных бусин и стекла.

- Шаг 5. Реакция секвенирования. Как упоминалось ранее, в отличие от других методов следующего поколения, которые выполняют секвенирование посредством синтеза, двухосновное кодирование основано на секвенировании путем лигирования. Лигирование осуществляется с использованием специфических 8-мерных зондов:

Эти зонды имеют длину восемь оснований со свободной гидроксильной группой на 3'-конце, флуоресцентным красителем на 5'-конце и сайтом расщепления между пятым и шестым нуклеотидом. Первые два основания (начиная с 3'-конца) комплементарны секвенируемым нуклеотидам. Основания с 3 по 5 вырождены и способны образовывать пары с любыми нуклеотидами матричной последовательности. Основания 6–8 также вырождаются, но отщепляются вместе с флуоресцентным красителем по мере продолжения реакции. Расщепление флуоресцентного красителя и оснований 6-8 оставляет свободную 5'-фосфатную группу, готовую к дальнейшему лигированию. Таким образом, позиции n+1 и n+2 составляют правильные пары оснований, за которыми следуют правильные пары оснований n+6 и n+7 и т. д. Состав оснований n+3, n+4 и n+5 остается неопределенным до дальнейшего. раунды реакции секвенирования.

Этап секвенирования в основном состоит из пяти раундов, каждый раунд состоит примерно из 5-7 циклов (рис. 2). Каждый раунд начинается с добавления универсального праймера, дополняющего P1. Этот праймер имеет, например, n нуклеотидов, и его 5'-конец точно совпадает с 3'-концом P1. В каждом цикле добавляются 8-мерные зонды и лигируются в соответствии с их первым и вторым основаниями. Затем оставшиеся несвязанные зонды вымываются, измеряется флуоресцентный сигнал от связанного зонда, а связанный зонд расщепляется между пятым и шестым нуклеотидом. Наконец, праймер и зонды сбрасываются для следующего раунда.

В следующем раунде новый универсальный праймер отжигает позицию n-1 (его 5'-конец совпадает с основанием точно перед 3'-концом P1), и последующие циклы повторяются аналогично первому раунду. Остальные три раунда будут выполнены с новыми универсальными праймерами, отжигающими позиции n-2, n-3 и n-4 относительно 3'-конца P1.

Полная реакция из пяти раундов позволяет секвенировать около 25 пар оснований матрицы из P1.

- Шаг 6. Декодирование данных. Для декодирования данных, представленных в виде цветов, мы должны сначала знать два важных фактора. Во-первых, мы должны знать, что каждый цвет обозначает две основы. Во-вторых, нам нужно знать одно из оснований в последовательности: это основание включено в последовательность в последнем (пятом) раунде шага 5. Это известное основание является последним нуклеотидом 3'-конца известного P1. Следовательно, поскольку каждый цвет представляет два нуклеотида, в которых второе основание каждой динуклеотидной единицы представляет собой первое основание следующего динуклеотида, зная только одно основание в последовательности, мы сможем интерпретировать всю последовательность (рис. 2). [13]

2 Рекомендации по базовому кодированию

[ редактировать ]

На практике прямой перевод считываний цвета в базовые считывания не рекомендуется, поскольку в тот момент, когда возникает ошибка в вызовах цвета, это приведет к сдвигу кадров базовых вызовов. Чтобы наилучшим образом использовать свойства «исправления ошибок» двух базовых кодировок, лучше всего преобразовать базовую ссылочную последовательность в цветовое пространство. Существует одно однозначное преобразование базовой эталонной последовательности в цветовое пространство, и хотя обратное также верно, преобразование может быть совершенно неточным, если есть какие-либо ошибки последовательности. [14]

Сопоставление чтения цветового пространства со ссылкой на цветовое пространство может правильно использовать правила двухосновного кодирования, где только соседние цветовые различия могут представлять истинный базовый полиморфизм. Прямое декодирование или перевод считанных цветов в базы не может сделать это эффективно без других знаний.

Точнее, этот метод не является инструментом исправления ошибок, а инструментом преобразования ошибок. Цветовое пространство преобразует ваш наиболее распространенный режим ошибки (одиночные ошибки измерения) в частоту, отличную от вашей наиболее распространенной формы вариации ДНК (SNP или изменения одного основания). Эти отдельные базовые изменения влияют на соседние цвета в цветовом пространстве. Существуют логические правила, которые помогают исправить соседние ошибки на «действительные» и «недействительные».

Можно оценить вероятность получения двух соседних ошибок при чтении размером 50 п.н. Существует 49 способов внесения смежных изменений в строку из 50 букв (чтение по 50 бит). Существует 1225 способов внесения несмежных изменений в строку из 50 букв (из 50 выберите 2). Упрощенно, если предположить, что ошибки полностью случайны (они обычно встречаются с более высокой частотой в конце чтения), только 49 из 1225 ошибок будут кандидатами на SNP. Кроме того, только одна треть соседних ошибок может быть действительными ошибками в соответствии с известной маркировкой зондов, таким образом доставляя только 16 из 1225 ошибок, которые могут быть кандидатами на SNP. Это особенно полезно для обнаружения SNP с низким охватом, поскольку снижает количество ложных срабатываний при низком охвате, Smith et al. [15]

Преимущества

[ редактировать ]

Каждое основание в этом методе секвенирования считывается дважды. Это изменяет цвет двух соседних вызовов цветового пространства, поэтому для неправильного вызова SNP необходимо неправильно вызвать два соседних цвета. Из-за этого частота ошибочных вызовов SNP составляет порядка e^2, где e — частота ошибок устройства.

Недостатки

[ редактировать ]

При вызове базы ошибки одного цвета вызывают ошибки в оставшейся части чтения. При вызове SNP это можно исправить, что приводит к снижению частоты ошибок при вызове SNP. Однако при упрощенной сборке de novo остается частота ошибок необработанного устройства, которая будет значительно выше, чем 0,06%, сообщаемые для вызова SNP. Качественная фильтрация считываний может обеспечить более высокую необработанную точность считываний, которые при выравнивании по формированию цветовых контигов могут обеспечить эталонные последовательности, в которых можно лучше использовать двухбазовое кодирование. Гибридные сборки с другими технологиями также могут лучше использовать 2-х базовую кодировку.

См. также

[ редактировать ]
  1. ^ Джей Шендюр и др. (2005)Точное мультиплексное секвенирование полонии эволюционировавшего бактериального генома. Наука 309(5741), 1728 - 1732 гг.
  2. ^ Последовательность и структурные изменения в геноме человека, обнаруженные с помощью короткого массового параллельного секвенирования лигирования с использованием двухосновного кодирования.МакКернан К.Дж., Пекхэм Х.Э., Коста Г.Л., Маклафлин С.Ф., Фу Ю, Цунг Э.Ф., Клоузер Ч.Р., Дункан С., Итикава Дж.К., Ли CC, Чжан З., Ранаде СС, Дималанта Э.Т., Хайланд ФК, Сокольский Т.Д., Чжан Л., Шеридан А. , Фу Х, Хендриксон КЛ, Ли Б, Котлер Л, Стюарт Дж. Р., Малек Дж. А., Мэннинг Дж. М., Антипова А. А., Перес Д. С., Мур М. П., Хаясибара К. К., Лайонс М. Р., Бодуан Р. Е., Коулман Б. Е., Лаптевич М. В., Санникандро А. Е., Роудс MD, Готтимуккала Р.К., Ян С., Бафна В., Башир А., Макбрайд А., Алкан С., Кидд Дж.М., Эйхлер Э.Э., Риз М.Г., Де Ла Вега FM, Бланшар А.П.Геном Рез. 2009 сентября; 19 (9): 1527-41. Epub 2009, 22 июня.
  3. ^ Патент: Реагенты, методы и библиотеки для секвенирования на основе шариков.
  4. ^ Статья: Карта положения нуклеосом C. elegans в высоком разрешении показывает отсутствие универсального...
  5. ^ Статья: Профилирование транскриптома стволовых клеток с помощью крупномасштабного секвенирования мРНК.
  6. ^ Быстрое мутационное профилирование всего генома с использованием технологий секвенирования следующего поколения, Genome Research, 2008 18: 1638-1642.
  7. ^ Chetverin, NAR, 1993, Vol.21, No. 10 2349-2353
  8. ^ МЭТЬЮ Э. ХАДСОН (2008) Прорывы в секвенировании геномной экологии и эволюционной биологии.Ресурсы по молекулярной экологии 8 (1), 3–17
  9. ^ Патент США Уайтли, номер 4 883 750.
  10. ^ Мацевич, патент США № 5,750,341.
  11. ^ Преобразование отдельных молекул ДНК во флуоресцентные магнитные частицы для обнаружения и подсчета генетических вариаций, PNAS, 22 июля 2004 г. Том. 100 нет. 15, 8817-8822
  12. ^ Прикладные биосистемы
  13. ^ Техническое резюме: SOLiD от ABI (последовательность лигирования/обнаружения олиго) - SEQответы
  14. ^ [1] Пример цветового пространства для FastQ
  15. ^ Смит и др., Genome Research, 2008, 18:1638-1642.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 869f705a22aac9ea927480c12d4c1f3f__1709893620
URL1:https://arc.ask3.ru/arc/aa/86/3f/869f705a22aac9ea927480c12d4c1f3f.html
Заголовок, (Title) документа по адресу, URL1:
2 base encoding - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)