Jump to content

Читать (биология)

В секвенировании ДНК чтение представляет собой предполагаемую последовательность пар оснований (или вероятностей пар оснований), соответствующую всему или части одного фрагмента ДНК. Типичный эксперимент по секвенированию включает фрагментацию генома на миллионы молекул, которые выбираются по размеру и лигируются с адаптерами . Набор фрагментов называется библиотекой секвенирования, которая секвенируется для создания набора ридов. [1]

Длина чтения

[ редактировать ]

Технологии секвенирования различаются по длине производимых считываний. Читания длиной 20-40 пар оснований (п.н.) называются ультракороткими. [2] Типичные секвенаторы производят длину считывания в диапазоне 100-500 п.н. [3] Однако платформы Pacific Biosciences обеспечивают длину чтения примерно 1500 п.н. [4] Длина чтения является фактором, который может повлиять на результаты биологических исследований. [5] Например, большая длина чтения улучшает разрешение сборки генома de novo и обнаружение структурных вариантов. Предполагается, что для рутинной сборки генома человека de novo потребуются длины чтения более 100 килобаз (кб) . [6] Биоинформационные конвейеры для анализа данных секвенирования обычно учитывают длину считывания. [7]

Поколения секвенирования и длины считывания

[ редактировать ]

Геном – это полная генетическая информация организма или клетки. Одно- или двухцепочечные нуклеиновые кислоты хранят эту информацию в линейной или кольцевой последовательности. Чтобы точно определить эту последовательность, со временем были разработаны более эффективные технологии с повышенной точностью, пропускной способностью и скоростью секвенирования. Технологии секвенирования Сэнгера и Максама-Гилберта были классифицированы как технология секвенирования первого поколения, которая положила начало области секвенирования ДНК своей публикацией в 1977 году. [8] Секвенирование первого поколения обычно имеет длину считывания от 400 до 900 пар оснований. [ нужна ссылка ]

В 2005 году технология 454 компании «Рош» представила новую технологию секвенирования, обеспечивающую высокую производительность при низких затратах. [9] Эта и подобные технологии стали известны как секвенирование второго поколения или секвенирование следующего поколения (NGS) . Одной из отличительных черт NSG является чтение коротких последовательностей. Методы NGS могут секвенировать от миллионов до миллиардов операций чтения за один проход, а время, необходимое для создания операций чтения размером с GigaBase, составляет всего несколько дней или часов, что делает его превосходящим методы секвенирования первого поколения, такие как секвенирование Сэнгера. Все методы NSG дают короткие считывания, т.е. 80–200 оснований, в отличие от считываний большей длины, получаемых при секвенировании по Сэнгеру. [10]

Начиная с 2010-х годов новые революционные технологии открыли эпоху секвенирования третьего поколения (TGS) . TGS — это термин, используемый для описания методов, позволяющих секвенировать отдельные молекулы ДНК без амплификации. В то время как методы Сэнгера и SRS могут обеспечить длину чтения только в одну пару тысяч оснований, технологии секвенирования третьего поколения могут обеспечить длину чтения от 5 до 30 пар оснований. Самая длинная длина считывания, когда-либо созданная с помощью технологии секвенирования третьего поколения, составляет 2 миллиона пар оснований. [11]

NGS и отображение чтения

[ редактировать ]

вида Исторически из-за ограничений по времени и средствам рассматривалась только одна особь каждого вида, и ее последовательность служила «эталонным» геномом .Эти эталонные геномы можно использовать для руководства усилиями по повторному секвенированию у одного и того же вида, выступая в качестве шаблона картирования чтения. Сопоставление чтений — это процесс согласования чтений NGS с эталонным геномом. [12] Любое приложение NGS, такое как вызов вариаций генома, анализ транскриптома, вызов сайта связывания транскрипционных факторов, вызов эпигенетических меток, метагеномика и т. д., требует картирования чтения. На производительность этих приложений влияет точность выравнивания. Более того, поскольку количество операций чтения очень велико, процесс отображения должен быть эффективным. Существуют разные методы, используемые для выравнивания прочтений эталонного генома в зависимости от того, сколько разрешенных несовпадений и вставок. Грубо говоря, методы можно разделить на две категории: подход с использованием семян и расширений и подход с фильтрацией. Многие выравниватели с коротким считыванием используют стратегию «заполнить и расширить», например BWA-SW, Bowtie 2, BatAlign, LAST, Cushaw2, BWA-MEM и т. д. Подход на основе фильтров используется в ряде методов, таких как SeqAlto, GEM. , МАСАИ и т. д. [13]

Сборка генома и чтение последовательности

[ редактировать ]

В геномике повторная сборка геномов путем секвенирования ДНК является серьезной проблемой. Полученные чтения равномерно охватывают весь геном благодаря случайной выборке. Считывания объединяются вычислительным путем для реконструкции генома. Этот процесс известен как сборка генома de novo .

Секвенирование I по Сэнгеру имеет большую длину считывания по сравнению с NGS. Для сборки чтений секвенирования Сэнгера были разработаны два ассемблера — ассемблер OLC Celera и ассемблер графа де Брейна Euler. Эти два метода были использованы для объединения нашего эталонного генома человека. Однако, поскольку секвенирование по Сэнгеру является малопроизводительным и дорогостоящим, лишь немногиеГеномы собираются с помощью секвенирования по Сэнгеру.

Считывания секвенирования второго поколения короткие, и эти методы секвенирования могут эффективно и экономично секвенировать сотни миллионов считываний.Для восстановления геномов из коротких последовательностей были созданы специальные ассемблеры генома. Их успех породил несколько проектов по сборке генома de novo. Хотя этот метод экономически эффективен, прочтения короткие, а повторяющиеся участки длинные, что приводит к фрагментации геномов.

Теперь у нас есть очень длинные чтения (10 000 п.н.) благодаря появлению секвенирования третьего поколения. Длинные чтения способны разрешить порядок повторяющихся областей, хотя они имеют высокий уровень ошибок (15–18%). Для исправления ошибок при чтении секвенирования третьего поколения был разработан ряд вычислительных методов.

Сборка с короткими чтениями и сборка с длинными чтениями имеют разные преимущества и недостатки из-за частоты ошибок и простоты сборки. Иногда предпочтителен гибридный метод, при котором короткие и длинные чтения объединяются для получения лучшего результата. Существует два подхода: первый использует чтение парных пар и длинные чтения для улучшения сборки из коротких чтений. Второй подход заключается в использовании коротких чтений для исправления ошибок при длинных чтениях.

Преимущества и недостатки коротких чтений

[ редактировать ]

Секвенирование второго поколения генерирует короткие риды (длиной <300 п.н.) и отличаются высокой точностью (коэффициент ошибок секвенирования составляет ~1%). Технологии секвенирования коротких ридов сделали секвенирование намного проще, намного быстрее и намного дешевле, чем секвенирование по Сэнгеру. В отчете Национального института исследований генома человека за август 2019 года стоимость секвенирования полного генома человека оценивается в 942 доллара США (USD). [14] [15]

Невозможность секвенировать длинные участки ДНК — недостаток, присущий всем технологиям секвенирования второго поколения.Чтобы использовать NGS для секвенирования большого генома, такого как ДНК человека, ДНК должна быть фрагментирована и амплифицирована в клонах с длиной от 75 до 400 пар оснований, поэтому NGS также известен как «короткое секвенирование» (SRS). После секвенирования коротких считываний это становится вычислительной проблемой, и было разработано множество компьютерных программ и методов для сборки случайных клонов в непрерывную последовательность. [16]

Необходимым этапом SRS является полимеразная цепная реакция, которая вызывает преимущественную амплификацию повторяющейся ДНК. SRS также не может генерировать достаточную перекрывающуюся последовательность из фрагментов ДНК. Это представляет собой серьезную проблему для секвенирования de novo очень сложного и повторяющегося генома, такого как геном человека. [17] Еще одной проблемой SRS является обнаружение крупных изменений последовательности, что является основным препятствием для изучения структурных вариаций. [18]

Преимущества и недостатки лонгридов

[ редактировать ]

Последовательности секвенирования третьего поколения имеют длинное чтение и часто называются секвенированием длинного чтения (LRS). Технологии LRS способны секвенировать отдельные молекулы ДНК без амплификации. Наличие длинных чтений представляет собой большое преимущество, поскольку часто бывает трудно создать длинную непрерывную консенсусную последовательность с использованием NGS из-за сложности обнаружения перекрытий между короткими чтениями NGS, что влияет на общее качество сборки. В нескольких исследованиях было показано, что LRS значительно улучшает качество сборок генома. [19] [20] Еще одним преимуществом LRS перед NGS является то, что он обеспечивает одновременную возможность характеристики множества эпигенетических меток наряду с секвенированием ДНК. [21] [22]

Основная проблема LRS — точность и стоимость. Хотя LRS быстро улучшается и в этих областях.

См. также

[ редактировать ]
  1. ^ «Библиотека секвенирования: что это такое?» . Бреда Генетикс . 12 августа 2016 г. Проверено 23 июля 2017 г.
  2. ^ Чессон, Марк Дж. (2009). «Сборка фрагментов de novo с короткими чтениями парных пар: имеет ли значение длина чтения?» . Геномные исследования . 19 (2): 336–346. дои : 10.1101/гр.079053.108 . ПМЦ   2652199 . ПМИД   19056694 . Проверено 23 июля 2017 г.
  3. ^ Джунманн, Себастьян (2013). «Обновление сравнения производительности настольного секвенирования» . Природная биотехнология . 31 (4): 294–296. дои : 10.1038/nbt.2522 . ПМИД   23563421 .
  4. ^ Перепел, Майкл А. (2012). «Рассказ о трех платформах секвенирования следующего поколения: сравнение секвенаторов Ion Torrent, Pacific Biosciences и Illumina MiSeq» . БМК Геномика . 13 (1): 341. дои : 10.1186/1471-2164-13-341 . ПМЦ   3431227 . ПМИД   22827831 .
  5. ^ Чхангавала, Сагар; Руди, Гейб; Мейсон, Кристофер Э.; Розенфельд, Джеффри А. (23 июня 2015 г.). «Влияние длины чтения на количественную оценку дифференциально экспрессируемых генов и обнаружение сплайсинговых соединений» . Геномная биология . 16 (1): 131. дои : 10.1186/s13059-015-0697-y . ПМЦ   4531809 . ПМИД   26100517 .
  6. ^ Чессон, Марк Дж. П. (2015). «Генетическая изменчивость и сборка геномов человека de novo» . Обзоры природы Генетика . 16 (11): 627–640. дои : 10.1038/nrg3933 . ПМЦ   4745987 . ПМИД   26442640 .
  7. ^ Конеса, Ана; Мадригал, Педро; Таразона, Соня; Гомес-Кабреро, Дэвид; Сервера, Алехандра; Макферсон, Эндрю; Щесняк, Михал Войцех; Гаффни, Дэниел Дж.; Эло, Лаура Л.; Чжан, Сюэгун; Мортазави, Али (26 января 2016 г.). «Обзор лучших практик анализа данных секвенирования РНК» . Геномная биология . 17 (1): 13. дои : 10.1186/s13059-016-0881-8 . ПМЦ   4728800 . ПМИД   26813401 .
  8. ^ Джани, Алиса Мария; Галло, Гвидо Роберто; Джанфранчески, Лука; Форменти, Джулио (2020). «Долгий путь к геномике: история и современные подходы к секвенированию и сборке генома» . Журнал вычислительной и структурной биотехнологии . 18 :9–19. дои : 10.1016/j.csbj.2019.11.002 . ПМК   6926122 . ПМИД   31890139 .
  9. ^ Цян-лун, Чжу; Ши, Лю; Пэн, Гао; Фэй-ши, Луан (1 сентября 2014 г.). «Технология высокопроизводительного секвенирования и ее применение». Журнал Северо-Восточного сельскохозяйственного университета (английское издание) . 21 (3): 84–96. дои : 10.1016/S1006-8104(14)60073-8 .
  10. ^ Чессон, М.; Певзнер П.; Тан, Х. (1 сентября 2004 г.). «Сборка фрагментов с короткими чтениями». Биоинформатика . 20 (13): 2067–2074. doi : 10.1093/биоинформатика/bth205 . ПМИД   15059830 .
  11. ^ Крафт, Флориан; Курт, Инго (16 июля 2019 г.). «Длительное секвенирование в генетике человека» . Медицинская генетика . 31 (2): 198–204. дои : 10.1007/s11825-019-0249-z . S2CID   197402652 .
  12. ^ Сун, Винг-Кин (2017). Алгоритмы секвенирования нового поколения . Бока Ратон. ISBN  978-1466565500 . {{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )
  13. ^ Сун, Винг-Кин (2017). Алгоритмы секвенирования нового поколения . Бока Ратон. ISBN  978-1466565500 . {{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )
  14. ^ Адевале, Болуватифе А. (26 ноября 2020 г.). «Смогут ли технологии секвенирования длинного считывания заменить технологии секвенирования короткого считывания в ближайшие 10 лет?» . Африканский журнал лабораторной медицины . 9 (1): 5. дои : 10.4102/ajlm.v9i1.1340 . ПМК   7736650 . ПМИД   33354530 .
  15. ^ «Затраты на секвенирование ДНК: данные» . Genome.gov .
  16. ^ Мардис, Элейн Р. (февраль 2017 г.). «Технологии секвенирования ДНК: 2006–2016». Протоколы природы . 12 (2): 213–218. дои : 10.1038/nprot.2016.182 . ПМИД   28055035 . S2CID   205466745 .
  17. ^ Мардис, Элейн Р. (февраль 2017 г.). «Технологии секвенирования ДНК: 2006–2016». Протоколы природы . 12 (2): 213–218. дои : 10.1038/nprot.2016.182 . ПМИД   28055035 . S2CID   205466745 .
  18. ^ Хо, Стив С.; Урбан, Александр Э.; Миллс, Райан Э. (март 2020 г.). «Структурные изменения в эпоху секвенирования» . Обзоры природы Генетика . 21 (3): 171–189. дои : 10.1038/s41576-019-0180-9 . ПМЦ   7402362 . ПМИД   31729472 .
  19. ^ Роудс, Энтони; Ау, Кин Фай (октябрь 2015 г.). «Секвенирование PacBio и его применение» . Геномика, протеомика и биоинформатика . 13 (5): 278–289. дои : 10.1016/j.gpb.2015.08.002 . ПМЦ   4678779 . ПМИД   26542840 .
  20. ^ Венгер, Аарон М.; Пелузо, Пол; Роуэлл, Уильям Дж.; Чанг, Пи-Чуан; Холл, Ричард Дж.; Консепсьон, Грегори Т.; Эблер, Яна; Фунгтамасан, Аркарачай; Колесников, Алексей; Олсон, Натан Д.; Тёпфер, Армин; Алонге, Майкл; Махмуд, Медхат; Цянь, Юфэн; Чин, Чэнь-Шань; Филлиппи, Адам М.; Шац, Майкл С.; Майерс, Джин; ДеПристо, Марк А.; Жуан, Цзюэ; Маршалл, Тобиас; Седлажек, Фриц Дж.; Зук, Джастин М.; Ли, Хэн; Корень, Сергей; Кэрролл, Эндрю; Ранг, Дэвид Р.; Хункапиллер, Майкл В. (октябрь 2019 г.). «Точное циклическое консенсусное секвенирование длинного считывания улучшает обнаружение вариантов и сборку генома человека» . Природная биотехнология . 37 (10): 1155–1162. дои : 10.1038/s41587-019-0217-9 . ПМК   6776680 . ПМИД   31406327 .
  21. ^ Флюсберг, Бенджамин А; Вебстер, Дейл Р.; Ли, Джессика Х; Трэверс, Кевин Дж; Оливарес, Эрик С; Кларк, Тайсон А; Корлах, Йонас; Тернер, Стивен В. (июнь 2010 г.). «Прямое обнаружение метилирования ДНК во время секвенирования одной молекулы в реальном времени» . Природные методы . 7 (6): 461–465. дои : 10.1038/nmeth.1459 . ПМЦ   2879396 . ПМИД   20453866 .
  22. ^ Симпсон, Джаред Т; Уоркман, Рэйчел Э; Зузарте, ПК; Дэвид, Матей; Дурси, LJ; Тимп, Уинстон (апрель 2017 г.). «Обнаружение метилирования цитозина ДНК с помощью секвенирования нанопор». Природные методы . 14 (4): 407–410. дои : 10.1038/nmeth.4184 . ПМИД   28218898 . S2CID   16152628 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: dffbf17a8a54c0498c1e64d34b5155ac__1719436980
URL1:https://arc.ask3.ru/arc/aa/df/ac/dffbf17a8a54c0498c1e64d34b5155ac.html
Заголовок, (Title) документа по адресу, URL1:
Read (biology) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)