Карта двоичного выравнивания
Карта двоичного выравнивания (BAM) — это комплексные необработанные данные секвенирования генома ; [1] он состоит из без потерь сжатого двоичного представления файлов карты выравнивания последовательностей . [2] [3]
BAM — это сжатое двоичное представление SAM (Карта выравнивания последовательностей), компактное и индексируемое представление выравниваний нуклеотидных последовательностей. [4] Цель индексирования — быстро получить трассы, перекрывающие определенное местоположение, без необходимости просматривать их все. Перед индексацией BAM необходимо отсортировать по идентификатору ссылки, а затем по крайней левой координате. [5] BAM имеет сжатый формат BGZF.

Структура файлов BAM включает раздел заголовка и раздел выравнивания: [6]
- Заголовок — в этот раздел включены имя образца, длина образца и метод выравнивания. Раздел выравниваний содержит выравнивания, связанные с конкретной информацией в разделе заголовка.
- Выравнивания — в этот файл включены имя чтения, последовательность чтения, качество чтения, информация о выравнивании и пользовательские теги. Хромосома, начальная координата, качество выравнивания и строка дескриптора совпадения включаются в имя чтения.
- Раздел выравнивания включает в себя следующее:
- Группа чтения (РГ)
- Тег со штрих-кодом (BC)
- Качество выравнивания одного конца (SM)
- Качество выравнивания парных концов (AS)
- Редактировать метку расстояния (NM)
- Именной тег ампликона (XN)
- Раздел выравнивания включает в себя следующее:
с отсчетом от 0 В формате BAM используется система координат , тогда как в формате SAM используется система координат с отсчетом от 1. BAM может представлять значения в диапазоне [−2^31, 2^32). [5]
Чтобы просмотреть список инструментов секвенирования и анализа, работающих с SAM/BAM, нажмите здесь .
См. также
[ редактировать ]- Формат FASTQ
- Формат SAM
- SAMtools
- Формат CRAM
- Список форматов файлов для молекулярной биологии
- Сжатие данных геномного секвенирования
Внешние ссылки
[ редактировать ]Ссылки
[ редактировать ]- ^ «Игра геномов Карла Циммера, сезон 1: Эпизод 3, БАМ раскрывает все» . СТАТ . Проверено 21 августа 2016 г.
- ^ Ли, Хэн (8 июня 2009 г.). «Формат Sequence Alignment/Map и SAMtools» (PDF) . Биоинформатика . 25 : 2078–9. doi : 10.1093/биоинформатика/btp352 . ПМК 2723002 . ПМИД 19505943 .
- ^ «Двоичная карта выравнивания» . Wiki Национального института рака . Проверено 21 августа 2016 г.
- ^ «Формат трека BAM браузера генома» . genome.ucsc.edu . Проверено 5 мая 2022 г.
- ^ Перейти обратно: а б «Спецификация формата выравнивания последовательности/карты» (PDF) . Рабочая группа по спецификации формата SAM/BAM . 3 июня 2021 г.
- ^ «Формат файла BAM» . support.illumina.com . Проверено 5 мая 2022 г.