Jump to content

Граф последовательности

Граф последовательностей , также называемый графом выравнивания , графом точек останова или графом смежности, представляет собой двунаправленные графы, используемые в сравнительной геномике . Структура состоит из нескольких графов или геномов с рядом ребер и вершин, представленных как смежности между сегментами генома . [1] и сегменты ДНК соответственно. Обход связного компонента сегментов и ребер смежности (называемого нитью ) дает последовательность, которая обычно представляет геном или часть генома. Сегменты можно рассматривать как блоки синтении , где края определяют, как расположить эти блоки в конкретном геноме, а маркировка ребер смежности представляет основания, которые не содержатся в блоках синтении.

Строительство

[ редактировать ]

Прежде чем построить граф последовательности, должно быть как минимум два генома, представленных в виде ориентированных графов с ребрами в виде нитей (ребер смежности) и вершинами в виде сегментов ДНК. Геномы должны быть помечены P и Q, а граф последовательности помечен как BreakpointGraph( P, Q ). [2]

Направленные вершины Q и их ребра располагаются в порядке P. После завершения ребра Q снова соединяются со своими исходными вершинами. После того, как все ребра сопоставлены, направления вершин удаляются, и вместо этого каждая вершина помечается как v. час (голова вершины) и v т (вершина хвоста).

Сходство между геномами выражается количеством циклов (независимых систем) в графе последовательности. Число циклов равно тактам (P, Q). Максимально возможное количество циклов равно количеству вершин в графе последовательности.

Пример рисунка.

При получении геномов P (+a +b -c) и Q (+a +b -c), [1] Q следует выровнять так, чтобы он соответствовал направлениям ребер (красного цвета) P. Вершины следует переименовать из a, b, c в a. час а т , б час б т , с час с т и ребра P и Q должны быть соединены со своими исходными вершинами (ребра P = черные, ребра Q = зеленые). Удалите направляющие края (красные). Количество циклов в G(P, Q) равно 1, а максимально возможное — 3.

Приложения

[ редактировать ]

Реконструкция геномов предков

[ редактировать ]

Алексеев и Певзнер используют графы последовательностей для создания собственного алгоритма для изучения истории реаранжировки генома нескольких млекопитающих, а также для решения проблем с текущей наследственной реконструкцией геномов. [1]

Множественное выравнивание последовательностей

[ редактировать ]

Графы последовательностей можно использовать для представления множественных выравниваний последовательностей с добавлением нового типа ребер, представляющих гомологию между сегментами. [3] Для набора геномов можно создать ациклический граф точек останова с потоком для каждого генома. На два сегмента и , где , , , и представляют конечные точки двух сегментов, ребра гомологии могут быть созданы из к и к или из к и к - представляющие две возможные ориентации гомологии. Преимущество представления множественного выравнивания последовательностей таким способом заключается в том, что можно включать инверсии и другие структурные перестановки, которые недопустимы в матричном представлении.

Представление вариаций

[ редактировать ]

Если при прохождении потока в графе последовательностей существует несколько возможных путей, один и тот же поток может представлять несколько последовательностей. Это означает, что можно создать граф последовательностей, который представляет популяцию людей с немного разными геномами, причем каждый геном соответствует одному пути через граф. Эти графики были предложены в качестве замены эталонного генома человека . [4]

  1. ^ Jump up to: а б с Алексеев, М.А.; Певзнер, Пенсильвания (13 февраля 2009 г.). «Графы точек останова и реконструкции генома предков» . Геномные исследования . 19 (5). Лаборатория Колд-Спринг-Харбор: 943–957. дои : 10.1101/гр.082784.108 . ISSN   1088-9051 . ПМК   2675983 . ПМИД   19218533 .
  2. ^ Графики точек останова , получены 5 мая 2022 г.
  3. ^ Патен, Бенедикт; Зербино, Дэниел Р.; Хикки, Гленн; Хаусслер, Дэвид (19 июня 2014 г.). «Объединяющая модель эволюции генома в условиях экономности» . БМК Биоинформатика . 15 (1). Springer Science and Business Media LLC: 206. doi : 10.1186/1471-2105-15-206 . ISSN   1471-2105 . ПМК   4082375 . ПМИД   24946830 .
  4. ^ Патен, Бенедикт; Новак, Адам; Хаусслер, Дэвид (20 апреля 2014 г.). «Сопоставление эталонной структуры генома». arXiv : 1404.5010 [ q-bio.GN ].
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: c1b657fa8d84d83f6fd44e6896a64260__1714480980
URL1:https://arc.ask3.ru/arc/aa/c1/60/c1b657fa8d84d83f6fd44e6896a64260.html
Заголовок, (Title) документа по адресу, URL1:
Sequence graph - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)