Байесовский инструмент для анализа метилирования
Байесовский инструмент для анализа метилирования , также известный как BATMAN , представляет собой статистический инструмент для анализа профилей иммунопреципитации метилированной ДНК (MeDIP). Его можно применять к большим наборам данных, созданным с использованием либо массивов олигонуклеотидов (MeDIP-чип), либо секвенирования следующего поколения (MeDIP-seq), обеспечивая количественную оценку состояния абсолютного метилирования в интересующей области. [1]

Теория
[ редактировать ]MeDIP (иммунопреципитация метилированной ДНК) — это экспериментальный метод, используемый для оценки уровней метилирования ДНК с помощью антитела для выделения метилированных последовательностей ДНК. Выделенные фрагменты ДНК либо гибридизуются с микрочипом (MeDIP-чип), либо секвенируются с помощью секвенирования следующего поколения (MeDIP-seq). Хотя это и говорит вам, какие области генома метилированы , оно не дает абсолютных уровней метилирования. Представьте себе две разные области генома A и B. : Область А имеет шесть CpG (метилирование ДНК в соматических клетках млекопитающих обычно происходит по динуклеотидам CpG). [2] ), три из которых метилированы. Область B содержит три CpG, все из которых метилированы. Поскольку антитело просто распознает метилированную ДНК , оно будет одинаково связывать обе эти области, и поэтому последующие этапы будут показывать одинаковые сигналы для этих двух областей. Это не дает полной картины метилирования в этих двух регионах (в регионе A метилирована только половина CpG, тогда как в регионе B метилированы все CpG). Следовательно, чтобы получить полную картину метилирования для данного региона, вам необходимо нормализовать сигнал, полученный в результате эксперимента MeDIP, на количество CpG в этом регионе, и именно это и делает алгоритм Бэтмена . Анализ сигнала MeDIP из приведенного выше примера даст баллы Бэтмена 0,5 для области A (т.е. область метилирована на 50%) и 1 для области B (т.е. область метилирована на 100%). Таким образом, Бэтмен преобразует сигналы экспериментов MeDIP в абсолютные уровни метилирования.
Развитие Бэтмена
[ редактировать ]Основной принцип алгоритма Бэтмена заключается в моделировании эффектов различной плотности динуклеотидов CpG и влияния, которое это оказывает на обогащение MeDIP фрагментов ДНК.Основные предположения Бэтмена:
- Почти все метилирование ДНК у млекопитающих происходит по динуклеотидам CpG.
- Большинство регионов с низким содержанием CpG конститутивно метилированы, тогда как большинство регионов с высоким содержанием CpG (островков CpG) конститутивно неметилированы. [3]
- В эксперименте MeDIP нет смещений фрагментов (примерный диапазон размеров фрагментов ДНК составляет 400–700 п.н.).
- Ошибки на микроматрице обычно распределяются с высокой точностью.
- Только метилированные CpG вносят вклад в наблюдаемый сигнал.
- Состояние метилирования CpG обычно сильно коррелирует с сотнями оснований. [4] таким образом, CpG, сгруппированные вместе в окнах размером 50 или 100 п.н., будут иметь одинаковое состояние метилирования.
Основные параметры в Бэтмене:
- C cp : коэффициент связи между зондом p и динуклеотидом CpG c , определяется как доля молекул ДНК, гибридизующихся с зондом p , которые содержат CpG c .
- C tot : параметр общего влияния CpG, определяется как сумма коэффициентов связи для любого данного зонда, который обеспечивает меру локальной плотности CpG.
- m c : статус метилирования в позиции c , который представляет собой долю хромосом в образце, на которой он метилирован. m c рассматривается как непрерывная переменная , поскольку большинство образцов, использованных в исследованиях MeDIP, содержат несколько типов клеток.
Исходя из этих предположений, сигнал от MeDIP-канала MeDIP-чипа или эксперимента MeDIP-seq зависит от степени обогащения фрагментов ДНК, перекрывающих этот зонд, что, в свою очередь, зависит от количества связывающихся антител и, следовательно, от количества метилированных CpG на этих фрагментах. В модели Бэтмена полный набор данных эксперимента MeDIP/чип, A, может быть представлен статистической моделью в форме следующего распределения вероятностей :
где ( Икс | м , п 2 ) — гауссова функция плотности вероятности . Стандартные байесовские методы можно использовать для вывода f ( m | A ), то есть распределения вероятных состояний метилирования с учетом одного или нескольких наборов выходных данных MeDIP-чипа/MeDIP-seq. Чтобы решить эту проблему вывода, Бэтмен использует вложенную выборку ( http://www.inference.phy.cam.ac.uk/bayesys/ ), чтобы сгенерировать 100 независимых выборок из f ( m | A ) для каждой мозаичной области генома, затем суммирует наиболее вероятное состояние метилирования в окнах размером 100 п.н., подгоняя бета-распределения к этим образцам. моды наиболее вероятного бета-распределения В качестве финальных вызовов метилирования использовали .
Ограничения
[ редактировать ]При рассмотрении использования Бэтмена может быть полезно принять во внимание следующие моменты:
- Бэтмен – это не программа ; это алгоритм, выполняемый с использованием командной строки . По существу, это не особенно удобно для пользователя и представляет собой довольно сложный в вычислительном отношении процесс.
- Поскольку это некоммерческое издание, при использовании Batman имеется очень мало поддержки, помимо той, что указана в руководстве.
- Это довольно трудоемко (на анализ одной хромосомы может уйти несколько дней). (Примечание: в одной правительственной лаборатории запуск Бэтмена на наборе из 100 массивов метилирования ДНК человека Agilent (около 250 000 зондов на массив) занял менее часа в программном обеспечении Agilent Genomic Workbench. Наш компьютер имел процессор с тактовой частотой 2 ГГц и 24 ГБ оперативной памяти. , 64-разрядная версия Windows 7.)
- изменение количества копий Необходимо учитывать (CNV). Например, балл для региона со значением CNV 1,6 при раке (потеря 0,4 по сравнению с нормой) необходимо будет умножить на 1,25 (=2/1,6), чтобы компенсировать потерю.
- Одно из основных предположений Бэтмена состоит в том, что все метилирование ДНК происходит на динуклеотидах CpG. Хотя обычно это справедливо для соматических клеток позвоночных , существуют ситуации, когда широко распространено не-CpG-метилирование, например, в растительных клетках и эмбриональных стволовых клетках . [5] [6]
Ссылки
[ редактировать ]- ^ Даун, Т.А. и др. Стратегия байесовской деконволюции для анализа метиломов ДНК на основе иммунопреципитации. Природная биотехнология 26 , 779–85 (2008).
- ^ Листер, Р. и др . ДНК человека Метиломы при разрешении оснований демонстрируют широко распространенные эпигеномные различия. Природа 462 , 315–22 (2009).
- ^ Бёрд, А. Паттерны метилирования ДНК и эпигенетическая память. Гены и развитие 16 , 6–21 (2002).
- ^ Экхардт, Ф. и др . Профилирование метилирования ДНК хромосом 6, 20 и 22 человека. Nature Genetics 38 , 1378–85 (2006).
- ^ Додж, Дж. Э., Рамсахой, Б. Х., Во, З. Г., Окано, М. и Ли, Э. Метилирование de novo провируса MMLV в эмбриональных стволовых клетках: метилирование CpG по сравнению с метилированием без CpG. Джин 289 , 41–8 (2002)
- ^ Ванюшин, Метилирование ДНК БФ у растений. Актуальные темы микробиологии и иммунологии 301 , 67–122 (2006).