Неравновесие связей
Эта статья может быть слишком технической для понимания большинства читателей . ( Май 2023 г. ) |
Эта статья содержит инструкции, советы и инструкции . ( май 2023 г. ) |
В популяционной генетике неравновесие по сцеплению ( LD ) — это мера неслучайной связи между сегментами ДНК ( аллелями ) в разных положениях хромосомы ( локусами ) в данной популяции, основанная на сравнении частоты обнаружения двух аллелей. вместе в одних и тех же локусах и частотах, с которыми каждая аллель обнаруживается в этом локусе в целом, независимо от того, встречается ли она с другой интересующей аллелью или без нее. Говорят, что локусы находятся в неравновесии по сцеплению, когда частота их совместного обнаружения (частота ассоциации их различных аллелей) выше или ниже, чем ожидалось, если бы локусы были независимыми и ассоциировались случайным образом. [1]
Хотя паттерн неравновесия по сцеплению в геноме является мощным сигналом популяционных генетических процессов, которые его структурируют, он не указывает на то, почему этот паттерн возникает сам по себе. На неравновесие по сцеплению влияют многие факторы, включая отбор , скорость генетической рекомбинации , скорость мутаций , генетический дрейф , систему спаривания , структуру популяции и генетическое сцепление .
Несмотря на свое название, неравновесие по сцеплению может существовать между аллелями в разных локусах без какой-либо генетической связи между ними и независимо от того, находятся ли частоты аллелей в равновесии (не меняются со временем). [1] Более того, неравновесие по сцеплению иногда называют гаметической фазы неравновесием ; [2] однако эта концепция применима и к бесполым организмам и, следовательно, не зависит от наличия гамет .
Формальное определение [ править ]
Предположим, что среди гамет, образующихся в популяции, размножающейся половым путем, аллель А встречается с частотой в одном локусе (т.е. — доля гамет с A в этом локусе), тогда как в другом локусе аллель B встречается с частотой . Аналогично, пусть — это частота, с которой A и B встречаются вместе в одной и той же гамете (т.е. — частота AB гаплотипа ).
Ассоциацию между аллелями A и B можно рассматривать как совершенно случайную (в статистике это называется независимостью ), когда появление одного не влияет на появление другого, и в этом случае вероятность того, что A и B встречаются вместе, равна данный продукт вероятностей. Говорят, что между двумя аллелями существует неравновесие по сцеплению всякий раз, когда отличается от по любой причине.
Уровень неравновесия по сцеплению между A и B можно определить количественно с помощью коэффициента неравновесия по сцеплению. , который определяется как
Неравновесие по сцеплению соответствует . В случае у нас есть аллели A и B и говорят, что находятся в равновесии по сцеплению . Индекс «АВ» на подчеркивает, что неравновесие по сцеплению является свойством пары аллелей, а не соответствующих им локусов. Другие пары аллелей тех же двух локусов могут иметь разные коэффициенты неравновесия по сцеплению.
Для двух биаллельных локусов, где a и b — другие аллели в этих двух локусах, ограничения настолько сильны, что только одного значения D достаточно, чтобы представить все отношения неравновесия по сцеплению между этими аллелями. В этом случае, . Их отношения можно охарактеризовать следующим образом. [3]
Знак D в этом случае выбирается произвольно. Величина D более важна, чем знак D , поскольку величина D отражает степень неравновесия сцепления. [4] Однако положительное значение D означает, что гаметы встречаются чаще, чем ожидалось, а отрицательное означает, что комбинация этих двух аллелей встречается реже, чем ожидалось.
Неравновесие по сцеплению в бесполых популяциях можно определить аналогичным образом с точки зрения частот популяционных аллелей. Кроме того, также возможно определить неравновесие по сцеплению между тремя или более аллелями, однако эти ассоциации более высокого порядка обычно не используются на практике. [1]
Нормализация [ править ]
Неравновесие по связям отражает как изменения интенсивности корреляции сцепления, так и изменения частоты генов. Это создает проблему при сравнении неравновесия по сцеплению между аллелями с разными частотами. Нормализация неравновесия по сцеплению позволяет легче сравнивать эти аллели.
Метод D [ править ]
Левонтин [5] предложил рассчитывать нормализованное неравновесие по сцеплению (также называемое относительным неравновесием по сцеплению) разделив по теоретической максимальной разнице между наблюдаемыми и ожидаемыми частотами аллелей следующим образом:
где
Стоимость будет в пределах диапазона . Когда , локусы независимы. Когда аллели встречаются реже, чем ожидалось. Когда , аллели встречаются чаще, чем ожидалось.
Обратите внимание, что может использоваться вместо при измерении того, насколько близки два аллеля к равновесию сцепления.
Метод r² [ править ]
Альтернатива - коэффициент корреляции между парами локусов, обычно выражаемый как его квадрат, . [6]
Стоимость будет в пределах диапазона . Когда , корреляции между парой нет. Когда , корреляция либо совершенно положительная, либо совершенно отрицательная в зависимости от знака .
d Метод [ править ]
Другая альтернатива нормализует произведением двух из четырех частот аллелей, когда две частоты представляют аллели из одного и того же локуса. Это позволяет сравнивать асимметрию между парой локусов. Это часто используется в исследованиях «случай-контроль» , где локус, содержащий аллель заболевания. [7]
ρ Метод [ править ]
Подобно методу d, эта альтернатива нормализует произведением двух из четырех частот аллелей, когда две частоты представляют аллели из разных локусов. [7]
диапазонов мер неравновесия сцеплению Пределы по
Меры и имеют пределы своего диапазона и не охватывают все значения от нуля до единицы для всех пар локусов. Максимум зависит от частот аллелей в двух сравниваемых локусах и может полностью варьироваться только от нуля до единицы, где либо частоты аллелей в обоих локусах равны, где , или когда частоты аллелей имеют отношение когда . [8] Пока всегда может принимать максимальное значение 1, его минимальное значение для двух локусов равно для этих локусов. [9]
Пример: два локуса и две аллели [ править ]
Рассмотрим гаплотипы для двух локусов A и B с двумя аллелями каждый — модель с двумя локусами и двумя аллелями. Тогда следующая таблица определяет частоты каждой комбинации:
Гаплотип | Частота |
Обратите внимание, что это относительные частоты . Можно использовать приведенные выше частоты для определения частоты каждого из аллелей:
Аллель | Частота |
Если два локуса и аллели независимы друг от друга, то можно было бы ожидать, что частота каждого гаплотипа будет равна произведению частот его соответствующих аллелей (например, ).
Отклонение наблюдаемой частоты гаплотипа от ожидаемой – это величина [10] называется неравновесием по сцеплению [11] и обычно обозначается заглавной буквой D :
Таким образом, если локусы наследовались независимо, то , так , и существует равновесие сцепления. Однако если наблюдаемая частота гаплотипа были выше, чем можно было бы ожидать, исходя из индивидуальных частот и затем , так , и существует положительное неравновесие по сцеплению. И наоборот, если бы наблюдаемая частота была ниже, то , , и существует отрицательное неравновесие по сцеплению.
Следующая таблица иллюстрирует взаимосвязь между частотами гаплотипов и частотами аллелей и D.
Общий | |||
Общий |
Кроме того, мы можем нормализовать наши данные в зависимости от того, чего мы пытаемся достичь. Например, если мы хотим создать карту ассоциаций в исследовании «случай-контроль» , то мы можем использовать метод d из-за его асимметрии. Если мы пытаемся найти вероятность того, что данный гаплотип попадет в популяцию без рекомбинации с другими гаплотипами, то, возможно, лучше использовать метод ρ. Но для большинства сценариев имеет тенденцию быть самым популярным методом из-за полезности коэффициента корреляции в статистике. Пара примеров того, где Может быть очень полезным, включая измерение скорости рекомбинации в развивающейся популяции или обнаружение ассоциаций заболеваний. [7]
Роль рекомбинации [ править ]
В отсутствие эволюционных сил, кроме случайного спаривания , менделевской сегрегации , случайного хромосомного набора и хромосомного скрещивания (т.е. в отсутствие естественного отбора , инбридинга и генетического дрейфа ),мера неравновесия по сцеплению сходится к нулю вдоль оси времени со скоростьюв зависимости от величины скорости рекомбинации между двумя локусами.
Используя обозначения выше, , мы можем продемонстрировать эту сходимость к нулюследующее. В следующем поколении, , частота гаплотипа , становится
Это следует из того, что дробь гаплотипов у потомства нерекомбинируются и, таким образом, являются копиями случайного гаплотипа своих родителей. Дробь из них . Дробь рекомбинировали эти два локуса. Если родители произошли в результате случайного спаривания, вероятностькопировать в место наличие аллеля является и вероятностькопии в локусе наличие аллеля является , и поскольку эти копии изначально находятся в двух разных гаметах, которые сформировали диплоидный генотип, это независимые события, поэтому вероятности можно умножить.
Эту формулу можно переписать как
так что
где в -е поколение обозначается как . Таким образом, мы имеем
Если , затем так что сходится к нулю.
Если в какой-то момент мы наблюдаем неравновесие по сцеплению, то в будущем оно исчезнет за счет рекомбинации. Однако чем меньше расстояние между двумя локусами, тем меньше будет скорость конвергенции. до нуля.
Визуализация [ править ]
После того, как неравновесие по сцеплению рассчитано для набора данных, часто выбирается метод визуализации, чтобы отобразить неравновесие по сцеплению, чтобы сделать его более понятным.
Наиболее распространенным методом является использование тепловой карты , где цвета используются для обозначения локусов с положительным неравновесием по сцеплению и равновесием по сцеплению. В этом примере отображается полная тепловая карта, но поскольку тепловая карта симметрична по диагонали (т. е. неравновесие по сцеплению между локусами A и B такое же, как между локусами B и A), обычно также используется треугольная тепловая карта, на которой пары показаны только один раз. трудоустроен. Преимущество этого метода состоит в том, что его легко интерпретировать, но он также не может отображать информацию о других переменных, которые могут представлять интерес.
Также доступны более надежные варианты визуализации, такие как текстильный сюжет. На текстильном участке комбинации аллелей в определенных локусах могут быть связаны с комбинациями аллелей в других локусах. Каждый генотип (комбинация аллелей) представлен кружком, площадь которого пропорциональна частоте этого генотипа, со столбцом для каждого локуса. Линии проведены от каждого круга к кругам в другом столбце(ах), а толщина соединительной линии пропорциональна частоте, с которой два генотипа встречаются вместе. Неравновесие по сцеплению видно по количеству пересечений линий на диаграмме, где большее количество пересечений линий указывает на низкое неравновесие по сцеплению, а меньшее количество пересечений указывает на сильное неравновесие по сцеплению. Преимущество этого метода в том, что он показывает частоты отдельных генотипов и включает визуальное различие между абсолютным (когда аллели в двух локусах всегда появляются вместе) и полным (когда аллели в двух локусах демонстрируют сильную связь, но с возможностью рекомбинация) неравновесие по сцеплению по форме графа. [12]
Другой вариант визуализации — леса иерархических моделей скрытых классов (FHLCM). Все локусы располагаются вдоль верхнего слоя графика, а под этим верхним слоем поля, представляющие скрытые переменные, добавляются со ссылками на верхний уровень. Линии соединяют локусы на верхнем уровне со скрытыми переменными ниже, и чем ниже уровень блока, с которым связаны локусы, тем больше неравновесие по сцеплению и тем меньше расстояние между локусами. Хотя этот метод не имеет тех же преимуществ, что и текстильный график, он позволяет визуализировать локусы, находящиеся далеко друг от друга, не требуя перестановки последовательности, как в случае с текстильным графиком. [13]
Это не исчерпывающий список методов визуализации, и для отображения набора данных можно использовать несколько методов, чтобы дать лучшее представление о данных на основе информации, которую исследователь стремится выделить.
Ресурсы [ править ]
Сравнение различных показателей LD предоставлено Devlin & Risch. [14]
Международный проект HapMap позволяет изучать БЛ в человеческих популяциях в режиме онлайн . Проект Ensembl интегрирует данные HapMap с другой генетической информацией из dbSNP .
Программное обеспечение для анализа [ править ]
- PLINK - набор инструментов для анализа ассоциаций всего генома, который, среди прочего, может рассчитывать LD.
- LDHat. Архивировано 13 мая 2016 г. на Wayback Machine.
- Хапловью
- LdCompare [15] — открытое программное обеспечение для расчета ЛД.
- SNP and Variation Suite – коммерческое программное обеспечение с интерактивным графиком LD.
- ЗОЛОТО – Графический обзор неравновесия связей
- TASSEL - программное обеспечение для оценки неравновесия по сцеплению, ассоциаций признаков и закономерностей эволюции.
- rAggr – находит прокси-маркеры (SNP и инделы), которые находятся в неравновесии по сцеплению с набором запрошенных маркеров, используя базы данных генотипов проекта 1000 Genomes Project и HapMap .
- SNeP – Быстрое вычисление LD и Ne для больших наборов данных генотипов в формате PLINK.
- LDlink – набор веб-приложений для простого и эффективного исследования неравновесия связей в подгруппах населения. Все данные о генотипах популяции взяты из фазы 3 проекта «1000 геномов», а номера вариантов RS индексируются на основе сборки dbSNP 151.
- Bcftools — утилиты для вызова вариантов и управления VCF и BCF.
Программное обеспечение для моделирования [ править ]
- Haploid — библиотека C для популяционно-генетического моделирования ( GPL )
См. также [ править ]
- Хапловью
- Принцип Харди – Вайнберга
- Генетический автостоп
- Генетическая связь
- Совместная адаптация
- Генеалогический ДНК-тест
- Тег SNP
- Сопоставление ассоциаций
- Картирование QTL на основе семьи
Ссылки [ править ]
- ^ Jump up to: Перейти обратно: а б с Слаткин, Монтгомери (июнь 2008 г.). «Неравновесие связей — понимание эволюционного прошлого и отображение медицинского будущего» . Обзоры природы Генетика . 9 (6): 477–485. дои : 10.1038/nrg2361 . ПМК 5124487 . ПМИД 18427557 .
- ^ Фальконер, Д.С.; Маккей, TFC (1996). Введение в количественную генетику (4-е изд.). Харлоу, Эссекс, Великобритания: Эддисон Уэсли Лонгман. ISBN 978-0-582-24302-6 .
- ^ Слаткин, Монтгомери (июнь 2008 г.). «Неравновесие связей — понимание эволюционного прошлого и отображение медицинского будущего» . Обзоры природы Генетика . 9 (6): 477–485. дои : 10.1038/nrg2361 . ISSN 1471-0056 . ПМК 5124487 . ПМИД 18427557 .
- ^ Калабрезе, Барбара (01 января 2019 г.), «Неравновесие связей» , в Ранганатане, Шоба; Грибсков, Михаил; Накаи, Кента; Шенбах, Кристиан (ред.), Энциклопедия биоинформатики и вычислительной биологии , Оксфорд: Academic Press, стр. 763–765, doi : 10.1016/b978-0-12-809633-8.20234-3 , ISBN 978-0-12-811432-2 , S2CID 226248080 , получено 21 октября 2020 г.
- ^ Левонтин, RC (1964). «Взаимодействие отбора и сцепления. I. Общие соображения; гетеротические модели» . Генетика . 49 (1): 49–67. дои : 10.1093/генетика/49.1.49 . ПМЦ 1210557 . ПМИД 17248194 .
- ^ Хилл, У.Г. и Робертсон, А. (1968). «Неравновесие по сцеплению в конечных популяциях». Теоретическая и прикладная генетика . 38 (6): 226–231. дои : 10.1007/BF01245622 . ПМИД 24442307 . S2CID 11801197 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Jump up to: Перейти обратно: а б с Канг, Джонатан Т.Л.; Розенберг, Ной А. (2019). «Математические свойства статистики неравновесия по сцеплению, определяемой нормализацией коэффициента D = pAB – pApB» . Наследственность человека . 84 (3): 127–143. дои : 10.1159/000504171 . ISSN 0001-5652 . ПМК 7199518 . ПМИД 32045910 .
- ^ ВанЛьер, Дж. М. и Розенберг, Н. А. (2008). «Математические свойства мера неравновесия по сцеплению» Theoretical Population Biology . 74 (1): 130–137. doi : 10.1016/j.tpb.2008.05.006 . PMC 2580747. . PMID 18572214 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Смит, Р.Д. (2020). «Нелинейная структура неравновесия сцепления». Теоретическая популяционная биология . 134 : 160–170. дои : 10.1016/j.tpb.2020.02.005 . ПМИД 32222435 . S2CID 214716456 .
- ^ Роббинс, РБ (1 июля 1918 г.). «Некоторые приложения математики к проблемам разведения III» . Генетика . 3 (4): 375–389. дои : 10.1093/генетика/3.4.375 . ПМК 1200443 . ПМИД 17245911 .
- ^ Р. К. Левонтин и К. Кодзима (1960). «Эволюционная динамика сложных полиморфизмов». Эволюция . 14 (4): 458–472. дои : 10.2307/2405995 . ISSN 0014-3820 . JSTOR 2405995 .
- ^ Кумасака, Нацухико; Накамура, Юсуке; Каматани, Наоюки (27 апреля 2010 г.). «Текстильный график: новое отображение неравновесия по сцеплению данных генотипа полиморфизма множественных одиночных нуклеотидов» . ПЛОС ОДИН . 5 (4): е10207. дои : 10.1371/journal.pone.0010207 . ISSN 1932-6203 . ПМЦ 2860502 . ПМИД 20436909 .
- ^ Мурад, Рафаэль; Синоке, Кристина; Дина, Кристиан; Лере, Филипп (13 декабря 2011 г.). «Визуализация структуры неравновесия парных и многолокусных связей с использованием латентных лесов» . ПЛОС ОДИН . 6 (12): е27320. дои : 10.1371/journal.pone.0027320 . ISSN 1932-6203 . ПМК 3236755 . ПМИД 22174739 .
- ^ Девлин Б.; Риш Н. (1995). «Сравнение мер неравновесия по сцеплению для мелкомасштабного картирования» (PDF) . Геномика . 29 (2): 311–322. CiteSeerX 10.1.1.319.9349 . дои : 10.1006/geno.1995.9003 . PMID 8666377 .
- ^ Хао К.; Ди Х.; Коули С. (2007). «LdCompare: быстрое вычисление одиночного и множественного маркера r2 и генетического покрытия» . Биоинформатика . 23 (2): 252–254. doi : 10.1093/биоинформатика/btl574 . ПМИД 17148510 .
Дальнейшее чтение [ править ]
- Хедрик, Филип В. (2005). Генетика популяций (3-е изд.). Садбери, Бостон, Торонто, Лондон, Сингапур: издательства Jones and Bartlett. ISBN 978-0-7637-4772-5 .
- Библиография: Анализ неравновесия по сцеплению : библиография из более чем тысячи статей по неравновесию по сцеплению, опубликованных с 1918 года.