Частотный спектр аллеля
В популяционной генетике частотный спектр аллелей , иногда называемый частотным спектром сайтов , представляет собой распределение частот аллелей данного набора локусов (часто SNP ) в популяции или образце. [1] [2] [3] [4] Поскольку частотный спектр аллелей часто представляет собой сводку или сравнение с секвенированными выборками всей популяции, это гистограмма, размер которой зависит от количества секвенированных отдельных хромосом. Каждая запись в частотном спектре записывает общее количество локусов с соответствующей частотой производного аллеля. Предполагается, что локусы, вносящие вклад в частотный спектр, независимо изменяются по частоте. Более того, предполагается, что локусы являются биаллельными (то есть имеют ровно две аллели), хотя существуют расширения для многоаллельных частотных спектров. [5]
Многие сводные статистические данные наблюдаемых генетических вариаций сами по себе являются сводками частотного спектра аллелей, включая оценки такие как Уоттерсон и Тадзима , D Тадзимы , H Фэя и Ву и индекс фиксации . [6]
Пример
[ редактировать ]Частотный спектр аллеля из образца хромосом рассчитывается путем подсчета количества участков с производными частотами аллелей. .Например, рассмотрим образец особи с восемью наблюдаемыми вариабельными сайтами. В этой таблице 1 указывает, что на этом сайте наблюдается производный аллель, а 0 указывает на то, что наблюдался предковый аллель.
СНП 1 | СНП 2 | СНП 3 | СНП 4 | СНП 5 | СНП 6 | СНП 7 | СНП 8 | |
---|---|---|---|---|---|---|---|---|
Образец 1 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 0 |
Образец 2 | 1 | 0 | 1 | 0 | 0 | 0 | 1 | 0 |
Образец 3 | 0 | 1 | 1 | 0 | 0 | 1 | 0 | 0 |
Образец 4 | 0 | 0 | 0 | 0 | 1 | 0 | 1 | 1 |
Образец 5 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 |
Образец 6 | 0 | 0 | 0 | 1 | 0 | 1 | 1 | 0 |
Общий | 1 | 2 | 3 | 1 | 1 | 2 | 5 | 1 |
Частотный спектр аллеля можно записать в виде вектора , где - количество наблюдаемых сайтов с производной частотой аллеля . В этом примере наблюдаемый частотный спектр аллеля равен , из-за четырех экземпляров одной наблюдаемой производной аллели в определенном локусе SNP, двух экземпляров двух производных аллелей и так далее.
Расчет
[ редактировать ]Ожидаемый частотный спектр аллелей можно рассчитать с использованием метода слияния или диффузии . [7] [8] Демографическая история популяции и естественный отбор влияют на динамику частот аллелей, и эти эффекты отражаются в форме спектра частот аллелей. Для простого случая сегрегации селективных нейтральных аллелей в популяции, которая достигла демографического равновесия (то есть без недавних изменений размера популяции или потока генов), ожидаемый спектр частот аллелей за образец размером дается
где - это частота мутаций в масштабе популяции. Отклонения от демографического равновесия или нейтральности изменят форму ожидаемого частотного спектра.
Для расчета частотного спектра на основе данных наблюдаемых последовательностей необходимо иметь возможность различать предковые и производные (мутантные) аллели, часто путем сравнения с последовательностью внешней группы . Например, в генетических исследованиях человеческой популяции гомологичная эталонная последовательность шимпанзе обычно используется для оценки предкового аллеля. Однако иногда предковый аллель не может быть определен, и в этом случае вместо этого можно рассчитать частотный спектр свернутого аллеля. Свернутый частотный спектр хранит наблюдаемые количества второстепенных (наиболее редких) частот аллелей. Свернутый спектр можно рассчитать путем объединения й и th элементов из развернутого спектра, где количество отобранных особей.
Частотный спектр многопопуляционных аллелей
[ редактировать ]Объединенный частотный спектр аллелей (JAFS) представляет собой совместное распределение частот аллелей в двух или более родственных популяциях. JAFS для населения, с взяты хромосомы в население, представляет собой -мерная гистограмма, в которой каждая запись хранит общее количество участков сегрегации, в которых производный аллель наблюдается с соответствующей частотой в каждой популяции. Каждая ось гистограммы соответствует популяции, а индексы отсчитываются от для тыс. населения. [9] [10]
Пример
[ редактировать ]Предположим, мы секвенируем диплоидных особей из двух популяций: 4 особей из популяции 1 и 2 особей из популяции 2. JAFS будет матрица, индексированная с нуля. запись будет фиксировать количество наблюдаемых полиморфных локусов с производной частотой аллеля 3 в популяции 1 и частотой 2 в популяции 2. запись будет регистрировать те локусы с наблюдаемой частотой 1 в популяции 1 и частотой 0 в популяции 2. запись будет регистрировать те локусы, производный аллель которых зафиксирован в популяции 1 (виден во всех хромосомах) и с частотой 3 в популяции 2.
Приложения
[ редактировать ]Форма частотного спектра аллелей чувствительна к демографии, например, к изменениям размера популяции, миграции и субструктуре, а также к естественному отбору. Сравнивая наблюдаемые данные, обобщенные в частотном спектре, с ожидаемым частотным спектром, рассчитанным в соответствии с заданной демографической и селекционной моделью, можно оценить степень соответствия этой модели данным и использовать теорию правдоподобия для оценки параметров наилучшего соответствия. модель.
Например, предположим, что население пережило недавний период экспоненциального роста и Последовательности образцов получали из популяции в конце роста и наблюдаемый (данные) частотный спектр аллелей рассчитывали с использованием предположительно нейтральной вариации. Демографическая модель будет иметь параметры экспоненциального роста. , время для которого произошел рост, и ориентировочная численность населения , предполагая, что в момент начала роста численность населения находилась в равновесии. Ожидаемый частотный спектр для данного набора параметров могут быть получены с использованием теории диффузии или коалесценции и сопоставлены с частотным спектром данных. Параметры наилучшего соответствия можно найти с использованием метода максимального правдоподобия.
Этот подход использовался для построения демографических моделей и моделей отбора для многих видов, включая человека. Например, Март и др. (2004) использовали частотные спектры отдельных аллелей популяции для группы африканцев, европейцев и азиатов, чтобы показать, что узкие места в популяциях возникали в демографических историях Азии и Европы, но не у африканцев. [11] Совсем недавно Gutenkunst et al. (2009) использовали общий частотный спектр аллелей для этих же трех популяций, чтобы сделать вывод о времени, когда популяции разошлись, и об объеме последующей продолжающейся миграции между ними (см. Гипотезу из Африки ). [10] Кроме того, эти методы можно использовать для оценки закономерностей отбора на основе данных о частоте аллелей. Например, Бойко и др. (2008) сделали вывод о распределении эффектов приспособленности для вновь возникающих мутаций, используя данные о полиморфизме человека, которые учитывали эффекты неравновесной демографии. [12]
Ссылки
[ редактировать ]- ^ Фишер, Рональд А. (1930). «Распределение соотношений генов для редких мутаций». Труды Королевского общества Эдинбурга . 50 : 205–220.
- ^ Райт, Сьюэлл (1938). «Распределение частот генов при необратимой мутации» . Учеб. Натл. акад. наук. США . 24 (7): 253–259. Бибкод : 1938PNAS...24..253W . дои : 10.1073/pnas.24.7.253 . ПМЦ 1077089 . ПМИД 16577841 .
- ^ Кимура, Мотоо (1964). «Диффузионные модели в популяционной генетике». Дж. Прил. Вероятно . 1 (2): 177–232. дои : 10.2307/3211856 . JSTOR 3211856 . S2CID 86705023 .
- ^ Эванс, Стивен Н.; Швец, Елена; Слаткин, Монтгомери (2007). «Неравновесная теория частотного спектра аллелей». Теоретическая популяционная биология . 71 (1): 109–119. arXiv : q-bio/0604010 . дои : 10.1016/j.tpb.2006.06.005 . ПМИД 16887160 . S2CID 924340 .
- ^ Дженкинс, Пол А.; Мюллер, Йонас В.; Сон, Юн С. (2014). «Общий спектр триаллельных частот в рамках демографических моделей с переменной численностью населения» . Генетика . 196 (1): 295–311. arXiv : 1310.3444 . дои : 10.1534/genetics.113.158584 . ПМЦ 3872192 . ПМИД 24214345 .
- ^ Дарретт, Рик (2008). Вероятностные модели эволюции последовательностей ДНК (PDF) (2-е изд.).
- ^ Уэйкли, Джон (22 апреля 2016 г.). Коалесцентная теория: введение . Издательство Робертс и компания. ISBN 978-0974707754 .
- ^ Кроу, Джеймс Ф.; Кимура, Мотоо (1970). Введение в теорию популяционной генетики ([Перепечатка] под ред.). Нью-Джерси: Блэкберн Пресс. ISBN 9781932846126 .
- ^ Чен, Х.; Зеленый, RE; Паабо, С.; Слаткин, М. (29 июля 2007 г.). «Объединенный аллельно-частотный спектр у близкородственных видов» . Генетика . 177 (1): 387–398. doi : 10.1534/genetics.107.070730 . ПМК 2013700 . ПМИД 17603120 .
- ^ Jump up to: а б Гутенкунст, Райан Н.; Эрнандес, Райан Д.; Уильямсон, Скотт Х.; Бустаманте, Карлос Д. (23 октября 2009 г.). «Вывод об общей демографической истории нескольких популяций на основе многомерных данных о частоте SNP» . ПЛОС Генетика . 5 (10): е1000695. arXiv : 0909.0925 . дои : 10.1371/journal.pgen.1000695 . ПМК 2760211 . ПМИД 19851460 .
- ^ Март, Габор Т.; Чабарка, Ева; Мурваи, Янош; Шерри, Стивен Т. (1 января 2004 г.). «Спектр частот аллелей в данных о полногеномных вариациях человека выявляет сигналы дифференциальной демографической истории в трех крупных популяциях мира» . Генетика . 166 (1): 351–372. дои : 10.1534/генетика.166.1.351 . ПМЦ 1470693 . ПМИД 15020430 .
- ^ Бойко, Адам Р.; Уильямсон, Скотт Х.; Индап, Амит Р.; Дегенхардт, Иеремия Д.; Эрнандес, Райан Д.; Ломюллер, Кирк Э.; Адамс, Марк Д.; Шмидт, Штеффен; Снински, Джон Дж.; Сюняев Шамиль Р.; Уайт, Томас Дж.; Нильсен, Расмус; Кларк, Эндрю Г.; Бустаманте, Карлос Д. (30 мая 2008 г.). «Оценка эволюционного влияния мутаций аминокислот на геном человека» . ПЛОС Генетика . 4 (5): e1000083. дои : 10.1371/journal.pgen.1000083 . ПМЦ 2377339 . ПМИД 18516229 .