Индекс фиксации
Индекс фиксации ( FST , ) является мерой дифференциации популяции обусловленной генетической структурой . Его часто оценивают на основе данных о генетическом полиморфизме , например, однонуклеотидных полиморфизмах (SNP) или микросателлитах . Разработанная как частный случай Райта F-статистики , она является одной из наиболее часто используемых статистических данных в популяционной генетике . Его значения варьируются от 0 до 1, при этом 0,15 соответствует существенной дифференциации, а 1 — полной дифференциации.
Интерпретация [ править ]
Такое сравнение генетической изменчивости внутри и между популяциями часто используется в прикладной популяционной генетике . Значения варьируются от 0 до 1. Нулевое значение подразумевает полную панмиксию ; то есть две популяции свободно скрещиваются. Значение единицы означает, что все генетические вариации объясняются структурой популяции и что эти две популяции не имеют общего генетического разнообразия.
Для идеализированных моделей, таких как модель конечных островов Райта , FST можно использовать для оценки темпов миграции. Согласно этой модели, уровень миграции составляет
- ,
где m — скорость миграции на поколение, а — частота мутаций на поколение. [1]
Интерпретация F ST может быть затруднена, если анализируемые данные сильно полиморфны. В этом случае вероятность идентичности по происхождению очень низка, и F ST может иметь сколь угодно низкую верхнюю границу, что может привести к неправильной интерпретации данных. Кроме того, строго говоря, FST не является расстоянием в математическом смысле, поскольку не удовлетворяет неравенству треугольника .
Для популяций растений , явно принадлежащих к одному и тому же виду , значения F ST более 15% считаются «большой» или «значительной» дифференциацией, а значения ниже 5% считаются «малой» или «незначительной» дифференциацией. [2] Значения для млекопитающих популяций между подвидами или близкородственными видами, типичные значения составляют порядка 5–20%. F ST между евразийской и североамериканской популяциями серого волка Сообщается, что составляет 9,9%, а между популяциями красного волка и серого волка - от 17% до 18%. Восточный волк , недавно признанный сильно смешанный «волкоподобный вид», имеет значения F ST ниже 10% по сравнению как с евразийскими (7,6%), так и с североамериканскими серыми волками (5,7%), а также с красным волком (8,5%). и еще более низкое значение в сочетании с Coyote (4,5%). [3]
Определение [ править ]
Два наиболее часто используемых определения F ST в данном локусе основаны на 1) вариативности частот аллелей среди популяций и 2) вероятности идентичности по происхождению .
Если - средняя частота аллеля в общей популяции, - это дисперсия частоты аллеля среди разных субпопуляций, взвешенная по размерам субпопуляций, и — дисперсия аллельного состояния в общей популяции, F ST определяется как [4]
Определение Райта показывает, что F ST измеряет величину генетической изменчивости, которую можно объяснить структурой популяции. Это также можно рассматривать как долю общего разнообразия, которая не является следствием среднего разнообразия внутри субпопуляций, где разнообразие измеряется вероятностью того, что два случайно выбранных аллеля различны, а именно . Если частота аллеля в население и относительный размер население , затем
Альтернативно, [5]
где - это вероятность идентичности двух особей по происхождению, учитывая, что эти две особи принадлежат к одной и той же субпопуляции, и — вероятность того, что два человека из общей популяции идентичны по происхождению. Используя это определение, F ST можно интерпретировать как измерение того, насколько ближе два человека из одной и той же субпопуляции по сравнению с общей популяцией. Если частота мутаций невелика, эту интерпретацию можно сделать более явной, связав вероятность идентичности по происхождению со временем слияния : Пусть T 0 и T обозначают среднее время слияния для особей из одной и той же субпопуляции и всей популяции соответственно. Затем,
Эта формулировка имеет то преимущество, что ожидаемое время слияния можно легко оценить на основе генетических данных, что привело к разработке различных оценок F ST .
Оценка [ править ]
На практике ни одну из величин, используемых в определениях, невозможно легко измерить. В результате были предложены различные оценки. Особенно простая оценка, применимая к данным о последовательностях ДНК: [6]
где и представляют собой среднее количество парных различий между двумя людьми, выбранными из разных подгрупп ( ) или из той же подгруппы населения ( ). Среднюю попарную разницу внутри популяции можно рассчитать как сумму попарных разностей, деленную на количество пар. Однако эта оценка является смещенной, когда размеры выборки невелики или если они различаются в зависимости от совокупности. используются более сложные методы для расчета F ST Поэтому на практике . Двумя наиболее широко используемыми процедурами являются оценщик Weir & Cockerham (1984): [7] или проведение анализа молекулярной дисперсии . Список реализаций доступен в конце этой статьи.
F ST у людей [ править ]
Значения F ST сильно зависят от выбора популяций. Близкородственные этнические группы, такие как датчане против голландцев или португальцы против испанцев, демонстрируют значения значительно ниже 1%, что неотличимо от панмиксии. Было обнаружено, что в Европе наиболее расходящиеся этнические группы имеют значения порядка 7% ( саамы против сардинцев ).
Более высокие значения обнаруживаются, если сравнивать сильно расходящиеся однородные группы: самое высокое такое найденное значение было около 46% между мбути и папуасами . [8]
Генетическая дистанция 0,125 означает, что родство между неродственными особями одного и того же происхождения по отношению к населению мира эквивалентно родству между сводными братьями и сестрами в случайно спаривающейся популяции. Это также означает, что если у человека из данной предковой популяции есть смешанный сводный брат, этот человек генетически ближе к неродственному индивидууму из его предковой популяции, чем к своему смешанному сводному брату или сестре. [9]
основе классических Аутосомные генетические дистанции на маркеров
В своем исследовании «История и география человеческих генов» (1994) Кавалли-Сфорца, Меноцци и Пьяцца представили некоторые из наиболее подробных и полных оценок генетических расстояний между человеческими популяциями внутри и между континентами. Их первоначальная база данных содержит 76 676 частот генов (с использованием 120 полиморфизмов крови), что соответствует 6 633 образцам в разных местах. Отбирая и объединяя такие образцы, они ограничивают свой анализ 491 популяцией.
Они сосредоточены на аборигенном населении , которое находилось на своем нынешнем месте в конце 15 века, когда начались великие европейские миграции. [10] При изучении генетических различий на мировом уровне их численность сокращается до 42 репрезентативных популяций, агрегирующих субпопуляции, характеризующиеся высоким уровнем генетического сходства. Для этих 42 популяций Кавалли-Сфорца и соавторы сообщают о двусторонних расстояниях, рассчитанных на основе 120 аллелей. Среди этого набора из 42 популяций мира наибольшая наблюдаемая генетическая дистанция наблюдается между пигмеями мбути и жителями Папуа-Новой Гвинеи, где расстояние Fst составляет 0,4573, а наименьшее генетическое расстояние (0,0021) - между датчанами и англичанами.
При рассмотрении более дезагрегированных данных по 26 европейским популяциям наименьшее генетическое расстояние (0,0009) наблюдается между голландцами и датчанами, а самое большое (0,0667) — между саамами и сардинцами. Среднее генетическое расстояние среди 861 доступной пары из 42 выбранных популяций составило 0,1338. [ нужна страница ] .
В следующей таблице показаны Fst, рассчитанные Кавалли-Сфорца (1994) для некоторых популяций:
Помощь | Неосахарский | Западная Африка | Козел | японский | корейский | тайский | Филиппинский | Южный китайский | датский | Английский | Меланезийский | новогвинейский | австралийский | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Помощь | 0.00 | |||||||||||||
Неосахарский | 0.01 | 0.00 | ||||||||||||
Западная Африка | 0.02 | 0.02 | 0.00 | |||||||||||
Козел | 0.07 | 0.08 | 0.08 | 0.00 | ||||||||||
японский | 0.24 | 0.25 | 0.23 | 0.31 | 0.00 | |||||||||
корейский | 0.27 | 0.24 | 0.18 | 0.30 | 0.01 | 0.00 | ||||||||
тайский | 0.34 | 0.30 | 0.25 | 0.39 | 0.07 | 0.06 | 0.00 | |||||||
Филиппинский | 0.29 | 0.30 | 0.23 | 0.38 | 0.10 | 0.12 | 0.06 | 0.00 | ||||||
Южный китайский | 0.30 | 0.29 | 0.20 | 0.34 | 0.05 | 0.05 | 0.01 | 0.03 | 0.00 | |||||
датский | 0.17 | 0.17 | 0.15 | 0.15 | 0.12 | 0.09 | 0.13 | 0.13 | 0.13 | 0.00 | ||||
Английский | 0.23 | 0.18 | 0.15 | 0.24 | 0.12 | 0.10 | 0.11 | 0.11 | 0.12 | 0.00 | 0.00 | |||
Меланезийский | 0.34 | 0.31 | 0.27 | 0.40 | 0.11 | 0.11 | 0.08 | 0.05 | 0.06 | 0.14 | 0.16 | 0.00 | ||
новогвинейский | 0.34 | 0.33 | 0.28 | 0.46 | 0.12 | 0.14 | 0.18 | 0.13 | 0.15 | 0.16 | 0.16 | 0.07 | 0.00 | |
австралийский | 0.33 | 0.36 | 0.27 | 0.43 | 0.06 | 0.07 | 0.13 | 0.13 | 0.11 | 0.14 | 0.15 | 0.11 | 0.10 | 0.00 |
основе Аутосомные генетические дистанции на SNP
Исследование 2012 года, основанное на данных Международного проекта HapMap, оценило F ST между тремя основными «континентальными» популяциями европейцев (объединяющих жителей штата Юта северо- и западноевропейского происхождения из коллекции CEPH и итальянцев из Тосканы), выходцев из Восточной Азии (объединяющих ханьцев из Пекина, китайцев из столичного Денвера и японцев из Токио, Япония). ) и Африканцы к югу от Сахары (объединяющие Лухью из Вебуе, Кения, масаи из Киньявы, Кения, и йоруба из Ибадана, Нигерия). Он сообщил о значении, близком к 12% между континентальными популяциями, и значениях, близких к панмиксии (менее 1%) внутри континентальных популяций. [11]
Европа (ЦЕУ) | Африка к югу от Сахары (йоруба) | Восточная Азия (яп.) | |
---|---|---|---|
Африка к югу от Сахары (йоруба) | 0.153 | ||
Восточная Азия (яп.) | 0.111 | 0.190 | |
Восточная Азия (китайский) | 0.110 | 0.192 | 0.007 |
итальянцы | палестинцы | Шведский | Доступный | испанский | немцы | русские | Французский | греки | |
---|---|---|---|---|---|---|---|---|---|
палестинцы | 0.0064 | ||||||||
Шведский | 0.0064-0.0090 | 0.0191 | |||||||
Доступный | 0.0130-0.0230 | 0.0050-0.0110 | |||||||
испанский | 0.0010-0.0050 | 0.0101 | 0.0040-0055 | 0.0110-0.0170 | |||||
немцы | 0.0029-0.0080 | 0.0136 | 0.0007-0.0010 | 0.0060-0.0130 | 0.0015-0.0030 | ||||
русские | 0.0088-0.0120 | 0.0202 | 0.0030-0.0036 | 0.0060-0.0120 | 0.0070-0.0079 | 0.0030-0.0037 | |||
Французский | 0.0030-0.0050 | 0.0020 | 0.0080-0.0150 | 0.0010 | 0.0010 | 0.0050 | |||
греки | 0.0000 | 0.0057 | 0.0084 | 0.0035 | 0.0039 | 0.0108 |
Программы для расчета F ST [ править ]
- Арлекин
- Фстат
- СМОГД [14]
- ДИВАЙРСИТИ (пакет R)
- hierfstat (пакет R)
- FinePop [15] (пакет R)
- Микросателлитный анализатор (MSA). Архивировано 29 марта 2015 г. в Wayback Machine.
- Инструменты VCF
- ДНКСП
- Популяция2
Модули для расчета F ST [ править ]
Ссылки [ править ]
- ^ Питер Бирли, Оценка темпов миграции и численности населения в географически структурированных популяциях (1998), Достижения в молекулярной экологии (под ред. Г. Карвальо). Серия НАТО Science A: Науки о жизни, IOS Press, Амстердам, 39–53.
- ^ Франкхэм, Р., Баллоу, Дж. Д., Бриско, Д. А., 2002. Введение в природоохранную генетику. Издательство Кембриджского университета, Кембридж.Хартл Д.Л., Кларк А.Г. (1997) Принципы популяционной генетики, 3-е изд. Sinauer Associates, Inc, Сандерленд, Массачусетс.
- ^ Б. М. фон Холдт и др., «Анализ последовательности всего генома показывает, что два эндемичных вида североамериканского волка представляют собой смесь койота и серого волка», Science Advances, 27 июля 2016: Vol. 2, нет. 7, е1501714, два : 10.1126/sciadv.1501714 .
- ^ Холсингер, Кент Э.; Брюс С. Вейр (2009). «Генетика в географически структурированных популяциях: определение, оценка и интерпретация FST» . Нат преподобный Жене . 10 (9): 639–650. дои : 10.1038/nrg2611 . ISSN 1471-0056 . ПМЦ 4687486 . ПМИД 19687804 .
- ^ Ричард Дарретт (12 августа 2008 г.). Вероятностные модели эволюции последовательностей ДНК . Спрингер. ISBN 978-0-387-78168-6 . Проверено 25 октября 2012 г.
- ^ Хадсон, РР.; Слаткин, М.; Мэддисон, В.П. (октябрь 1992 г.). «Оценка уровней потока генов на основе данных последовательностей ДНК» . Генетика . 132 (2): 583–9. дои : 10.1093/генетика/132.2.583 . ПМК 1205159 . ПМИД 1427045 .
- ^ Вейр, Б.С.; Кокерхэм, К. Кларк (1984). «Оценка F-статистики для анализа структуры населения». Эволюция . 38 (6): 1358–1370. дои : 10.2307/2408641 . ISSN 0014-3820 . JSTOR 2408641 . ПМИД 28563791 .
- ^ Кавалли-Сфорца и др. (1994), цитируется поВ. Гинзбург, С. Вебер, Справочник Пэлгрейва по экономике и языку , Springer (2016), с. 182 .
- ^ Харпендинг, Генри (2002). «Родство и деление населения». Население и окружающая среда . 24 (2): 141–147. дои : 10.1023/А:1020815420693 . S2CID 15208802 .
- ^ Кавалли-Сфорца и др., 1994, с. 24
- ^ Эльхайк, Эран (2012). «Эмпирическое распределение FST на основе крупномасштабных данных о полиморфизме человека» . ПЛОС ОДИН . 7 (11): e49837. Бибкод : 2012PLoSO...749837E . дои : 10.1371/journal.pone.0049837 . ПМК 3504095 . ПМИД 23185452 .
- ^ Jump up to: Перейти обратно: а б Нелис, Мари; и др. (08 мая 2009 г.). Флейшер, Роберт К. (ред.). «Генетическая структура европейцев: взгляд с северо-востока» . ПЛОС ОДИН . 4 (5): е5472. Бибкод : 2009PLoSO...4.5472N . дои : 10.1371/journal.pone.0005472 . ПМК 2675054 . ПМИД 19424496 . , см. таблицу
- ^ Тянь, Чао; и др. (ноябрь 2009 г.). «Генетическая подструктура европейского населения: дальнейшее определение информативных маркеров происхождения для различения разнообразных европейских этнических групп» . Молекулярная медицина . 15 (11–12): 371–383. дои : 10.2119/molmed.2009.00094 . ISSN 1076-1551 . ПМЦ 2730349 . ПМИД 19707526 . , см. таблицу
- ^ Кроуфорд, Николас Г. (2010). « смогд : программное обеспечение для измерения генетического разнообразия». Ресурсы молекулярной экологии . 10 (3): 556–557. дои : 10.1111/j.1755-0998.2009.02801.x . ПМИД 21565057 . S2CID 205970662 .
- ^ Китада С., Китакадо Т., Кишино Х. (2007). «Эмпирический байесовский вывод парного F (ST) и его распределение в геноме» . Генетика . 177 (2): 861–73. doi : 10.1534/genetics.107.077263 . ПМК 2034649 . ПМИД 17660541 .
Дальнейшее чтение [ править ]
- Эволюция и генетика популяций, том 2: Теория частот генов, стр. 294–295, С. Райт, Univ. Чикаго Пресс, Чикаго, 1969 г.
- Карта гаплотипов генома человека, Международный консорциум HapMap, Nature 2005.