F -статистика
В популяционной генетике F - статистика (также известная как индексы фиксации ) описывает статистически ожидаемый уровень гетерозиготности в популяции; более конкретно, ожидаемая степень (обычно) снижения гетерозиготности по сравнению с ожиданием Харди-Вайнберга .
F -статистику также можно рассматривать как меру корреляции между генами, взятыми на разных уровнях (иерархически) разделенной популяции. На эту корреляцию влияют несколько эволюционных процессов, таких как генетический дрейф , эффект основателя , узкое место , генетический автостоп , мейотический драйв , мутация , поток генов , инбридинг , естественный отбор или эффект Валунда , но изначально она была разработана для измерения количества аллельная фиксация вследствие генетического дрейфа .
Концепция F -статистики была разработана в 1920-е годы американским генетиком Сьюэллом Райтом , [ 1 ] [ 2 ] который интересовался инбридингом крупного рогатого скота . Однако, поскольку полное доминирование приводит к тому, что фенотипы и доминантных гомозигот гетерозигот становятся одинаковыми, только с появлением молекулярной генетики с 1960-х годов гетерозиготность в популяциях можно было измерить.
F можно использовать для определения эффективной численности населения . [ нужны дальнейшие объяснения ]
Определения и уравнения
[ редактировать ]Меры FIS , FST и . FIT связаны с уровнем гетерозиготности на различных уровнях структуры популяции Вместе они называются F -статистикой и являются производными от F , коэффициента инбридинга . В простой двухаллельной системе с инбридингом генотипические частоты составляют:
Значение для находится путем решения уравнения для с использованием гетерозигот в указанной выше инбредной популяции. Это становится единицей минус наблюдаемая частота гетерозигот в популяции, деленная на ожидаемую частоту гетерозигот при равновесии Харди-Вайнберга :
где ожидаемая частота в равновесии Харди – Вайнберга определяется выражением
где и являются аллелей частотами и , соответственно. Это также вероятность того, что в любом локусе две аллели от случайного индивидуума из популяции идентичны по происхождению .
Например, рассмотрим данные Э. Б. Форда (1971) об одной популяции алой тигровой бабочки :
Генотип | Белопятнистый ( ) | Средний ( ) | Немного пятен( ) | Общий |
---|---|---|---|---|
Число | 1469 | 138 | 5 | 1612 |
Исходя из этого, можно рассчитать частоты аллелей и определить ожидание полученный :
Различные F-статистики рассматривают разные уровни структуры населения. F IT — коэффициент инбридинга особи ( I ) по отношению к общей ( T ) популяции, как указано выше; F IS — коэффициент инбридинга особи ( I ) по отношению к субпопуляции ( S ), используя приведенные выше значения для субпопуляций и усредняя их; и F ST представляет собой влияние субпопуляций ( S ) по сравнению с общей численностью населения ( T ) и рассчитывается путем решения уравнения:
как показано в следующем разделе.
Разделение по структуре населения
[ редактировать ]Рассмотрим популяцию, имеющую структуру двухуровневую ; один от индивидуума (I) к субпопуляции (S) и один от субпопуляции к общей численности (T). Тогда общая сумма , известный здесь как , можно разделить на и :
Его можно дополнительно разделить на подструктуру населения, и он расширяется в соответствии с правилами биномиального расширения , так что для I- разделов:
Индекс фиксации
[ редактировать ]Переформулировка определения будет отношением среднего числа различий между парами хромосом, отобранных у диплоидных особей, со средним числом, полученным при случайном отборе хромосом из популяции (исключая группировку на одну особь). Можно изменить это определение и рассмотреть группировку по подгруппам населения, а не по отдельным лицам. Популяционные генетики использовали эту идею для измерения степени структурированности популяции.
К сожалению, существует большое количество определений понятия , вызывая некоторую путаницу в научной литературе. Распространенным определением является следующее:
где дисперсия рассчитывается по подгруппам населения и – ожидаемая частота гетерозигот.
Индекс фиксации в человеческих популяциях
[ редактировать ]Хорошо известно, что генетическое разнообразие среди человеческих популяций невелико. [ 3 ] хотя распределение генетического разнообразия оценивалось лишь приблизительно. Ранние исследования утверждали, что 85–90% генетических вариаций обнаруживается у людей, проживающих в одних и тех же популяциях внутри континентов (внутриконтинентальные популяции), и только дополнительные 10–15% обнаруживаются между популяциями разных континентов (континентальные популяции). [ 4 ] [ 5 ] [ 6 ] [ 7 ] [ 8 ] Более поздние исследования, основанные на сотнях тысяч однонуклеотидных полиморфизмов (SNP), показали, что генетическое разнообразие между континентальными популяциями еще меньше и составляет от 3 до 7%. [ 9 ] [ 10 ] [ 11 ] [ 12 ] [ 13 ] [ 14 ] Более позднее исследование, основанное на трех миллионах SNP, показало, что 12% генетических вариаций обнаруживается между континентальными популяциями и только 1% внутри них. [ 15 ] В большинстве этих исследований использовалась F ST. статистика [ 16 ] или тесно связанная статистика. [ 17 ] [ 18 ]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Райт, С. (1950). «Генетическая структура популяций». Природа . 166 (4215): 247–9. Бибкод : 1950Natur.166..247W . дои : 10.1038/166247a0 . ПМИД 15439261 . S2CID 36311175 .
- ^ Кулиг, К (1985). «Использование экранов экстренной токсикологии». Американский журнал неотложной медицины . 3 (6): 573–4. дои : 10.1016/0735-6757(85)90177-9 . LCCN 67025533 . ПМИД 4063030 .
- ^ Холсингер, Кент Э.; Вейр, Брюс С. (2009). «Генетика в географически структурированных популяциях: определение, оценка и интерпретация FST» . Обзоры природы Генетика . 10 (9): 639–50. дои : 10.1038/nrg2611 . ПМЦ 4687486 . ПМИД 19687804 .
- ^ Левонтин (1972). «Распределение человеческого разнообразия». Эволюционная биология . Том. 6. С. 381–98. дои : 10.1007/978-1-4684-9063-3_14 . ISBN 978-1-4684-9065-7 .
- ^ Боукок, Энн М.; Кидд, Джудит Р.; Маунтин, Джоанна Л.; Герберт, Джоан М.; Каротенуто, Лучано; Кидд, Кеннет К.; Кавалли-Сфорца, Лука (1991). «Дрейф, примесь и отбор в эволюции человека: исследование полиморфизма ДНК» . Труды Национальной академии наук . 88 (3): 839–43. Бибкод : 1991PNAS...88..839B . дои : 10.1073/pnas.88.3.839 . JSTOR 2356081 . ПМК 50909 . ПМИД 1992475 .
- ^ Барбуджани, Гвидо; Маганьи, Арианна; Минч, Эрик; Кавалли-Сфорца, Л. Лука (1997). «Распределение разнообразия ДНК человека» . Труды Национальной академии наук Соединенных Штатов Америки . 94 (9): 4516–9. Бибкод : 1997PNAS...94.4516B . дои : 10.1073/pnas.94.9.4516 . JSTOR 42042 . ПМК 20754 . ПМИД 9114021 .
- ^ Джорде, LB; Уоткинс, У.С.; Бамшад, MJ; Диксон, Мэн; Рикер, CE; Зейлстад, Монтана; Батцер, Массачусетс (2000). «Распределение генетического разнообразия человека: сравнение данных митохондриальной, аутосомной и Y-хромосомы» . Американский журнал генетики человека . 66 (3): 979–88. дои : 10.1086/302825 . ПМК 1288178 . ПМИД 10712212 .
- ^ Джорд, Линн Б; Вудинг, Стивен П. (2004). «Генетическая изменчивость, классификация и «раса» » . Природная генетика . 36 (11с): С28-33. дои : 10.1038/ng1435 . ПМИД 15508000 .
- ^ Махасиримонгкол, Суракамет; Чантратита, Васун; Промсо, Сомьинг; Пасомсаб, Экават; и др. (2006). «Сходство частоты аллелей и характер неравновесия по сцеплению однонуклеотидных полиморфизмов в локусах генов, связанных с наркотиками, между популяциями Таиланда и северной Восточной Азии: значение для маркировки выбора SNP у тайцев» . Журнал генетики человека . 51 (10): 896–904. дои : 10.1007/s10038-006-0041-1 . ПМИД 16957813 .
- ^ Ханнелиус, Ульф; Салмела, Элина; Лаппалайнен, Туули; Гийо, Жиль; Линдгрен, Сесилия М; Фон Дёбельн, Ульрика; Лаэрмо, Пяйви; Кере, Юха (2008). «Субструктура населения в Финляндии и Швеции выявляется с помощью пространственных координат и небольшого количества несвязанных аутосомных SNP» . БМК Генетика . 9:54 . дои : 10.1186/1471-2156-9-54 . ПМК 2527025 . ПМИД 18713460 .
- ^ Лао, Оскар; Лу, Тимоти Т.; Нотнагель, Майкл; Юнге, Олаф; и др. (2008). «Корреляция между генетической и географической структурой в Европе» . Современная биология . 18 (16): 1241–8. дои : 10.1016/j.cub.2008.07.049 . ПМИД 18691889 .
- ^ Бисвас, Шамик; Шейнфельдт, Лаура Б.; Эйки, Джошуа М. (2009). «Полногеномное понимание закономерностей и детерминант мелкомасштабной структуры популяции человека» . Американский журнал генетики человека . 84 (5): 641–650. дои : 10.1016/j.ajhg.2009.04.015 . ПМК 2681007 . ПМИД 19442770 .
- ^ Нелис, Мари; Эско, Тыну; Мяги, Ридик; Зимприх, Фриц; и др. (2009). Флейшер, Роберт С. (ред.). «Генетическая структура европейцев: взгляд с северо-востока» . ПЛОС ОДИН . 4 (5): е5472. Бибкод : 2009PLoSO...4.5472N . дои : 10.1371/journal.pone.0005472 . ПМК 2675054 . ПМИД 19424496 .
- ^ Райх, Дэвид; Тангарадж, Кумарасами; Паттерсон, Ник; Прайс, Алкес Л.; и др. (2009). «Реконструкция истории населения Индии» . Природа . 461 (7263): 489–94. Бибкод : 2009Natur.461..489R . дои : 10.1038/nature08365 . ПМЦ 2842210 . ПМИД 19779445 .
- ^ Эльхайк, Э (2012). «Эмпирическое распределение FST на основе крупномасштабных данных о полиморфизме человека» . ПЛОС ОДИН . 7 (11): e49837. Бибкод : 2012PLoSO...749837E . дои : 10.1371/journal.pone.0049837 . ПМК 3504095 . ПМИД 23185452 .
- ^ Райт, Сьюэлл (1965). «Интерпретация структуры населения с помощью F-статистики с особым учетом систем спаривания». Эволюция . 19 (3): 395–420. дои : 10.2307/2406450 . JSTOR 2406450 .
- ^ Шалев, Б.А.; Дворин А.; Герман, Р.; Кац, З.; Борнштейн, С. (1991). «Многолетнее гусиное разведение на яйценоскость и набитую массу печени». Британская наука о птицеводстве . 32 (4): 703–9. дои : 10.1080/00071669108417396 . ПМИД 1933444 .
- ^ Экскофье, Л; Смус, ЧП; Кваттро, Дж. М. (1992). «Анализ молекулярной дисперсии, выведенной на основе метрических расстояний между гаплотипами ДНК: применение к данным об ограничении митохондриальной ДНК человека» . Генетика . 131 (2): 479–91. дои : 10.1093/генетика/131.2.479 . ПМК 1205020 . ПМИД 1644282 .
Внешние ссылки
[ редактировать ]- Простое руководство Шейна по F-статистике
- Анализ генетической структуры популяций
- Эффект Валунда, F-статистика Райта. Архивировано 27 мая 2005 г. в Wayback Machine.
- Проработанный пример расчета F-статистики по генотипическим данным
- F-статистика на основе IAM
- F-статистика для эко-инструмента популяционной генетики
- Структура населения (слайды)