Геномный контроль
Геномный контроль (GC) — это статистический метод, который используется для контроля мешающих эффектов стратификации популяции в исследованиях генетических ассоциаций . Первоначально метод был описан Берни Девлином и Кэтрин Рёдер в статье 1999 года. [ 1 ] Он предполагает использование набора анонимных генетических маркеров для оценки влияния структуры популяции на распределение статистики хи-квадрат . Распределение статистики хи-квадрат для данной аллели , которая предположительно связана с данным признаком , затем можно сравнить с распределением той же статистики для аллели, которая, как ожидается, не будет связана с данным признаком. [ 2 ] [ 3 ] Предполагается, что метод предполагает использование маркеров, не связанных с тестируемым маркером на возможную ассоциацию. [ 4 ] Теоретически он использует тенденцию структуры населения вызывать чрезмерный разброс тестовой статистики при анализе ассоциаций. [ 5 ] Метод геномного контроля так же надежен , как и семейный дизайн, несмотря на то, что он применяется к популяционным данным. [ 6 ] Это потенциально может привести к снижению статистической способности обнаружить истинную связь, а также может не устранить искажающие эффекты стратификации населения. [ 7 ] Более надежную форму метода геномного контроля можно реализовать, выражая изучаемую ассоциацию в виде двух трендовых тестов Кокрана-Армитажа , а затем применяя этот метод к каждому тесту отдельно. [ 8 ]
Предположение об однородности популяции в ассоциативных исследованиях, особенно в исследованиях «случай-контроль», может быть легко нарушено и может привести к ошибкам как типа I, так и типа II . Поэтому важно, чтобы модели, используемые в исследовании, компенсировали структуру населения. Проблема в исследованиях «случай-контроль» заключается в том, что если есть генетическая вовлеченность в заболевание, популяция больных с большей вероятностью будет родственной, чем люди из контрольной популяции. Это означает, что предположение о независимости наблюдений нарушается. Часто это приводит к завышению значимости ассоциации, но это зависит от способа отбора выборки. Если по совпадению в какой-то субпопуляции случаев наблюдается более высокая частота аллелей, вы обнаружите связь с любым признаком, который более распространен в данной популяции случаев. [ 9 ] Этот вид ложной ассоциации увеличивается по мере роста выборки, поэтому эта проблема должна вызывать особое беспокойство в крупномасштабных исследованиях ассоциаций, когда локусы оказывают лишь относительно небольшое влияние на признак. Метод, который в некоторых случаях может компенсировать описанные выше проблемы, был разработан Девлином и Родером (1999). [ 10 ] Он использует как частотный , так и байесовский подход (последний подходит при работе с большим количеством генов-кандидатов ).
Частотный способ поправки на структуру населения основан на использовании маркеров, не связанных с рассматриваемым признаком, для коррекции любого увеличения статистики, вызванного структурой населения. Этот метод был впервые разработан для бинарных признаков, но с тех пор был обобщен для количественных. [ 11 ] Для бинарного метода, который применяется для выявления генетических различий между основной и контрольной популяциями, Девлин и Роедер (1999) используют тест тенденции Армитиджа.
и тест на частоты аллелей
Аллели | аа | Аа | АА | общий |
---|---|---|---|---|
Случай | р 0 | р 1 | год 2 | Р |
Контроль | с 0 | страница 1 | ss2 | С |
общий | п 0 | № 1 | нет 2 | Н |
Если популяция находится в равновесии Харди – Вайнберга, эти две статистики примерно равны. При нулевой гипотезе об отсутствии стратификации населения критерий тенденции является асимптотическим. распределение с одной степенью свободы. Идея состоит в том, что статистика завышена на коэффициент так что где зависит от эффекта стратификации. Вышеописанный метод основан на предположении, что коэффициент инфляции является постоянным, что означает, что локусы должны иметь примерно одинаковую частоту мутаций, не должны подвергаться разному отбору в двух популяциях, а степень неравновесия Харди-Вайнберга, измеренная с помощью коэффициента инбридинга F Райта , не должна различаться между разными локусами. Последнее из них вызывает наибольшую озабоченность. Если эффект стратификации одинаков в разных локусах можно оценить по несвязанным маркерам
где L — количество несвязанных маркеров. Знаменатель получается из гамма-распределения как надежной оценки . Были предложены и другие оценки, например, Райха и Гольдштейна. [ 12 ] предложил вместо этого использовать среднее значение статистики. Это не единственный способ оценить но согласно Bacanu et al. [ 13 ] это подходящая оценка, даже если некоторые из несвязанных маркеров фактически находятся в неравновесии с локусом, вызывающим заболевание, или сами связаны с заболеванием. При нулевой гипотезе и с поправкой на стратификацию с использованием L несвязанных генов примерно распределено. При такой поправке общая частота ошибок I рода должна быть примерно равна даже если население расслоено. Девлин и Редер (1999) [ 10 ] в основном рассматривалась ситуация, когда дает уровень достоверности 95% и не меньшие значения p. Марчини и др. (2004) [ 14 ] с помощью моделирования демонстрирует, что геномный контроль может привести к антиконсервативному значению p, если это значение очень мало и две популяции (случай и контроль) чрезвычайно различны. Это было особенно проблемой, если количество несвязанных маркеров было порядка 50–100. Это может привести к ложным срабатываниям (на этом уровне значимости).
Ссылки
[ редактировать ]- ^ Девлин, Берни ; Редер, Кэтрин (1999). «Геномный контроль для ассоциативных исследований». Биометрия . 55 (4): 997–1004. CiteSeerX 10.1.1.420.1751 . дои : 10.1111/j.0006-341X.1999.00997.x . ISSN 1541-0420 . ПМИД 11315092 . S2CID 6297807 .
- ^ Доннелли, Питер ; Филлипс, Майкл С.; Кардон, Лон Р.; Марчини, Джонатан (май 2004 г.). «Влияние структуры человеческой популяции на крупные исследования генетических ассоциаций» . Природная генетика . 36 (5): 512–517. дои : 10.1038/ng1337 . ISSN 1546-1718 . ПМИД 15052271 .
- ^ Альтшулер, Давид ; Хиршхорн, Джоэл Н .; Хендерсон, Брайан; Склар, Памела ; Ландер, Эрик С .; Колонель, Лоуренс Н.; Петришен, Трейси Л.; Пато, Мишель Т.; Пато, Карлос Н. (апрель 2004 г.). «Оценка влияния стратификации населения на исследования генетических ассоциаций» . Природная генетика . 36 (4): 388–393. дои : 10.1038/ng1333 . ISSN 1546-1718 . ПМИД 15052270 .
- ^ Кравчак, Майкл; Демпфл, Астрид; Либ, Вольфганг; Фрайтаг-Вольф, Сандра; Ядав, Панкадж (01 октября 2015 г.). «Учет стратификации населения в единичных исследованиях взаимодействия генов и окружающей среды с использованием геномного контроля». Генетика человека . 134 (10): 1117–1125. дои : 10.1007/s00439-015-1593-y . ISSN 1432-1203 . ПМИД 26297539 . S2CID 18146948 .
- ^ Девлин, Берни; Редер, Кэтрин; Вассерман, Ларри (1 ноября 2001 г.). «Геномный контроль: новый подход к исследованиям генетических ассоциаций» . Теоретическая популяционная биология . 60 (3): 155–166. дои : 10.1006/tpbi.2001.1542 . ISSN 0040-5809 . ПМИД 11855950 . S2CID 11547174 .
- ^ Редер, Кэтрин; Девлин, Б.; Бакану, Сильвиу-Алин (01 июня 2000 г.). «Сила геномного контроля» . Американский журнал генетики человека . 66 (6): 1933–1944. дои : 10.1086/302929 . ISSN 1537-6605 . ПМЦ 1378064 . ПМИД 10801388 .
- ^ Гринберг, Дэвид А.; Чжан, Цзюньин; Шмулевич, Двора (2004). «Исследования ассоциаций случаев-контроля в смешанных популяциях: коррекция с использованием геномного контроля». Наследственность человека . 58 (3–4): 145–153. дои : 10.1159/000083541 . ISSN 1423-0062 . ПМИД 15812171 . S2CID 24635575 .
- ^ Гаствирт, Джозеф Л.; Фрейдлин, Борис; Чжэн, Банда (1 февраля 2006 г.). «Надежный геномный контроль для исследований ассоциаций» . Американский журнал генетики человека . 78 (2): 350–356. дои : 10.1086/500054 . ISSN 1537-6605 . ПМК 1380242 . ПМИД 16400614 .
- ^ Ландер Э.С., Шорк, штат Нью-Джерси (сентябрь 1994 г.). «Генетический анализ сложных признаков». Наука . 265 (5181): 2037–48. Бибкод : 1994Sci...265.2037L . дои : 10.1126/science.8091226 . ПМИД 8091226 .
- ^ Перейти обратно: а б Девлин Б., Редер К. (декабрь 1999 г.). «Геномный контроль для изучения ассоциаций». Биометрия . 55 (4): 997–1004. дои : 10.1111/j.0006-341X.1999.00997.x . ПМИД 11315092 . S2CID 6297807 .
- ^ Бакану С.А., Девлин Б., Редер К. (январь 2002 г.). «Исследования ассоциаций количественных признаков в структурированных популяциях» . Генетическая эпидемиология . 22 (1): 78–93. дои : 10.1002/gepi.1045 . ПМИД 11754475 . S2CID 3053350 .
- ^ Райх Д.Э., Гольдштейн Д.Б. (январь 2001 г.). «Обнаружение связи в исследовании случай-контроль с поправкой на расслоение населения». Генетическая эпидемиология . 20 (1): 4–16. doi : 10.1002/1098-2272(200101)20:1<4::AID-GEPI2>3.0.CO;2-T . ПМИД 11119293 . S2CID 17480622 .
- ^ Бакану С.А., Девлин Б., Редер К. (июнь 2000 г.). «Сила геномного контроля» . Американский журнал генетики человека . 66 (6): 1933–44. дои : 10.1086/302929 . ПМЦ 1378064 . ПМИД 10801388 .
- ^ Марчини Дж., Кардон Л.Р., Филлипс М.С., Доннелли П. (май 2004 г.). «Влияние структуры человеческой популяции на крупные исследования генетических ассоциаций» . Природная генетика . 36 (5): 512–7. дои : 10.1038/ng1337 . ПМИД 15052271 . S2CID 11694537 .