Менделевская рандомизация
В эпидемиологии (обычно сокращенно MR) — это метод , менделевская рандомизация использующий измеренные изменения в генах для изучения причинного влияния воздействия на результат. При соблюдении ключевых предположений (см. ниже) такая схема уменьшает как обратную причинно-следственную связь, так и мешающие факторы, которые часто существенно затрудняют или вводят в заблуждение интерпретацию результатов эпидемиологических исследований. [1]

Дизайн исследования был впервые предложен в 1986 году. [2] и впоследствии описанный Греем и Уитли [3] как метод получения объективных оценок эффектов предполагаемой причинной переменной без проведения традиционного рандомизированного контролируемого исследования (стандарт в эпидемиологии для установления причинно-следственной связи). Эти авторы также ввели термин «менделевская рандомизация» .
Мотивация
[ редактировать ]Одной из основных целей эпидемиологии является выявление поддающихся изменению причин последствий для здоровья и заболеваний, особенно тех, которые представляют угрозу общественному здравоохранению . Чтобы выяснить, принесет ли изменение определенного признака (например, посредством вмешательства, лечения или изменения политики) положительный эффект в популяции, необходимы убедительные доказательства того, что этот признак вызывает интересующий результат. Однако многие планы наблюдательных эпидемиологических исследований ограничены в способности отличить корреляцию от причинно-следственной связи, в частности, является ли определенная черта причиной интересующего результата, просто связана с этим результатом (но не является его причиной) или является следствием самого результата. . Только первое будет полезно в условиях общественного здравоохранения, где цель состоит в том, чтобы изменить эту особенность, чтобы уменьшить бремя болезней. Существует множество планов эпидемиологических исследований, целью которых является понимание взаимосвязей между характеристиками внутри выборки населения, каждое из которых имеет общие и уникальные преимущества и ограничения с точки зрения предоставления причинно-следственных данных, при этом «золотым стандартом» является рандомизированные контролируемые исследования . [4]
Хорошо известные успешные демонстрации причинно-следственных связей, согласованных в многочисленных исследованиях с разными дизайнами, включают выявленные причинные связи между курением и раком легких, а также между артериальным давлением и инсультом. Однако были также заметные неудачи, когда воздействия, предположительно являвшиеся причинным фактором риска для конкретного исхода, позже в хорошо проведенных рандомизированных контролируемых исследованиях показали, что они не являются причинными. Например, ранее считалось, что заместительная гормональная терапия предотвратит сердечно-сосудистые заболевания , но теперь известно, что она не имеет такой пользы. [5] Еще одним ярким примером является селен и рак простаты. Некоторые обсервационные исследования обнаружили связь между более высокими уровнями циркулирующего селена (обычно получаемого с помощью различных продуктов питания и пищевых добавок) и более низким риском рака простаты. Тем не менее, исследование по профилактике рака с селеном и витамином Е (SELECT) продемонстрировало доказательства того, что пищевые добавки селена на самом деле увеличивают риск развития рака простаты и рака простаты, а также оказывают дополнительный нецелевой эффект на повышение риска диабета 2 типа. [6] Менделевские методы рандомизации теперь подтверждают точку зрения, что высокий статус селена не может предотвратить рак в общей популяции и может даже увеличить риск определенных типов. [7] Такие несоответствия между наблюдательными эпидемиологическими исследованиями и рандомизированными контролируемыми исследованиями, вероятно, являются функцией социальных, поведенческих или физиологических факторов, искажающих результаты во многих наблюдательных эпидемиологических проектах, которые особенно трудно точно измерить и контролировать. Более того, рандомизированные контролируемые исследования (РКИ) обычно являются дорогостоящими, трудоемкими и трудоемкими, и многие эпидемиологические результаты не могут быть воспроизведены с этической точки зрения в клинических испытаниях. Менделевские рандомизационные исследования, по-видимому, способны решать вопросы потенциального смешивания более эффективно, чем РКИ. [8]
Определение
[ редактировать ]Менделевская рандомизация (MR) — это, по сути, метод оценки инструментальных переменных, происходящий из эконометрики . В этом методе используются свойства генетических вариаций зародышевой линии (обычно в форме однонуклеотидных полиморфизмов или SNP), тесно связанных с предполагаемым воздействием, в качестве «прокси» или «инструмента» для этого воздействия для проверки и оценки причинного эффекта воздействия. на результат, представляющий интерес из данных наблюдений. Используемая генетическая вариация будет иметь либо хорошо изученные эффекты на характер воздействия (например, склонность к сильному курению), либо эффекты, имитирующие эффекты, вызываемые модифицируемым воздействием (например, повышение уровня холестерина в крови). [2] ). Важно отметить, что генотип должен влиять на статус заболевания только косвенно через его влияние на интересующую экспозицию. [9]

Поскольку генотипы назначаются случайным образом при передаче от родителей к потомству во время мейоза , тогда группы людей, определяемые генетическими вариациями, связанными с воздействием на популяционном уровне, должны быть в значительной степени не связаны со мешающими факторами, которые обычно мешают наблюдательным эпидемиологическим исследованиям. Генетические вариации зародышевой линии (то есть те, которые могут передаваться по наследству) также временно фиксируются при зачатии и не изменяются при возникновении какого-либо исхода или заболевания, что исключает обратную причинно-следственную связь . Кроме того, учитывая усовершенствования современных технологий генотипирования, ошибки измерения и систематическая неправильная классификация генетических данных часто невелики. В этом отношении менделевскую рандомизацию можно рассматривать как аналог «природного рандомизированного контролируемого исследования».
Менделевская рандомизация требует трех основных допущений об инструментальных переменных. [10] А именно это:
- Генетический вариант(ы), используемый в качестве инструмента воздействия, связан с воздействием. Это известно как предположение «релевантности».
- Не существует общих причин (то есть мешающих факторов ) генетического варианта(ов) и интересующего исхода. Это известно как предположение о «независимости» или «обменимости».
- Не существует независимого пути между генетическим вариантом(ами) и исходом, кроме воздействия. Это известно как предположение об «ограничении исключения» или «отсутствии горизонтальной плейотропии».
Чтобы гарантировать подтверждение первого основного предположения, менделевская рандомизация требует четких связей между генетическими вариациями и представляющими интерес факторами воздействия. Их обычно получают в результате полногеномных исследований ассоциаций , хотя они также могут быть исследованиями генов-кандидатов. Второе предположение основано на отсутствии субструктуры популяции (например, географических факторов, которые вызывают связь между генотипом и результатом), выборе партнера , который не связан с генотипом (т. е. случайное спаривание или панмиксия ), и отсутствии династических эффектов (т. е. когда проявление родительский генотип в родительском фенотипе напрямую влияет на фенотип потомства). [ нужна ссылка ]
Статистический анализ
[ редактировать ]Менделевская рандомизация обычно применяется посредством использования оценки инструментальных переменных , при этом генетические варианты действуют как инструменты для выявления интересующих факторов. [11] Это может быть реализовано с использованием данных о генетических вариантах, воздействии и представляющем интерес исходе для группы лиц в одном наборе данных или с использованием сводных данных о связи между генетическими вариантами и воздействием, а также связи между генетическими вариантами и исходом в отдельные наборы данных. Этот метод также использовался в экономических исследованиях, изучающих влияние ожирения на доходы и другие результаты на рынке труда. [12]
Когда используется один набор данных, применяются методы оценки, которые часто используются в других местах при оценке инструментальных переменных, например, двухэтапный метод наименьших квадратов. [13] Если с воздействием связано несколько генетических вариантов, их можно использовать либо индивидуально в качестве инструментов, либо объединить для создания оценки аллелей, которая используется как единый инструмент. [ нужна ссылка ]
Анализ с использованием сводных данных часто использует данные полногеномных исследований ассоциаций. В этом случае связь между генетическими вариантами и воздействием берется из сводных результатов, полученных в ходе полногеномного исследования ассоциации воздействия. Связь между одними и теми же генетическими вариантами и исходом затем берется из сводных результатов, полученных в ходе полногеномного исследования ассоциации исхода. Эти два набора сводных результатов затем используются для получения оценки MR. Учитывая следующие обозначения:
- эффект генетического варианта на экспозиции ;
- предполагаемый эффект генетического варианта о результате
- предполагаемая стандартная ошибка этого оцененного эффекта;
- МР-оценка причинного эффекта воздействия о результате
и учитывая влияние одного генетического варианта, оценку MR можно получить из коэффициента Вальда:
При использовании нескольких генетических вариантов отдельные соотношения для каждого генетического варианта объединяются с использованием взвешивания обратной дисперсии, где каждое отдельное соотношение взвешивается с учетом неопределенности в их оценке. [14] Это дает оценку IVW, которую можно рассчитать как:
Альтернативно, ту же оценку можно получить с помощью линейной регрессии, в которой в качестве результата использовалась связь генетического варианта с результатом, а в качестве воздействия — связь генетического варианта с воздействием. Эта линейная регрессия взвешена с учетом неопределенности в связи с генетическим вариантом результата и не включает константу.
Эти методы обеспечивают только надежные оценки причинного воздействия воздействия на результат при допущениях основных инструментальных переменных. Доступны альтернативные методы, устойчивые к нарушению третьего предположения, т.е. обеспечивающие надежные результаты при некоторых типах горизонтальной плейотропии. [15] Кроме того, некоторые предубеждения, возникающие из-за нарушений второго предположения IV, такие как династические эффекты, можно преодолеть за счет использования данных, включающих братьев и сестер или родителей и их потомков. [16]
История
[ редактировать ]Менделевский метод рандомизации основан на двух принципах, заимствованных из оригинальной работы Грегора Менделя о генетическом наследовании. В основу его легли законы Менделя, а именно: 1) закон сегрегации, при котором происходит полное разделение двух аллеломорфов в равном количестве зародышевых клеток гетерозиготы и 2) отдельные пары аллеломорфов сегрегируются независимо друг от друга и которые были впервые опубликованы. как таковой в 1906 году Роберт Хит Локк . Еще одним прародителем менделевской рандомизации является Сьюэлл Райт, который ввел анализ путей — форму причинно-следственной диаграммы, используемую для создания причинно-следственных выводов на основе неэкспериментальных данных. Этот метод опирается на причинные якоря, а якоря в большинстве его примеров были предоставлены менделевским наследованием , что и лежит в основе MR. [17] Еще одним компонентом логики МР является инструментальный ген, понятие о котором ввел Томас Хант Морган . [18] Это важно, поскольку устраняет необходимость понимать физиологию гена для того, чтобы сделать вывод о генетических процессах. [ нужна ссылка ]
С тех пор в литературе появляются примеры исследований с использованием молекулярной генетики для вывода о модифицируемых факторах риска, что и составляет суть МР. Одним из примеров является работа Джерри Лоуэра и его коллег в 1979 году, которые использовали фенотип N-ацетилтрансферазы в качестве основы для вывода о различных воздействиях, включая курение и аминные красители, как факторах риска рака мочевого пузыря. [19] Другим примером является работа Мартейна Катана (тогда работавшего в Вагенингенском университете и исследовательских центрах , Нидерланды ), в которой он пропагандировал дизайн исследования с использованием аллели аполипопротеина Е в качестве инструментального якоря переменной для изучения наблюдаемой взаимосвязи между низким уровнем холестерина в крови и повышенным риском развития рака. [2] Фактически, термин «менделевская рандомизация» впервые был использован в печати Ричардом Греем и Китом Уитли (оба из больницы Рэдклифф , Оксфорд, Великобритания ) в 1991 году в несколько ином контексте; в методе, позволяющем оценивать инструментальные переменные, но по отношению к подходу, основанному на менделевском наследовании, а не на генотипе. [3] В своей статье 2003 года Шах Эбрагим и Джордж Дэйви Смит снова используют этот термин для описания метода использования генетических вариантов зародышевой линии для понимания причинно-следственной связи в инструментальном анализе переменных, и именно эта методология сейчас широко используется и ей приписывается значение. . [20] Менделевский метод рандомизации в настоящее время широко применяется в причинной эпидемиологии, а количество исследований МР, о которых сообщается в научной литературе, растет каждый год после публикации статьи 2003 года. В 2021 году были опубликованы рекомендации STROBE-MR, призванные помочь читателям и рецензентам менделевских рандомизированных исследований оценить достоверность и полезность опубликованных исследований. [21]
Ссылки
[ редактировать ]- ^ Хейкок ПК, Берджесс С., Уэйд К.Х., Боуден Дж., Релтон С., Дэйви Смит Дж. (апрель 2016 г.). «Лучшие (но часто забываемые) практики: разработка, анализ и интерпретация менделевских рандомизированных исследований» . Американский журнал клинического питания . 103 (4): 965–978. дои : 10.3945/ajcn.115.118216 . ПМК 4807699 . ПМИД 26961927 .
- ^ Перейти обратно: а б с Катан М.Б. (март 1986 г.). «Изоформы аполипопротеина Е, сывороточный холестерин и рак». Ланцет . 1 (8479): 507–508. дои : 10.1016/s0140-6736(86)92972-7 . ПМИД 2869248 . S2CID 38327985 .
- ^ Перейти обратно: а б Грей Р., Уитли К. (1991). «Как избежать предвзятости при сравнении трансплантации костного мозга с химиотерапией» . Трансплантация костного мозга . 7 (Приложение 3): 9–12. ПМИД 1855097 .
- ^ Мурад, М. Хасан; Аси, Нур; Альсавас, Муаз; Алахдаб, Фарес (1 августа 2016 г.). «Новая пирамида доказательств» . BMJ Доказательная медицина . 21 (4): 125–127. doi : 10.1136/ebmed-2016-110401 . ISSN 2515-446X . ПМЦ 4975798 . ПМИД 27339128 .
- ^ «Польза и риски ЗГТ | Информация для общественности | Менопауза: диагностика и лечение | Руководство | NICE» . www.nice.org.uk. 12 ноября 2015 г.
- ^ Кляйн Э.А., Томпсон И.М., Танген К.М., Кроули Дж.Дж., Люсия М.С., Гудман П.Дж. и др. (октябрь 2011 г.). «Витамин Е и риск рака простаты: исследование по профилактике рака с использованием селена и витамина Е (SELECT)» . ДЖАМА . 306 (14): 1549–1556. дои : 10.1001/jama.2011.1437 . ПМК 4169010 . ПМИД 21990298 .
- ^ [Юань, Шуай, Эми М. Мейсон, Пол Картер, Мэтью Витаятил, Сиддхартха Кар, Стивен Берджесс и Сюзанна К. Ларссон. «Селен и риск рака: широкоугольный менделевский рандомизационный анализ». Международный журнал рака 150, вып. 7 (2022): 1134-1140]
- ^ «Исследователи находят способ имитировать клинические испытания с помощью генетики» . Обзор технологий Массачусетского технологического института .
- ^ Холмс М.В., Ала-Корпела М., Смит Г.Д. (октябрь 2017 г.). «Менделевская рандомизация при кардиометаболических заболеваниях: проблемы оценки причинно-следственной связи» . Обзоры природы. Кардиология . 14 (10): 577–590. дои : 10.1038/nrcardio.2017.78 . ПМК 5600813 . ПМИД 28569269 .
- ^ Уэйд К. (2021). «Словарь МР» . Словарь МР .
- ^ Диделес В., Шихан Н. (август 2007 г.). «Менделевская рандомизация как подход к причинному выводу с использованием инструментальной переменной». Статистические методы в медицинских исследованиях . 16 (4): 309–330. дои : 10.1177/0962280206077743 . ПМИД 17715159 . S2CID 6236517 .
- ^ Бёккерман П., Коули Дж., Виникайнен Дж., Лехтимяки Т., Ровио С., Сеппяля И. и др. (январь 2019 г.). «Влияние веса на результаты рынка труда: применение генетических инструментальных переменных» . Экономика здравоохранения . 28 (1): 65–77. дои : 10.1002/гек.3828 . ПМК 6585973 . ПМИД 30240095 .
- ^ Вулдридж Дж. М. (2010). Эконометрический анализ перекрестных и панельных данных (2-е изд.). Кембридж, Массачусетс: MIT Press. ISBN 978-0-262-23258-6 . OCLC 627701062 – через worldcat.org.
- ^ Берджесс С., Баттерворт А., Томпсон С.Г. (ноябрь 2013 г.). «Менделевский рандомизационный анализ с множественными генетическими вариантами с использованием обобщенных данных» . Генетическая эпидемиология . 37 (7): 658–665. дои : 10.1002/gepi.21758 . ПМК 4377079 . ПМИД 24114802 .
- ^ Хемани Дж., Боуден Дж., Дэйви Смит Дж. (август 2018 г.). «Оценка потенциальной роли плейотропии в менделевских рандомизированных исследованиях» . Молекулярная генетика человека . 27 (Р2): Р195–Р208. дои : 10.1093/hmg/ddy163 . ПМК 6061876 . ПМИД 29771313 .
- ^ Брамптон Б., Сандерсон Э., Хейлброн К., Хартвиг Ф.П., Харрисон С., Ви Го и др. (июль 2020 г.). «Избежание династических, ассортативных спариваний и предубеждений стратификации населения при менделевской рандомизации посредством внутрисемейного анализа» . Природные коммуникации . 11 (1): 3519. Бибкод : 2020NatCo..11.3519B . дои : 10.1038/s41467-020-17117-4 . ПМЦ 7360778 . PMID 32665587 .
- ^ Райт С. (1921). «Корреляция и причинно-следственная связь». J. Сельскохозяйственные исследования . 20 : 557–585.
- ^ Морган Т.Х. (1917). «Теория гена» . Американский натуралист . 51 (609): 513–544. дои : 10.1086/279629 . ISSN 0003-0147 . JSTOR 2456204 . S2CID 84050307 .
- ^ Нижний гроссмейстер, Нильссон Т., Нельсон С.Э., Вольф Х., Гамский Т.Э., Брайан Г.Т. (апрель 1979 г.). «Фенотип N-ацетилтрансферазы и риск рака мочевого пузыря: подходы в молекулярной эпидемиологии. Предварительные результаты в Швеции и Дании» . Перспективы гигиены окружающей среды . 29 : 71–79. дои : 10.1289/ehp.792971 . ПМЦ 1637362 . ПМИД 510245 .
- ^ Смит Г.Д., Ибрагим С. (февраль 2003 г.). « Менделевская рандомизация: может ли генетическая эпидемиология способствовать пониманию экологических детерминант болезней?». Международный журнал эпидемиологии . 32 (1): 1–22. дои : 10.1093/ije/dyg070 . ПМИД 12689998 .
- ^ Скриванкова В.В., Ричмонд Р.К., Вульф Б.А., Дэвис Н.М., Суонсон С.А., ВандерВил Т.Дж. и др. (октябрь 2021 г.). «Укрепление отчетности об наблюдательных исследованиях в эпидемиологии с использованием менделевской рандомизации (STROBE-MR): объяснение и разработка» . БМЖ . 375 : n2233. дои : 10.1136/bmj.n2233 . ПМЦ 8546498 . ПМИД 34702754 .
Дальнейшее чтение
[ редактировать ]- Дэйви Смит Дж., Ибрагим С., Льюис С., Ханселл А.Л., Палмер Л.Дж., Бертон П.Р. (2005). «Генетическая эпидемиология и общественное здравоохранение: надежда, шумиха и перспективы на будущее». Ланцет . 366 (9495): 1484–1498. дои : 10.1016/S0140-6736(05)67601-5 . ПМИД 16243094 . S2CID 38483453 .
- Дэйви Смит Дж., Ибрагим С. (май 2005 г.). «Что может менделевская рандомизация рассказать нам о поддающихся изменению поведенческих воздействиях и воздействиях окружающей среды?» . Британский медицинский журнал . 330 (7499): 1076–1079. дои : 10.1136/bmj.330.7499.1076 . ПМК 557238 . ПМИД 15879400 .
- Майер Р.М., Вишер П.М., Робинсон М.Р., Рэй Н.Р. (май 2018 г.). «Принятие полигенности: обзор методов и инструментов исследований в области психиатрической генетики» . Психологическая медицина . 48 (7): 1055–1067. дои : 10.1017/S0033291717002318 . ПМК 6088780 . ПМИД 28847336 .
- Сандерсон, Элеонора (10 февраля 2022 г.). «Менделевская рандомизация» . Учебники по методам Nature Reviews . 2 . дои : 10.1038/s43586-021-00092-5 . ПМЦ 7614635 .