Сбивающий с толку

В причинно-следственном выводе сбивает с толку ^[а] Это переменная, которая влияет как на зависимую, так и на независимую переменную , вызывая ложную ассоциацию . Смешение — это причинная концепция, и поэтому ее нельзя описать в терминах корреляций или ассоциаций. ^[1]^[2]^[3] Существование искажающих факторов является важным количественным объяснением того, почему корреляция не подразумевает причинно-следственную связь . Некоторые обозначения специально предназначены для определения существования, возможного существования или отсутствия факторов, искажающих причинно-следственные связи между элементами системы.

Смущение – это угроза внутренней валидности . ^[4]

Простой пример

Предположим, что автотранспортная компания владеет парком грузовых автомобилей двух разных производителей. Грузовики одного производителя называются «Грузовики А», а грузовики другого производителя — «Грузовики Б». Мы хотим выяснить, будут ли грузовики A или B лучше экономить топливо. Мы измеряем расход топлива и пробег за месяц и рассчитываем расход топлива на галлон для каждого грузовика. Затем мы проводим соответствующий анализ, который определяет, что существует статистически значимая тенденция: грузовики A более экономичны, чем грузовики B. Однако, подумав дальше, мы также замечаем, что грузовикам A с большей вероятностью будут назначены маршруты по шоссе, а грузовикам B с большей вероятностью будут назначены городские маршруты. Это сбивающая с толку переменная. Смешивающая переменная делает результаты анализа ненадежными. Вполне вероятно, что мы просто измеряем тот факт, что езда по шоссе приводит к большей экономии топлива, чем езда по городу.

С точки зрения статистики, марка грузовика является независимой переменной, расход топлива (миль на галлон) — зависимой переменной, а количество поездок по городу — вмешивающейся переменной. Чтобы исправить это исследование, у нас есть несколько вариантов. Один из них — рандомизировать назначения грузовиков так, чтобы грузовики A и B имели одинаковое количество поездок по городу и шоссе. Это устраняет мешающую переменную. Другой вариант — количественно оценить количество поездок по городу и использовать его в качестве второй независимой переменной. Третий вариант — сегментировать исследование, сначала сравнив расход топлива на галлон при движении по городу для всех грузовиков, а затем провести отдельное исследование, сравнивая расход топлива на галлон при движении по шоссе.

Определение

Смешение определяется с точки зрения модели генерации данных. Пусть X — некоторая независимая переменная , а Y — некоторая зависимая переменная . Чтобы оценить влияние X на Y , статистик должен исключить влияние посторонних переменных которые влияют как на X , так и на Y. , Мы говорим, что X и Y смешиваются с какой-то другой переменной Z, Z причинно влияет как на X , так и на Y. если

Позволять $P(y\mid {\text{do}}(x))$ быть вероятностью события Y = y при гипотетическом вмешательстве X = x . X и Y не смешиваются тогда и только тогда, когда выполняется следующее:

P(y\mid {\text{do}}(x))=P(y\mid x)

( 1 )

для всех значений X = x и Y = y , где $P(y\mid x)$ — условная вероятность увидеть X = x . Интуитивно это равенство означает, что X и Y не смешиваются, если связь между ними, наблюдаемая наблюдениями, такая же, как связь, которая была бы измерена в контролируемом эксперименте с x рандомизированным .

В принципе, определяющее равенство $P(y\mid {\text{do}}(x))=P(y\mid x)$ можно проверить на основе модели генерации данных, предполагая, что у нас есть все уравнения и вероятности, связанные с моделью. Это делается путем моделирования вмешательства ${\text{do}}(X=x)$ (см. Байесовскую сеть ) и проверяем, равна ли результирующая вероятность Y условной вероятности $P(y\mid x)$ . Однако оказывается, что одной только структуры графа достаточно для проверки равенства $P(y\mid {\text{do}}(x))=P(y\mid x)$ .

Контроль

Рассмотрим исследователя, пытающегося оценить эффективность препарата X на основе данных о популяции, в которых употребление препарата было выбором пациента. Данные показывают, что пол ( Z ) влияет на выбор препарата пациентом, а также на его шансы на выздоровление ( Y ). В этом сценарии пол Z смешивает отношения между X и Y, поскольку Z является причиной как X , так и Y :

Причинно-следственная диаграмма гендера как распространенной причины употребления наркотиков и выздоровления — Causal diagram of Gender as common cause of Drug use and Recovery

У нас есть это

P(y\mid {\text{do}}(x))\neq P(y\mid x)

( 2 )

поскольку наблюдательная величина содержит информацию о корреляции между X и Z , а интервенционная величина — нет (поскольку X не коррелирует с Z в рандомизированном эксперименте). Это можно показать ^[5] что в тех случаях, когда доступны только данные наблюдений, несмещенная оценка желаемой величины $P(y\mid {\text{do}}(x))$ , можетбыть получены путем «поправки» на все мешающие факторы, а именно, обусловления их различных значений и усреднения результата. В случае одного искажающего фактора Z это приводит к «формуле корректировки»:

P(y\mid {\text{do}}(x))=\sum _{z}P(y\mid x,z)P(z)

( 3 )

дает несмещенную оценку причинного влияния X на Y. что Та же самая формула корректировки работает, когда имеется несколько искажающих факторов, за исключением того, что в этом случае выбор набора Z переменных, который гарантировал бы несмещенные оценки, должен осуществляться с осторожностью. Критерий правильного выбора переменных называется Back-Door. ^[5]^[6] и требует, чтобы выбранный набор Z «блокировал» (или перехватывал) каждый путь между X и Y , который содержит стрелку в X. Такие наборы называются «допустимыми черным ходом» и могут включать переменные, которые не являются общими причинами X и Y. , а просто их прокси.

Возвращаясь к примеру с употреблением наркотиков, поскольку Z соответствует требованию «Черного хода» (т. е. он перехватывает один путь «Черного хода»). $X\leftarrow Z\rightarrow Y$ ), формула корректировки Back-Door действительна:

{\begin{aligned}P(Y={\text{recovered}}\mid {\text{do}}(x={\text{give drug}}))={}&P(Y={\text{recovered}}\mid X={\text{give drug}},Z={\text{male}})P(Z={\text{male}})\\&{}+P(Y={\text{recovered}}\mid X={\text{give drug}},Z={\text{female}})P(Z={\text{female}})\end{aligned}}

( 4 )

Таким образом, врач может предсказать вероятный эффект от введения препарата на основе наблюдательных исследований, в которых условные вероятности, стоящие в правой части уравнения, можно оценить с помощью регрессии.

Вопреки распространенному мнению, добавление ковариат в набор корректировок Z может привести к смещению. ^[7] Типичный контрпример возникает, когда Z является общим эффектом X и Y , ^[8] случай, в котором Z не является искажающим фактором (т. е. нулевой набор является допустимым через черный ход), и поправка на Z создаст смещение, известное как « предвзятость коллайдера » или « парадокс Берксона ». Средства контроля, которые не являются хорошими искажающими факторами, иногда называют плохими средствами контроля .

В общем, смешивание можно контролировать путем корректировки тогда и только тогда, когда существует набор наблюдаемых ковариат, который удовлетворяет условию «черного хода». Более того, если Z является таким набором, то корректировочная формула уравнения. (3) справедливо. ^[5]^[6] До-исчисление Перла обеспечивает все возможные условия, при которых $P(y\mid {\text{do}}(x))$ можно оценить, не обязательно путем корректировки. ^[9]

История

По данным Морабиа (2011), ^[10] Слово «смешение» происходит от средневекового латинского глагола «confundere», который означало «смешивание», и, вероятно, было выбрано для обозначения путаницы (от латыни: con = with + fusus = смешивать или сливаться вместе) между причиной, которую человек хочет оценить, и другие причины, которые могут повлиять на результат и, таким образом, запутать или помешать желаемой оценке. Гренландия, Робинс и Перл ^[11] обратите внимание на раннее использование термина «смешивающий» в причинном выводе Джоном Стюартом Миллем в 1843 году.

Фишер ввел слово «сбивающий с толку» в своей книге 1935 года «План экспериментов». ^[12] конкретно относится к последствиям блокировки (т.е. разделения ) набора комбинаций лечения в факторном эксперименте , в результате чего определенные взаимодействия могут быть «спутаны с блоками». Это популяризировало идею смешения статистических данных, хотя Фишера интересовал контроль неоднородности в экспериментальных единицах, а не причинно-следственные выводы.

По словам Ванденбрука (2004) ^[13] это был Киш ^[14] который использовал слово «смешение» в смысле «несравнимости» двух или более групп (например, подвергшихся и необлученных) в обсервационном исследовании. Формальные условия, определяющие, что делает одни группы «сопоставимыми», а другие — «несравнимыми», были позже разработаны в эпидемиологии Гренландом и Робинсом (1986). ^[15] используя контрфактический язык Неймана (1935) ^[16] и Рубин (1974). ^[17] Позже они были дополнены графическими критериями, такими как условие «черной двери» ( Pearl 1993; Greenland, Robins and Pearl 1999). ^[11]^[5]

Было показано, что графические критерии формально эквивалентны контрфактическому определению. ^[18] но более прозрачным для исследователей, полагающихся на модели процессов.

Типы

В случае оценок риска, оценивающих величину и характер риска для человека здоровья , важно контролировать смешивание, чтобы изолировать эффект конкретной опасности, такой как пищевая добавка, пестицид или новый препарат. Для проспективных исследований трудно набирать и проверять добровольцев с одинаковым опытом (возраст, диета, образование, географическое положение и т. д.), а в исторических исследованиях может наблюдаться аналогичная вариабельность. Из-за неспособности контролировать изменчивость добровольцев и исследований на людях, смешивание является особой проблемой. По этим причинам эксперименты предлагают способ избежать большинства форм путаницы.

В некоторых дисциплинах смешение подразделяется на разные типы. В эпидемиологии один тип — «сбивающий с толку по признаку». ^[19] что связано с искажением данных обсервационных исследований . Поскольку прогностические факторы могут влиять на решения о лечении (и систематическую оценку эффектов лечения), контроль известных прогностических факторов может уменьшить эту проблему, но всегда возможно, что забытый или неизвестный фактор не был включен или что факторы взаимодействуют сложно. Смешение по показаниям было описано как наиболее важное ограничение наблюдательных исследований. На рандомизированные исследования не влияет влияние показаний из-за случайного распределения .

Смешивающие переменные также можно классифицировать в зависимости от их источника. Выбор инструмента измерения (операционная путаница), ситуационных характеристик (процедурная путаница) или межиндивидуальных различий (личностная путаница).

Операционное смешивание может произойти как в экспериментальных , так и в неэкспериментальных исследованиях. Этот тип путаницы возникает, когда мера, предназначенная для оценки конкретной конструкции, непреднамеренно измеряет также и что-то еще. ^[20]
Процедурное смешение может произойти в лабораторном эксперименте или квазиэксперименте . Этот тип путаницы возникает, когда исследователь по ошибке допускает изменение другой переменной вместе с независимой переменной, которой манипулируют. ^[20]
происходит Смешение людей , когда две или более группы единиц анализируются вместе (например, работники разных профессий), несмотря на различия по одной или нескольким другим (наблюдаемым или ненаблюдаемым) характеристикам (например, полу). ^[21]

Примеры

Допустим, кто-то изучает связь между порядком рождения (1-й ребенок, 2-й ребенок и т. д.) и наличием синдрома Дауна у ребенка . В этом сценарии возраст матери будет вмешивающейся переменной: ^{[ нужна ссылка ]}

Более высокий возраст матери напрямую связан с синдромом Дауна у ребенка.
Более высокий возраст матери напрямую связан с синдромом Дауна, независимо от порядка рождения (мать, рожающая первого и третьего ребенка в возрасте 50 лет, подвергается такому же риску).
Возраст матери напрямую связан с порядком рождения (второй ребенок, за исключением близнецов, рождается, когда мать старше, чем она была на момент рождения 1-го ребенка)
Возраст матери не является следствием порядка рождения (рождение второго ребенка не меняет возраст матери).

При оценке риска такие факторы, как возраст, пол и уровень образования, часто влияют на состояние здоровья, и поэтому их следует контролировать. Помимо этих факторов, исследователи могут не учитывать или не иметь доступа к данным о других причинных факторах. Примером может служить изучение влияния курения табака на здоровье человека. Курение, употребление алкоголя и диета — это связанные между собой образ жизни. Оценка риска, которая учитывает последствия курения, но не учитывает употребление алкоголя или диету, может переоценить риск курения. ^[22] Курение и путаница рассматриваются при оценке профессиональных рисков, таких как безопасность добычи угля. ^[23] Когда в конкретной профессии нет большой выборки некурящих или непьющих людей, оценка риска может быть смещена в сторону выявления отрицательного воздействия на здоровье.

Уменьшение вероятности путаницы

Снижения вероятности возникновения и влияния мешающих факторов можно добиться за счет увеличения типов и количества сравнений, выполняемых в анализе. Если меры или манипуляции с основными конструкциями смешаны (т.е. существуют операционные или процедурные помехи), анализ подгрупп может не выявить проблем в анализе. Кроме того, увеличение количества сравнений может создать другие проблемы (см. множественные сравнения ).

Экспертная оценка — это процесс, который может помочь уменьшить количество случаев путаницы как до проведения исследования, так и после проведения анализа. Рецензирование опирается на коллективный опыт в рамках дисциплины для выявления потенциальных недостатков в дизайне и анализе исследования, включая способы, которыми результаты могут зависеть от искажающих факторов. Аналогичным образом, репликация может проверить надежность результатов одного исследования в альтернативных условиях исследования или альтернативных анализах (например, с учетом потенциальных искажающих факторов, не выявленных в первоначальном исследовании).

Смешивающие эффекты могут возникать с меньшей вероятностью и действовать одинаково в разных случаях и в разных местах. ^{[ нужна ссылка ]} При выборе участков для исследования можно подробно охарактеризовать окружающую среду на участках исследования, чтобы гарантировать, что участки экологически схожи и, следовательно, с меньшей вероятностью имеют мешающие факторы. Наконец, можно изучить взаимосвязь между переменными окружающей среды, которые могут исказить анализ, и измеряемыми параметрами. Информация, относящаяся к переменным окружающей среды, может затем использоваться в моделях для конкретного участка для выявления остаточной дисперсии, которая может быть связана с реальными последствиями. ^[24]

В зависимости от типа используемого дизайна исследования существуют различные способы его изменения, чтобы активно исключать или контролировать мешающие переменные: ^[25]

В исследованиях «случай-контроль» факторы, искажающие результаты, в равной степени распределяются как по случаям, так и по контролю. Например, если кто-то хочет изучить причину инфаркта миокарда и считает, что возраст является вероятной вмешивающейся переменной, каждому 67-летнему пациенту с инфарктом будет сопоставлен здоровый 67-летний «контрольный» человек. В исследованиях «случай-контроль» совпадающими переменными чаще всего являются возраст и пол. Недостаток: исследования «случай-контроль» осуществимы только тогда, когда легко найти контрольную группу, то есть людей, чей статус по отношению ко всем известным потенциальным искажающим факторам такой же, как и у пациента в данном случае: предположим, что исследование «случай-контроль» пытается найти причина данного заболевания у человека 1) 45 лет, 2) афроамериканца, 3) выходца с Аляски , 4) заядлого футболиста, 5) вегетарианца и 6) работающего в сфере образования. Теоретически идеальным контролем может быть человек, который не только не имеет исследуемого заболевания, но и соответствует всем этим характеристикам и не имеет заболеваний, которых нет и у пациента, — но найти такой контроль было бы огромной задачей.
Когортные исследования : также возможна определенная степень соответствия, и это часто достигается путем включения в исследуемую совокупность только определенных возрастных групп или определенного пола, создавая когорту людей, которые имеют схожие характеристики, и, таким образом, все когорты сопоставимы с точки зрения возможных искажающая переменная. Например, если возраст и пол считаются определяющими факторами, только мужчины в возрасте от 40 до 50 лет будут участвовать в когортном исследовании, которое будет оценивать риск инфаркта миокарда в когортах, которые либо физически активны, либо неактивны. Недостаток: в когортных исследованиях чрезмерное исключение входных данных может привести к тому, что исследователи будут слишком узко определять группу людей, находящихся в аналогичном положении, для которых, по их утверждениям, исследование будет полезным, так что другие люди, к которым действительно применима причинно-следственная связь, могут потерять возможность воспользоваться рекомендациями исследования. Аналогичным образом, «чрезмерная стратификация» входных данных в рамках исследования может уменьшить размер выборки в данной страте до такой степени, что обобщения, сделанные путем наблюдения за членами этой страты сами по себе, не будут статистически значимо .
Двойное слепое исследование : скрывает от участников исследования и наблюдателей членство участников в экспериментальной группе. Не позволяя участникам знать, получают они лечение или нет, эффект плацебо должен быть одинаковым для контрольной и терапевтической групп. Не позволяя наблюдателям знать об их членстве, не должно быть предвзятости со стороны исследователей, относящихся к группам по-разному или по-разному интерпретирующих результаты.
Рандомизированное контролируемое исследование : метод, при котором исследуемая популяция делится случайным образом, чтобы снизить вероятность самостоятельного выбора участников или предвзятости со стороны организаторов исследования. Перед началом эксперимента тестировщики распределят членов пула участников по своим группам (контрольная, интервенционная, параллельная), используя процесс рандомизации, такой как использование генератора случайных чисел. Например, в исследовании влияния физических упражнений выводы были бы менее обоснованными, если бы участникам был предоставлен выбор, хотят ли они принадлежать к контрольной группе, которая не будет заниматься физическими упражнениями, или к группе вмешательства, которая будет готова принять участие в физических упражнениях. программа упражнений. Затем в исследовании будут учитываться и другие переменные, помимо физических упражнений, такие как уровень здоровья перед экспериментом и мотивация к здоровому образу жизни. Со стороны наблюдателя экспериментатор может выбрать кандидатов, которые с большей вероятностью покажут результаты, которые хочет видеть исследование, или может интерпретировать субъективные результаты (более энергичный, позитивный настрой) в соответствии со своими желаниями.
Стратификация . Как и в приведенном выше примере, считается, что физическая активность представляет собой поведение, защищающее от инфаркта миокарда; Предполагается, что возраст является возможным фактором, искажающим результаты. Затем собранные данные стратифицируются по возрастным группам – это означает, что связь между активностью и инфарктом будет анализироваться для каждой возрастной группы. Если разные возрастные группы (или возрастные слои) дают совершенно разные коэффициенты риска , возраст следует рассматривать как вмешивающуюся переменную. Существуют статистические инструменты, в том числе методы Мантеля-Хензеля, которые учитывают стратификацию наборов данных.
Контроль искажающих факторов путем измерения известных искажающих факторов и включения их в качестве ковариат представляет собой многомерный анализ, такой как регрессионный анализ . Многомерный анализ дает гораздо меньше информации о силе или полярности мешающей переменной, чем методы стратификации. Например, если многомерный анализ контролирует антидепрессанты и не стратифицирует антидепрессанты по ТЦА и СИОЗС , то он будет игнорировать тот факт, что эти два класса антидепрессантов оказывают противоположные эффекты на инфаркт миокарда, и один из них намного сильнее другого.

Все эти методы имеют свои недостатки:

Лучшая доступная защита от возможности получения ложных результатов из-за смешивания часто состоит в том, чтобы отказаться от усилий по стратификации и вместо этого провести рандомизированное исследование выборки, достаточно большой взятой в целом, так, чтобы все потенциальные искажающие переменные (известные и неизвестные) были распределены случайно по всем исследовательским группам и, следовательно, не будут коррелировать с бинарной переменной для включения/исключения в любую группу.
Этические соображения. В двойных слепых и рандомизированных контролируемых исследованиях участники не знают, что они получают фиктивное лечение , и им может быть отказано в эффективном лечении. ^[26] Существует вероятность того, что пациенты соглашаются на инвазивную операцию (которая несет в себе реальный медицинский риск) только при условии, что они получают лечение. Хотя это и является этической проблемой, это не является полным описанием ситуации. Для операций, которые в настоящее время проводятся регулярно, но для которых нет конкретных доказательств подлинного эффекта, могут возникнуть этические проблемы, связанные с продолжением таких операций. В таких обстоятельствах многие люди подвергаются реальному риску хирургического вмешательства, однако эти методы лечения могут не принести заметной пользы. Контроль ложной операции — это метод, который может позволить медицинской науке определить, эффективна ли хирургическая процедура или нет. Учитывая, что существуют известные риски, связанные с медицинскими операциями, сомнительно этично допускать проведение непроверенных операций до бесконечности в будущем.

Артефакты

Артефакты — это переменные, которые должны были систематически изменяться как внутри, так и между исследованиями, но случайно остались постоянными. Таким образом, артефакты представляют собой угрозу внешней достоверности . Артефакты – это факторы, которые зависят от лечения и его результата. Кэмпбелл и Стэнли ^[27] идентифицировать несколько артефактов. Основными угрозами внутренней валидности являются история, созревание, тестирование, инструментирование, статистическая регрессия , отбор, экспериментальная смертность и взаимодействие отбора и истории.

Один из способов минимизировать влияние артефактов — использовать структуру контрольной группы до и после тестирования . В рамках этой схемы «группы людей, которые изначально эквивалентны (на этапе предварительного тестирования), случайным образом распределяются для получения экспериментального лечения или контрольного состояния, а затем снова оцениваются после этого дифференциального опыта (фаза после тестирования)». ^[28] Таким образом, любые эффекты артефактов (в идеале) одинаково распределяются среди участников как в условиях лечения, так и в контрольных условиях.

См. также

Неофициальные доказательства - доказательства, основанные на личных показаниях.
Причинный вывод - раздел статистики, занимающийся выводом причинно-следственных связей между переменными.
Эпидемиологический метод - Научный метод в конкретной области.
Парадокс Симпсона - Ошибка в статистических рассуждениях с группами
Смещение пропущенной переменной

Примечания

^ Также известна как вмешивающаяся переменная , вмешивающийся фактор , посторонний детерминант или скрытая переменная .

Ссылки

^ Перл, Дж. (2009). Парадокс Симпсона , путаница и свертываемость в причинности: модели, рассуждения и выводы (2-е изд.). Нью-Йорк: Издательство Кембриджского университета.
^ ВандерВил, Ти Джей; Шпицер, И. (2013). «Об определении конфаундера» . Анналы статистики . 41 (1): 196–220. arXiv : 1304.0564 . дои : 10.1214/12-aos1058 . ПМК 4276366 . ПМИД 25544784 .
^ Гренландия, С.; Робинс, Дж. М.; Перл, Дж. (1999). «Смешение и свертываемость в причинном выводе» . Статистическая наука . 14 (1): 29–46. дои : 10.1214/ss/1009211805 .
^ Шадиш, WR; Кук, Т.Д.; Кэмпбелл, DT (2002). Экспериментальные и квазиэкспериментальные планы обобщенного причинно-следственного вывода . Бостон, Массачусетс: Houghton-Mifflin .
^ Перейти обратно: ^а ^б ^с ^д Перл, Дж. (1993). «Аспекты графических моделей, связанные с причинностью», в материалах 49-й сессии Международного института статистических наук, стр. 391–401.
^ Перейти обратно: ^а ^б Перл, Дж. (2009). Причинные диаграммы и идентификация причинных эффектов в причинности: модели, рассуждения и выводы (2-е изд.). Нью-Йорк, штат Нью-Йорк, США: Издательство Кембриджского университета.
^ Синелли, К.; Форни, А.; Перл, Дж. (март 2022 г.). «Ускоренный курс хорошего и плохого контроля» (PDF) . Лаборатория когнитивных систем Калифорнийского университета в Лос-Анджелесе, технический отчет (R-493) .
^ Ли, PH (2014). «Следует ли нам делать поправку на искажающий фактор, если эмпирические и теоретические критерии дают противоречивые результаты? Моделирование» . Научный представитель . 4 : 6085. Бибкод : 2014NatSR...4E6085L . дои : 10.1038/srep06085 . ПМК 5381407 . ПМИД 25124526 .
^ Шпицер И.; Перл, Дж. (2008). «Полные методы идентификации причинной иерархии». Журнал исследований машинного обучения . 9 : 1941–1979.
^ Морабия, А (2011). «История современной эпидемиологической концепции смешения» (PDF) . Журнал эпидемиологии и общественного здравоохранения . 65 (4): 297–300. дои : 10.1136/jech.2010.112565 . ПМИД 20696848 . S2CID 9068532 .
^ Перейти обратно: ^а ^б Гренландия, С.; Робинс, Дж. М.; Перл, Дж. (1999). «Смешение и свертываемость в причинном выводе» . Статистическая наука . 14 (1): 31. дои : 10.1214/ss/1009211805 .
^ Фишер, РА (1935). План экспериментов (стр. 114–145).
^ Ванденбрук, JP (2004). «История смешения». Соз Правентивмед . 47 (4): 216–224. дои : 10.1007/BF01326402 . ПМИД 12415925 . S2CID 198174446 .
^ Киш, Л. (1959). «Некоторые статистические проблемы в планировании исследований». Я социальный . 26 (3): 328–338. дои : 10.2307/2089381 . JSTOR 2089381 .
^ Гренландия, С.; Робинс, Дж. М. (1986). «Идентифицируемость, возможность обмена и эпидемиологическое смешивание». Международный журнал эпидемиологии . 15 (3): 413–419. CiteSeerX 10.1.1.157.6445 . дои : 10.1093/ije/15.3.413 . ПМИД 3771081 .
^ Нейман, Дж., при сотрудничестве К. Иваскевича и Св. Колодзейчика (1935). Статистические проблемы в сельскохозяйственном экспериментировании (с обсуждением). Приложение J Roy Statist Soc Ser B 2 107-180.
^ Рубин, Д.Б. (1974). «Оценка причинных эффектов лечения в рандомизированных и нерандомизированных исследованиях». Журнал педагогической психологии . 66 (5): 688–701. дои : 10.1037/h0037350 . S2CID 52832751 .
^ Перл, Дж. (2009). Причинность: модели, рассуждения и выводы (2-е изд.). Нью-Йорк, штат Нью-Йорк, США: Издательство Кембриджского университета.
^ Джонстон, Южная Каролина (2001). «Выявление искажений по показаниям посредством слепого проспективного обзора» . Американский журнал эпидемиологии . 154 (3): 276–284. дои : 10.1093/aje/154.3.276 . ПМИД 11479193 .
^ Перейти обратно: ^а ^б Пелхэм, Бретт (2006). Проведение исследований в области психологии . Бельмонт: Уодсворт. ISBN 978-0-534-53294-9 .
^ Стег, Л.; Буунк, АП; Ротенгаттер, Т. (2008). «Глава 4». Прикладная социальная психология: понимание и решение социальных проблем . Кембридж, Великобритания: Издательство Кембриджского университета.
^ Тьённеланд, Энн; Грёнбек, Мортен; Стрип, Конни; Овервад, Ким (январь 1999 г.). «Потребление вина и диета в случайной выборке из 48763 датских мужчин и женщин» . Американский журнал клинического питания . 69 (1): 49–54. дои : 10.1093/ajcn/69.1.49 . ПМИД 9925122 .
^ Аксельсон, О. (1989). «Смешение от курения в профессиональной эпидемиологии» . Британский журнал промышленной медицины . 46 (8): 505–07. дои : 10.1136/oem.46.8.505 . ПМЦ 1009818 . ПМИД 2673334 .
^ Калоу, Питер П. (2009) Справочник по оценке и управлению экологическими рисками , Wiley
^ Мэйрент, Шерри Л. (1987). Эпидемиология в медицине . Липпинкотт Уильямс и Уилкинс . ISBN 978-0-316-35636-7 .
^ Эмануэль, Иезекииль Дж; Миллер, Франклин Дж. (20 сентября 2001 г.). «Этика плацебо-контролируемых исследований — золотая середина». Медицинский журнал Новой Англии . 345 (12): 915–9. дои : 10.1056/nejm200109203451211 . ПМИД 11565527 .
^ Кэмпбелл, DT; Стэнли, Джей Си (1966). Экспериментальные и квазиэкспериментальные планы исследований . Чикаго: Рэнд МакНелли.
^ Крано, штат Вашингтон; Брюэр, МБ (2002). Принципы и методы социальных исследований (2-е изд.). Махва, Нью-Джерси: Lawrence Erlbaum Associates . п. 28.

Дальнейшее чтение

Перл, Дж. (январь 1998 г.). «Почему не существует статистического теста на путаницу, почему многие думают, что он есть, и почему они почти правы» (PDF) . Департамент компьютерных наук Калифорнийского университета в Лос-Анджелесе, Технический отчет R-256 .
Монтгомери, округ Колумбия (2001). «Блокирование и замешательство в $2^{k}$ Факторный дизайн». Планирование и анализ экспериментов (5-е изд.). Wiley. стр. 287–302. В этом учебнике дается обзор мешающих факторов и способов их учета при планировании экспериментов. {{cite book}}: CS1 maint: постскриптум ( ссылка )
Брюэр, МБ (2000). «План исследования и вопросы обоснованности». В Рейсе, ХТ; Джадд, КМ (ред.). Справочник исследований . Нью-Йорк: Издательство Кембриджского университета . стр. 3–16 . ISBN 9780521551281 .
Смит, скорая помощь (2000). «Исследовательский дизайн». В Рейсе, ХТ; Джадд, КМ (ред.). Справочник по методам исследования в социальной психологии и психологии личности . Нью-Йорк: Издательство Кембриджского университета. стр. 17–39 . ISBN 9780521551281 .

Внешние ссылки

[1] Также известна как вмешивающаяся переменная , вмешивающийся фактор , посторонний детерминант или скрытая переменная .

[Pearl_2009-2] Перл, Дж. (2009). Парадокс Симпсона , путаница и свертываемость в причинности: модели, рассуждения и выводы (2-е изд.). Нью-Йорк: Издательство Кембриджского университета.

[3] ВандерВил, Ти Джей; Шпицер, И. (2013). «Об определении конфаундера» . Анналы статистики . 41 (1): 196–220. arXiv : 1304.0564 . дои : 10.1214/12-aos1058 . ПМК 4276366 . ПМИД 25544784 .

[Greenland_Pearl_Robbins_1999-4] Гренландия, С.; Робинс, Дж. М.; Перл, Дж. (1999). «Смешение и свертываемость в причинном выводе» . Статистическая наука . 14 (1): 29–46. дои : 10.1214/ss/1009211805 .

[Shadish2002-5] Шадиш, WR; Кук, Т.Д.; Кэмпбелл, DT (2002). Экспериментальные и квазиэкспериментальные планы обобщенного причинно-следственного вывода . Бостон, Массачусетс: Houghton-Mifflin .

[Pearl_1993-6] Перейти обратно: ^а ^б ^с ^д Перл, Дж. (1993). «Аспекты графических моделей, связанные с причинностью», в материалах 49-й сессии Международного института статистических наук, стр. 391–401.

[pearl09-causal-diagrams-7] Перейти обратно: ^а ^б Перл, Дж. (2009). Причинные диаграммы и идентификация причинных эффектов в причинности: модели, рассуждения и выводы (2-е изд.). Нью-Йорк, штат Нью-Йорк, США: Издательство Кембриджского университета.

[8] Синелли, К.; Форни, А.; Перл, Дж. (март 2022 г.). «Ускоренный курс хорошего и плохого контроля» (PDF) . Лаборатория когнитивных систем Калифорнийского университета в Лос-Анджелесе, технический отчет (R-493) .

[9] Ли, PH (2014). «Следует ли нам делать поправку на искажающий фактор, если эмпирические и теоретические критерии дают противоречивые результаты? Моделирование» . Научный представитель . 4 : 6085. Бибкод : 2014NatSR...4E6085L . дои : 10.1038/srep06085 . ПМК 5381407 . ПМИД 25124526 .

[10] Шпицер И.; Перл, Дж. (2008). «Полные методы идентификации причинной иерархии». Журнал исследований машинного обучения . 9 : 1941–1979.

[11] Морабия, А (2011). «История современной эпидемиологической концепции смешения» (PDF) . Журнал эпидемиологии и общественного здравоохранения . 65 (4): 297–300. дои : 10.1136/jech.2010.112565 . ПМИД 20696848 . S2CID 9068532 .

[Greenland_Robins_Pearl_1999-12] Перейти обратно: ^а ^б Гренландия, С.; Робинс, Дж. М.; Перл, Дж. (1999). «Смешение и свертываемость в причинном выводе» . Статистическая наука . 14 (1): 31. дои : 10.1214/ss/1009211805 .

[13] Фишер, РА (1935). План экспериментов (стр. 114–145).

[14] Ванденбрук, JP (2004). «История смешения». Соз Правентивмед . 47 (4): 216–224. дои : 10.1007/BF01326402 . ПМИД 12415925 . S2CID 198174446 .

[15] Киш, Л. (1959). «Некоторые статистические проблемы в планировании исследований». Я социальный . 26 (3): 328–338. дои : 10.2307/2089381 . JSTOR 2089381 .

[16] Гренландия, С.; Робинс, Дж. М. (1986). «Идентифицируемость, возможность обмена и эпидемиологическое смешивание». Международный журнал эпидемиологии . 15 (3): 413–419. CiteSeerX 10.1.1.157.6445 . дои : 10.1093/ije/15.3.413 . ПМИД 3771081 .

[17] Нейман, Дж., при сотрудничестве К. Иваскевича и Св. Колодзейчика (1935). Статистические проблемы в сельскохозяйственном экспериментировании (с обсуждением). Приложение J Roy Statist Soc Ser B 2 107-180.

[18] Рубин, Д.Б. (1974). «Оценка причинных эффектов лечения в рандомизированных и нерандомизированных исследованиях». Журнал педагогической психологии . 66 (5): 688–701. дои : 10.1037/h0037350 . S2CID 52832751 .

[19] Перл, Дж. (2009). Причинность: модели, рассуждения и выводы (2-е изд.). Нью-Йорк, штат Нью-Йорк, США: Издательство Кембриджского университета.

[20] Джонстон, Южная Каролина (2001). «Выявление искажений по показаниям посредством слепого проспективного обзора» . Американский журнал эпидемиологии . 154 (3): 276–284. дои : 10.1093/aje/154.3.276 . ПМИД 11479193 .

[Pelham-21] Перейти обратно: ^а ^б Пелхэм, Бретт (2006). Проведение исследований в области психологии . Бельмонт: Уодсворт. ISBN 978-0-534-53294-9 .

[22] Стег, Л.; Буунк, АП; Ротенгаттер, Т. (2008). «Глава 4». Прикладная социальная психология: понимание и решение социальных проблем . Кембридж, Великобритания: Издательство Кембриджского университета.

[23] Тьённеланд, Энн; Грёнбек, Мортен; Стрип, Конни; Овервад, Ким (январь 1999 г.). «Потребление вина и диета в случайной выборке из 48763 датских мужчин и женщин» . Американский журнал клинического питания . 69 (1): 49–54. дои : 10.1093/ajcn/69.1.49 . ПМИД 9925122 .

[24] Аксельсон, О. (1989). «Смешение от курения в профессиональной эпидемиологии» . Британский журнал промышленной медицины . 46 (8): 505–07. дои : 10.1136/oem.46.8.505 . ПМЦ 1009818 . ПМИД 2673334 .

[25] Калоу, Питер П. (2009) Справочник по оценке и управлению экологическими рисками , Wiley

[Hennekens1987-26] Мэйрент, Шерри Л. (1987). Эпидемиология в медицине . Липпинкотт Уильямс и Уилкинс . ISBN 978-0-316-35636-7 .

[27] Эмануэль, Иезекииль Дж; Миллер, Франклин Дж. (20 сентября 2001 г.). «Этика плацебо-контролируемых исследований — золотая середина». Медицинский журнал Новой Англии . 345 (12): 915–9. дои : 10.1056/nejm200109203451211 . ПМИД 11565527 .

[C&S2006-28] Кэмпбелл, DT; Стэнли, Джей Си (1966). Экспериментальные и квазиэкспериментальные планы исследований . Чикаго: Рэнд МакНелли.

[C&B2002-29] Крано, штат Вашингтон; Брюэр, МБ (2002). Принципы и методы социальных исследований (2-е изд.). Махва, Нью-Джерси: Lawrence Erlbaum Associates . п. 28.

[а]

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

v т и Планирование экспериментов
Scientific method	Scientific experiment Statistical design Control Internal and external validity Experimental unit Blinding Optimal design: Bayesian Random assignment Randomization Restricted randomization Replication versus subsampling Sample size
Treatment and blocking	Treatment Effect size Contrast Interaction Confounding Orthogonality Blocking Covariate Nuisance variable
Models and inference	Linear regression Ordinary least squares Bayesian Random effect Mixed model Hierarchical model: Bayesian Analysis of variance (Anova) Cochran's theorem Manova (multivariate) Ancova (covariance) Compare means Multiple comparison
Designs Completely randomized	Factorial Fractional factorial Plackett–Burman Taguchi Response surface methodology Polynomial and rational modeling Box–Behnken Central composite Block Generalized randomized block design (GRBD) Latin square Graeco-Latin square Orthogonal array Latin hypercube Repeated measures design Crossover study Randomized controlled trial Sequential analysis Sequential probability ratio test
Glossary Category Mathematics portal Statistical outline Statistical topics