Причинная модель Рубина
Причинная модель Рубина ( RCM ), также известная как причинная модель Неймана-Рубина , [1] — это подход к статистическому анализу причин и следствий, основанный на системе потенциальных результатов , названный в честь Дональда Рубина . Название «каузальная модель Рубина» впервые было предложено Полом Холландом . [2] Модель потенциальных результатов была впервые предложена Ежи Нейманом в его магистерской диссертации 1923 года. [3] хотя он обсуждал это только в контексте полностью рандомизированных экспериментов. [4] Рубин расширил ее до общей основы для размышлений о причинно-следственной связи как в наблюдательных, так и в экспериментальных исследованиях. [1]
Введение
[ редактировать ]Причинно-следственная модель Рубина основана на идее потенциальных результатов. Например, у человека был бы определенный доход в возрасте 40 лет, если бы он учился в колледже, тогда как у него был бы другой доход в возрасте 40 лет, если бы он не учился в колледже. Чтобы измерить причинный эффект поступления в колледж для этого человека, нам нужно сравнить результат для одного и того же человека в обоих альтернативных вариантах будущего. Поскольку невозможно увидеть оба потенциальных результата одновременно, один из потенциальных результатов всегда отсутствует. Эта дилемма является «фундаментальной проблемой причинного вывода ». [2]
Из-за фундаментальной проблемы причинного вывода причинные эффекты на уровне единицы не могут наблюдаться напрямую. Однако рандомизированные эксперименты позволяют оценить причинные эффекты на уровне популяции. [5] Рандомизированный эксперимент случайным образом распределяет людей по группам лечения: в колледже или без колледжа. Из-за этого случайного распределения группы (в среднем) эквивалентны, и разницу в доходах в возрасте 40 лет можно отнести на счет распределения в колледже, поскольку это была единственная разница между группами. Оценку среднего причинного эффекта (также называемого средним эффектом лечения или ATE) можно затем получить путем вычисления разницы в средних значениях между обработанными (посещающими колледж) и контрольными (не посещающими колледж) выборками.
Однако во многих случаях рандомизированные эксперименты невозможны из-за этических или практических соображений. В таких сценариях существует механизм неслучайного назначения. Это относится к примеру с посещением колледжа: люди не распределяются в колледж случайным образом. Скорее, люди могут выбрать поступление в колледж в зависимости от своего финансового положения, образования родителей и так далее. Для причинно-следственных выводов было разработано множество статистических методов, таких как сопоставление показателей склонности . Эти методы пытаются исправить механизм назначения, находя контрольные единицы, аналогичные лечебным единицам.
Расширенный пример
[ редактировать ]Рубин определяет причинно-следственную связь:
Интуитивно понятно, что причинный эффект одного лечения, E, по сравнению с другим, C, для конкретной единицы и интервала времени от к разница между тем, что могло бы произойти в данный момент если бы устройство подверглось воздействию E, инициированному в и что бы произошло в если бы устройство подверглось воздействию C, инициированному в : «Если бы час назад я принял две таблетки аспирина вместо стакана воды, моя головная боль исчезла бы» или «Поскольку час назад я принял две таблетки аспирина вместо стакана воды, моя головная боль исчезла». .' Наше определение причинного эффекта лечения E по сравнению с C будет отражать это интуитивное значение». [5]
Согласно RCM, причинный эффект от приема или не приема вами аспирина час назад — это разница между тем, как бы ощущала себя ваша голова в случае 1 (прием аспирина) и случае 2 (не прием аспирина). Если ваша головная боль останется без аспирина, но исчезнет, если вы примете аспирин, то причинным эффектом приема аспирина является облегчение головной боли. В большинстве случаев нас интересует сравнение двух вариантов будущего: одно обычно называют «лечением», а другое — «контролем». Эти ярлыки несколько условны.
Потенциальные результаты
[ редактировать ]Предположим, что Джо участвует в испытаниях FDA нового лекарства от гипертонии. Всезнающий наблюдатель знал бы результаты лечения Джо как при лечении (новым препаратом), так и при контроле (либо отсутствие лечения, либо текущее стандартное лечение). Причинный эффект или эффект лечения – это разница между этими двумя потенциальными результатами.
предмет | |||
---|---|---|---|
Джо | 130 | 135 | −5 |
Джо, будет ли кровяное давление если он примет новую таблетку. В общем, это обозначение выражает потенциальный результат, который является результатом лечения t на единице u . Сходным образом, – это эффект другого лечения c или контроля на единицу u . В этом случае, кровяное давление Джо, если он не примет таблетку. является причинным следствием приема нового препарата.
Из этой таблицы мы знаем только причинное влияние на Джо. У всех остальных участников исследования может повыситься кровяное давление, если они примут таблетку. Однако независимо от того, каков был причинный эффект для других субъектов, причинным эффектом для Джо является более низкое кровяное давление по сравнению с тем, каким было бы его кровяное давление, если бы он не принимал таблетку.
Рассмотрим большую выборку пациентов:
предмет | |||
---|---|---|---|
Джо | 130 | 135 | −5 |
Мэри | 140 | 150 | −10 |
Салли | 135 | 125 | 10 |
Боб | 135 | 150 | −15 |
Причинный эффект различен для каждого субъекта, но препарат действует на Джо, Мэри и Боба, поскольку причинный эффект отрицательный. При приеме препарата их кровяное давление ниже, чем было бы, если бы каждый из них не принимал препарат. С другой стороны, у Салли препарат вызывает повышение кровяного давления.
Чтобы потенциальный результат имел смысл, он должен быть возможен, по крайней мере априори . Например, если у Джо ни при каких обстоятельствах нет возможности получить новый препарат, то для него невозможно. Этого никогда не произойдет. И если никогда не может наблюдаться, даже теоретически, тогда причинное влияние лечения на кровяное давление Джо не определено.
Нет причинно-следственной связи без манипуляций
[ редактировать ]Причинный эффект нового препарата четко определен, поскольку он представляет собой простую разницу двух потенциальных результатов, оба из которых могут произойти. В этом случае мы (или что-то еще) можем манипулировать миром, по крайней мере концептуально, так что возможно то или иное событие.
Такое определение причинных последствий становится гораздо более проблематичным, если ни один из потенциальных результатов никогда не сможет произойти. Например, каково причинное влияние роста Джо на его вес? Наивно это кажется похожим на другие наши примеры. Нам просто нужно сравнить два потенциальных результата: каким будет вес Джо во время лечения (где лечение определяется как рост на 3 дюйма) и каким будет вес Джо под контролем (где контроль определяется как его текущий рост).
Недолгое размышление выявляет проблему: мы не можем увеличить рост Джо. Невозможно, даже концептуально, наблюдать, каким был бы вес Джо, если бы он был выше, потому что нет способа сделать его выше. Мы не можем манипулировать ростом Джо, поэтому нет смысла исследовать причинное влияние роста на вес. Отсюда и лозунг: «Нет причинно-следственной связи без манипуляций» .
Допущение о стабильной стоимости единицы лечения (SUTVA)
[ редактировать ]Мы требуем, чтобы «на наблюдение [потенциального результата] в одном отделении не влияло конкретное назначение лечения другим подразделениям» (Cox 1958, §2.4). Это называется предположением о стабильной стоимости единицы лечения (SUTVA), которое выходит за рамки концепции независимости.
В контексте нашего примера кровяное давление Джо не должно зависеть от того, принимает ли Мэри препарат. Но что, если это так? Предположим, что Джо и Мэри живут в одном доме и Мэри всегда готовит. Препарат вызывает у Мэри тягу к соленой пище, поэтому, если она примет препарат, она будет готовить с большим количеством соли, чем в противном случае. Диета с высоким содержанием соли повышает кровяное давление Джо. Поэтому его результат будет зависеть как от того, какое лечение он получил, так и от того, какое лечение получает Мэри.
Нарушение SUTVA затрудняет причинно-следственную связь. Мы можем объяснить зависимые наблюдения, рассматривая дополнительные методы лечения. Мы создаем 4 варианта лечения, принимая во внимание, получает ли Мэри лечение.
предмет | Джо = с, Мэри = т | Джо = т, Мэри = т | Джо = с, Мэри = с | Джо = т, Мэри = с |
---|---|---|---|---|
Джо | 140 | 130 | 125 | 120 |
Напомним, что причинный эффект определяется как разница между двумя потенциальными результатами. В этом случае существует несколько причинных последствий, поскольку существует более двух потенциальных результатов. Одним из них является причинное воздействие препарата на Джо, когда Мэри получает лечение, и рассчитывается: . Другой — это причинное воздействие на Джо, когда Мэри не получает лечения, и рассчитано . Третий — причинное влияние лечения Мэри на Джо, когда Джо не лечат. Это рассчитывается как . Лечение, которое получает Мэри, имеет больший причинный эффект на Джо, чем лечение, которое Джо получил, на Джо, и оно направлено в противоположном направлении.
Рассматривая таким образом больше потенциальных результатов, мы можем обеспечить сохранение SUTVA. Однако если какие-либо подразделения, кроме Джо, зависят от Мэри, то мы должны рассмотреть дальнейшие потенциальные результаты. Чем больше число зависимых единиц, тем больше потенциальных результатов мы должны учитывать и тем сложнее становятся расчеты (представим себе эксперимент с 20 разными людьми, статус лечения каждого из которых может влиять на результаты для всех остальных). Чтобы (легко) оценить причинный эффект однократного лечения по сравнению с контролем, следует придерживаться SUTVA.
Средний причинный эффект
[ редактировать ]Учитывать:
предмет | |||
---|---|---|---|
Джо | 130 | 135 | −5 |
Мэри | 130 | 145 | −15 |
Салли | 130 | 145 | −15 |
Боб | 140 | 150 | −10 |
Джеймс | 145 | 140 | +5 |
ИМЕТЬ В ВИДУ | 135 | 143 | −8 |
Можно рассчитать средний причинный эффект (также известный как средний эффект лечения или ATE), взяв среднее значение всех причинных эффектов.
То, как мы измеряем реакцию, влияет на то, какие выводы мы делаем. Предположим, что мы измеряем изменения артериального давления в процентах, а не в абсолютных значениях. Тогда, в зависимости от точных цифр, средний причинный эффект может заключаться в повышении артериального давления. Например, предположим, что кровяное давление Джорджа будет 154 под контролем и 140 при лечении. Абсолютная величина причинного эффекта равна -14, а процентная разница (при уровне лечения 140) составляет -10%. Если кровяное давление Сары составляет 200 во время лечения и 184 под контролем, то причинный эффект составляет 16 в абсолютном выражении, но 8% в отношении ценности лечения. Меньшее абсолютное изменение артериального давления (-14 против 16) дает большее процентное изменение (-10% против 8%) для Джорджа. Хотя средний причинный эффект для Джорджа и Сары равен +2 в абсолютном выражении, он равен –2 в процентном выражении.
Фундаментальная проблема причинного вывода
[ редактировать ]Результаты, которые мы видели до сих пор, никогда не будут измерены на практике. По определению невозможно наблюдать эффект более чем одного лечения на субъекте в течение определенного периода времени. Джо не может одновременно принять таблетку и не принять таблетку. Таким образом, данные будут выглядеть примерно так:
предмет | |||
---|---|---|---|
Джо | 130 | ? | ? |
Вопросительные знаки — это ответы, которые невозможно было наблюдать. Фундаментальная проблема причинного вывода [2] заключается в том, что непосредственное наблюдение причинных эффектов невозможно. Однако это не делает невозможным причинно-следственный вывод . Определенные методы и предположения позволяют преодолеть фундаментальную проблему.
Предположим, что у нас есть следующие данные:
предмет | |||
---|---|---|---|
Джо | 130 | ? | ? |
Мэри | ? | 125 | ? |
Салли | 100 | ? | ? |
Боб | ? | 130 | ? |
Джеймс | ? | 120 | ? |
ИМЕТЬ В ВИДУ | 115 | 125 | −10 |
Мы можем сделать вывод, каким был бы потенциальный результат Джо под контролем, если мы сделаем предположение о постоянном эффекте:
и
Где Т — средний эффект лечения.. в данном случае -10.
Если бы мы хотели вывести ненаблюдаемые значения, мы могли бы предположить постоянный эффект. Следующие таблицы иллюстрируют данные, соответствующие предположению о постоянном эффекте.
предмет | |||
---|---|---|---|
Джо | 130 | 140 | −10 |
Мэри | 115 | 125 | −10 |
Салли | 100 | 110 | −10 |
Боб | 120 | 130 | −10 |
Джеймс | 110 | 120 | −10 |
ИМЕТЬ В ВИДУ | 115 | 125 | −10 |
Все субъекты имеют одинаковый причинный эффект, хотя результаты лечения у них разные.
Механизм назначения
[ редактировать ]Механизм назначения, метод, с помощью которого единицам назначается лечение, влияет на расчет среднего причинного эффекта. Одним из таких механизмов назначения является рандомизация. Для каждого субъекта мы могли бы подбросить монетку, чтобы определить, получает ли она лечение. Если бы мы хотели, чтобы пять субъектов получили лечение, мы могли бы назначить лечение первым пяти именам, которые мы выбираем из шляпы. Когда мы случайным образом назначаем лечение, мы можем получить разные ответы.
Предположим, что эти данные соответствуют действительности:
предмет | |||
---|---|---|---|
Джо | 130 | 115 | 15 |
Мэри | 120 | 125 | −5 |
Салли | 100 | 125 | −25 |
Боб | 110 | 130 | −20 |
Джеймс | 115 | 120 | −5 |
ИМЕТЬ В ВИДУ | 115 | 123 | −8 |
Истинный средний причинный эффект равен -8. Но причинный эффект для этих людей никогда не равен этому среднему значению. Причинный эффект варьируется, как это обычно (всегда?) происходит в реальной жизни. После случайного назначения лечения мы могли бы оценить причинный эффект как:
предмет | |||
---|---|---|---|
Джо | 130 | ? | ? |
Мэри | 120 | ? | ? |
Салли | ? | 125 | ? |
Боб | ? | 130 | ? |
Джеймс | 115 | ? | ? |
ИМЕТЬ В ВИДУ | 121.66 | 127.5 | −5.83 |
Другое случайное назначение методов лечения дает другую оценку среднего причинного эффекта.
предмет | |||
---|---|---|---|
Джо | 130 | ? | ? |
Мэри | 120 | ? | ? |
Салли | 100 | ? | ? |
Боб | ? | 130 | ? |
Джеймс | ? | 120 | ? |
ИМЕТЬ В ВИДУ | 116.67 | 125 | −8.33 |
Средний причинный эффект варьируется, поскольку наша выборка мала, а ответы имеют большую дисперсию . Если бы выборка была больше, а дисперсия была бы меньше, средний причинный эффект был бы ближе к истинному среднему причинному эффекту, независимо от конкретных единиц, случайно назначенных для лечения.
В качестве альтернативы предположим, что механизм назначает лечение всем мужчинам и только им.
предмет | |||
---|---|---|---|
Джо | 130 | ? | ? |
Боб | 110 | ? | ? |
Джеймс | 105 | ? | ? |
Мэри | ? | 130 | ? |
Салли | ? | 125 | ? |
Там | ? | 135 | ? |
ИМЕТЬ В ВИДУ | 115 | 130 | −15 |
В соответствии с этим механизмом назначения женщины не могут получить лечение и, следовательно, невозможно определить средний причинный эффект на женщин. Чтобы сделать какие-либо выводы о причинном влиянии на субъекта, вероятность того, что субъект получит лечение, должна быть больше 0 и меньше 1.
Идеальный врач
[ редактировать ]Рассмотрим использование идеального врача в качестве механизма назначения. Идеальный врач знает, как каждый субъект будет реагировать на препарат или контрольный препарат, и назначает каждому субъекту лечение, которое принесет ему наибольшую пользу. Идеальный врач знает следующую информацию о выборке пациентов:
предмет | |||
---|---|---|---|
Джо | 130 | 115 | 15 |
Боб | 120 | 125 | −5 |
Джеймс | 100 | 150 | −50 |
Мэри | 115 | 125 | −10 |
Салли | 120 | 130 | −10 |
Там | 135 | 105 | 30 |
ИМЕТЬ В ВИДУ | 120 | 125 | −5 |
Основываясь на этих знаниях, она давала следующие лечебные назначения:
предмет | |||
---|---|---|---|
Джо | ? | 115 | ? |
Боб | 120 | ? | ? |
Джеймс | 100 | ? | ? |
Мэри | 115 | ? | ? |
Салли | 120 | ? | ? |
Там | ? | 105 | ? |
ИМЕТЬ В ВИДУ | 113.75 | 110 | 3.75 |
Идеальный врач искажает оба средних значения, отфильтровывая плохие реакции как на лечение, так и на контроль. Разница между средствами, которая представляет собой предполагаемый средний причинный эффект, искажается в направлении, зависящем от деталей. Например, идеальный врач отнесет такого субъекта, как Лейла, которому причинен вред от приема препарата, и, таким образом, отрицательный эффект препарата будет замаскирован.
Заключение
[ редактировать ]Причинное влияние лечения на отдельную единицу в определенный момент времени представляет собой разницу между переменной результата с лечением и без лечения. Фундаментальная проблема причинного вывода заключается в том, что невозможно наблюдать причинное воздействие на одной единице. Ты либо принимаешь аспирин сейчас, либо нет. Как следствие, необходимо сделать предположения, чтобы оценить недостающие контрфакты.
Причинная модель Рубина также связана с инструментальными переменными (Ангрист, Имбенс и Рубин, 1996). [6] и другие методы причинного вывода. Дополнительную информацию о связях между причинной моделью Рубина, моделированием структурными уравнениями и другими статистическими методами причинного вывода см. в Morgan and Winship (2007). [7] и Перл (2000). [8] Перл (2000) утверждает, что все потенциальные результаты могут быть получены с помощью моделей структурных уравнений (SEM), таким образом объединяя эконометрику и современный причинный анализ.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Перейти обратно: а б Сехон, Джасджит (2007). «Модель Неймана-Рубина причинного вывода и оценки с помощью методов сопоставления» (PDF) . Оксфордский справочник по политической методологии . Архивировано из оригинала (PDF) 13 мая 2015 г. Проверено 14 июня 2013 г.
- ^ Перейти обратно: а б с Холланд, Пол В. (1986). «Статистика и причинно-следственный вывод». Дж. Амер. Статист. доц. 81 (396): 945–960. дои : 10.1080/01621459.1986.10478354 . JSTOR 2289064 . S2CID 14377504 .
- ^ Нейман, Ежи. Sur les application de la theorie des вероятностный опыт в сельском хозяйстве: Essai des principes. Магистерская диссертация (1923). Выдержки перепечатаны на английском языке, Statistical Science, Vol. 5, стр. 463–472. ( Д.М. Домбровская и Т.П. Скорость, переводчики.)
- ^ Рубин, Дональд (2005). «Причинно-следственный вывод с использованием потенциальных результатов». Дж. Амер. Статист. доц. 100 (469): 322–331. дои : 10.1198/016214504000001880 . S2CID 842793 .
- ^ Перейти обратно: а б Рубин, Дональд (1974). «Оценка причинных эффектов лечения в рандомизированных и нерандомизированных исследованиях». Дж. Эдюк. Психол. 66 (5): 688–701 [с. 689]. дои : 10.1037/h0037350 .
- ^ Ангрист, Дж.; Имбенс, Г.; Рубин, Д. (1996). «Идентификация причинных эффектов с использованием инструментальных переменных» (PDF) . Дж. Амер. Статист. доц. 91 (434): 444–455. дои : 10.1080/01621459.1996.10476902 .
- ^ Морган, С.; Уиншип, К. (2007). Контрафакты и причинный вывод: методы и принципы социальных исследований . Нью-Йорк: Издательство Кембриджского университета . ISBN 978-0-521-67193-4 .
- ^ Перл, Иудея (2000). Причинность: модели, рассуждения и выводы (2-е изд. 2009 г.). Издательство Кембриджского университета.
Дальнейшее чтение
[ редактировать ]- Гвидо Имбенс и Дональд Рубин (2015). Причинно-следственный вывод для статистики, социальных и биомедицинских наук: введение . Кембридж: Издательство Кембриджского университета. дои: 10.1017/CBO9781139025751
- Дональд Рубин (1977). «Отнесение к лечебной группе на основе ковариаты», Журнал образовательной статистики , 2, стр. 1–26.
- Рубин, Дональд (1978). «Байесовский вывод для причинных эффектов: роль рандомизации», Анналы статистики , 6, стр. 34–58.
Внешние ссылки
[ редактировать ]- «Причинная модель Рубина» : статья Гвидо Имбенса и Дональда Рубина для Нового экономического словаря Пэлгрейва .
- «Контрфактический причинный анализ» : веб-страница, поддерживаемая Стивеном Морганом, Кристофером Уиншипом и другими, со ссылками на множество исследовательских статей по причинным выводам.