Jump to content

Причинная модель Рубина

Причинная модель Рубина ( RCM ), также известная как причинная модель Неймана-Рубина , [1] — это подход к статистическому анализу причин и следствий, основанный на системе потенциальных результатов , названный в честь Дональда Рубина . Название «каузальная модель Рубина» впервые было предложено Полом Холландом . [2] Модель потенциальных результатов была впервые предложена Ежи Нейманом в его магистерской диссертации 1923 года. [3] хотя он обсуждал это только в контексте полностью рандомизированных экспериментов. [4] Рубин расширил ее до общей основы для размышлений о причинно-следственной связи как в наблюдательных, так и в экспериментальных исследованиях. [1]

Введение

[ редактировать ]

Причинно-следственная модель Рубина основана на идее потенциальных результатов. Например, у человека был бы определенный доход в возрасте 40 лет, если бы он учился в колледже, тогда как у него был бы другой доход в возрасте 40 лет, если бы он не учился в колледже. Чтобы измерить причинный эффект поступления в колледж для этого человека, нам нужно сравнить результат для одного и того же человека в обоих альтернативных вариантах будущего. Поскольку невозможно увидеть оба потенциальных результата одновременно, один из потенциальных результатов всегда отсутствует. Эта дилемма является «фундаментальной проблемой причинного вывода ». [2]

Из-за фундаментальной проблемы причинного вывода причинные эффекты на уровне единицы не могут наблюдаться напрямую. Однако рандомизированные эксперименты позволяют оценить причинные эффекты на уровне популяции. [5] Рандомизированный эксперимент случайным образом распределяет людей по группам лечения: в колледже или без колледжа. Из-за этого случайного распределения группы (в среднем) эквивалентны, и разницу в доходах в возрасте 40 лет можно отнести на счет распределения в колледже, поскольку это была единственная разница между группами. Оценку среднего причинного эффекта (также называемого средним эффектом лечения или ATE) можно затем получить путем вычисления разницы в средних значениях между обработанными (посещающими колледж) и контрольными (не посещающими колледж) выборками.

Однако во многих случаях рандомизированные эксперименты невозможны из-за этических или практических соображений. В таких сценариях существует механизм неслучайного назначения. Это относится к примеру с посещением колледжа: люди не распределяются в колледж случайным образом. Скорее, люди могут выбрать поступление в колледж в зависимости от своего финансового положения, образования родителей и так далее. Для причинно-следственных выводов было разработано множество статистических методов, таких как сопоставление показателей склонности . Эти методы пытаются исправить механизм назначения, находя контрольные единицы, аналогичные лечебным единицам.

Расширенный пример

[ редактировать ]

Рубин определяет причинно-следственную связь:

Интуитивно понятно, что причинный эффект одного лечения, E, по сравнению с другим, C, для конкретной единицы и интервала времени от к разница между тем, что могло бы произойти в данный момент если бы устройство подверглось воздействию E, инициированному в и что бы произошло в если бы устройство подверглось воздействию C, инициированному в : «Если бы час назад я принял две таблетки аспирина вместо стакана воды, моя головная боль исчезла бы» или «Поскольку час назад я принял две таблетки аспирина вместо стакана воды, моя головная боль исчезла». .' Наше определение причинного эффекта лечения E по сравнению с C будет отражать это интуитивное значение». [5]

Согласно RCM, причинный эффект от приема или не приема вами аспирина час назад — это разница между тем, как бы ощущала себя ваша голова в случае 1 (прием аспирина) и случае 2 (не прием аспирина). Если ваша головная боль останется без аспирина, но исчезнет, ​​если вы примете аспирин, то причинным эффектом приема аспирина является облегчение головной боли. В большинстве случаев нас интересует сравнение двух вариантов будущего: одно обычно называют «лечением», а другое — «контролем». Эти ярлыки несколько условны.

Потенциальные результаты

[ редактировать ]

Предположим, что Джо участвует в испытаниях FDA нового лекарства от гипертонии. Всезнающий наблюдатель знал бы результаты лечения Джо как при лечении (новым препаратом), так и при контроле (либо отсутствие лечения, либо текущее стандартное лечение). Причинный эффект или эффект лечения – это разница между этими двумя потенциальными результатами.

предмет
Джо 130 135 −5

Джо, будет ли кровяное давление если он примет новую таблетку. В общем, это обозначение выражает потенциальный результат, который является результатом лечения t на единице u . Сходным образом, – это эффект другого лечения c или контроля на единицу u . В этом случае, кровяное давление Джо, если он не примет таблетку. является причинным следствием приема нового препарата.

Из этой таблицы мы знаем только причинное влияние на Джо. У всех остальных участников исследования может повыситься кровяное давление, если они примут таблетку. Однако независимо от того, каков был причинный эффект для других субъектов, причинным эффектом для Джо является более низкое кровяное давление по сравнению с тем, каким было бы его кровяное давление, если бы он не принимал таблетку.

Рассмотрим большую выборку пациентов:

предмет
Джо 130 135 −5
Мэри 140 150 −10
Салли 135 125 10
Боб 135 150 −15

Причинный эффект различен для каждого субъекта, но препарат действует на Джо, Мэри и Боба, поскольку причинный эффект отрицательный. При приеме препарата их кровяное давление ниже, чем было бы, если бы каждый из них не принимал препарат. С другой стороны, у Салли препарат вызывает повышение кровяного давления.

Чтобы потенциальный результат имел смысл, он должен быть возможен, по крайней мере априори . Например, если у Джо ни при каких обстоятельствах нет возможности получить новый препарат, то для него невозможно. Этого никогда не произойдет. И если никогда не может наблюдаться, даже теоретически, тогда причинное влияние лечения на кровяное давление Джо не определено.

Нет причинно-следственной связи без манипуляций

[ редактировать ]

Причинный эффект нового препарата четко определен, поскольку он представляет собой простую разницу двух потенциальных результатов, оба из которых могут произойти. В этом случае мы (или что-то еще) можем манипулировать миром, по крайней мере концептуально, так что возможно то или иное событие.

Такое определение причинных последствий становится гораздо более проблематичным, если ни один из потенциальных результатов никогда не сможет произойти. Например, каково причинное влияние роста Джо на его вес? Наивно это кажется похожим на другие наши примеры. Нам просто нужно сравнить два потенциальных результата: каким будет вес Джо во время лечения (где лечение определяется как рост на 3 дюйма) и каким будет вес Джо под контролем (где контроль определяется как его текущий рост).

Недолгое размышление выявляет проблему: мы не можем увеличить рост Джо. Невозможно, даже концептуально, наблюдать, каким был бы вес Джо, если бы он был выше, потому что нет способа сделать его выше. Мы не можем манипулировать ростом Джо, поэтому нет смысла исследовать причинное влияние роста на вес. Отсюда и лозунг: «Нет причинно-следственной связи без манипуляций» .

Допущение о стабильной стоимости единицы лечения (SUTVA)

[ редактировать ]

Мы требуем, чтобы «на наблюдение [потенциального результата] в одном отделении не влияло конкретное назначение лечения другим подразделениям» (Cox 1958, §2.4). Это называется предположением о стабильной стоимости единицы лечения (SUTVA), которое выходит за рамки концепции независимости.

В контексте нашего примера кровяное давление Джо не должно зависеть от того, принимает ли Мэри препарат. Но что, если это так? Предположим, что Джо и Мэри живут в одном доме и Мэри всегда готовит. Препарат вызывает у Мэри тягу к соленой пище, поэтому, если она примет препарат, она будет готовить с большим количеством соли, чем в противном случае. Диета с высоким содержанием соли повышает кровяное давление Джо. Поэтому его результат будет зависеть как от того, какое лечение он получил, так и от того, какое лечение получает Мэри.

Нарушение SUTVA затрудняет причинно-следственную связь. Мы можем объяснить зависимые наблюдения, рассматривая дополнительные методы лечения. Мы создаем 4 варианта лечения, принимая во внимание, получает ли Мэри лечение.

предмет Джо = с, Мэри = т Джо = т, Мэри = т Джо = с, Мэри = с Джо = т, Мэри = с
Джо 140 130 125 120

Напомним, что причинный эффект определяется как разница между двумя потенциальными результатами. В этом случае существует несколько причинных последствий, поскольку существует более двух потенциальных результатов. Одним из них является причинное воздействие препарата на Джо, когда Мэри получает лечение, и рассчитывается: . Другой — это причинное воздействие на Джо, когда Мэри не получает лечения, и рассчитано . Третий — причинное влияние лечения Мэри на Джо, когда Джо не лечат. Это рассчитывается как . Лечение, которое получает Мэри, имеет больший причинный эффект на Джо, чем лечение, которое Джо получил, на Джо, и оно направлено в противоположном направлении.

Рассматривая таким образом больше потенциальных результатов, мы можем обеспечить сохранение SUTVA. Однако если какие-либо подразделения, кроме Джо, зависят от Мэри, то мы должны рассмотреть дальнейшие потенциальные результаты. Чем больше число зависимых единиц, тем больше потенциальных результатов мы должны учитывать и тем сложнее становятся расчеты (представим себе эксперимент с 20 разными людьми, статус лечения каждого из которых может влиять на результаты для всех остальных). Чтобы (легко) оценить причинный эффект однократного лечения по сравнению с контролем, следует придерживаться SUTVA.

Средний причинный эффект

[ редактировать ]

Учитывать:

предмет
Джо 130 135 −5
Мэри 130 145 −15
Салли 130 145 −15
Боб 140 150 −10
Джеймс 145 140 +5
ИМЕТЬ В ВИДУ 135 143 −8

Можно рассчитать средний причинный эффект (также известный как средний эффект лечения или ATE), взяв среднее значение всех причинных эффектов.

То, как мы измеряем реакцию, влияет на то, какие выводы мы делаем. Предположим, что мы измеряем изменения артериального давления в процентах, а не в абсолютных значениях. Тогда, в зависимости от точных цифр, средний причинный эффект может заключаться в повышении артериального давления. Например, предположим, что кровяное давление Джорджа будет 154 под контролем и 140 при лечении. Абсолютная величина причинного эффекта равна -14, а процентная разница (при уровне лечения 140) составляет -10%. Если кровяное давление Сары составляет 200 во время лечения и 184 под контролем, то причинный эффект составляет 16 в абсолютном выражении, но 8% в отношении ценности лечения. Меньшее абсолютное изменение артериального давления (-14 против 16) дает большее процентное изменение (-10% против 8%) для Джорджа. Хотя средний причинный эффект для Джорджа и Сары равен +2 в абсолютном выражении, он равен –2 в процентном выражении.

Фундаментальная проблема причинного вывода

[ редактировать ]

Результаты, которые мы видели до сих пор, никогда не будут измерены на практике. По определению невозможно наблюдать эффект более чем одного лечения на субъекте в течение определенного периода времени. Джо не может одновременно принять таблетку и не принять таблетку. Таким образом, данные будут выглядеть примерно так:

предмет
Джо 130 ? ?

Вопросительные знаки — это ответы, которые невозможно было наблюдать. Фундаментальная проблема причинного вывода [2] заключается в том, что непосредственное наблюдение причинных эффектов невозможно. Однако это не делает невозможным причинно-следственный вывод . Определенные методы и предположения позволяют преодолеть фундаментальную проблему.

Предположим, что у нас есть следующие данные:

предмет
Джо 130 ? ?
Мэри ? 125 ?
Салли 100 ? ?
Боб ? 130 ?
Джеймс ? 120 ?
ИМЕТЬ В ВИДУ 115 125 −10

Мы можем сделать вывод, каким был бы потенциальный результат Джо под контролем, если мы сделаем предположение о постоянном эффекте:

и

Где Т — средний эффект лечения.. в данном случае -10.

Если бы мы хотели вывести ненаблюдаемые значения, мы могли бы предположить постоянный эффект. Следующие таблицы иллюстрируют данные, соответствующие предположению о постоянном эффекте.

предмет
Джо 130 140 −10
Мэри 115 125 −10
Салли 100 110 −10
Боб 120 130 −10
Джеймс 110 120 −10
ИМЕТЬ В ВИДУ 115 125 −10

Все субъекты имеют одинаковый причинный эффект, хотя результаты лечения у них разные.

Механизм назначения

[ редактировать ]

Механизм назначения, метод, с помощью которого единицам назначается лечение, влияет на расчет среднего причинного эффекта. Одним из таких механизмов назначения является рандомизация. Для каждого субъекта мы могли бы подбросить монетку, чтобы определить, получает ли она лечение. Если бы мы хотели, чтобы пять субъектов получили лечение, мы могли бы назначить лечение первым пяти именам, которые мы выбираем из шляпы. Когда мы случайным образом назначаем лечение, мы можем получить разные ответы.

Предположим, что эти данные соответствуют действительности:

предмет
Джо 130 115 15
Мэри 120 125 −5
Салли 100 125 −25
Боб 110 130 −20
Джеймс 115 120 −5
ИМЕТЬ В ВИДУ 115 123 −8

Истинный средний причинный эффект равен -8. Но причинный эффект для этих людей никогда не равен этому среднему значению. Причинный эффект варьируется, как это обычно (всегда?) происходит в реальной жизни. После случайного назначения лечения мы могли бы оценить причинный эффект как:

предмет
Джо 130 ? ?
Мэри 120 ? ?
Салли ? 125 ?
Боб ? 130 ?
Джеймс 115 ? ?
ИМЕТЬ В ВИДУ 121.66 127.5 −5.83

Другое случайное назначение методов лечения дает другую оценку среднего причинного эффекта.

предмет
Джо 130 ? ?
Мэри 120 ? ?
Салли 100 ? ?
Боб ? 130 ?
Джеймс ? 120 ?
ИМЕТЬ В ВИДУ 116.67 125 −8.33

Средний причинный эффект варьируется, поскольку наша выборка мала, а ответы имеют большую дисперсию . Если бы выборка была больше, а дисперсия была бы меньше, средний причинный эффект был бы ближе к истинному среднему причинному эффекту, независимо от конкретных единиц, случайно назначенных для лечения.

В качестве альтернативы предположим, что механизм назначает лечение всем мужчинам и только им.

предмет
Джо 130 ? ?
Боб 110 ? ?
Джеймс 105 ? ?
Мэри ? 130 ?
Салли ? 125 ?
Там ? 135 ?
ИМЕТЬ В ВИДУ 115 130 −15

В соответствии с этим механизмом назначения женщины не могут получить лечение и, следовательно, невозможно определить средний причинный эффект на женщин. Чтобы сделать какие-либо выводы о причинном влиянии на субъекта, вероятность того, что субъект получит лечение, должна быть больше 0 и меньше 1.

Идеальный врач

[ редактировать ]

Рассмотрим использование идеального врача в качестве механизма назначения. Идеальный врач знает, как каждый субъект будет реагировать на препарат или контрольный препарат, и назначает каждому субъекту лечение, которое принесет ему наибольшую пользу. Идеальный врач знает следующую информацию о выборке пациентов:

предмет
Джо 130 115 15
Боб 120 125 −5
Джеймс 100 150 −50
Мэри 115 125 −10
Салли 120 130 −10
Там 135 105 30
ИМЕТЬ В ВИДУ 120 125 −5

Основываясь на этих знаниях, она давала следующие лечебные назначения:

предмет
Джо ? 115 ?
Боб 120 ? ?
Джеймс 100 ? ?
Мэри 115 ? ?
Салли 120 ? ?
Там ? 105 ?
ИМЕТЬ В ВИДУ 113.75 110 3.75

Идеальный врач искажает оба средних значения, отфильтровывая плохие реакции как на лечение, так и на контроль. Разница между средствами, которая представляет собой предполагаемый средний причинный эффект, искажается в направлении, зависящем от деталей. Например, идеальный врач отнесет такого субъекта, как Лейла, которому причинен вред от приема препарата, и, таким образом, отрицательный эффект препарата будет замаскирован.

Заключение

[ редактировать ]

Причинное влияние лечения на отдельную единицу в определенный момент времени представляет собой разницу между переменной результата с лечением и без лечения. Фундаментальная проблема причинного вывода заключается в том, что невозможно наблюдать причинное воздействие на одной единице. Ты либо принимаешь аспирин сейчас, либо нет. Как следствие, необходимо сделать предположения, чтобы оценить недостающие контрфакты.

Причинная модель Рубина также связана с инструментальными переменными (Ангрист, Имбенс и Рубин, 1996). [6] и другие методы причинного вывода. Дополнительную информацию о связях между причинной моделью Рубина, моделированием структурными уравнениями и другими статистическими методами причинного вывода см. в Morgan and Winship (2007). [7] и Перл (2000). [8] Перл (2000) утверждает, что все потенциальные результаты могут быть получены с помощью моделей структурных уравнений (SEM), таким образом объединяя эконометрику и современный причинный анализ.

См. также

[ редактировать ]
  1. ^ Перейти обратно: а б Сехон, Джасджит (2007). «Модель Неймана-Рубина причинного вывода и оценки с помощью методов сопоставления» (PDF) . Оксфордский справочник по политической методологии . Архивировано из оригинала (PDF) 13 мая 2015 г. Проверено 14 июня 2013 г.
  2. ^ Перейти обратно: а б с Холланд, Пол В. (1986). «Статистика и причинно-следственный вывод». Дж. Амер. Статист. доц. 81 (396): 945–960. дои : 10.1080/01621459.1986.10478354 . JSTOR   2289064 . S2CID   14377504 .
  3. ^ Нейман, Ежи. Sur les application de la theorie des вероятностный опыт в сельском хозяйстве: Essai des principes. Магистерская диссертация (1923). Выдержки перепечатаны на английском языке, Statistical Science, Vol. 5, стр. 463–472. ( Д.М. Домбровская и Т.П. Скорость, переводчики.)
  4. ^ Рубин, Дональд (2005). «Причинно-следственный вывод с использованием потенциальных результатов». Дж. Амер. Статист. доц. 100 (469): 322–331. дои : 10.1198/016214504000001880 . S2CID   842793 .
  5. ^ Перейти обратно: а б Рубин, Дональд (1974). «Оценка причинных эффектов лечения в рандомизированных и нерандомизированных исследованиях». Дж. Эдюк. Психол. 66 (5): 688–701 [с. 689]. дои : 10.1037/h0037350 .
  6. ^ Ангрист, Дж.; Имбенс, Г.; Рубин, Д. (1996). «Идентификация причинных эффектов с использованием инструментальных переменных» (PDF) . Дж. Амер. Статист. доц. 91 (434): 444–455. дои : 10.1080/01621459.1996.10476902 .
  7. ^ Морган, С.; Уиншип, К. (2007). Контрафакты и причинный вывод: методы и принципы социальных исследований . Нью-Йорк: Издательство Кембриджского университета . ISBN  978-0-521-67193-4 .
  8. ^ Перл, Иудея (2000). Причинность: модели, рассуждения и выводы (2-е изд. 2009 г.). Издательство Кембриджского университета.

Дальнейшее чтение

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 124c3c53d3749cb26476b7713d60ed68__1720361940
URL1:https://arc.ask3.ru/arc/aa/12/68/124c3c53d3749cb26476b7713d60ed68.html
Заголовок, (Title) документа по адресу, URL1:
Rubin causal model - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)