Средний эффект лечения
Средний эффект лечения ( ATE ) — это показатель, используемый для сравнения методов лечения (или вмешательств) в рандомизированных экспериментах, оценке политических мер и медицинских исследованиях. ATE измеряет разницу в средних (средних) результатах между единицами, отнесенными к лечению, и единицами, отнесенными к контролю. В рандомизированном исследовании (т.е. экспериментальном исследовании) средний эффект лечения можно оценить на основе выборки, используя сравнение средних результатов для леченных и нелеченных единиц. Однако под ATE обычно понимают причинный параметр (т. е. оценку или свойство популяции ) , который желает знать исследователь, определяемый безотносительно к плану исследования или процедуре оценки. Как наблюдательные исследования, так и экспериментальные исследования со случайным распределением могут позволить оценить ATE различными способами.
Средний эффект лечения при некоторых условиях напрямую связан с графиком частичной зависимости. [1]
Общее определение [ править ]
Возникший на основе раннего статистического анализа в области сельского хозяйства и медицины, термин «лечение» теперь применяется в более широком смысле к другим областям естественных и социальных наук, особенно к психологии , политологии и экономике, таким как, например, оценка воздействия государственной политики. Характер лечения или исход относительно неважен при оценке ATE, то есть расчет ATE требует, чтобы лечение применялось к одним единицам, а не к другим, но характер этого лечения (например, фармацевтическое лечение) , поощрительная выплата, политическая реклама) не имеет отношения к определению и оценке ATE.
Выражение «эффект лечения» относится к причинному эффекту данного лечения или вмешательства (например, введения лекарственного средства) на интересующую переменную результата (например, здоровье пациента). В «структуре потенциальных результатов» Неймана-Рубина эффект лечения определяется для каждой отдельной единицы в терминах двух «потенциальных результатов». У каждой единицы есть один результат, который проявился бы, если бы единица подверглась лечению, и другой результат, который проявился бы, если бы единица подверглась контролю. «Эффект лечения» — это разница между этими двумя потенциальными результатами. Однако этот эффект лечения на индивидуальном уровне ненаблюдаем, поскольку отдельные единицы могут получать только лечение или контроль, но не то и другое. Случайное назначение на лечение гарантирует, что единицы, назначенные на обработку, и единицы, назначенные на контроль, идентичны (в течение большого количества итераций эксперимента). Действительно, единицы в обеих группах имеют одинаковое распределение. ковариат и потенциальных результатов. Таким образом, средний результат среди лечебных отделений противопоставляется среднему результату среди контрольных отделений. Разница между этими двумя средними значениями представляет собой ATE, который представляет собой оценку центральной тенденции распределения ненаблюдаемых эффектов лечения на индивидуальном уровне. [2] Если выборка формируется случайным образом из генеральной совокупности, выборочная ATE (сокращенно SATE) также является оценкой генеральной ATE (сокращенно PATE). [3]
Хотя эксперимент гарантирует , что дело обстоит иначе потенциальные результаты (и все ковариаты) будут одинаково распределены в экспериментальной и контрольной группах, в обсервационном исследовании . В обсервационном исследовании единицы не назначаются для лечения и контроля случайным образом, поэтому их назначение на лечение может зависеть от ненаблюдаемых или ненаблюдаемых факторов. Наблюдаемые факторы можно статистически контролировать (например, посредством регрессии или сопоставления ), но любая оценка ATE может быть искажена ненаблюдаемыми факторами, влияющими на то, какие подразделения получали лечение по сравнению с контрольной группой.
Формальное определение [ править ]
Чтобы формально определить ATE, мы определяем два потенциальных результата: значение переменной результата для индивидуального если их не лечить, значение переменной результата для индивидуального если их лечить. Например, состояние здоровья человека, если ему не вводят исследуемый препарат и состояние здоровья, если им вводят препарат.
Эффект лечения для индивидуального дается . В общем случае нет оснований ожидать, что этот эффект будет постоянным для разных людей. Средний эффект лечения определяется выражением
и может быть оценено (если выполняется закон больших чисел )
где суммирование происходит по всем особей в популяции.
Если бы мы могли наблюдать для каждого человека, и среди большой репрезентативной выборки населения мы могли бы оценить ATE, просто взяв среднее значение по всему образцу. Однако мы не можем наблюдать оба и для каждого человека, поскольку человека нельзя одновременно лечить и не лечить. Например, в примере с наркотиками мы можем наблюдать только для лиц, получивших препарат и для тех, кто его не получил. Это основная проблема, с которой сталкиваются ученые при оценке эффектов лечения, и она привела к появлению большого количества методов оценки.
Оценка [ править ]
В зависимости от данных и лежащих в их основе обстоятельств для оценки ATE можно использовать множество методов. Наиболее распространенными из них являются:
- Естественные эксперименты
- Разница в различиях
- Модели разрыва регрессии
- Сопоставление оценок склонности
- Оценка инструментальных переменных
Пример [ править ]
Рассмотрим пример, когда все единицы являются безработными, и некоторые подвергаются политическому вмешательству (группа лечения), а другие нет (контрольная группа). Причинно-следственный эффект интереса – это влияние политики мониторинга поиска работы (лечения) на продолжительность периода безработицы: в среднем, насколько короче была бы безработица, если бы они подверглись вмешательству? В данном случае ATE представляет собой разницу ожидаемых значений (средних значений) продолжительности безработицы в экспериментальной и контрольной группах.
Положительное значение ATE в этом примере предполагает, что политика занятости увеличила продолжительность безработицы. Отрицательное значение ATE предполагает, что политика занятости сократила продолжительность безработицы. Оценка ATE, равная нулю, предполагает, что предоставление лечения не имеет преимуществ или недостатков с точки зрения продолжительности безработицы. Определение того, отличима ли оценка ATE от нуля (положительная или отрицательная), требует статистического вывода .
Поскольку ATE представляет собой оценку среднего эффекта лечения, положительная или отрицательная ATE не указывает на то, что лечение принесет пользу или вред конкретному человеку. Таким образом, средний эффект лечения не учитывает распределение эффекта лечения. Некоторые части населения могут пострадать от лечения, даже если средний эффект положительный.
лечения Гетерогенные эффекты
Некоторые исследователи называют эффект лечения «гетерогенным», если он влияет на разных людей по-разному (гетерогенно). Например, возможно, описанное выше отношение к политике мониторинга поиска работы по-разному повлияло на мужчин и женщин или на людей, живущих в разных штатах. ATE требует сильного предположения, известного как предположение о стабильной стоимости единичного лечения (SUTVA), которое требует значения потенциального результата. на них не влияет механизм, используемый для назначения лечения и воздействия лечения на всех остальных лиц. Позволять быть лечением, эффектом лечения для отдельных дается . Предположение SUTVA позволяет нам объявить .
Один из способов поиска гетерогенных эффектов лечения — разделить данные исследования на подгруппы (например, мужчин и женщин или по штатам) и посмотреть, различаются ли средние эффекты лечения по подгруппам. Если средние эффекты лечения различны, SUTVA нарушается. ATE для каждой подгруппы называется «условным средним эффектом лечения» (CATE), т.е. ATE, обусловленным членством в подгруппе. CATE можно использовать в качестве оценки, если SUTVA не соблюдается.
Проблема с этим подходом заключается в том, что каждая подгруппа может иметь значительно меньше данных, чем исследование в целом, поэтому, если исследование было направлено на выявление основных эффектов без анализа подгрупп, данных может не хватить для правильной оценки воздействия на подгруппы. .
Ведется некоторая работа по обнаружению гетерогенных эффектов обработки с использованием случайных лесов. [4] [5] а также выявление гетерогенных субпопуляций с помощью кластерного анализа . [6] [7] Недавно были разработаны подходы к метаобучению, которые используют произвольные структуры регрессии в качестве базовых обучающихся для вывода CATE. [8] [9] Обучение представлению можно использовать для дальнейшего улучшения производительности этих методов. [10] [11]
Ссылки [ править ]
- ^ Чжао, К., и Хасти, Т. (2019). Причинные интерпретации моделей черного ящика. Журнал деловой и экономической статистики, 39 (1), 272–281. https://doi.org/10.1080/07350015.2019.1624293 онлайн ncbi /
- ^ Холланд, Пол В. (1986). «Статистика и причинно-следственный вывод». Дж. Амер. Статист. доц. 81 (396): 945–960. дои : 10.1080/01621459.1986.10478354 . JSTOR 2289064 .
- ^ Имаи, Косуке; Кинг, Гэри; Стюарт, Элизабет А. (2008). «Недоразумения между экспериментаторами и наблюдателями по поводу причинного вывода» . JR Стат. Соц. Сер. А. 171 (2): 481–502. дои : 10.1111/j.1467-985X.2007.00527.x . S2CID 17852724 .
- ^ Вейгер, Стефан; Эти, Сьюзен (2015). «Оценка и вывод эффектов гетерогенного лечения с использованием случайных лесов». arXiv : 1510.04342 [ stat.ME ].
- ^ «Явная оптимизация причинных эффектов с помощью причинного случайного леса: практическое введение и руководство» . 14 октября 2018 г.
- ^ Маркхэм, Алекс; Дас, Ричик; Гросс-Вентруп, Мориц (2022). «Ядро на основе дистанционной ковариации для нелинейной причинной кластеризации в гетерогенных популяциях» . Учеб. Прозрачный . ПМЛР 177: 542–558.
- ^ Хуан, Бивэй; Чжан, Кун; Се, Пэнтао; Гонг, Минмин; Син, Эрик П.; Глимур, Кларк (2019). «Моделирование конкретных и общих причинно-следственных связей и кластеризация на основе механизмов» . Достижения в области нейронных систем обработки информации (NeurIPS) . 32 .
- ^ Не, Синькунь; Вейгер, Стефан (2021). «Квази-оракул оценки эффектов гетерогенного лечения». Биометрика . 108 (2): 299–319. arXiv : 1712.04912 . doi : 10.1093/biomet/asaa076 .
- ^ Кюнцель, Сёрен; Сехон, Джасджит; Бикель, Питер; Ю, Бин (2019). «Метал-обучающие для оценки эффектов гетерогенного лечения с использованием машинного обучения» . Труды Национальной академии наук . 116 (10): 4156–4165. дои : 10.1073/pnas.1804597116 . ПМК 6410831 . ПМИД 30770453 .
- ^ Йоханссон, Фредрик; Шалит, Ури; Зонтаг, Дэвид (2016). «Изучение представлений для контрфактического вывода» . Учеб. ИКМЛ . ПМЛР 48: 3020–3029.
- ^ Беркхарт, Майкл С.; Руис, Габриэль (2022). «Нейроэволюционные представления признаков для причинного вывода». Вычислительная наука – ICCS 2022 . Конспекты лекций по информатике. Том. 13351. стр. 3–10. arXiv : 2205.10541 . дои : 10.1007/978-3-031-08754-7_1 . ISBN 978-3-031-08753-0 . S2CID 248987304 .
Дальнейшее чтение [ править ]
- Вулдридж, Джеффри М. (2013). «Анализ политики с объединенными поперечными сечениями». Вводная эконометрика: современный подход . Мейсон, Огайо: Томсон Юго-Западный. стр. 438–443. ISBN 978-1-111-53104-1 .