Перелив (эксперимент)
В экспериментах — побочный эффект это косвенное воздействие на субъекта, непосредственно не подвергающегося воздействию эксперимента. Эти эффекты полезны для политического анализа , но усложняют статистический анализ экспериментов.
Анализ побочных эффектов включает в себя смягчение предположения о невмешательстве, или SUTVA (допущение о стоимости обработки стабильной единицы). Это предположение требует, чтобы раскрытие субъектом i своих потенциальных результатов зависело только от собственного статуса лечения этого субъекта i и не подвергалось влиянию другого субъекта j статуса лечения . В обычных условиях, когда исследователь пытается оценить средний эффект лечения ( ), нарушение предположения о невмешательстве означает, что традиционные оценки ATE, такие как разница средних, могут быть необъективными . Тем не менее, существует множество реальных случаев, когда раскрытие потенциальных результатов в одном отделении зависит от назначенного лечения в другом отделении, и анализ этих эффектов может быть столь же важным, как и анализ прямого эффекта лечения.
Одним из решений этой проблемы является переопределение причинно-следственной оценки интереса путем переопределения потенциальных результатов субъекта с точки зрения его собственного статуса лечения и статуса лечения связанных субъектов. Затем исследователь может проанализировать различные представляющие интерес оценки отдельно. Одним из важных предположений здесь является то, что этот процесс охватывает все модели побочных эффектов и что не остается немоделированных побочных эффектов (например, побочные эффекты происходят внутри домохозяйства, состоящего из двух человек, но не за его пределами).
После того, как потенциальные результаты переопределены, остальная часть статистического анализа включает моделирование вероятностей подвергнуться лечению при определенном графике назначения лечения и использование взвешивания обратной вероятности (IPW) для получения несмещенных (или асимптотически несмещенных) оценок оценки интерес.
Примеры побочных эффектов
[ редактировать ]Побочные эффекты могут проявляться по-разному. Общие приложения включают анализ вторичных эффектов социальных сетей и географических вторичных эффектов. Примеры включают следующее:
- Коммуникация : Вмешательство, которое передает информацию о технологии или продукте, может повлиять на решения других участников их сети , если оно распространяется за пределы первоначального пользователя. [1]
- Конкуренция : Помощь в трудоустройстве молодым людям, ищущим работу, может повлиять на перспективы на рынке труда лиц, которые не прошли обучение, но претендуют на одну и ту же работу. [2]
- Заражение: прием препаратов для дегельминтизации может снизить вероятность заражения этим заболеванием у других людей. [3]
- Сдерживание : информация о государственных проверках в конкретных муниципалитетах может распространиться на близлежащие муниципалитеты. [4]
- Перемещение : вмешательство полиции в горячих точках, которое увеличивает присутствие полиции на данной улице, может привести к перемещению преступности на близлежащие необработанные улицы. [5]
- Перераспределение ресурсов : вмешательство полиции в «горячих точках», которое увеличивает присутствие полиции на данной улице, может уменьшить присутствие полиции на близлежащих улицах.
- Социальное сравнение . Программа, которая рандомизирует людей для получения ваучера на переезд в новый район, может дополнительно повлиять на представления контрольной группы об их жилищных условиях. [6]
В таких примерах лечение в рандомизированном контролируемом исследовании может иметь прямой эффект на тех, кто получает вмешательство, а также побочный эффект на тех, кто не получал прямого лечения.
Статистические вопросы
[ редактировать ]Оценка побочных эффектов в экспериментах сопряжена с тремя статистическими проблемами, которые исследователи должны принять во внимание.
Ослабление предположения о невмешательстве
[ редактировать ]Одним из ключевых предположений для объективного вывода является предположение о невмешательстве, которое утверждает, что потенциальные результаты человека раскрываются только в результате его собственного назначения лечения, а не назначения лечения другими. [7] Это предположение также получило название «индивидуалистическая реакция на лечение». [8] или предположение о стабильной стоимости единицы лечения . Невмешательство нарушается, когда субъекты могут сообщать друг другу о своем лечении, решениях или опыте, тем самым влияя на потенциальные результаты друг друга. Если предположение о невмешательстве не выполняется, подразделения больше не имеют только два потенциальных результата (леченный и контрольный), а имеют множество других потенциальных результатов, которые зависят от назначения лечения другими подразделениями. [9] что усложняет оценку среднего эффекта лечения .
Оценка побочных эффектов требует смягчения предположения о невмешательстве. Это связано с тем, что результаты подразделения зависят не только от назначения лечения, но и от назначения лечения его соседей. Исследователь должен постулировать набор потенциальных результатов, которые ограничивают тип вмешательства. В качестве примера рассмотрим эксперимент , в ходе которого студентам бакалавриата рассылается политическая информация, чтобы повысить их политическое участие. Если исследуемая совокупность состоит из всех студентов, живущих с соседом по комнате в общежитии колледжа, можно представить четыре набора потенциальных результатов, в зависимости от того, получил ли информацию студент или его партнер (предположим, что за пределами каждой двухместной комнаты нет побочных эффектов):
- Y 0,0 относится к потенциальным последствиям для человека, когда он не лечится (0), как и его сосед по комнате (0).
- Y 0,1 относится к потенциальному результату для человека, когда он не лечится (0), но лечится его сосед по комнате (1).
- Y 1,0 относится к потенциальному результату для человека, когда он лечится (1), но его сосед по комнате не лечится (0).
- Y 1,1 относится к потенциальному результату лечения человека (1) и лечения его соседа по комнате (1).
Теперь на результаты человека влияет как то, получил ли он лечение, так и то, прошел ли лечение его сосед по комнате. Мы можем оценить один тип побочного эффекта , посмотрев, как меняются результаты в зависимости от того, получал ли его сосед по комнате лечение или нет, учитывая, что человек не получал лечения напрямую. Это будет отражено разницей Y 0,1 - Y 0,0 . Аналогичным образом мы можем измерить, как меняются результаты лечения в зависимости от статуса лечения их соседа по комнате, когда лечится сам человек. Это равнозначно принятию разности Y 1,1 - Y 1,0 .
Хотя исследователи обычно проводят эксперименты , потому что они требуют менее требовательных предположений, побочные эффекты могут быть «неограниченными по размеру и не поддающимися определению по форме». [10] Исследователь должен сделать конкретные предположения о том, какие типы побочных эффектов действуют. Можно ослабить допущение о невмешательстве различными способами в зависимости от того, как вторичные эффекты, как предполагается, происходят в данной ситуации. Одним из способов моделирования побочных эффектов является бинарный индикатор того, обрабатывался ли также непосредственный сосед, как в примере выше. Можно также предположить побочные эффекты, которые зависят от количества непосредственных соседей, которые также были обработаны, также известные как эффекты k-уровня. [11]
Сопоставления экспозиции
[ редактировать ]Следующим шагом после переопределения интересующей причинно-следственной связи является характеристика вероятности вторичного воздействия для каждого субъекта анализа с учетом некоторого вектора назначения лечения. Аронов и Самии (2017) [12] представить метод получения матрицы вероятностей воздействия для каждой единицы анализа.
Сначала определите диагональную матрицу с вектором вероятностей назначения лечения.
Во-вторых, определите матрицу индикаторов того, подвержено ли устройство переливу или нет. Это делается с помощью матрицы смежности , как показано справа, где информация о сети может быть преобразована в матрицу индикаторов. Полученная матрица показателей будет содержать значения , реализованные значения случайной двоичной величины , указывающий, подверглось ли данное устройство переливу или нет.
В-третьих, получить сэндвич-продукт , матрица размера N × N , содержащая два элемента: индивидуальная вероятность воздействия по диагонали, а вероятности совместного воздействия на недиагоналях:
- Аналогичным образом, совместная вероятность воздействия i , находящегося в состоянии воздействия и j находятся в других условиях воздействия можно получить, вычислив :
Обратите внимание, что диагонали во второй матрице равны 0, поскольку субъект не может одновременно подвергаться воздействию двух разных условий воздействия, точно так же, как субъект не может одновременно выявить два разных потенциальных результата.
Полученные вероятности воздействия затем может использоваться для взвешивания обратной вероятности (IPW, описанное ниже) в такой системе оценки, как оценка Хорвица – Томпсона .
Одним из важных предостережений является то, что эта процедура исключает все единицы, вероятность воздействия которых равна нулю (например, единицу, которая не связана ни с какими другими единицами), поскольку эти числа оказываются в знаменателе регрессии IPW.
Необходимость в весах обратной вероятности
[ редактировать ]Оценка побочных эффектов требует дополнительной осторожности: хотя лечение назначается напрямую, статус побочных эффектов присваивается косвенно и может привести к разным вероятностям распределения побочных эффектов для единиц. Например, субъект, имеющий 10 друзей, с большей вероятностью будет косвенно подвергнут лечению, в отличие от субъекта, у которого есть только один друг. Игнорирование различной вероятности воздействия побочных эффектов может привести к искажению оценок среднего эффекта побочных эффектов.
На рис. 1 показан пример, в котором единицы имеют различную вероятность попадания в состояние перелива. На подрисунке A показана сеть из 25 узлов, в которых единицы, выделенные зеленым, имеют право на лечение. Вторичные эффекты определяются как разделяющие хотя бы одно ребро с обрабатываемой единицей. Например, если рассматривать узел 16, узлы 11, 17 и 21 будут классифицированы как переливные единицы. Предположим, что три из этих шести зеленых единиц выбраны случайным образом для обработки, так что возможны различные наборы лечебных назначений. В этом случае на подрисунке B отображается вероятность попадания каждого узла в состояние перелива. Узел 3 назначается для перелива в 95% рандомизаций, поскольку он имеет общие ребра с тремя обрабатываемыми единицами. Этот узел будет контрольным узлом только в 5% рандомизаций: то есть, когда тремя обработанными узлами являются 14, 16 и 18. Между тем, узел 15 назначается для перераспределения только в 50% случаев — если узел 14 не обрабатывается напрямую, узел 15 не будет назначен переливу.
Использование весов обратной вероятности
[ редактировать ]При анализе экспериментов с различной вероятностью отнесения следует принимать особые меры предосторожности. Эти различия в вероятностях назначения могут быть нейтрализованы с помощью , взвешенной по обратной вероятности (IPW) регрессии , где каждое наблюдение взвешивается по величине, обратной вероятности его отнесения к состоянию лечения, наблюдаемому с использованием оценщика Хорвица-Томпсона . [13] Этот подход устраняет предвзятость , которая могла бы возникнуть, если бы потенциальные результаты были систематически связаны с вероятностью назначения. Недостаток этой оценки заключается в том, что она может быть чревата изменчивостью выборки , если некоторым наблюдениям будет присвоен высокий вес (т. е. единица с низкой вероятностью перелива случайно попадает в условие переливов).
Использование вывода рандомизации для проверки гипотез
[ редактировать ]В некоторых случаях оценка изменчивости побочного эффекта создает дополнительные трудности. Когда исследовательское исследование имеет фиксированную единицу кластеризации , например, школу или домохозяйство, исследователи могут использовать традиционные инструменты корректировки стандартных ошибок , такие как устойчивые к кластерам стандартные ошибки, которые учитывают корреляции с точки зрения ошибок внутри кластеров, но не между ними. [14] Однако в других условиях фиксированной единицы кластеризации не существует. Для проведения проверки гипотез в таких условиях использовать метод рандомизации . рекомендуется [15] Этот метод позволяет генерировать p-значения и доверительные интервалы, даже если побочные эффекты не соответствуют фиксированной единице кластеризации, но соседним единицам, как правило, присваиваются аналогичные условия вторичного воздействия, как в случае нечеткой кластеризации .
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ «Распространение технологий в социальных сетях: данные программы обучения кофе в Руанде» . МГК . 31 марта 2010 года . Проверено 11 декабря 2018 г.
- ^ Самора, Филипп; Рателот, Роланд; Гурганд, Марк; Дюфло, Эстер; Крепон, Бруно (01 мая 2013 г.). «Оказывает ли политика на рынке труда эффект смещения? Данные кластерного рандомизированного эксперимента». Ежеквартальный экономический журнал . 128 (2): 531–580. дои : 10.1093/qje/qjt001 . hdl : 1721.1/82896 . ISSN 0033-5533 . S2CID 15381050 .
- ^ «Черви: выявление воздействия на образование и здоровье при наличии внешних эффектов лечения | Эдвард Мигель, профессор экономики Калифорнийского университета в Беркли» . emiguel.econ.berkeley.edu . Проверено 11 декабря 2018 г.
- ^ Авис, Эрик; Феррас, Клаудио; Финан, Фредерико (2018). «Снижает ли государственный аудит коррупцию? Оценка последствий разоблачения коррумпированных политиков» (PDF) . Журнал политической экономии . 126 (5): 1912–1964. дои : 10.1086/699209 . hdl : 10419/176135 . S2CID 36161954 .
- ^ Вейсбурд, Дэвид; Телеп, Коди В. (01 мая 2014 г.). «Полиция в горячих точках: что мы знаем и что нам нужно знать». Журнал современного уголовного правосудия . 30 (2): 200–220. дои : 10.1177/1043986214525083 . ISSN 1043-9862 . S2CID 145692978 .
- ^ Собел, Майкл (2006). «Что демонстрируют рандомизированные исследования жилищной мобильности?». Журнал Американской статистической ассоциации . 101 (476): 1398–1407. дои : 10.1198/016214506000000636 . S2CID 739283 .
- ^ «ПсикНЕТ» . psycnet.apa.org . Проверено 11 декабря 2018 г.
- ^ Мански, Чарльз Ф. (1 февраля 2013 г.). «Определение реакции на лечение с учетом социальных взаимодействий» (PDF) . Эконометрический журнал . 16 (1): С1–С23. дои : 10.1111/j.1368-423X.2012.00368.x . hdl : 10419/64721 . ISSN 1368-4221 . S2CID 1559596 .
- ^ Розенбаум, Пол Р. (2007). «Вмешательство между единицами в рандомизированных экспериментах». Журнал Американской статистической ассоциации . 102 (477): 191–200. CiteSeerX 10.1.1.571.7817 . дои : 10.1198/016214506000001112 . S2CID 38153548 .
- ^ Розенбаум, Пол Р. (2007). «Вмешательство между единицами в рандомизированных экспериментах». Журнал Американской статистической ассоциации . 102 (477): 191–200. CiteSeerX 10.1.1.571.7817 . дои : 10.1198/016214506000001112 . S2CID 38153548 .
- ^ Као, Эдвард; Тулис, Панос (13 февраля 2013 г.). «Оценка причинно-следственных эффектов влияния сверстников» . Международная конференция по машинному обучению : 1489–1497.
- ^ Аронов, Питер М.; Самии, Сайрус (01 декабря 2017 г.). «Оценка средних причинных эффектов при общем вмешательстве с применением к эксперименту в социальных сетях». Анналы прикладной статистики . 11 (4): 1912–1947. arXiv : 1305.6156 . дои : 10.1214/16-aoas1005 . ISSN 1932-6157 . S2CID 26963450 .
- ^ Хортвиц, генеральный директор; Томпсон, ди-джей (1952). «Обобщение выборки без замены из конечной вселенной». Журнал Американской статистической ассоциации . 47 (260): 663–685. дои : 10.1080/01621459.1952.10483446 . JSTOR 2280784 . S2CID 120274071 .
- ^ А. Колин Кэмерон; Дуглас Л. Миллер. «Руководство для практикующего специалиста по кластерному выводу» (PDF) . Cameron.econ.ucdavis.edu . Проверено 19 декабря 2018 г.
- ^ «10 вещей, которые нужно знать о рандомизационном выводе» . Egap.org . Проверено 11 декабря 2018 г.