Дизайн разрыва регрессии
В статистике , эконометрике , политологии , эпидемиологии и смежных дисциплинах регрессионный план разрыва (RDD) — это квазиэкспериментальный план пре-тест-посттест, целью которого является определение причинных эффектов вмешательств путем назначения порогового значения или порога, выше или ниже которого назначено вмешательство. Сравнивая наблюдения, находящиеся по обе стороны от порога, можно оценить средний эффект лечения в условиях, в которых рандомизация невозможна. Однако сделать истинный причинно-следственный вывод с помощью одного только этого метода по-прежнему невозможно, поскольку он не исключает автоматически причинные эффекты какой-либо потенциальной мешающей переменной. Впервые примененный Дональдом Тистлтуэйтом и Дональдом Кэмпбеллом (1960) для оценки стипендиальных программ. [1] В последние годы RDD становится все более популярным. [2] Недавние сравнения рандомизированных контролируемых исследований (РКИ) и RDD эмпирически продемонстрировали внутреннюю валидность дизайна. [3]
Пример [ править ]
Интуиция, лежащая в основе RDD, хорошо иллюстрируется на примере оценки стипендий, основанных на заслугах. Основной проблемой при оценке причинного эффекта такого вмешательства является однородность результатов лечения ( например, присуждения стипендии). Поскольку успешные студенты с большей вероятностью будут награждены стипендией за заслуги и в то же время продолжат хорошо учиться, сравнение результатов лауреатов и не получателей может привести к смещению оценок в сторону повышения. Даже если бы стипендия вообще не улучшила оценки, лауреаты показали бы лучшие результаты, чем не получатели, просто потому, что стипендии предоставлялись студентам, которые раньше хорошо успевали.
Несмотря на отсутствие экспериментального плана , RDD может использовать экзогенные характеристики вмешательства для выявления причинных эффектов . Если все учащиеся выше определенного класса (например, 80%) получают стипендию, можно выявить местный эффект лечения, сравнив учащихся с пороговым значением в 80%. Интуиция заключается в том, что учащийся, набравший 79%, скорее всего, будет очень похож на учащегося, набравшего 81%, — учитывая заранее определенный порог в 80%. Однако один студент получит стипендию, а другой — нет. Сравнение результата получателя (группа лечения) с контрфактическим результатом не получателя (контрольная группа), следовательно, обеспечит локальный эффект лечения.
Методология [ править ]
Двумя наиболее распространенными подходами к оценке с использованием RDD являются непараметрический и параметрический (обычно полиномиальная регрессия ).
Непараметрическая оценка [ править ]
Наиболее распространенным непараметрическим методом, используемым в контексте RDD, является локальная линейная регрессия. Это имеет форму:
где прекращение лечения и — двоичная переменная, равная единице, если . Сдача в аренду быть пропускной способностью используемых данных, мы имеем . Различные наклоны и точки пересечения соответствуют данным по обе стороны от границы. либо прямоугольное ядро Обычно используется (без взвешивания), либо треугольное ядро. Прямоугольное ядро имеет более простую интерпретацию по сравнению со сложными ядрами, которые дают небольшой прирост эффективности. [4]
Основное преимущество использования непараметрических методов в RDD заключается в том, что они дают оценки на основе данных, близких к пороговому значению, что интуитивно привлекательно. Это уменьшает некоторую погрешность, которая может возникнуть в результате использования данных, находящихся дальше от границы, для оценки разрыва на границе. [4] Более формально, локальные линейные регрессии предпочтительнее, поскольку они имеют лучшие свойства смещения. [5] и иметь лучшую сходимость. [6] Однако использование обоих типов оценок, если это возможно, является полезным способом доказать, что оценочные результаты не слишком сильно зависят от конкретного используемого подхода.
Параметрическая оценка [ править ]
Пример параметрической оценки:
где
и это прекращение лечения.Обратите внимание, что полиномиальная часть может быть сокращена или расширена в зависимости от потребностей.
Другие примеры [ править ]
- Политика, в которой лечение определяется возрастным критерием (например, пенсии, минимальный возраст, с которого разрешено употребление алкоголя). [7] [8]
- Выборы, на которых один политик побеждает с незначительным большинством голосов. [9] [10]
- Баллы за размещение в системе образования, которые распределяют студентов по программам лечения. [11]
Необходимые предположения [ править ]
Дизайн разрыва регрессии требует, чтобы все потенциально значимые переменные, кроме переменной лечения и переменной результата, были непрерывными в точке, где происходят разрывы лечения и результата. Одного достаточно, хотя и не обязательно, [10] условием является то, что назначение лечения является «почти случайным» на пороге лечения. [9] Если это так, то это гарантирует, что те, кто едва получил лечение, сравнимы с теми, кто едва получил лечение, поскольку статус лечения фактически случайен.
Назначение лечения на пороге может быть «почти случайным», если в переменной назначения присутствует случайность и рассматриваемые агенты (отдельные лица, фирмы и т. д.) не могут идеально манипулировать своим статусом лечения. Например, предположим, что лечение представляет собой сдачу экзамена, где требуется оценка 50%. В данном случае этот пример является допустимой моделью разрыва регрессии, поскольку оценки в некоторой степени случайны, либо из-за случайности оценок, либо из-за случайности успеваемости учащихся.
Студенты также не должны иметь возможность манипулировать своей оценкой, чтобы точно определить статус своего лечения. Два примера включают в себя способность студентов убедить учителей «сдать их из милосердия» или разрешение студентам пересдавать экзамен до тех пор, пока они не сдадут экзамен. В первом случае те студенты, которые едва терпят неудачу, но могут получить «пропуск милосердия», могут отличаться от тех студентов, которые едва терпят неудачу, но не могут получить «пропуск милосердия». Это приводит к систематической ошибке отбора , поскольку теперь экспериментальная и контрольная группы различаются. В последнем случае некоторые студенты могут решить пересдать экзамен, остановившись после его успешной сдачи. Это также приводит к предвзятости отбора , поскольку только некоторые студенты решатся пересдать экзамен. [4]
Проверка обоснованности предположений [ править ]
Невозможно окончательно проверить валидность, если агенты способны точно определить статус своего лечения. Однако некоторые тесты могут предоставить доказательства, которые либо подтверждают, либо опровергают достоверность модели разрыва регрессии.
Тест на плотность [ править ]

МакКрари (2008) предложил изучить плотность наблюдений переменной назначения. [12] Предположим, что существует разрыв плотности переменной назначения на пороге лечения. В данном случае это может свидетельствовать о том, что некоторые агенты могли идеально манипулировать своим статусом лечения.
Например, если несколько студентов смогут получить «пропуск милосердия», то студентов, едва сдавших экзамен, будет больше, чем студентов, едва проваливших экзамен. Аналогично, если студентам разрешить пересдавать экзамен до тех пор, пока они не сдадут его, то результат будет аналогичным. В обоих случаях это, скорее всего, проявится при проверке плотности оценок на экзаменах. Подобная «игра с системой» может привести к искажению оценки эффекта лечения.
Непрерывность наблюдаемых переменных
Поскольку достоверность модели разрыва регрессии зависит от того, что те, кого почти не лечили, такие же, как и те, кого почти не лечили, имеет смысл проверить, одинаково ли эти группы основаны на наблюдаемых переменных. В предыдущем примере можно было проверить, отличаются ли характеристики тех, кто едва сдал экзамен, (демографические данные, семейный доход и т. д.) от тех, кто едва сдал экзамен. Хотя некоторые переменные могут различаться для двух групп в зависимости от случайности, большинство этих переменных должны быть одинаковыми. [13]
Фальсификационные тесты [ править ]
Предопределенные переменные [ править ]
Подобно непрерывности наблюдаемых переменных, можно было бы ожидать, что в момент прекращения лечения будет существовать непрерывность заранее определенных переменных. Поскольку эти переменные были определены до принятия решения о лечении, статус лечения не должен на них влиять. Рассмотрим предыдущий пример стипендии, основанной на заслугах. Если результатом интереса являются будущие оценки, то мы не ожидаем, что стипендия повлияет на предыдущие оценки. Если в момент прекращения лечения присутствует разрыв в заранее определенных переменных, то это ставит под сомнение обоснованность плана разрыва регрессии.
Другие нарушения [ править ]
Если разрывы присутствуют в других точках переменной назначения, где они не ожидаются, это может сделать подозрительным дизайн разрыва регрессии. Рассмотрим пример Карпентера и Добкина (2011), которые изучали влияние легального доступа к алкоголю в Соединенных Штатах. [8] Поскольку доступ к алкоголю увеличивается в возрасте 21 года, это приводит к изменениям в различных результатах, таких как уровень смертности и уровень заболеваемости. Если уровни смертности и заболеваемости также скачкообразно увеличиваются в других возрастах, то это ставит под сомнение интерпретацию разрыва в возрасте 21 года.
Включение и исключение ковариат [ править ]
Если оценки параметров чувствительны к удалению или добавлению ковариат в модель, это может поставить под сомнение достоверность модели разрыва регрессии. Существенные изменения могут свидетельствовать о том, что те, кто едва получил лечение, отличаются по этим ковариатам от тех, кто почти не получал лечения. Включение ковариат могло бы частично устранить эту предвзятость. Если присутствует большая степень систематической ошибки, и ковариаты объясняют значительную ее часть, то их включение или исключение значительно изменит оценку параметра. [4]
Недавняя работа показала, как добавлять ковариаты, при каких условиях это допустимо, а также потенциал повышения точности. [14]
Преимущества [ править ]
- При правильном применении и анализе RDD дает несмещенную оценку местного эффекта лечения. [15] RDD может быть почти таким же эффективным, как рандомизированный эксперимент по измерению эффекта лечения.
- RDD, как квазиэксперимент , не требует предварительной рандомизации и обходит этические проблемы случайного назначения .
- Хорошо проведенные исследования RDD могут дать оценки эффекта лечения, аналогичные оценкам рандомизированных исследований. [16]
Недостатки [ править ]
- Предполагаемые эффекты являются объективными только в том случае, если правильно смоделирована функциональная форма связи между лечением и результатом. Самыми популярными предостережениями являются нелинейные зависимости, которые ошибочно принимают за разрыв.
- Загрязнение другими методами лечения. Предположим, что другая обработка происходит при том же предельном значении той же переменной назначения. В этом случае измеренный разрыв в переменной результата может быть частично приписан этому другому лечению. Например, предположим, что исследователь хочет изучить влияние легального доступа к алкоголю на психическое здоровье, используя метод разрыва регрессии для минимального возраста, с которого разрешено употребление алкоголя. Измеряемое воздействие можно спутать с легальным доступом к азартным играм, который может возникнуть в том же возрасте.
Расширения [ править ]
Нечеткий СДР [ править ]
Идентификация причинных эффектов зависит от решающего предположения о том , что действительно существует резкая граница, вокруг которой существует разрыв в вероятности присвоения от 0 до 1. В действительности, однако, границы часто не соблюдаются строго (например, по усмотрению учащихся, которым не удалось преодолеть порог), и, следовательно, оценки будут необъективными .
В отличие от плана с резким разрывом регрессии, план с нечетким разрывом регрессии (FRDD) не требует резкого скачка вероятности назначения. Тем не менее, он применим до тех пор, пока вероятность назначения различна. Интуиция, лежащая в основе этого, связана со стратегией инструментальной переменной и намерением лечить . Нечеткий RDD не дает несмещенной оценки, когда интересующая величина является пропорциональным эффектом (например, эффективность вакцины ), но существуют расширения, которые это делают. [17]
Регрессионный кинковый дизайн [ править ]
Когда переменная назначения является непрерывной (например, помощь студентам) и предсказуемо зависит от другой наблюдаемой переменной (например, семейного дохода), можно определить эффекты лечения, используя резкие изменения наклона функции лечения. Этот метод был предложен регрессионный кинковый дизайн , хотя они ссылаются на аналогичные более ранние исследования. Нильсеном, Соренсеном и Табером (2010) как [18] Они пишут: «Этот подход напоминает идею разрыва регрессии. Вместо разрыва уровня функции стипендии-дохода мы имеем разрыв наклона функции». Строгие теоретические основы были предоставлены Card et al. (2012) [19] и эмпирическое применение Бокермана и др. (2018). [20]
Обратите внимание, что перегибы регрессии (или изогнутая регрессия ) также могут означать тип сегментированной регрессии , который представляет собой другой тип анализа.
Заключительные соображения
Дизайн РД имеет форму квазиэкспериментального исследования с четкой структурой, лишенной рандомизированных экспериментальных особенностей. Некоторые аспекты отрицают, что РД допускает сохранение статус-кво. Например, проекты часто затрагивают серьезные проблемы, не оставляющие места для случайных экспериментов. Кроме того, план экспериментов зависит от точности процесса моделирования и взаимосвязи между входными и выходными данными.
См. также [ править ]
Ссылки [ править ]
- ^ Тистлетвейт, Д.; Кэмпбелл, Д. (1960). «Регрессионно-разрывный анализ: альтернатива эксперименту постфактум» . Журнал педагогической психологии . 51 (6): 309–317. дои : 10.1037/h0044319 . S2CID 13668989 .
- ^ Имбенс, Г.; Лемье, Т. (2008). «Схемы регрессионного разрыва: практическое руководство» (PDF) . Журнал эконометрики . 142 (2): 615–635. doi : 10.1016/j.jeconom.2007.05.001 .
- ^ Чаплин, Дункан Д.; Кук, Томас Д.; Журовац, Елена; Куперсмит, Джаред С.; Финукейн, Мариэль М.; Воллмер, Лорен Н.; Моррис, Ребекка Э. (2018). «Внутренняя и внешняя достоверность модели разрыва регрессии: метаанализ 15 сравнений внутри исследования» . Журнал политического анализа и управления . 37 (2): 403–429. дои : 10.1002/pam.22051 . ISSN 1520-6688 .
- ^ Jump up to: Перейти обратно: а б с д Ли; Лемье (2010). «Регрессионные модели разрыва в экономике» . Журнал экономической литературы . 48 (2): 281–355. дои : 10.1257/jel.48.2.281 . S2CID 14166110 .
- ^ Вентилятор; Гейбельс (1996). Локальное полиномиальное моделирование и его приложения . Лондон: Чепмен и Холл. ISBN 978-0-412-98321-4 .
- ^ Портер (2003). «Оценка в модели разрыва регрессии» (PDF) . Неопубликованная рукопись .
- ^ Дюфло (2003). «Бабушки и внучки: пенсии по старости и внутридомохозяйства в Южной Африке». Экономический обзор Всемирного банка . 17 (1): 1–25. дои : 10.1093/wber/lhg013 . hdl : 10986/17173 .
- ^ Jump up to: Перейти обратно: а б Плотник; Добкин (2011). «Минимальный возраст употребления алкоголя и общественное здравоохранение» . Журнал экономических перспектив . 25 (2): 133–156. дои : 10.1257/jep.25.2.133 . JSTOR 23049457 . ПМЦ 3182479 . ПМИД 21595328 .
- ^ Jump up to: Перейти обратно: а б Ли (2008). «Рандомизированные эксперименты с неслучайным отбором на выборах в Палату представителей США». Журнал эконометрики . 142 (2): 675–697. CiteSeerX 10.1.1.409.5179 . doi : 10.1016/j.jeconom.2007.05.004 . S2CID 2293046 .
- ^ Jump up to: Перейти обратно: а б де ла Куэста, Б; Имаи, К. (2016). «Недоразумения относительно модели разрыва регрессии при изучении закрытых выборов» . Ежегодный обзор политической науки . 19 (1): 375–396. doi : 10.1146/annurev-polisci-032015-010115 .
- ^ Мосс, Б.Г.; Йитон, Вашингтон; Ллойд, Дж. Э. (2014). «Оценка эффективности развивающей математики путем внедрения рандомизированного эксперимента в модель разрыва регрессии». Оценка образования и анализ политики . 36 (2): 170–185. дои : 10.3102/0162373713504988 . S2CID 123440758 .
- ^ Jump up to: Перейти обратно: а б МакКрари (2008). «Манипулирование текущей переменной в регрессионном моделировании разрывов: тест на плотность». Журнал эконометрики . 142 (2): 698–714. CiteSeerX 10.1.1.395.6501 . doi : 10.1016/j.jeconom.2007.05.005 .
- ^ Jump up to: Перейти обратно: а б Ли; Моретти; Батлер (2004). «Влияют ли избиратели на политику или избирают ее? Свидетельства Палаты представителей США». Ежеквартальный экономический журнал . 119 (3): 807–859. дои : 10.1162/0033553041502153 .
- ^ Калонико; Каттанео; Фаррелл; Титюник (2018). «Схемы разрывов регрессии с использованием ковариат». arXiv : 1809.03904 [ econ.EM ].
- ^ Рубин (1977). «Назначение лечения на основании ковариаты». Журнал образовательной и поведенческой статистики . 2 (1): 1–26. дои : 10.3102/10769986002001001 . S2CID 123013161 .
- ^ Мосс, Б.Г.; Йитон, Вашингтон; Ллойд, Дж. Э. (2014). «Оценка эффективности развивающей математики путем внедрения рандомизированного эксперимента в модель разрыва регрессии». Оценка образования и анализ политики . 36 (2): 170–185. дои : 10.3102/0162373713504988 . S2CID 123440758 .
- ^ Мукерджи, Абхируп; Панайотов, Джордж; Сен, Рик; Дутта, Харша; Гош, Пулак (2022). «Измерение эффективности вакцин на основе ограниченных наборов данных общественного здравоохранения: структура и оценки второй волны COVID в Индии» . Достижения науки . 8 (18): eabn4274. Бибкод : 2022SciA....8N4274M . дои : 10.1126/sciadv.abn4274 . ПМЦ 9075799 . ПМИД 35522748 .
- ^ Нильсен, HS; Соренсен, Т.; Табер, ЧР (2010). «Оценка влияния помощи студентам на зачисление в колледж: данные реформы политики государственных грантов» . Американский экономический журнал: Экономическая политика . 2 (2): 185–215. дои : 10.1257/pol.2.2.185 . hdl : 10419/35588 . JSTOR 25760068 .
- ^ Кард, Дэвид; Ли, Дэвид С.; Пей, Чжуань; Вебер, Андреа (2012). «Правила нелинейной политики, идентификация и оценка причинных эффектов в модели обобщенной регрессии» . Рабочий документ NBER № W18564 . дои : 10.3386/w18564 . ССНН 2179402 .
- ^ Бокерман, Петри; Каннинен, Ото; Суониеми, Ильпо (2018). «Излом, от которого вас тошнит: влияние больничного на отсутствие» . Журнал прикладной эконометрики . 33 (4): 568–579. дои : 10.1002/jae.2620 .
Дальнейшее чтение [ править ]
- Ангрист, JD ; Пишке, Ж.-С. (2008). «Немного нервничаем: модели разрыва регрессии». В основном безобидная эконометрика: спутник эмпирика . Издательство Принстонского университета. стр. 251–268. ISBN 978-0-691-12035-5 .
- Каттанео, Матиас Д.; Титюник, Росио (2022). «Схемы разрывов регрессии» . Ежегодный обзор экономики . 14 : 821–851. doi : 10.1146/annurev- Economics-051520-021409 . S2CID 125763727 .
- Каттанео, Матиас Д.; Идробо, Николас; Титюник, Росио (2024). Практическое введение в модели регрессионного разрыва: расширения . Издательство Кембриджского университета.
- Кук, Томас Д. (2008). « В ожидании прихода жизни: история модели регрессии-разрыва в психологии, статистике и экономике». Журнал эконометрики . 142 (2): 636–654. doi : 10.1016/j.jeconom.2007.05.002 .
- Имбенс, Гвидо В.; Вулдридж, Джеффри М. (2009). «Последние достижения в эконометрике оценки программ» . Журнал экономической литературы . 47 (1): 5–86. дои : 10.1257/jel.47.1.5 .
- Маас, Ирис Л.; Нолте, Сандра; Уолтер, Отто Б.; Бергер, Томас; Хаутцингер, Мартин (2017). «Дизайн разрыва регрессии оказался действенной альтернативой рандомизированному контролируемому исследованию для оценки эффектов лечения». Журнал клинической эпидемиологии . 82 : 94–102. дои : 10.1016/j.jclinepi.2016.11.008 . ПМИД 27865902 .
Внешние ссылки [ править ]
- Регрессионно-разрывный анализ в базе знаний методов исследования