Разница в различиях
Разница в различиях ( DID [1] или ДД [2] ) — статистический метод, используемый в эконометрике и количественных исследованиях в социальных науках, который пытается имитировать план экспериментального исследования с использованием данных наблюдательного исследования , изучая дифференциальный эффект лечения на «группу лечения» по сравнению с « контрольной группой » в естественный эксперимент . [3] Он рассчитывает влияние лечения (т. е. объясняющей переменной или независимой переменной ) на результат (т. е. переменную ответа или зависимую переменную ) путем сравнения среднего изменения с течением времени конечной переменной для группы лечения со средним изменением. с течением времени для контрольной группы. Хотя он предназначен для смягчения воздействия внешних факторов и систематической ошибки отбора , в зависимости от того, как выбрана группа лечения, этот метод все равно может быть подвержен определенным систематическим ошибкам (например, регрессии среднего , обратной причинно-следственной связи и систематической ошибке опущенной переменной ).
В отличие от оценки временного ряда эффекта лечения на субъектов (которая анализирует различия во времени) или перекрестной оценки эффекта лечения (которая измеряет разницу между группами лечения и контрольной группой), разница в различиях использует панельные данные для измерить различия между группой лечения и контрольной группой в изменениях конечной переменной, которые происходят с течением времени.
Общее определение
[ редактировать ]Для определения разницы в различиях необходимы данные, измеренные в группе лечения и контрольной группе в два или более разных периода времени, в частности, по меньшей мере, за один период времени до «лечения» и, по меньшей мере, за один период времени после «лечения». В изображенном примере результат в группе лечения представлен линией P, а результат в контрольной группе представлен линией S. Переменная результата (зависимая) в обеих группах измеряется в момент времени 1, до того, как какая-либо группа получил лечение (т.е. независимую или объясняющую переменную), представленную точками P 1 и S 1 . Затем группа лечения получает или испытывает лечение, и обе группы снова измеряются во время 2. Не все различия между группой лечения и контрольной группой во время 2 (то есть разница между P 2 и S 2 ) можно объяснить как является эффектом лечения, поскольку группа лечения и контрольная группа не начинали работу в один и тот же момент времени 1. Таким образом, DID вычисляет «нормальную» разницу в переменной результата между двумя группами (разница, которая все равно была бы существуют, если ни одна из групп не проходила лечение), представлена пунктирной линией Вопрос . что наклон от P1 (Обратите внимание , к Q такой же, как и наклон от к S1 S2 . ) ) Эффект лечения — это разница между наблюдаемым результатом (P2 ) и «нормальным» результатом (разница между P2 и S2 . и В).
Формальное определение
[ редактировать ]Рассмотрим модель
где является зависимой переменной для индивидуального и время , это группа, к которой принадлежит (т.е. к группе лечения или контрольной группе), и является сокращением фиктивной переменной, равной 1, когда событие, описанное в истинно, и 0 в противном случае. В сюжете время против по группе, является вертикальной точкой пересечения графика для , и — временной тренд, общий для обеих групп в соответствии с предположением о параллельном тренде (см. «Допущения» ниже). эффект лечения, и это остаточный срок .
Рассмотрим среднее значение зависимой переменной и фиктивных показателей по группам и времени:
и предположим для простоты, что и . Обратите внимание, что не является случайным; он просто кодирует то, как помечены группы и периоды. Затем
, что Тогда из предположения строгой экзогенности следует
Без ограничения общности предположим, что это группа лечения, и это период после, тогда и , давая оценку DID
который можно интерпретировать как лечебный эффект лечения, указанный . Ниже показано, как эту оценку можно рассматривать как коэффициент в обычной регрессии наименьших квадратов. Модель, описанная в этом разделе, чрезмерно параметризована; Чтобы исправить это, один из коэффициентов для фиктивных переменных можно установить равным 0, например, мы можем установить .
Предположения
[ редактировать ]Все предположения модели OLS в равной степени применимы и к DID. Кроме того, DID требует предположения о параллельном тренде . Предположение о параллельном тренде гласит, что одинаковы в обоих и . Учитывая, что приведенное выше формальное определение точно отражает реальность, это предположение автоматически выполняется. Однако модель с вполне может быть более реалистичным. Чтобы повысить вероятность подтверждения предположения о параллельном тренде, подход разницы в различиях часто сочетается с сопоставлением . [4] Это предполагает «сопоставление» известных «лечебных» единиц с смоделированными контрфактическими «контрольными» единицами: характерно эквивалентными единицами, которые не получали лечения. Определив переменную результата как временную разницу (изменение наблюдаемого результата между периодами до и после лечения) и сопоставив несколько единиц в большой выборке на основе аналогичных историй болезни до лечения, результирующее ATE (т. е. ATT: среднее значение лечения) Эффект для пролеченного) обеспечивает надежную оценку эффекта разницы в различиях. Это служит двум статистическим целям: во-первых, при условии наличия ковариат до начала лечения предположение о параллельных тенденциях, скорее всего, будет выполнено; и, во-вторых, этот подход уменьшает зависимость от связанных предположений о пренебрежении, необходимых для правильного вывода.
Как показано справа, эффект лечения — это разница между наблюдаемым значением y значение y и тем, каким было бы при параллельных тенденциях, если бы не было лечения. Ахиллесова пята ДРИ — это когда в одной группе одновременно с лечением меняется что-то, кроме лечения, но не меняется в другой, что подразумевает нарушение предположения о параллельной тенденции.
Чтобы гарантировать точность оценки DID, предполагается, что состав особей двух групп остается неизменным с течением времени. При использовании модели DID могут возникнуть различные проблемы, которые могут поставить под угрозу результаты, например автокорреляция. [5] и Ашенфельтерские провалы , необходимо учитывать и бороться с ними.
Выполнение
[ редактировать ]Метод DID можно реализовать в соответствии с таблицей ниже, где нижняя правая ячейка представляет собой оценщик DID.
Разница | |||
---|---|---|---|
Изменять |
Запуск регрессионного анализа дает тот же результат. Рассмотрим модель OLS
где – фиктивная переменная для периода, равная когда , и — фиктивная переменная для членства в группе, равная когда . Составная переменная — это фиктивная переменная, указывающая, когда . Хотя здесь это не показано строго, это правильная параметризация формального определения модели ; более того, оказывается, что средние значения группы и периода в этом разделе относятся к оценкам параметров модели следующим образом:
где обозначает условные средние значения, рассчитанные по выборке, например, – показатель для последующего периода, является показателем для контрольной группы. Обратите внимание, что является оценкой контрфактического, а не влияния контрольной группы. Контрольная группа часто используется в качестве замены контрфактического ( более см. в разделе «Метод синтетического контроля глубокое понимание этого вопроса »). Таким образом, можно интерпретировать как влияние как контрольной группы, так и контрфактического вмешательства (лечения). Сходным образом, , из-за предположения о параллельной тенденции, также является той же самой разницей между экспериментальной и контрольной группой в . Приведенные выше описания не следует истолковывать как предполагающие (средний) эффект только контрольной группы, поскольку или только разница между экспериментальной и контрольной группами в предпериодный период, для . Как и в случае с Кардом и Крюгером , ниже первая (временная) разница результирующей переменной устраняет необходимость во временном тренде (т.е. ) для формирования несмещенной оценки , подразумевая, что на самом деле не зависит от экспериментальной или контрольной группы. [6] Следовательно, разница между экспериментальной и контрольной группами устранит необходимость в дифференцированном лечении (т. е. ) для формирования несмещенной оценки . Этот нюанс важно понимать, когда пользователь считает, что существуют (слабые) нарушения параллельного пред-тренда, или в случае нарушения соответствующих допущений контрфактической аппроксимации, учитывая существование необычных потрясений или искажающих событий. Чтобы увидеть связь между этими обозначениями и предыдущим разделом, рассмотрим, как указано выше, только одно наблюдение за период времени для каждой группы, тогда
и так далее для других значений и , что эквивалентно
А ведь именно такое выражение эффекта лечения было дано в формальном определении и в приведенной выше таблице.
Пример
[ редактировать ]Статья Карда и , опубликованная в Крюгера о минимальной заработной плате в Нью-Джерси 1994 году, [6] считается одним из самых известных исследований DID; Позже Кард был удостоен Нобелевской премии по экономике 2021 года частично за эту и связанные с ней работы. Кард и Крюгер сравнили занятость в секторе быстрого питания в Нью-Джерси и Пенсильвании в феврале 1992 года и в ноябре 1992 года, после того как в апреле 1992 года минимальная заработная плата в Нью-Джерси выросла с 4,25 до 5,05 долларов. и после обработки не сможет контролировать пропущенные переменные, такие как погода и макроэкономические условия региона. Включив Пенсильванию в качестве контрольного показателя в модель «разница в различиях», можно неявно контролировать любые отклонения, вызванные переменными, общими для Нью-Джерси и Пенсильвании, даже если эти переменные не наблюдаются. Если предположить, что в Нью-Джерси и Пенсильвании наблюдаются параллельные тенденции с течением времени, изменение уровня занятости в Пенсильвании можно интерпретировать как изменение, которое произошло бы в Нью-Джерси, если бы они не увеличили минимальную заработную плату, и наоборот. Факты свидетельствуют о том, что повышение минимальной заработной платы не привело к снижению занятости в Нью-Джерси, вопреки тому, что предполагают некоторые экономические теории. В таблице ниже показаны оценки Card & Krueger влияния лечения на занятость, измеряемого как ЭПЗ (или эквиваленты полной занятости) . Кард и Крюгер подсчитали, что повышение минимальной заработной платы на 0,80 доллара в Нью-Джерси привело к увеличению занятости на 2,75 ЭПЗ.
Нью-Джерси | Пенсильвания | Разница | |
---|---|---|---|
февраль | 20.44 | 23.33 | −2.89 |
ноябрь | 21.03 | 21.17 | −0.14 |
Изменять | 0.59 | −2.16 | 2.75 |
Программный пример применения этого исследования можно найти в Stata -diff-. команде [7] автор Хуан Мигель Вилья .
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Абади, А. (2005). «Полупараметрические оценки разностей». Обзор экономических исследований . 72 (1): 1–19. CiteSeerX 10.1.1.470.1475 . дои : 10.1111/0034-6527.00321 . S2CID 8801460 .
- ^ Бертран, М.; Дюфло, Э .; Муллайнатан, С. (2004). «Насколько нам следует доверять оценкам различий в различиях?» (PDF) . Ежеквартальный экономический журнал . 119 (1): 249–275. дои : 10.1162/003355304772839588 . S2CID 470667 .
- ^ Ангрист, JD; Пишке, Дж. С. (2008). В основном безобидная эконометрика: спутник эмпирика . Издательство Принстонского университета. стр. 227–243. ISBN 978-0-691-12034-8 .
- ^ Басу, Паллави; Смолл, Дилан (2020). «Построение более точно подобранной контрольной группы в анализе различий в различиях: его влияние на историю, взаимодействующую с групповой предвзятостью» . Наблюдательные исследования . 6 : 103–130. дои : 10.1353/obs.2020.0011 . S2CID 221702893 .
- ^ Бертран, Марианна; Дюфло, Эстер; Муллайнатан, Сендхил (2004). «Насколько нам следует доверять оценкам различий в различиях?» (PDF) . Ежеквартальный экономический журнал . 119 (1): 249–275. дои : 10.1162/003355304772839588 . S2CID 470667 .
- ^ Jump up to: а б Кард, Дэвид; Крюгер, Алан Б. (1994). «Минимальная заработная плата и занятость: пример индустрии быстрого питания в Нью-Джерси и Пенсильвании». Американский экономический обзор . 84 (4): 772–793. JSTOR 2118030 .
- ^ Вилла, Хуан М. (2016). «diff: Упрощение оценки эффектов лечения «разница в различиях»» . Стата-журнал . 16 (1): 52–71. дои : 10.1177/1536867X1601600108 . S2CID 124464636 .
Дальнейшее чтение
[ редактировать ]- Ангрист, JD; Пишке, Дж. С. (2008). В основном безобидная эконометрика: спутник эмпирика . Издательство Принстонского университета. стр. 227–243. ISBN 978-0-691-12034-8 .
- Кэмерон, Артур С.; Триведи, Правин К. (2005). Микроэконометрика: методы и приложения . Издательство Кембриджского университета. стр. 768–772. дои : 10.1017/CBO9780511811241 . ISBN 9780521848053 . S2CID 120313863 .
- Имбенс, Гвидо В.; Вулдридж, Джеффри М. (2009). «Последние достижения в эконометрике оценки программ» . Журнал экономической литературы . 47 (1): 5–86. дои : 10.1257/jel.47.1.5 .
- Бакиджа, Джон; Хейм, Брэдли (август 2008 г.). «Как благотворительные пожертвования влияют на стимулы и доходы? Динамические панельные оценки, учитывающие предсказуемые изменения в налогообложении» . Рабочий документ NBER № 14237 . дои : 10.3386/w14237 .
- Конли, Т.; Табер, К. (июль 2005 г.). «Вывод с «разницей в различиях» с небольшим количеством изменений политики» . Технический рабочий документ NBER № 312 . дои : 10.3386/t0312 .
Внешние ссылки
[ редактировать ]- Разница в оценке разницы , веб-сайт Healthcare Economist