Jump to content

Разница в различиях

(Перенаправлено с «Разница в различиях »)

Разница в различиях ( DID [1] или ДД [2] ) — статистический метод, используемый в эконометрике и количественных исследованиях в социальных науках, который пытается имитировать план экспериментального исследования с использованием данных наблюдательного исследования , изучая дифференциальный эффект лечения на «группу лечения» по сравнению с « контрольной группой » в естественный эксперимент . [3] Он рассчитывает влияние лечения (т. е. объясняющей переменной или независимой переменной ) на результат (т. е. переменную ответа или зависимую переменную ) путем сравнения среднего изменения с течением времени конечной переменной для группы лечения со средним изменением. с течением времени для контрольной группы. Хотя он предназначен для смягчения воздействия внешних факторов и систематической ошибки отбора , в зависимости от того, как выбрана группа лечения, этот метод все равно может быть подвержен определенным систематическим ошибкам (например, регрессии среднего , обратной причинно-следственной связи и систематической ошибке опущенной переменной ).

В отличие от оценки временного ряда эффекта лечения на субъектов (которая анализирует различия во времени) или перекрестной оценки эффекта лечения (которая измеряет разницу между группами лечения и контрольной группой), разница в различиях использует панельные данные для измерить различия между группой лечения и контрольной группой в изменениях конечной переменной, которые происходят с течением времени.

Общее определение

[ редактировать ]

Для определения разницы в различиях необходимы данные, измеренные в группе лечения и контрольной группе в два или более разных периода времени, в частности, по меньшей мере, за один период времени до «лечения» и, по меньшей мере, за один период времени после «лечения». В изображенном примере результат в группе лечения представлен линией P, а результат в контрольной группе представлен линией S. Переменная результата (зависимая) в обеих группах измеряется в момент времени 1, до того, как какая-либо группа получил лечение (т.е. независимую или объясняющую переменную), представленную точками P 1 и S 1 . Затем группа лечения получает или испытывает лечение, и обе группы снова измеряются во время 2. Не все различия между группой лечения и контрольной группой во время 2 (то есть разница между P 2 и S 2 ) можно объяснить как является эффектом лечения, поскольку группа лечения и контрольная группа не начинали работу в один и тот же момент времени 1. Таким образом, DID вычисляет «нормальную» разницу в переменной результата между двумя группами (разница, которая все равно была бы существуют, если ни одна из групп не проходила лечение), представлена ​​пунктирной линией Вопрос . что наклон от P1 (Обратите внимание , к Q такой же, как и наклон от к S1 S2 . ) ) Эффект лечения — это разница между наблюдаемым результатом (P2 ) и «нормальным» результатом (разница между P2 и S2 . и В).

Формальное определение

[ редактировать ]

Рассмотрим модель

где является зависимой переменной для индивидуального и время , это группа, к которой принадлежит (т.е. к группе лечения или контрольной группе), и является сокращением фиктивной переменной, равной 1, когда событие, описанное в истинно, и 0 в противном случае. В сюжете время против по группе, является вертикальной точкой пересечения графика для , и — временной тренд, общий для обеих групп в соответствии с предположением о параллельном тренде (см. «Допущения» ниже). эффект лечения, и это остаточный срок .

Рассмотрим среднее значение зависимой переменной и фиктивных показателей по группам и времени:

и предположим для простоты, что и . Обратите внимание, что не является случайным; он просто кодирует то, как помечены группы и периоды. Затем

, что Тогда из предположения строгой экзогенности следует

Без ограничения общности предположим, что это группа лечения, и это период после, тогда и , давая оценку DID

который можно интерпретировать как лечебный эффект лечения, указанный . Ниже показано, как эту оценку можно рассматривать как коэффициент в обычной регрессии наименьших квадратов. Модель, описанная в этом разделе, чрезмерно параметризована; Чтобы исправить это, один из коэффициентов для фиктивных переменных можно установить равным 0, например, мы можем установить .

Предположения

[ редактировать ]
Иллюстрация предположения о параллельном тренде

Все предположения модели OLS в равной степени применимы и к DID. Кроме того, DID требует предположения о параллельном тренде . Предположение о параллельном тренде гласит, что одинаковы в обоих и . Учитывая, что приведенное выше формальное определение точно отражает реальность, это предположение автоматически выполняется. Однако модель с вполне может быть более реалистичным. Чтобы повысить вероятность подтверждения предположения о параллельном тренде, подход разницы в различиях часто сочетается с сопоставлением . [4] Это предполагает «сопоставление» известных «лечебных» единиц с смоделированными контрфактическими «контрольными» единицами: характерно эквивалентными единицами, которые не получали лечения. Определив переменную результата как временную разницу (изменение наблюдаемого результата между периодами до и после лечения) и сопоставив несколько единиц в большой выборке на основе аналогичных историй болезни до лечения, результирующее ATE (т. е. ATT: среднее значение лечения) Эффект для пролеченного) обеспечивает надежную оценку эффекта разницы в различиях. Это служит двум статистическим целям: во-первых, при условии наличия ковариат до начала лечения предположение о параллельных тенденциях, скорее всего, будет выполнено; и, во-вторых, этот подход уменьшает зависимость от связанных предположений о пренебрежении, необходимых для правильного вывода.

Как показано справа, эффект лечения — это разница между наблюдаемым значением y значение y и тем, каким было бы при параллельных тенденциях, если бы не было лечения. Ахиллесова пята ДРИ — это когда в одной группе одновременно с лечением меняется что-то, кроме лечения, но не меняется в другой, что подразумевает нарушение предположения о параллельной тенденции.

Чтобы гарантировать точность оценки DID, предполагается, что состав особей двух групп остается неизменным с течением времени. При использовании модели DID могут возникнуть различные проблемы, которые могут поставить под угрозу результаты, например автокорреляция. [5] и Ашенфельтерские провалы , необходимо учитывать и бороться с ними.

Выполнение

[ редактировать ]

Метод DID можно реализовать в соответствии с таблицей ниже, где нижняя правая ячейка представляет собой оценщик DID.

Разница
Изменять

Запуск регрессионного анализа дает тот же результат. Рассмотрим модель OLS

где – фиктивная переменная для периода, равная когда , и — фиктивная переменная для членства в группе, равная когда . Составная переменная — это фиктивная переменная, указывающая, когда . Хотя здесь это не показано строго, это правильная параметризация формального определения модели ; более того, оказывается, что средние значения группы и периода в этом разделе относятся к оценкам параметров модели следующим образом:

где обозначает условные средние значения, рассчитанные по выборке, например, – показатель для последующего периода, является показателем для контрольной группы. Обратите внимание, что является оценкой контрфактического, а не влияния контрольной группы. Контрольная группа часто используется в качестве замены контрфактического ( более см. в разделе «Метод синтетического контроля глубокое понимание этого вопроса »). Таким образом, можно интерпретировать как влияние как контрольной группы, так и контрфактического вмешательства (лечения). Сходным образом, , из-за предположения о параллельной тенденции, также является той же самой разницей между экспериментальной и контрольной группой в . Приведенные выше описания не следует истолковывать как предполагающие (средний) эффект только контрольной группы, поскольку или только разница между экспериментальной и контрольной группами в предпериодный период, для . Как и в случае с Кардом и Крюгером , ниже первая (временная) разница результирующей переменной устраняет необходимость во временном тренде (т.е. ) для формирования несмещенной оценки , подразумевая, что на самом деле не зависит от экспериментальной или контрольной группы. [6] Следовательно, разница между экспериментальной и контрольной группами устранит необходимость в дифференцированном лечении (т. е. ) для формирования несмещенной оценки . Этот нюанс важно понимать, когда пользователь считает, что существуют (слабые) нарушения параллельного пред-тренда, или в случае нарушения соответствующих допущений контрфактической аппроксимации, учитывая существование необычных потрясений или искажающих событий. Чтобы увидеть связь между этими обозначениями и предыдущим разделом, рассмотрим, как указано выше, только одно наблюдение за период времени для каждой группы, тогда

и так далее для других значений и , что эквивалентно

А ведь именно такое выражение эффекта лечения было дано в формальном определении и в приведенной выше таблице.

Статья Карда и , опубликованная в Крюгера о минимальной заработной плате в Нью-Джерси 1994 году, [6] считается одним из самых известных исследований DID; Позже Кард был удостоен Нобелевской премии по экономике 2021 года частично за эту и связанные с ней работы. Кард и Крюгер сравнили занятость в секторе быстрого питания в Нью-Джерси и Пенсильвании в феврале 1992 года и в ноябре 1992 года, после того как в апреле 1992 года минимальная заработная плата в Нью-Джерси выросла с 4,25 до 5,05 долларов. и после обработки не сможет контролировать пропущенные переменные, такие как погода и макроэкономические условия региона. Включив Пенсильванию в качестве контрольного показателя в модель «разница в различиях», можно неявно контролировать любые отклонения, вызванные переменными, общими для Нью-Джерси и Пенсильвании, даже если эти переменные не наблюдаются. Если предположить, что в Нью-Джерси и Пенсильвании наблюдаются параллельные тенденции с течением времени, изменение уровня занятости в Пенсильвании можно интерпретировать как изменение, которое произошло бы в Нью-Джерси, если бы они не увеличили минимальную заработную плату, и наоборот. Факты свидетельствуют о том, что повышение минимальной заработной платы не привело к снижению занятости в Нью-Джерси, вопреки тому, что предполагают некоторые экономические теории. В таблице ниже показаны оценки Card & Krueger влияния лечения на занятость, измеряемого как ЭПЗ (или эквиваленты полной занятости) . Кард и Крюгер подсчитали, что повышение минимальной заработной платы на 0,80 доллара в Нью-Джерси привело к увеличению занятости на 2,75 ЭПЗ.

Нью-Джерси Пенсильвания Разница
февраль 20.44 23.33 −2.89
ноябрь 21.03 21.17 −0.14
Изменять 0.59 −2.16 2.75

Программный пример применения этого исследования можно найти в Stata -diff-. команде [7] автор Хуан Мигель Вилья .

См. также

[ редактировать ]
  1. ^ Абади, А. (2005). «Полупараметрические оценки разностей». Обзор экономических исследований . 72 (1): 1–19. CiteSeerX   10.1.1.470.1475 . дои : 10.1111/0034-6527.00321 . S2CID   8801460 .
  2. ^ Бертран, М.; Дюфло, Э .; Муллайнатан, С. (2004). «Насколько нам следует доверять оценкам различий в различиях?» (PDF) . Ежеквартальный экономический журнал . 119 (1): 249–275. дои : 10.1162/003355304772839588 . S2CID   470667 .
  3. ^ Ангрист, JD; Пишке, Дж. С. (2008). В основном безобидная эконометрика: спутник эмпирика . Издательство Принстонского университета. стр. 227–243. ISBN  978-0-691-12034-8 .
  4. ^ Басу, Паллави; Смолл, Дилан (2020). «Построение более точно подобранной контрольной группы в анализе различий в различиях: его влияние на историю, взаимодействующую с групповой предвзятостью» . Наблюдательные исследования . 6 : 103–130. дои : 10.1353/obs.2020.0011 . S2CID   221702893 .
  5. ^ Бертран, Марианна; Дюфло, Эстер; Муллайнатан, Сендхил (2004). «Насколько нам следует доверять оценкам различий в различиях?» (PDF) . Ежеквартальный экономический журнал . 119 (1): 249–275. дои : 10.1162/003355304772839588 . S2CID   470667 .
  6. ^ Jump up to: а б Кард, Дэвид; Крюгер, Алан Б. (1994). «Минимальная заработная плата и занятость: пример индустрии быстрого питания в Нью-Джерси и Пенсильвании». Американский экономический обзор . 84 (4): 772–793. JSTOR   2118030 .
  7. ^ Вилла, Хуан М. (2016). «diff: Упрощение оценки эффектов лечения «разница в различиях»» . Стата-журнал . 16 (1): 52–71. дои : 10.1177/1536867X1601600108 . S2CID   124464636 .

Дальнейшее чтение

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 45ac2133db3ce321ac9ccf73407bc976__1720986360
URL1:https://arc.ask3.ru/arc/aa/45/76/45ac2133db3ce321ac9ccf73407bc976.html
Заголовок, (Title) документа по адресу, URL1:
Difference in differences - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)