Модель с фиксированными эффектами

В статистике модель с фиксированными эффектами — это статистическая модель модели , в которой параметрами являются фиксированные или неслучайные величины. В этом отличие от моделей случайных эффектов и смешанных моделей , в которых все или некоторые параметры модели являются случайными величинами. Во многих приложениях, включая эконометрику ^[1] и биостатистика ^[2]^[3]^[4]^[5]^[6] Модель с фиксированными эффектами относится к модели регрессии , в которой групповые средние фиксированы (неслучайны), в отличие от модели со случайными эффектами, в которой групповые средние представляют собой случайную выборку из совокупности. ^[7]^[6] Как правило, данные можно сгруппировать по нескольким наблюдаемым факторам. Групповые средние значения могут быть смоделированы как фиксированные или случайные эффекты для каждой группы. В модели с фиксированными эффектами каждое среднее значение группы представляет собой фиксированную величину, специфичную для группы.

В панельных данных , где существуют продольные наблюдения за одним и тем же субъектом, фиксированные эффекты представляют собой средства, специфичные для субъекта. В панельном анализе данных термин «оценщик фиксированных эффектов» (также известный как « внутренняя оценка ») используется для обозначения оценки коэффициентов средства в регрессионной модели, включая эти фиксированные эффекты (один не зависящий от времени перехват для каждого субъекта).

Качественное описание

Такие модели помогают контролировать систематическую ошибку пропущенных переменных из-за ненаблюдаемой гетерогенности, когда эта гетерогенность постоянна во времени. Эту неоднородность можно устранить из данных путем дифференцирования, например, путем вычитания среднего значения на уровне группы за определенный период времени или путем взятия первой разницы , которая удалит любые нестационарные компоненты модели.

Существует два общих предположения об индивидуальном специфическом эффекте: предположение о случайных эффектах и предположение о фиксированных эффектах. Допущение о случайных эффектах заключается в том, что индивидуальные эффекты не коррелируют с независимыми переменными. Допущение о фиксированном эффекте заключается в том, что индивидуальные эффекты коррелируют с независимыми переменными. Если предположение о случайных эффектах справедливо, то оценщик случайных эффектов более эффективен, чем оценщик фиксированных эффектов. Однако, если это предположение не выполняется, оценка случайных эффектов не является состоятельной . Тест Дурбина-Ву-Хаусмана часто используется для различения моделей с фиксированными и случайными эффектами. ^[8]^[9]

Формальная модель и предположения

Рассмотрим модель линейных ненаблюдаемых эффектов для $N$ наблюдения и $T$ периоды времени:

y_{it}=X_{it}\mathbf {\beta } +\alpha _{i}+u_{it}

для

t=1,\dots ,T

и

i=1,\dots ,N

Где:

$y_{it}$ является зависимой переменной, наблюдаемой для отдельных $i$ во время $t$ .
$X_{it}$ является временным вариантом $1\times k$ (количество независимых переменных) вектор-регрессор.
$\beta$ это $k\times 1$ матрица параметров.
$\alpha _{i}$ – это ненаблюдаемый, не зависящий от времени индивидуальный эффект. Например, врожденные способности отдельных лиц или исторические и институциональные факторы для стран.
$u_{it}$ это термин ошибки .

В отличие от $X_{it}$ , $\alpha _{i}$ невозможно наблюдать непосредственно.

В отличие от модели случайных эффектов , где ненаблюдаемые $\alpha _{i}$ не зависит от $X_{it}$ для всех $t=1,...,T$ , модель с фиксированными эффектами (FE) позволяет $\alpha _{i}$ быть коррелированным с матрицей регрессора $X_{it}$ . Строгая экзогенность по отношению к идиосинкразической ошибке. $u_{it}$ все еще требуется.

Статистическая оценка

Оценщик фиксированных эффектов

С $\alpha _{i}$ не наблюдаемо, его нельзя напрямую контролировать . Модель FE исключает $\alpha _{i}$ путем обесценивания переменных с помощью внутреннего преобразования:

y_{it}-{\overline {y}}_{i}=\left(X_{it}-{\overline {X}}_{i}\right)\beta +\left(\alpha _{i}-{\overline {\alpha }}_{i}\right)+\left(u_{it}-{\overline {u}}_{i}\right)\implies {\ddot {y}}_{it}={\ddot {X}}_{it}\beta +{\ddot {u}}_{it}

где ${\overline {y}}_{i}={\frac {1}{T}}\sum \limits _{t=1}^{T}y_{it}$ , ${\overline {X}}_{i}={\frac {1}{T}}\sum \limits _{t=1}^{T}X_{it}$ , и ${\overline {u}}_{i}={\frac {1}{T}}\sum \limits _{t=1}^{T}u_{it}$ .

С $\alpha _{i}$ является постоянным, ${\overline {\alpha _{i}}}=\alpha _{i}$ и, следовательно, эффект устраняется. Оценщик FE ${\hat {\beta }}_{FE}$ затем получается с помощью регрессии МНК ${\ddot {y}}$ на ${\ddot {X}}$ .

Существуют по крайней мере три альтернативы внутренней трансформации с вариациями.

Один из них — добавить фиктивную переменную для каждого отдельного $i>1$ (первый экземпляр опускаем из-за мультиколлинеарности ). Это численно, но не вычислительно, эквивалентно модели с фиксированным эффектом и работает только в том случае, если сумма количества рядов и количества глобальных параметров меньше количества наблюдений. ^[10] Подход с фиктивными переменными особенно требователен к использованию памяти компьютера и не рекомендуется для задач, размер которых превышает объем доступной оперативной памяти и компиляцию прикладной программы.

Вторая альтернатива — использовать подход последовательных повторений для локальных и глобальных оценок. ^[11] Этот подход очень подходит для систем с небольшим объемом памяти, в которых он гораздо более эффективен в вычислительном отношении, чем подход с фиктивными переменными.

Третий подход представляет собой вложенную оценку, при которой локальная оценка для отдельных рядов программируется как часть определения модели. ^[12] Этот подход наиболее эффективен с точки зрения вычислений и памяти, но требует хороших навыков программирования и доступа к программному коду модели; хотя, его можно запрограммировать в том числе и в SAS. ^[13]^[14]

Наконец, каждая из вышеперечисленных альтернатив может быть улучшена, если оценка для конкретного ряда является линейной (в рамках нелинейной модели), и в этом случае прямое линейное решение для отдельных рядов может быть запрограммировано как часть определения нелинейной модели. ^[15]

Первая оценка разницы

Альтернативой внутреннему преобразованию является первое разностное преобразование, которое дает другую оценку. Для $t=2,\dots ,T$ :

y_{it}-y_{i,t-1}=\left(X_{it}-X_{i,t-1}\right)\beta +\left(\alpha _{i}-\alpha _{i}\right)+\left(u_{it}-u_{i,t-1}\right)\implies \Delta y_{it}=\Delta X_{it}\beta +\Delta u_{it}.

Оценщик FD ${\hat {\beta }}_{FD}$ затем получается с помощью регрессии МНК $\Delta y_{it}$ на $\Delta X_{it}$ .

Когда $T=2$ , первая разность и оценки фиксированных эффектов численно эквивалентны. Для $T>2$ , это не так. Если условия ошибки $u_{it}$ гомоскедастичны и не имеют серийной корреляции , оценка фиксированных эффектов более эффективна , чем первая оценка разности. Если $u_{it}$ следует за случайным блужданием , однако первая оценка разности более эффективна. ^[16]

Равенство фиксированных эффектов и оценок первой разности при T = 2

Для особого случая двух периодов ( $T=2$ ), оценка фиксированных эффектов (FE) и оценка первой разности (FD) численно эквивалентны. Это связано с тем, что оценщик FE эффективно «удваивает набор данных», используемый в оценщике FD. Чтобы убедиться в этом, установите, что оценщик фиксированных эффектов имеет вид: ${FE}_{T=2}=\left[(x_{i1}-{\bar {x}}_{i})(x_{i1}-{\bar {x}}_{i})'+(x_{i2}-{\bar {x}}_{i})(x_{i2}-{\bar {x}}_{i})'\right]^{-1}\left[(x_{i1}-{\bar {x}}_{i})(y_{i1}-{\bar {y}}_{i})+(x_{i2}-{\bar {x}}_{i})(y_{i2}-{\bar {y}}_{i})\right]$

Поскольку каждый $(x_{i1}-{\bar {x}}_{i})$ можно переписать как $(x_{i1}-{\dfrac {x_{i1}+x_{i2}}{2}})={\dfrac {x_{i1}-x_{i2}}{2}}$ , мы перепишем строку так:

${FE}_{T=2}=\left[\sum _{i=1}^{N}{\dfrac {x_{i1}-x_{i2}}{2}}{\dfrac {x_{i1}-x_{i2}}{2}}'+{\dfrac {x_{i2}-x_{i1}}{2}}{\dfrac {x_{i2}-x_{i1}}{2}}'\right]^{-1}\left[\sum _{i=1}^{N}{\dfrac {x_{i1}-x_{i2}}{2}}{\dfrac {y_{i1}-y_{i2}}{2}}+{\dfrac {x_{i2}-x_{i1}}{2}}{\dfrac {y_{i2}-y_{i1}}{2}}\right]$

=\left[\sum _{i=1}^{N}2{\dfrac {x_{i2}-x_{i1}}{2}}{\dfrac {x_{i2}-x_{i1}}{2}}'\right]^{-1}\left[\sum _{i=1}^{N}2{\dfrac {x_{i2}-x_{i1}}{2}}{\dfrac {y_{i2}-y_{i1}}{2}}\right]

=2\left[\sum _{i=1}^{N}(x_{i2}-x_{i1})(x_{i2}-x_{i1})'\right]^{-1}\left[\sum _{i=1}^{N}{\frac {1}{2}}(x_{i2}-x_{i1})(y_{i2}-y_{i1})\right]

=\left[\sum _{i=1}^{N}(x_{i2}-x_{i1})(x_{i2}-x_{i1})'\right]^{-1}\sum _{i=1}^{N}(x_{i2}-x_{i1})(y_{i2}-y_{i1})={FD}_{T=2}

Метод Чемберлена

Метод Гэри Чемберлена , являющийся обобщением внутренней оценки, заменяет $\alpha _{i}$ с его линейной проекцией на объясняющие переменные. Записав линейную проекцию как:

\alpha _{i}=\lambda _{0}+X_{i1}\lambda _{1}+X_{i2}\lambda _{2}+\dots +X_{iT}\lambda _{T}+e_{i}

это приводит к следующему уравнению:

y_{it}=\lambda _{0}+X_{i1}\lambda _{1}+X_{i2}\lambda _{2}+\dots +X_{it}(\lambda _{t}+\mathbf {\beta } )+\dots +X_{iT}\lambda _{T}+e_{i}+u_{it}

которое можно оценить с помощью оценки минимального расстояния . ^[17]

Метод Хаусмана – Тейлора

Необходимо иметь более одного изменяющегося во времени регрессора ( $X$ ) и инвариантен ко временирегрессор ( $Z$ ) и хотя бы один $X$ и один $Z$ которые не коррелируют с $\alpha _{i}$ .

Разделите $X$ и $Z$ переменные такие, что ${\begin{array}{c}X=[{\underset {TN\times K1}{X_{1it}}}\vdots {\underset {TN\times K2}{X_{2it}}}]\\Z=[{\underset {TN\times G1}{Z_{1it}}}\vdots {\underset {TN\times G2}{Z_{2it}}}]\end{array}}$ где $X_{1}$ и $Z_{1}$ не коррелируют с $\alpha _{i}$ . Нуждаться $K1>G2$ .

Оценка $\gamma$ через OLS на ${\widehat {di}}=Z_{i}\gamma +\varphi _{it}$ с использованием $X_{1}$ и $Z_{1}$ в качестве инструментов дает последовательную оценку.

Обобщение с входной неопределенностью

Когда существует входная неопределенность для $y$ данные, $\delta y$ , тогда $\chi ^{2}$ значение, а не сумму квадратов остатков, должно быть минимизировано. ^[18] Этого можно добиться непосредственно с помощью правил замены:

{\frac {y_{it}}{\delta y_{it}}}=\mathbf {\beta } {\frac {X_{it}}{\delta y_{it}}}+\alpha _{i}{\frac {1}{\delta y_{it}}}+{\frac {u_{it}}{\delta y_{it}}}

,

затем значения и стандартные отклонения для $\mathbf {\beta }$ и $\alpha _{i}$ может быть определена с помощью классического обычного анализа наименьших квадратов и дисперсионно-ковариационной матрицы .

Используйте для проверки согласованности

Оценщики случайных эффектов иногда могут быть непоследовательными в пределах длинных временных рядов, если случайные эффекты определены неправильно (т. е. модель, выбранная для случайных эффектов, неверна). Однако в некоторых ситуациях модель фиксированных эффектов может оставаться последовательной. Например, если моделируемый временной ряд не является стационарным, модели случайных эффектов, предполагающие стационарность, могут быть несогласованными в пределе длинных рядов. Одним из примеров этого является восходящий тренд временного ряда. Затем, по мере того как ряд становится длиннее, модель пересматривает оценки среднего значения более ранних периодов в сторону увеличения, давая все более и более смещенные прогнозы коэффициентов. Однако модель с фиксированными временными эффектами не объединяет информацию во времени, и в результате более ранние оценки не будут затронуты.

В подобных ситуациях, когда известно, что модель фиксированных эффектов непротиворечива, тест Дурбина-Ву-Хаусмана, можно использовать чтобы проверить, является ли выбранная модель случайных эффектов непротиворечивой. Если $H_{0}$ правда, оба ${\widehat {\beta }}_{RE}$ и ${\widehat {\beta }}_{FE}$ последовательны, но только ${\widehat {\beta }}_{RE}$ эффективен. Если $H_{a}$ верна последовательность ${\widehat {\beta }}_{RE}$ не может быть гарантировано.

См. также

Модель Пуассона с фиксированным эффектом

Примечания

^ Грин, WH, 2011. Эконометрический анализ , 7-е изд., Prentice Hall.
^ Диггл, Питер Дж.; Хигерти, Патрик; Лян, Кунг-Йи; Зегер, Скотт Л. (2002). Анализ продольных данных (2-е изд.). Издательство Оксфордского университета. стр. 169–171. ISBN 0-19-852484-6 .
^ Фицморис, Гаррет М.; Лэрд, Нэн М.; Уэр, Джеймс Х. (2004). Прикладной продольный анализ . Хобокен: Джон Уайли и сыновья. стр. 326–328. ISBN 0-471-21487-6 .
^ Лэрд, Нэн М.; Уэр, Джеймс Х. (1982). «Модели случайных эффектов для продольных данных». Биометрия . 38 (4): 963–974. дои : 10.2307/2529876 . JSTOR 2529876 .
^ Гардинер, Джозеф К.; Ло, Чжэхуэй; Роман, Ли Энн (2009). «Фиксированные эффекты, случайные эффекты и GEE: в чем различия?». Статистика в медицине . 28 (2): 221–239. дои : 10.1002/сим.3478 . ПМИД 19012297 . S2CID 16277040 .
^ Jump up to: ^а ^б Гомес, Дилан Дж. Э. (20 января 2022 г.). «Должен ли я использовать фиксированные эффекты или случайные эффекты, если у меня менее пяти уровней группирующего фактора в модели со смешанными эффектами?» . ПерДж . 10 : е12794. дои : 10.7717/peerj.12794 . ПМЦ 8784019 . ПМИД 35116198 .
^ Рэмси Ф., Шафер Д., 2002. Статистический сыщик: курс методов анализа данных , 2-е изд. Даксбери Пресс
^ Кэмерон, А. Колин; Триведи, Правин К. (2005). Микроэконометрика: методы и приложения . Издательство Кембриджского университета. стр. 717–19. ISBN 9780521848053 .
^ Нерлав, Марк (2005). Очерки по эконометрике панельных данных . Издательство Кембриджского университета. стр. 36–39. ISBN 9780521022460 .
^ Гарсия, Оскар. (1983). «Модель стохастического дифференциального уравнения для роста древостоев по высоте». Биометрия . 39 (4): 1059–1072. дои : 10.2307/2531339 . JSTOR 2531339 .
^ Тейт, Дэвид; Чешевски, Крис Дж.; Белла, Имре Э. (1986). «Динамика стенда сосны ложной». Может. Дж. Для. Рез . 18 (10): 1255–1260. дои : 10.1139/x88-193 .
^ Струб, Майк; Чешевски, Крис Дж. (2006). «Свойства инвариантности базового возраста двух методов оценки параметров моделей индекса сайта». Лесная наука . 52 (2): 182–186.
^ Струб, Майк; Чешевски, Крис Дж. (2003). «Подбор параметров глобального индекса участка, когда индекс участка или участка дерева рассматривается как параметр локальной помехи. В: Беркхарт Х.А., редактор. Материалы симпозиума по статистике и информационным технологиям в лесном хозяйстве; 8–12 сентября 2002 г.; Блэксбург, Вирджиния: Политехнический институт Вирджинии. Институт и государственный университет»: 97–107. {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )
^ Чешевски, Крис Дж.; Харрисон, Майк; Мартин, Стейси В. (2000). «Практические методы оценки несмещенных параметров в самоссылающихся моделях роста и урожайности» (PDF) . Технический отчет PMRC . 2000 (7): 12.
^ Шнуте, Джон; Маккиннелл, Скип (1984). «Биологически значимый подход к анализу поверхности отклика». Может. Дж. Фиш. Акват. Наука . 41 (6): 936–953. дои : 10.1139/f84-108 .
^ Вулдридж, Джеффри М. (2001). Эконометрический анализ перекрестных и панельных данных . МТИ Пресс. стр. 279–291 . ISBN 978-0-262-23219-7 .
^ Чемберлен, Гэри (1984). Глава 22 Панельные данные . Справочник по эконометрике. Том. 2. С. 1247–1318. дои : 10.1016/S1573-4412(84)02014-6 . ISBN 9780444861863 . ISSN 1573-4412 .
^ Рен, Бин; Донг, Руобинг; Эспозито, Томас М.; Пуэйо, Лоран; Дебес, Джон Х.; Потит, Чарльз А.; Шоке, Элоди; Бенисти, Мириам; Чан, Юджин; Грейди, Кэрол А.; Хайнс, Дин С.; Шнайдер, Гленн; Лето, Реми (2018). «Десятилетие изображений дисков MWC 758: где находятся планеты, движущиеся по спиральным рукавам?» . Письма астрофизического журнала . 857 (1): Л9. arXiv : 1803.06776 . Бибкод : 2018ApJ...857L...9R . дои : 10.3847/2041-8213/aab7f5 . S2CID 59427417 .

Ссылки

Кристенсен, Рональд (2002). Плоские ответы на сложные вопросы: теория линейных моделей (Третье изд.). Нью-Йорк: Спрингер. ISBN 0-387-95361-2 .
Гуджарати, Дамодар Н.; Портер, Дон К. (2009). «Модели регрессии панельных данных». Базовая эконометрика (Пятое международное изд.). Бостон: МакГроу-Хилл. стр. 591–616. ISBN 978-007-127625-2 .
Сяо, Ченг (2003). «Модели с фиксированными эффектами» . Анализ панельных данных (2-е изд.). Нью-Йорк: Издательство Кембриджского университета. стр. 95–103. ISBN 0-521-52271-4 .
Вулдридж, Джеффри М. (2013). «Оценка фиксированных эффектов». Вводная эконометрика: современный подход (Пятое международное изд.). Мейсон, Огайо: Юго-Запад. стр. 466–474. ISBN 978-1-111-53439-4 .

Внешние ссылки

[1] Грин, WH, 2011. Эконометрический анализ , 7-е изд., Prentice Hall.

[2] Диггл, Питер Дж.; Хигерти, Патрик; Лян, Кунг-Йи; Зегер, Скотт Л. (2002). Анализ продольных данных (2-е изд.). Издательство Оксфордского университета. стр. 169–171. ISBN 0-19-852484-6 .

[3] Фицморис, Гаррет М.; Лэрд, Нэн М.; Уэр, Джеймс Х. (2004). Прикладной продольный анализ . Хобокен: Джон Уайли и сыновья. стр. 326–328. ISBN 0-471-21487-6 .

[4] Лэрд, Нэн М.; Уэр, Джеймс Х. (1982). «Модели случайных эффектов для продольных данных». Биометрия . 38 (4): 963–974. дои : 10.2307/2529876 . JSTOR 2529876 .

[5] Гардинер, Джозеф К.; Ло, Чжэхуэй; Роман, Ли Энн (2009). «Фиксированные эффекты, случайные эффекты и GEE: в чем различия?». Статистика в медицине . 28 (2): 221–239. дои : 10.1002/сим.3478 . ПМИД 19012297 . S2CID 16277040 .

[Gomes2022-6] Jump up to: ^а ^б Гомес, Дилан Дж. Э. (20 января 2022 г.). «Должен ли я использовать фиксированные эффекты или случайные эффекты, если у меня менее пяти уровней группирующего фактора в модели со смешанными эффектами?» . ПерДж . 10 : е12794. дои : 10.7717/peerj.12794 . ПМЦ 8784019 . ПМИД 35116198 .

[7] Рэмси Ф., Шафер Д., 2002. Статистический сыщик: курс методов анализа данных , 2-е изд. Даксбери Пресс

[8] Кэмерон, А. Колин; Триведи, Правин К. (2005). Микроэконометрика: методы и приложения . Издательство Кембриджского университета. стр. 717–19. ISBN 9780521848053 .

[9] Нерлав, Марк (2005). Очерки по эконометрике панельных данных . Издательство Кембриджского университета. стр. 36–39. ISBN 9780521022460 .

[10] Гарсия, Оскар. (1983). «Модель стохастического дифференциального уравнения для роста древостоев по высоте». Биометрия . 39 (4): 1059–1072. дои : 10.2307/2531339 . JSTOR 2531339 .

[11] Тейт, Дэвид; Чешевски, Крис Дж.; Белла, Имре Э. (1986). «Динамика стенда сосны ложной». Может. Дж. Для. Рез . 18 (10): 1255–1260. дои : 10.1139/x88-193 .

[12] Струб, Майк; Чешевски, Крис Дж. (2006). «Свойства инвариантности базового возраста двух методов оценки параметров моделей индекса сайта». Лесная наука . 52 (2): 182–186.

[13] Струб, Майк; Чешевски, Крис Дж. (2003). «Подбор параметров глобального индекса участка, когда индекс участка или участка дерева рассматривается как параметр локальной помехи. В: Беркхарт Х.А., редактор. Материалы симпозиума по статистике и информационным технологиям в лесном хозяйстве; 8–12 сентября 2002 г.; Блэксбург, Вирджиния: Политехнический институт Вирджинии. Институт и государственный университет»: 97–107. {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )

[14] Чешевски, Крис Дж.; Харрисон, Майк; Мартин, Стейси В. (2000). «Практические методы оценки несмещенных параметров в самоссылающихся моделях роста и урожайности» (PDF) . Технический отчет PMRC . 2000 (7): 12.

[15] Шнуте, Джон; Маккиннелл, Скип (1984). «Биологически значимый подход к анализу поверхности отклика». Может. Дж. Фиш. Акват. Наука . 41 (6): 936–953. дои : 10.1139/f84-108 .

[16] Вулдридж, Джеффри М. (2001). Эконометрический анализ перекрестных и панельных данных . МТИ Пресс. стр. 279–291 . ISBN 978-0-262-23219-7 .

[Chamberlain1984-17] Чемберлен, Гэри (1984). Глава 22 Панельные данные . Справочник по эконометрике. Том. 2. С. 1247–1318. дои : 10.1016/S1573-4412(84)02014-6 . ISBN 9780444861863 . ISSN 1573-4412 .

[ren18-18] Рен, Бин; Донг, Руобинг; Эспозито, Томас М.; Пуэйо, Лоран; Дебес, Джон Х.; Потит, Чарльз А.; Шоке, Элоди; Бенисти, Мириам; Чан, Юджин; Грейди, Кэрол А.; Хайнс, Дин С.; Шнайдер, Гленн; Лето, Реми (2018). «Десятилетие изображений дисков MWC 758: где находятся планеты, движущиеся по спиральным рукавам?» . Письма астрофизического журнала . 857 (1): Л9. arXiv : 1803.06776 . Бибкод : 2018ApJ...857L...9R . дои : 10.3847/2041-8213/aab7f5 . S2CID 59427417 .

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]