Модель случайных эффектов

В статистике модель случайных эффектов , также называемая моделью компонентов дисперсии , представляет собой статистическую модель , в которой параметры модели являются случайными величинами . Это своего рода иерархическая линейная модель , которая предполагает, что анализируемые данные взяты из иерархии различных популяций, различия которых связаны с этой иерархией. Модель случайных эффектов является частным случаем смешанной модели .

Сравните это с определениями биостатистики : ^[1]^[2]^[3]^[4]^[5] поскольку специалисты по биостатистике используют «фиксированные» и «случайные» эффекты для обозначения среднестатистических и специфичных для субъекта эффектов соответственно (а там, где последние обычно считаются неизвестными, - латентных переменных ).

Качественное описание

Модели случайных эффектов помогают контролировать ненаблюдаемую неоднородность , когда неоднородность постоянна во времени и не коррелирует с независимыми переменными. Эту константу можно удалить из продольных данных путем дифференцирования, поскольку получение первой разницы приведет к удалению любых инвариантных во времени компонентов модели. ^[6]

В отношении индивидуального специфического эффекта можно сделать два общих предположения: предположение о случайных эффектах и предположение о фиксированных эффектах. Допущение о случайных эффектах заключается в том, что индивидуальная ненаблюдаемая неоднородность не коррелирует с независимыми переменными. Допущение о фиксированном эффекте заключается в том, что индивидуальный специфический эффект коррелирует с независимыми переменными. ^[6]

Если предположение о случайных эффектах справедливо, оценщик случайных эффектов более эффективен , чем модель с фиксированными эффектами.

Простой пример

Предположим, что m больших начальных школ выбираются случайным образом из тысяч в большой стране. Предположим также, что в каждой выбранной школе случайно выбираются n учеников одного возраста. Подсчитываются их баллы по стандартному тесту на профпригодность. Пусть Y _{ij —} балл j -го ученика i- й школы. Простой способ смоделировать эту переменную:

Y_{ij}=\mu +U_{i}+W_{ij},\,

где μ — средний балл теста для всей популяции. В этой модели U _i , специфичный для школы представляет собой случайный эффект : он измеряет разницу между средним баллом в школе i и средним баллом по всей стране. Член W _ij представляет собой индивидуально-специфический случайный эффект, т. е. отклонение балла j -го ученика от среднего по i -й школе.

Модель может быть дополнена путем включения дополнительных объясняющих переменных, которые будут отражать различия в баллах между различными группами. Например:

Y_{ij}=\mu +\beta _{1}\mathrm {Sex} _{ij}+\beta _{2}\mathrm {ParentsEduc} _{ij}+U_{i}+W_{ij},\,

где Sex _ij — двоичная фиктивная переменная , а ParentsEduc _ij записывает, скажем, средний уровень образования родителей ребенка. Это смешанная модель , а не модель чисто случайных эффектов, поскольку она вводит условия с фиксированными эффектами для полового образования и образования родителей.

Компоненты отклонения

Дисперсия Y _ij представляет собой сумму дисперсий τ ² и σ ² или U _i и Wi _ij соответственно.

Позволять

{\overline {Y}}_{i\bullet }={\frac {1}{n}}\sum _{j=1}^{n}Y_{ij}

быть средним не всех баллов i - й школы, а тех баллов i- й школы, которые включены в случайную выборку . Позволять

{\overline {Y}}_{\bullet \bullet }={\frac {1}{mn}}\sum _{i=1}^{m}\sum _{j=1}^{n}Y_{ij}

быть большим средним .

Позволять

SSW=\sum _{i=1}^{m}\sum _{j=1}^{n}(Y_{ij}-{\overline {Y}}_{i\bullet })^{2}\,

SSB=n\sum _{i=1}^{m}({\overline {Y}}_{i\bullet }-{\overline {Y}}_{\bullet \bullet })^{2}\,

быть соответственно суммой квадратов, обусловленной различиями внутри групп, и суммой квадратов, обусловленной различиями между группами. Тогда это можно будет показать ^{[ нужна ссылка ]} что

{\frac {1}{m(n-1)}}E(SSW)=\sigma ^{2}

и

{\frac {1}{(m-1)n}}E(SSB)={\frac {\sigma ^{2}}{n}}+\tau ^{2}.

Эти « ожидаемые средние квадраты » можно использовать в качестве основы для оценки «компонентов дисперсии» σ. ² и τ ².

σ ² Параметр также называют коэффициентом внутриклассовой корреляции .

Предельное правдоподобие

Для моделей случайных эффектов предельные вероятности . важны ^[7]

Приложения

Модели случайных эффектов, используемые на практике, включают Бюльмана модель страховых контрактов и модель Фэя-Эрриота, используемую для оценки малых территорий .

См. также

Дальнейшее чтение

Балтаги, Бади Х. (2008). Эконометрический анализ панельных данных (4-е изд.). Нью-Йорк, штат Нью-Йорк: Уайли. стр. 17–22. ISBN 978-0-470-51886-1 .
Сяо, Ченг (2003). Анализ панельных данных (2-е изд.). Нью-Йорк, штат Нью-Йорк: Издательство Кембриджского университета. стр. 73–92 . ISBN 0-521-52271-4 .
Вулдридж, Джеффри М. (2002). Эконометрический анализ перекрестных и панельных данных . Кембридж, Массачусетс: MIT Press. стр. 257–265 . ISBN 0-262-23219-7 .
Гомес, Дилан Дж. Э. (20 января 2022 г.). «Должен ли я использовать фиксированные эффекты или случайные эффекты, если у меня менее пяти уровней группирующего фактора в модели со смешанными эффектами?» . ПерДж . 10 : е12794. дои : 10.7717/peerj.12794 . ПМЦ 8784019 . ПМИД 35116198 .

Ссылки

^ Диггл, Питер Дж.; Хигерти, Патрик; Лян, Кунг-Йи; Зегер, Скотт Л. (2002). Анализ продольных данных (2-е изд.). Издательство Оксфордского университета. стр. 169–171 . ISBN 0-19-852484-6 .
^ Фицморис, Гаррет М.; Лэрд, Нэн М.; Уэр, Джеймс Х. (2004). Прикладной продольный анализ . Хобокен: Джон Уайли и сыновья. стр. 326–328. ISBN 0-471-21487-6 .
^ Лэрд, Нэн М.; Уэр, Джеймс Х. (1982). «Модели случайных эффектов для продольных данных». Биометрия . 38 (4): 963–974. дои : 10.2307/2529876 . JSTOR 2529876 . PMID 7168798 .
^ Гардинер, Джозеф К.; Ло, Чжэхуэй; Роман, Ли Энн (2009). «Фиксированные эффекты, случайные эффекты и GEE: в чем различия?». Статистика в медицине . 28 (2): 221–239. дои : 10.1002/сим.3478 . ПМИД 19012297 .
^ Гомес, Дилан Дж. Э. (20 января 2022 г.). «Должен ли я использовать фиксированные эффекты или случайные эффекты, если у меня менее пяти уровней группирующего фактора в модели со смешанными эффектами?» . ПерДж . 10 : е12794. дои : 10.7717/peerj.12794 . ПМЦ 8784019 . ПМИД 35116198 .
^ Перейти обратно: ^а ^б Вулдридж, Джеффри (2010). Эконометрический анализ поперечных и панельных данных (2-е изд.). Кембридж, Массачусетс: MIT Press. п. 252. ИСБН 9780262232586 . OCLC 627701062 .
^ Хедекер, Д., Гиббонс, Р.Д. (2006). Продольный анализ данных. Германия: Уайли. Страница 163 https://books.google.de/books?id=f9p9iIgzQSQC&pg=PA163

Внешние ссылки

[1] Диггл, Питер Дж.; Хигерти, Патрик; Лян, Кунг-Йи; Зегер, Скотт Л. (2002). Анализ продольных данных (2-е изд.). Издательство Оксфордского университета. стр. 169–171 . ISBN 0-19-852484-6 .

[2] Фицморис, Гаррет М.; Лэрд, Нэн М.; Уэр, Джеймс Х. (2004). Прикладной продольный анализ . Хобокен: Джон Уайли и сыновья. стр. 326–328. ISBN 0-471-21487-6 .

[3] Лэрд, Нэн М.; Уэр, Джеймс Х. (1982). «Модели случайных эффектов для продольных данных». Биометрия . 38 (4): 963–974. дои : 10.2307/2529876 . JSTOR 2529876 . PMID 7168798 .

[4] Гардинер, Джозеф К.; Ло, Чжэхуэй; Роман, Ли Энн (2009). «Фиксированные эффекты, случайные эффекты и GEE: в чем различия?». Статистика в медицине . 28 (2): 221–239. дои : 10.1002/сим.3478 . ПМИД 19012297 .

[5] Гомес, Дилан Дж. Э. (20 января 2022 г.). «Должен ли я использовать фиксированные эффекты или случайные эффекты, если у меня менее пяти уровней группирующего фактора в модели со смешанными эффектами?» . ПерДж . 10 : е12794. дои : 10.7717/peerj.12794 . ПМЦ 8784019 . ПМИД 35116198 .

[:0-6] Перейти обратно: ^а ^б Вулдридж, Джеффри (2010). Эконометрический анализ поперечных и панельных данных (2-е изд.). Кембридж, Массачусетс: MIT Press. п. 252. ИСБН 9780262232586 . OCLC 627701062 .

[7] Хедекер, Д., Гиббонс, Р.Д. (2006). Продольный анализ данных. Германия: Уайли. Страница 163 https://books.google.de/books?id=f9p9iIgzQSQC&pg=PA163

[1]

[2]

[3]

[4]

[5]

[6]

[7]