Модель случайных эффектов
Часть серии о |
Регрессионный анализ |
---|
Модели |
Оценка |
Фон |
В статистике модель случайных эффектов , также называемая моделью компонентов дисперсии , представляет собой статистическую модель , в которой параметры модели являются случайными величинами . Это своего рода иерархическая линейная модель , которая предполагает, что анализируемые данные взяты из иерархии различных популяций, различия которых связаны с этой иерархией. Модель случайных эффектов является частным случаем смешанной модели .
Сравните это с определениями биостатистики : [1] [2] [3] [4] [5] поскольку специалисты по биостатистике используют «фиксированные» и «случайные» эффекты для обозначения среднестатистических и специфичных для субъекта эффектов соответственно (а там, где последние обычно считаются неизвестными, - латентных переменных ).
Качественное описание
[ редактировать ]Модели случайных эффектов помогают контролировать ненаблюдаемую неоднородность , когда неоднородность постоянна во времени и не коррелирует с независимыми переменными. Эту константу можно удалить из продольных данных путем дифференцирования, поскольку получение первой разницы приведет к удалению любых инвариантных во времени компонентов модели. [6]
В отношении индивидуального специфического эффекта можно сделать два общих предположения: предположение о случайных эффектах и предположение о фиксированных эффектах. Допущение о случайных эффектах заключается в том, что индивидуальная ненаблюдаемая неоднородность не коррелирует с независимыми переменными. Допущение о фиксированном эффекте заключается в том, что индивидуальный специфический эффект коррелирует с независимыми переменными. [6]
Если предположение о случайных эффектах справедливо, оценщик случайных эффектов более эффективен , чем модель с фиксированными эффектами.
Простой пример
[ редактировать ]Предположим, что m больших начальных школ выбираются случайным образом из тысяч в большой стране. Предположим также, что в каждой выбранной школе случайно выбираются n учеников одного возраста. Подсчитываются их баллы по стандартному тесту на профпригодность. Пусть Y ij — балл j -го ученика i- й школы. Простой способ смоделировать эту переменную:
где μ — средний балл теста для всей популяции. В этой модели U i , специфичный для школы представляет собой случайный эффект : он измеряет разницу между средним баллом в школе i и средним баллом по всей стране. Член W ij представляет собой индивидуально-специфический случайный эффект, т. е. отклонение балла j -го ученика от среднего по i -й школе.
Модель может быть дополнена включением дополнительных объясняющих переменных, которые будут отражать различия в баллах между различными группами. Например:
где Sex ij — двоичная фиктивная переменная , а ParentsEduc ij записывает, скажем, средний уровень образования родителей ребенка. Это смешанная модель , а не модель чисто случайных эффектов, поскольку она вводит условия с фиксированными эффектами для полового образования и образования родителей.
Компоненты отклонения
[ редактировать ]Дисперсия Y ij представляет собой сумму дисперсий τ 2 и σ 2 или U i и Wi ij соответственно.
Позволять
быть средним не всех баллов i - й школы, а тех баллов i- й школы, которые включены в случайную выборку . Позволять
быть большим средним .
Позволять
быть соответственно суммой квадратов, обусловленной различиями внутри групп, и суммой квадратов, обусловленной различиями между группами. Тогда это можно будет показать [ нужна ссылка ] что
и
Эти « ожидаемые средние квадраты » можно использовать в качестве основы для оценки «компонентов дисперсии» σ. 2 и τ 2 .
σ 2 Параметр также называют коэффициентом внутриклассовой корреляции .
Предельное правдоподобие
[ редактировать ]Эту статью может потребовать очистки Википедии , чтобы она соответствовала стандартам качества . Конкретная проблема: нужно показывать формулы. ( Апрель 2024 г. ) |
Для моделей случайных эффектов предельные вероятности . важны [7]
Приложения
[ редактировать ]Модели случайных эффектов, используемые на практике, включают Бюльмана модель страховых контрактов и модель Фэя-Эрриота, используемую для оценки малых территорий .
См. также
[ редактировать ]- Модель Бюльмана
- Иерархическое линейное моделирование
- Исправлены эффекты
- МИНКЕ
- Оценка ковариации
- Условная дисперсия
Дальнейшее чтение
[ редактировать ]- Балтаги, Бади Х. (2008). Эконометрический анализ панельных данных (4-е изд.). Нью-Йорк, штат Нью-Йорк: Уайли. стр. 17–22. ISBN 978-0-470-51886-1 .
- Сяо, Ченг (2003). Анализ панельных данных (2-е изд.). Нью-Йорк, штат Нью-Йорк: Издательство Кембриджского университета. стр. 73–92 . ISBN 0-521-52271-4 .
- Вулдридж, Джеффри М. (2002). Эконометрический анализ перекрестных и панельных данных . Кембридж, Массачусетс: MIT Press. стр. 257–265 . ISBN 0-262-23219-7 .
- Гомес, Дилан Дж. Э. (20 января 2022 г.). «Должен ли я использовать фиксированные эффекты или случайные эффекты, если у меня менее пяти уровней группирующего фактора в модели со смешанными эффектами?» . ПерДж . 10 : е12794. дои : 10.7717/peerj.12794 . ПМЦ 8784019 . ПМИД 35116198 .
Ссылки
[ редактировать ]- ^ Диггл, Питер Дж.; Хигерти, Патрик; Лян, Кунг-Йи; Зегер, Скотт Л. (2002). Анализ продольных данных (2-е изд.). Издательство Оксфордского университета. стр. 169–171 . ISBN 0-19-852484-6 .
- ^ Фицморис, Гаррет М.; Лэрд, Нэн М.; Уэр, Джеймс Х. (2004). Прикладной продольный анализ . Хобокен: Джон Уайли и сыновья. стр. 326–328. ISBN 0-471-21487-6 .
- ^ Лэрд, Нэн М.; Уэр, Джеймс Х. (1982). «Модели случайных эффектов для продольных данных». Биометрия . 38 (4): 963–974. дои : 10.2307/2529876 . JSTOR 2529876 . ПМИД 7168798 .
- ^ Гардинер, Джозеф К.; Ло, Чжэхуэй; Роман, Ли Энн (2009). «Фиксированные эффекты, случайные эффекты и GEE: в чем различия?». Статистика в медицине . 28 (2): 221–239. дои : 10.1002/сим.3478 . ПМИД 19012297 .
- ^ Гомес, Дилан Дж. Э. (20 января 2022 г.). «Должен ли я использовать фиксированные эффекты или случайные эффекты, если у меня менее пяти уровней группирующего фактора в модели со смешанными эффектами?» . ПерДж . 10 : е12794. дои : 10.7717/peerj.12794 . ПМЦ 8784019 . ПМИД 35116198 .
- ^ Jump up to: а б Вулдридж, Джеффри (2010). Эконометрический анализ поперечных и панельных данных (2-е изд.). Кембридж, Массачусетс: MIT Press. п. 252. ИСБН 9780262232586 . OCLC 627701062 .
- ^ Хедекер, Д., Гиббонс, Р.Д. (2006). Продольный анализ данных. Германия: Уайли. Страница 163 https://books.google.de/books?id=f9p9iIgzQSQC&pg=PA163