Обобщенная линейная смешанная модель
Эта статья нуждается в дополнительных цитатах для проверки . ( июль 2017 г. ) |
В статистике обобщенная линейная смешанная модель ( GLMM ) является расширением обобщенной линейной модели (GLM), в которой линейный предиктор содержит случайные эффекты в дополнение к обычным фиксированным эффектам . [1] [2] [3] Они также наследуют от обобщенных линейных моделей идею расширения линейных смешанных моделей на ненормальные данные.
Обобщенные линейные смешанные модели предоставляют широкий спектр моделей для анализа сгруппированных данных, поскольку различия между группами можно моделировать как случайный эффект. Эти модели полезны при анализе многих видов данных, включая продольные данные . [4]
Модель
[ редактировать ]Обобщенные линейные смешанные модели обычно определяются так, что в зависимости от случайных эффектов , зависимая переменная распределяется по экспоненциальному семейству с его ожиданиемсвязанный с линейным предсказателем через функцию ссылки :
- .
Здесь и – матрица расчета фиксированных эффектов и фиксированные эффекты соответственно; и – это матрица расчета случайных эффектов и случайные эффекты соответственно. Чтобы понять это очень краткое определение, вам сначала необходимо понять определения обобщенной линейной модели и смешанной модели .
Обобщенные линейные смешанные модели представляют собой частный случай иерархических обобщенных линейных моделей, в которых случайные эффекты распределены нормально.
Полная вероятность [5]
не имеет общей замкнутой формы, и интегрирование по случайным эффектам обычно требует чрезвычайно больших вычислительных ресурсов. В дополнение к численной аппроксимации этого интеграла (например, с помощью квадратуры Гаусса – Эрмита ), были предложены методы, основанные на аппроксимации Лапласа. [6] Например, метод штрафного квазиправдоподобия, который по существу включает в себя неоднократное подгонку (т.е. двойную итерацию) взвешенной нормальной смешанной модели с рабочей вариацией, [7] реализуется различными коммерческими статистическими программами и программами с открытым исходным кодом.
Примерка модели
[ редактировать ]Подбор обобщенных линейных смешанных моделей с помощью максимального правдоподобия (например, с помощью информационного критерия Акаике (AIC) ) включает в себя интегрирование случайных эффектов. В общем случае эти интегралы не могут быть выражены в аналитической форме . Были разработаны различные приближенные методы, но ни один из них не обладает хорошими свойствами для всех возможных моделей и наборов данных (например, негруппированные двоичные данные особенно проблематичны ). По этой причине методы, включающие числовые квадратуры или цепи Маркова Монте-Карло, стали использоваться все чаще, поскольку увеличение вычислительной мощности и развитие методов сделали их более практичными.
Информационный критерий Акаике является распространенным критерием выбора модели . оценки информационного критерия Акаике для обобщенных линейных смешанных моделей, основанных на некоторых распределениях экспоненциального семейства . Недавно были получены [8]
Программное обеспечение
[ редактировать ]- Несколько добавленных пакетов в R предоставляют функциональность для обобщенных линейных смешанных моделей. [9] [10] включая
lme4
[11] иglmm
. [12] - Обобщенные линейные смешанные модели можно подобрать с помощью SAS и SPSS. [13]
- MATLAB также предоставляет
fitglme
функция, подходящая для моделей обобщенной линейной смешанной модели. - Питон
Statsmodels
пакет поддерживает биномиальную и пуассоновскую реализации. [14] - Пакет «Юлия»
MixedModels.jl
предоставляет функцию под названиемGeneralizedLinearMixedModel
который соответствует обобщенной линейной смешанной модели предоставленным данным. [15] - DHARMa: остаточная диагностика для иерархических (многоуровневых/смешанных) регрессионных моделей (utk.edu) [16]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Бреслоу, штат Небраска; Клейтон, Д.Г. (1993), «Приблизительный вывод в обобщенных линейных смешанных моделях», Журнал Американской статистической ассоциации , 88 (421): 9–25, doi : 10.2307/2290687 , JSTOR 2290687
- ^ Строуп, WW (2012), Обобщенные линейные смешанные модели , CRC Press
- ^ Цзян Дж. (2007), Линейные и обобщенные линейные смешанные модели и их приложения , Springer
- ^ Фицморис, генеральный менеджер; Лэрд, Нью-Мексико; Уэр, Дж. (2011), Прикладной продольный анализ (2-е изд.), John Wiley & Sons , ISBN 978-0-471-21487-8
- ^ Павитан, Юди. По всей вероятности: статистическое моделирование и выводы с использованием правдоподобия (изд. в мягкой обложке). ОУП Оксфорд. п. 459. ИСБН 978-0199671229 .
- ^ Бреслоу, штат Небраска; Клейтон, генеральный директор (20 декабря 2012 г.). «Приблизительный вывод в обобщенных линейных смешанных моделях». Журнал Американской статистической ассоциации . 88 (421): 9–25. дои : 10.1080/01621459.1993.10594284 .
- ^ Вулфингер, Расс; О'Коннелл, Майкл (декабрь 1993 г.). «Обобщенные линейные смешанные модели: подход псевдоправдоподобия». Журнал статистических вычислений и моделирования . 48 (3–4): 233–243. дои : 10.1080/00949659308811554 .
- ^ Саефкен, Б.; Кнейб, Т.; ван Ваверен, К.-С.; Гревен, С. (2014), «Объединяющий подход к оценке условной информации Акаике в обобщенных линейных смешанных моделях» , Электронный журнал статистики , 8 : 201–225, doi : 10.1214/14-EJS881
- ^ Пиньейру, JC; Бейтс, DM (2000), Модели со смешанными эффектами в S и S-PLUS , Спрингер, Нью-Йорк
- ^ Берридж, DM; Краучли, Р. (2011), Многомерные обобщенные линейные смешанные модели с использованием R , CRC Press
- ^ «Пакет lme4 — RDocumentation» . www.rdocumentation.org . Проверено 15 сентября 2022 г.
- ^ «Пакет glmm — RDocumentation» . www.rdocumentation.org . Проверено 15 сентября 2022 г.
- ^ «Центр знаний IBM» . www.ibm.com . Проверено 6 декабря 2017 г.
- ^ «Документация по статистическим моделям» . www.statsmodels.org . Проверено 17 марта 2021 г.
- ^ «Подробности оценки параметров · Смешанные модели» . Сайт juliastats.org . Проверено 16 июня 2021 г.
- ^ Установка, загрузка и цитирование пакета , получено 24 августа 2022 г.