Обобщенное оценочное уравнение

В статистике обобщенное уравнение оценки (GEE) используется для оценки параметров обобщенной линейной модели с возможной неизмеренной корреляцией между наблюдениями в разные моменты времени. ^[1]^[2] Хотя некоторые считают, что GEE устойчивы во всем, даже при неправильном выборе рабочей корреляционной матрицы, обобщенные оценочные уравнения устойчивы только в случае потери согласованности при неправильном выборе.

Оценки бета-коэффициента регрессии из GEE Лянга-Цегера являются последовательными , несмещенными и асимптотически нормальными, даже когда рабочая корреляция определена неверно, в условиях умеренной регулярности. GEE выше по эффективности, чем обобщенная линейная итерационная модель (GLIM) при наличии высокой автокорреляции. ^[1] Когда известна истинная рабочая корреляция, согласованность не требует предположения, что недостающие данные отсутствуют совершенно случайно . ^[1] Стандартные ошибки Хубера-Уайта повышают эффективность GEE Лянга-Цегера в отсутствие серийной автокорреляции , но могут устранить пограничную интерпретацию. GEE оценивает среднюю реакцию по популяции («среднепопуляционные» эффекты) с помощью стандартных ошибок Лянга-Цегера , а у отдельных лиц — с использованием стандартных ошибок Хубера-Уайта , также известных как оценки «робастной стандартной ошибки» или «сэндвич-дисперсии». ^[3] GEE Хубера-Уайта использовался с 1997 года, а GEE Лянга-Зегера датируется 1980-ми годами, основываясь на ограниченном обзоре литературы. ^[4] Несколько независимых формулировок этих оценок стандартной ошибки вносят вклад в теорию GEE. Объединение независимых оценок стандартной ошибки под общим термином «GEE» может служить примером злоупотребления терминологией .

GEE относятся к классу методов регрессии, которые называются полупараметрическими , поскольку они полагаются на определение только первых двух моментов . Они являются популярной альтернативой правдоподобии основанной на обобщенной линейной смешанной модели, , которая более подвержена риску потери согласованности при спецификации структуры дисперсии. ^[5] Компромиссом неправильной спецификации структуры дисперсии и последовательных оценок коэффициента регрессии является потеря эффективности, приводящая к завышенным значениям p теста Вальда в результате более высокой дисперсии стандартных ошибок, чем у наиболее оптимального. ^[6] Их обычно используют в крупных эпидемиологических исследованиях, особенно в многоцентровых когортных исследованиях , поскольку они могут учитывать многие типы неизмеренной зависимости между исходами.

Формулировка

Учитывая среднюю модель $\mu _{ij}$ по теме $i$ и время $j$ это зависит от параметров регрессии $\beta _{k}$ и структура дисперсии, $V_{i}$ оценочное уравнение формируется через: ^[7]

U(\beta )=\sum _{i=1}^{N}{\frac {\partial \mu _{i}}{\partial \beta }}V_{i}^{-1}\{Y_{i}-\mu _{i}(\beta )\}\,\!

Параметры $\beta _{k}$ оцениваются путем решения $U(\beta )=0$ и обычно получаются с помощью алгоритма Ньютона-Рафсона . Структура дисперсии выбрана для повышения эффективности оценок параметров. Гессиан . решения GEE в пространстве параметров можно использовать для расчета надежных оценок стандартной ошибки Термин «структура дисперсии» относится к алгебраической форме матрицы ковариаций между результатами Y в выборке. Примеры спецификаций структуры дисперсии включают независимость, возможность обмена, авторегрессию, стационарную m-зависимость и неструктурированность. Наиболее популярной формой вывода о параметрах регрессии GEE является тест Вальда с использованием наивных или робастных стандартных ошибок, хотя тест Score также действителен и предпочтителен, когда трудно получить оценки информации в соответствии с альтернативной гипотезой. Тест отношения правдоподобия в этом случае недействителен, поскольку оценочные уравнения не обязательно являются уравнениями правдоподобия. Выбор модели может быть выполнен с помощью GEE-эквивалента информационного критерия Акаике. (AIC), квазиправдоподобие по критерию модели независимости (QIC). ^[8]

Связь с обобщенным методом моментов

Обобщенное оценивающее уравнение является частным случаем обобщенного метода моментов (ОММ). ^[9] Эта связь сразу очевидна из требования, чтобы функция оценки удовлетворяла уравнению: $\mathbb {E} [U(\beta )]={1 \over {N}}\sum _{i=1}^{N}{\frac {\partial \mu _{i}}{\partial \beta }}V_{i}^{-1}\{Y_{i}-\mu _{i}(\beta )\}\,\!=0$

Вычисление

Программное обеспечение для решения обобщенных уравнений оценки доступно в MATLAB , ^[10] SAS (процедура genmod ^[11]), SPSS ( гравитации процедура ^[12]), Stata ( xtgee команда ^[13]), R (пакеты glmtoolbox , ^[14] geeдать ^[15] Гипэк ^[16] и мультик ^[17]), Юлия (пакет GEE.jl ^[18]) и Python пакета ( статистические модели ^[19]).

Сравнение пакетов программного обеспечения для анализа двоичных коррелированных данных ^[20]^[21] и порядковые коррелированные данные ^[22] через GEE доступны.

См. также

Ссылки

^ Перейти обратно: ^а ^б ^с Кунг-Йи Лян; Скотт Зегер (1986). «Продольный анализ данных с использованием обобщенных линейных моделей» . Биометрика . 73 (1): 13–22. дои : 10.1093/biomet/73.1.13 .
^ Хардин, Джеймс; Хильбе, Джозеф (2003). Обобщенные оценочные уравнения . Лондон: Чепмен и Холл/CRC. ISBN 978-1-58488-307-4 .
^ Абади, Альберто; Эти, Сьюзен; Имбенс, Гвидо В; Вулдридж, Джеффри М. (октябрь 2022 г.). «Когда следует корректировать стандартные ошибки для кластеризации?» . Ежеквартальный экономический журнал . 138 (1): 1–35. arXiv : 1710.02926 . дои : 10.1093/qje/qjac038 .
^ Вулф, Фредерик; Андерсон, Дженис; Харкнесс, Дебора; Беннетт, Роберт М.; Каро, Ксавье Дж.; Гольденберг, Дон Л.; Рассел, И. Джон; Юнус, Мухаммад Б. (1997). «Проспективное продольное многоцентровое исследование использования услуг и затрат при фибромиалгии» . Артрит и ревматизм . 40 (9): 1560–1570. дои : 10.1002/арт.1780400904 . ПМИД 9324009 .
^ Фонг, Ю; Рю, Х; Уэйкфилд, Дж (2010). «Байесовский вывод для обобщенных линейных смешанных моделей» . Биостатистика . 11 (3): 397–412. doi : 10.1093/biostatistics/kxp053 . ПМЦ 2883299 . ПМИД 19966070 .
^ О'Брайен, Лиам М.; Фицморис, Гаррет М.; Хортон, Николас Дж. (октябрь 2006 г.). «Оценка максимального правдоподобия маргинальных парных ассоциаций с предикторами из нескольких источников» . Биометрический журнал . 48 (5): 860–875. дои : 10.1002/bimj.200510227 . ISSN 0323-3847 . ПМК 1764610 . ПМИД 17094349 .
^ Диггл, Питер Дж.; Патрик Хигерти; Кунг-Йи Лян; Скотт Л. Зегер (2002). Анализ продольных данных . Оксфордская серия статистических наук. ISBN 978-0-19-852484-7 .
^ Пан, В. (2001), «Информационный критерий Акаике в обобщенных уравнениях оценки», Biometrics , 57 (1): 120–125, doi : 10.1111/j.0006-341X.2001.00120.x , PMID 11252586 , S2CID 7862441 .
^ Брейтунг, Йорг; Чаганти, Н. Рао; Дэниел, Риан М.; Кенвард, Майкл Г.; Лехнер, Майкл; Мартус, Питер; Сабо, Рой Т.; Ван, Ю-Ган; Зорн, Кристофер (2010). «Обсуждение« Обобщенных оценочных уравнений: замечания по выбору рабочей корреляционной матрицы » ». Методы информации в медицине . 49 (5): 426–432. дои : 10.1055/s-0038-1625133 . S2CID 3213776 .
^ Сара Дж. Рэтклифф; Жюстин Шульц (2008). «GEEQBOX: набор инструментов MATLAB для обобщенных уравнений оценки и квазинаименьших квадратов» . Журнал статистического программного обеспечения . 25 (14): 1–14.
^ «Процедура GENMOD» . Институт САС.
^ «Расширенная статистика IBM SPSS» . Веб-сайт IBM SPSS.
^ «Внедрение GEE компанией Stata» (PDF) . Сайт Статы.
^ «glmtoolbox: Набор инструментов для анализа данных с использованием обобщенных линейных моделей» . КРАН. 10 октября 2023 г.
^ «Ну и дела: решатель обобщенных уравнений оценки» . КРАН. 7 ноября 2019 г.
^ geepack: Пакет обобщенных оценочных уравнений , CRAN, 18 декабря 2020 г. {{citation}}: CS1 maint: отсутствует местоположение издателя ( ссылка )
^ multgee: решатель GEE для коррелированных номинальных или порядковых многочленных ответов с использованием параметризации локальных отношений шансов , CRAN, 13 мая 2021 г. {{citation}}: CS1 maint: отсутствует местоположение издателя ( ссылка )
^ Шедден, Керби (23 июня 2022 г.). «Обобщенные оценочные уравнения в Джулии» . Гитхаб . Проверено 24 июня 2022 г.
^ «Обобщенные оценочные уравнения — статистические модели» .
^ Андреас Зиглер; Ульрике Грёмпинг (1998). «Обобщенные уравнения оценки: сравнение процедур, доступных в коммерческих пакетах статистического программного обеспечения». Биометрический журнал . 40 (3): 245–260. doi : 10.1002/(sici)1521-4036(199807)40:3<245::aid-bimj245>3.0.co;2-n .
^ Николас Дж. ХОРТОН; Стюарт Р. ЛИПСИТЦ (1999). «Обзор программного обеспечения для соответствия моделям регрессии обобщенных уравнений оценки». Американский статистик . 53 (2): 160–169. CiteSeerX 10.1.1.22.9325 . дои : 10.1080/00031305.1999.10474451 .
^ Назанин Нураи; Герт Моленбергс; Эдвин Р. ван ден Хеувел (2014). «GEE для продольных порядковых данных: сравнение R-geepack, R-multgee, R-repolr, SAS-GENMOD, SPSS-GENLIN» (PDF) . Вычислительная статистика и анализ данных . 77 : 70–83. дои : 10.1016/j.csda.2014.03.009 . S2CID 15063953 .

Дальнейшее чтение

Хардин, Джеймс; Хильбе, Джозеф (2003). Обобщенные оценочные уравнения . Лондон: Чепмен и Холл/CRC. ISBN 978-1-58488-307-4 .
Зиглер, А. (2011). Обобщенные оценочные уравнения . Спрингер. ISBN 978-1-4614-0498-9 .

Внешние ссылки

Продвинутые темы I — Обобщенные оценочные уравнения (GEE)

[:0-1] Перейти обратно: ^а ^б ^с Кунг-Йи Лян; Скотт Зегер (1986). «Продольный анализ данных с использованием обобщенных линейных моделей» . Биометрика . 73 (1): 13–22. дои : 10.1093/biomet/73.1.13 .

[2] Хардин, Джеймс; Хильбе, Джозеф (2003). Обобщенные оценочные уравнения . Лондон: Чепмен и Холл/CRC. ISBN 978-1-58488-307-4 .

[3] Абади, Альберто; Эти, Сьюзен; Имбенс, Гвидо В; Вулдридж, Джеффри М. (октябрь 2022 г.). «Когда следует корректировать стандартные ошибки для кластеризации?» . Ежеквартальный экономический журнал . 138 (1): 1–35. arXiv : 1710.02926 . дои : 10.1093/qje/qjac038 .

[4] Вулф, Фредерик; Андерсон, Дженис; Харкнесс, Дебора; Беннетт, Роберт М.; Каро, Ксавье Дж.; Гольденберг, Дон Л.; Рассел, И. Джон; Юнус, Мухаммад Б. (1997). «Проспективное продольное многоцентровое исследование использования услуг и затрат при фибромиалгии» . Артрит и ревматизм . 40 (9): 1560–1570. дои : 10.1002/арт.1780400904 . ПМИД 9324009 .

[5] Фонг, Ю; Рю, Х; Уэйкфилд, Дж (2010). «Байесовский вывод для обобщенных линейных смешанных моделей» . Биостатистика . 11 (3): 397–412. doi : 10.1093/biostatistics/kxp053 . ПМЦ 2883299 . ПМИД 19966070 .

[6] О'Брайен, Лиам М.; Фицморис, Гаррет М.; Хортон, Николас Дж. (октябрь 2006 г.). «Оценка максимального правдоподобия маргинальных парных ассоциаций с предикторами из нескольких источников» . Биометрический журнал . 48 (5): 860–875. дои : 10.1002/bimj.200510227 . ISSN 0323-3847 . ПМК 1764610 . ПМИД 17094349 .

[7] Диггл, Питер Дж.; Патрик Хигерти; Кунг-Йи Лян; Скотт Л. Зегер (2002). Анализ продольных данных . Оксфордская серия статистических наук. ISBN 978-0-19-852484-7 .

[8] Пан, В. (2001), «Информационный критерий Акаике в обобщенных уравнениях оценки», Biometrics , 57 (1): 120–125, doi : 10.1111/j.0006-341X.2001.00120.x , PMID 11252586 , S2CID 7862441 .

[9] Брейтунг, Йорг; Чаганти, Н. Рао; Дэниел, Риан М.; Кенвард, Майкл Г.; Лехнер, Майкл; Мартус, Питер; Сабо, Рой Т.; Ван, Ю-Ган; Зорн, Кристофер (2010). «Обсуждение« Обобщенных оценочных уравнений: замечания по выбору рабочей корреляционной матрицы » ». Методы информации в медицине . 49 (5): 426–432. дои : 10.1055/s-0038-1625133 . S2CID 3213776 .

[10] Сара Дж. Рэтклифф; Жюстин Шульц (2008). «GEEQBOX: набор инструментов MATLAB для обобщенных уравнений оценки и квазинаименьших квадратов» . Журнал статистического программного обеспечения . 25 (14): 1–14.

[11] «Процедура GENMOD» . Институт САС.

[12] «Расширенная статистика IBM SPSS» . Веб-сайт IBM SPSS.

[13] «Внедрение GEE компанией Stata» (PDF) . Сайт Статы.

[14] «glmtoolbox: Набор инструментов для анализа данных с использованием обобщенных линейных моделей» . КРАН. 10 октября 2023 г.

[15] «Ну и дела: решатель обобщенных уравнений оценки» . КРАН. 7 ноября 2019 г.

[16] geepack: Пакет обобщенных оценочных уравнений , CRAN, 18 декабря 2020 г. {{citation}}: CS1 maint: отсутствует местоположение издателя ( ссылка )

[17] ultgee: решатель GEE для коррелированных номинальных или порядковых многочленных ответов с использованием параметризации локальных отношений шансов , CRAN, 13 мая 2021 г. {{citation}}: CS1 maint: отсутствует местоположение издателя ( ссылка )

[18] Шедден, Керби (23 июня 2022 г.). «Обобщенные оценочные уравнения в Джулии» . Гитхаб . Проверено 24 июня 2022 г.

[19] «Обобщенные оценочные уравнения — статистические модели» .

[20] Андреас Зиглер; Ульрике Грёмпинг (1998). «Обобщенные уравнения оценки: сравнение процедур, доступных в коммерческих пакетах статистического программного обеспечения». Биометрический журнал . 40 (3): 245–260. doi : 10.1002/(sici)1521-4036(199807)40:3<245::aid-bimj245>3.0.co;2-n .

[21] Николас Дж. ХОРТОН; Стюарт Р. ЛИПСИТЦ (1999). «Обзор программного обеспечения для соответствия моделям регрессии обобщенных уравнений оценки». Американский статистик . 53 (2): 160–169. CiteSeerX 10.1.1.22.9325 . дои : 10.1080/00031305.1999.10474451 .

[22] Назанин Нураи; Герт Моленбергс; Эдвин Р. ван ден Хеувел (2014). «GEE для продольных порядковых данных: сравнение R-geepack, R-multgee, R-repolr, SAS-GENMOD, SPSS-GENLIN» (PDF) . Вычислительная статистика и анализ данных . 77 : 70–83. дои : 10.1016/j.csda.2014.03.009 . S2CID 15063953 .

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

Базы данных авторитетного контроля
Международный	БЫСТРЫЙ
Национальный	Франция Данные БнФ Германия Израиль Соединенные Штаты
Другой	ИдРеф