Обобщенное оценочное уравнение
В статистике обобщенное уравнение оценки (GEE) используется для оценки параметров обобщенной линейной модели с возможной неизмеренной корреляцией между наблюдениями в разные моменты времени. [1] [2] Хотя некоторые считают, что GEE устойчивы во всем, даже при неправильном выборе рабочей корреляционной матрицы, обобщенные оценочные уравнения устойчивы только в случае потери согласованности при неправильном выборе.
Оценки бета-коэффициента регрессии из GEE Лянга-Цегера являются последовательными , несмещенными и асимптотически нормальными, даже когда рабочая корреляция определена неверно, в условиях умеренной регулярности. GEE выше по эффективности, чем обобщенная линейная итерационная модель (GLIM) при наличии высокой автокорреляции. [1] Когда известна истинная рабочая корреляция, согласованность не требует предположения, что недостающие данные отсутствуют совершенно случайно . [1] Стандартные ошибки Хубера-Уайта повышают эффективность GEE Лянга-Цегера в отсутствие серийной автокорреляции , но могут устранить пограничную интерпретацию. GEE оценивает среднюю реакцию по популяции («среднепопуляционные» эффекты) с помощью стандартных ошибок Лянга-Цегера , а у отдельных лиц — с использованием стандартных ошибок Хубера-Уайта , также известных как оценки «робастной стандартной ошибки» или «сэндвич-дисперсии». [3] GEE Хубера-Уайта использовался с 1997 года, а GEE Лянга-Зегера датируется 1980-ми годами, основываясь на ограниченном обзоре литературы. [4] Несколько независимых формулировок этих оценок стандартной ошибки вносят вклад в теорию GEE. Объединение независимых оценок стандартной ошибки под общим термином «GEE» может служить примером злоупотребления терминологией .
GEE относятся к классу методов регрессии, которые называются полупараметрическими , поскольку они полагаются на определение только первых двух моментов . Они являются популярной альтернативой правдоподобии основанной на обобщенной линейной смешанной модели, , которая более подвержена риску потери согласованности при спецификации структуры дисперсии. [5] Компромиссом неправильной спецификации структуры дисперсии и последовательных оценок коэффициента регрессии является потеря эффективности, приводящая к завышенным значениям p теста Вальда в результате более высокой дисперсии стандартных ошибок, чем у наиболее оптимального. [6] Их обычно используют в крупных эпидемиологических исследованиях, особенно в многоцентровых когортных исследованиях , поскольку они могут учитывать многие типы неизмеренной зависимости между исходами.
Формулировка
[ редактировать ]Учитывая среднюю модель по теме и время это зависит от параметров регрессии и структура дисперсии, оценочное уравнение формируется через: [7]
Параметры оцениваются путем решения и обычно получаются с помощью алгоритма Ньютона-Рафсона . Структура дисперсии выбрана для повышения эффективности оценок параметров. Гессиан . решения GEE в пространстве параметров можно использовать для расчета надежных оценок стандартной ошибки Термин «структура дисперсии» относится к алгебраической форме матрицы ковариаций между результатами Y в выборке. Примеры спецификаций структуры дисперсии включают независимость, возможность обмена, авторегрессию, стационарную m-зависимость и неструктурированность. Наиболее популярной формой вывода о параметрах регрессии GEE является тест Вальда с использованием наивных или робастных стандартных ошибок, хотя тест Score также действителен и предпочтителен, когда трудно получить оценки информации в соответствии с альтернативной гипотезой. Тест отношения правдоподобия в этом случае недействителен, поскольку оценочные уравнения не обязательно являются уравнениями правдоподобия. Выбор модели может быть выполнен с помощью GEE-эквивалента информационного критерия Акаике. (AIC), квазиправдоподобие по критерию модели независимости (QIC). [8]
Связь с обобщенным методом моментов
[ редактировать ]Обобщенное оценивающее уравнение является частным случаем обобщенного метода моментов (ОММ). [9] Эта связь сразу очевидна из требования, чтобы функция оценки удовлетворяла уравнению:
Вычисление
[ редактировать ]Программное обеспечение для решения обобщенных уравнений оценки доступно в MATLAB , [10] SAS (процедура genmod [11] ), SPSS ( гравитации процедура [12] ), Stata ( xtgee команда [13] ), R (пакеты glmtoolbox , [14] geeдать [15] Гипэк [16] и мультик [17] ), Юлия (пакет GEE.jl [18] ) и Python пакета ( статистические модели [19] ).
Сравнение пакетов программного обеспечения для анализа двоичных коррелированных данных [20] [21] и порядковые коррелированные данные [22] через GEE доступны.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Перейти обратно: а б с Кунг-Йи Лян; Скотт Зегер (1986). «Продольный анализ данных с использованием обобщенных линейных моделей» . Биометрика . 73 (1): 13–22. дои : 10.1093/biomet/73.1.13 .
- ^ Хардин, Джеймс; Хильбе, Джозеф (2003). Обобщенные оценочные уравнения . Лондон: Чепмен и Холл/CRC. ISBN 978-1-58488-307-4 .
- ^ Абади, Альберто; Эти, Сьюзен; Имбенс, Гвидо В; Вулдридж, Джеффри М. (октябрь 2022 г.). «Когда следует корректировать стандартные ошибки для кластеризации?» . Ежеквартальный экономический журнал . 138 (1): 1–35. arXiv : 1710.02926 . дои : 10.1093/qje/qjac038 .
- ^ Вулф, Фредерик; Андерсон, Дженис; Харкнесс, Дебора; Беннетт, Роберт М.; Каро, Ксавье Дж.; Гольденберг, Дон Л.; Рассел, И. Джон; Юнус, Мухаммад Б. (1997). «Проспективное продольное многоцентровое исследование использования услуг и затрат при фибромиалгии» . Артрит и ревматизм . 40 (9): 1560–1570. дои : 10.1002/арт.1780400904 . ПМИД 9324009 .
- ^ Фонг, Ю; Рю, Х; Уэйкфилд, Дж (2010). «Байесовский вывод для обобщенных линейных смешанных моделей» . Биостатистика . 11 (3): 397–412. doi : 10.1093/biostatistics/kxp053 . ПМЦ 2883299 . ПМИД 19966070 .
- ^ О'Брайен, Лиам М.; Фицморис, Гаррет М.; Хортон, Николас Дж. (октябрь 2006 г.). «Оценка максимального правдоподобия маргинальных парных ассоциаций с предикторами из нескольких источников» . Биометрический журнал . 48 (5): 860–875. дои : 10.1002/bimj.200510227 . ISSN 0323-3847 . ПМК 1764610 . ПМИД 17094349 .
- ^ Диггл, Питер Дж.; Патрик Хигерти; Кунг-Йи Лян; Скотт Л. Зегер (2002). Анализ продольных данных . Оксфордская серия статистических наук. ISBN 978-0-19-852484-7 .
- ^ Пан, В. (2001), «Информационный критерий Акаике в обобщенных уравнениях оценки», Biometrics , 57 (1): 120–125, doi : 10.1111/j.0006-341X.2001.00120.x , PMID 11252586 , S2CID 7862441 .
- ^ Брейтунг, Йорг; Чаганти, Н. Рао; Дэниел, Риан М.; Кенвард, Майкл Г.; Лехнер, Майкл; Мартус, Питер; Сабо, Рой Т.; Ван, Ю-Ган; Зорн, Кристофер (2010). «Обсуждение« Обобщенных оценочных уравнений: замечания по выбору рабочей корреляционной матрицы » ». Методы информации в медицине . 49 (5): 426–432. дои : 10.1055/s-0038-1625133 . S2CID 3213776 .
- ^ Сара Дж. Рэтклифф; Жюстин Шульц (2008). «GEEQBOX: набор инструментов MATLAB для обобщенных уравнений оценки и квазинаименьших квадратов» . Журнал статистического программного обеспечения . 25 (14): 1–14.
- ^ «Процедура GENMOD» . Институт САС.
- ^ «Расширенная статистика IBM SPSS» . Веб-сайт IBM SPSS.
- ^ «Внедрение GEE компанией Stata» (PDF) . Сайт Статы.
- ^ «glmtoolbox: Набор инструментов для анализа данных с использованием обобщенных линейных моделей» . КРАН. 10 октября 2023 г.
- ^ «Ну и дела: решатель обобщенных уравнений оценки» . КРАН. 7 ноября 2019 г.
- ^ geepack: Пакет обобщенных оценочных уравнений , CRAN, 18 декабря 2020 г.
{{citation}}
: CS1 maint: отсутствует местоположение издателя ( ссылка ) - ^ multgee: решатель GEE для коррелированных номинальных или порядковых многочленных ответов с использованием параметризации локальных отношений шансов , CRAN, 13 мая 2021 г.
{{citation}}
: CS1 maint: отсутствует местоположение издателя ( ссылка ) - ^ Шедден, Керби (23 июня 2022 г.). «Обобщенные оценочные уравнения в Джулии» . Гитхаб . Проверено 24 июня 2022 г.
- ^ «Обобщенные оценочные уравнения — статистические модели» .
- ^ Андреас Зиглер; Ульрике Грёмпинг (1998). «Обобщенные уравнения оценки: сравнение процедур, доступных в коммерческих пакетах статистического программного обеспечения». Биометрический журнал . 40 (3): 245–260. doi : 10.1002/(sici)1521-4036(199807)40:3<245::aid-bimj245>3.0.co;2-n .
- ^ Николас Дж. ХОРТОН; Стюарт Р. ЛИПСИТЦ (1999). «Обзор программного обеспечения для соответствия моделям регрессии обобщенных уравнений оценки». Американский статистик . 53 (2): 160–169. CiteSeerX 10.1.1.22.9325 . дои : 10.1080/00031305.1999.10474451 .
- ^ Назанин Нураи; Герт Моленбергс; Эдвин Р. ван ден Хеувел (2014). «GEE для продольных порядковых данных: сравнение R-geepack, R-multgee, R-repolr, SAS-GENMOD, SPSS-GENLIN» (PDF) . Вычислительная статистика и анализ данных . 77 : 70–83. дои : 10.1016/j.csda.2014.03.009 . S2CID 15063953 .
Дальнейшее чтение
[ редактировать ]- Хардин, Джеймс; Хильбе, Джозеф (2003). Обобщенные оценочные уравнения . Лондон: Чепмен и Холл/CRC. ISBN 978-1-58488-307-4 .
- Зиглер, А. (2011). Обобщенные оценочные уравнения . Спрингер. ISBN 978-1-4614-0498-9 .