Jump to content

Обобщенное оценочное уравнение

В статистике обобщенное уравнение оценки (GEE) используется для оценки параметров обобщенной линейной модели с возможной неизмеренной корреляцией между наблюдениями в разные моменты времени. [1] [2] Хотя некоторые считают, что GEE устойчивы во всем, даже при неправильном выборе рабочей корреляционной матрицы, обобщенные оценочные уравнения устойчивы только в случае потери согласованности при неправильном выборе.

Оценки бета-коэффициента регрессии из GEE Лянга-Цегера являются последовательными , несмещенными и асимптотически нормальными, даже когда рабочая корреляция определена неверно, в условиях умеренной регулярности. GEE выше по эффективности, чем обобщенная линейная итерационная модель (GLIM) при наличии высокой автокорреляции. [1] Когда известна истинная рабочая корреляция, согласованность не требует предположения, что недостающие данные отсутствуют совершенно случайно . [1] Стандартные ошибки Хубера-Уайта повышают эффективность GEE Лянга-Цегера в отсутствие серийной автокорреляции , но могут устранить пограничную интерпретацию. GEE оценивает среднюю реакцию по популяции («среднепопуляционные» эффекты) с помощью стандартных ошибок Лянга-Цегера , а у отдельных лиц — с использованием стандартных ошибок Хубера-Уайта , также известных как оценки «робастной стандартной ошибки» или «сэндвич-дисперсии». [3] GEE Хубера-Уайта использовался с 1997 года, а GEE Лянга-Зегера датируется 1980-ми годами, основываясь на ограниченном обзоре литературы. [4] Несколько независимых формулировок этих оценок стандартной ошибки вносят вклад в теорию GEE. Объединение независимых оценок стандартной ошибки под общим термином «GEE» может служить примером злоупотребления терминологией .

GEE относятся к классу методов регрессии, которые называются полупараметрическими , поскольку они полагаются на определение только первых двух моментов . Они являются популярной альтернативой правдоподобии основанной на обобщенной линейной смешанной модели, , которая более подвержена риску потери согласованности при спецификации структуры дисперсии. [5] Компромиссом неправильной спецификации структуры дисперсии и последовательных оценок коэффициента регрессии является потеря эффективности, приводящая к завышенным значениям p теста Вальда в результате более высокой дисперсии стандартных ошибок, чем у наиболее оптимального. [6] Их обычно используют в крупных эпидемиологических исследованиях, особенно в многоцентровых когортных исследованиях , поскольку они могут учитывать многие типы неизмеренной зависимости между исходами.

Формулировка

[ редактировать ]

Учитывая среднюю модель по теме и время это зависит от параметров регрессии и структура дисперсии, оценочное уравнение формируется через: [7]

Параметры оцениваются путем решения и обычно получаются с помощью алгоритма Ньютона-Рафсона . Структура дисперсии выбрана для повышения эффективности оценок параметров. Гессиан . решения GEE в пространстве параметров можно использовать для расчета надежных оценок стандартной ошибки Термин «структура дисперсии» относится к алгебраической форме матрицы ковариаций между результатами Y в выборке. Примеры спецификаций структуры дисперсии включают независимость, возможность обмена, авторегрессию, стационарную m-зависимость и неструктурированность. Наиболее популярной формой вывода о параметрах регрессии GEE является тест Вальда с использованием наивных или робастных стандартных ошибок, хотя тест Score также действителен и предпочтителен, когда трудно получить оценки информации в соответствии с альтернативной гипотезой. Тест отношения правдоподобия в этом случае недействителен, поскольку оценочные уравнения не обязательно являются уравнениями правдоподобия. Выбор модели может быть выполнен с помощью GEE-эквивалента информационного критерия Акаике. (AIC), квазиправдоподобие по критерию модели независимости (QIC). [8]

Связь с обобщенным методом моментов

[ редактировать ]

Обобщенное оценивающее уравнение является частным случаем обобщенного метода моментов (ОММ). [9] Эта связь сразу очевидна из требования, чтобы функция оценки удовлетворяла уравнению:

Вычисление

[ редактировать ]

Программное обеспечение для решения обобщенных уравнений оценки доступно в MATLAB , [10] SAS (процедура genmod [11] ), SPSS ( гравитации процедура [12] ), Stata ( xtgee команда [13] ), R (пакеты glmtoolbox , [14] geeдать [15] Гипэк [16] и мультик [17] ), Юлия (пакет GEE.jl [18] ) и Python пакета ( статистические модели [19] ).

Сравнение пакетов программного обеспечения для анализа двоичных коррелированных данных [20] [21] и порядковые коррелированные данные [22] через GEE доступны.

См. также

[ редактировать ]
  1. ^ Перейти обратно: а б с Кунг-Йи Лян; Скотт Зегер (1986). «Продольный анализ данных с использованием обобщенных линейных моделей» . Биометрика . 73 (1): 13–22. дои : 10.1093/biomet/73.1.13 .
  2. ^ Хардин, Джеймс; Хильбе, Джозеф (2003). Обобщенные оценочные уравнения . Лондон: Чепмен и Холл/CRC. ISBN  978-1-58488-307-4 .
  3. ^ Абади, Альберто; Эти, Сьюзен; Имбенс, Гвидо В; Вулдридж, Джеффри М. (октябрь 2022 г.). «Когда следует корректировать стандартные ошибки для кластеризации?» . Ежеквартальный экономический журнал . 138 (1): 1–35. arXiv : 1710.02926 . дои : 10.1093/qje/qjac038 .
  4. ^ Вулф, Фредерик; Андерсон, Дженис; Харкнесс, Дебора; Беннетт, Роберт М.; Каро, Ксавье Дж.; Гольденберг, Дон Л.; Рассел, И. Джон; Юнус, Мухаммад Б. (1997). «Проспективное продольное многоцентровое исследование использования услуг и затрат при фибромиалгии» . Артрит и ревматизм . 40 (9): 1560–1570. дои : 10.1002/арт.1780400904 . ПМИД   9324009 .
  5. ^ Фонг, Ю; Рю, Х; Уэйкфилд, Дж (2010). «Байесовский вывод для обобщенных линейных смешанных моделей» . Биостатистика . 11 (3): 397–412. doi : 10.1093/biostatistics/kxp053 . ПМЦ   2883299 . ПМИД   19966070 .
  6. ^ О'Брайен, Лиам М.; Фицморис, Гаррет М.; Хортон, Николас Дж. (октябрь 2006 г.). «Оценка максимального правдоподобия маргинальных парных ассоциаций с предикторами из нескольких источников» . Биометрический журнал . 48 (5): 860–875. дои : 10.1002/bimj.200510227 . ISSN   0323-3847 . ПМК   1764610 . ПМИД   17094349 .
  7. ^ Диггл, Питер Дж.; Патрик Хигерти; Кунг-Йи Лян; Скотт Л. Зегер (2002). Анализ продольных данных . Оксфордская серия статистических наук. ISBN  978-0-19-852484-7 .
  8. ^ Пан, В. (2001), «Информационный критерий Акаике в обобщенных уравнениях оценки», Biometrics , 57 (1): 120–125, doi : 10.1111/j.0006-341X.2001.00120.x , PMID   11252586 , S2CID   7862441 .
  9. ^ Брейтунг, Йорг; Чаганти, Н. Рао; Дэниел, Риан М.; Кенвард, Майкл Г.; Лехнер, Майкл; Мартус, Питер; Сабо, Рой Т.; Ван, Ю-Ган; Зорн, Кристофер (2010). «Обсуждение« Обобщенных оценочных уравнений: замечания по выбору рабочей корреляционной матрицы » ». Методы информации в медицине . 49 (5): 426–432. дои : 10.1055/s-0038-1625133 . S2CID   3213776 .
  10. ^ Сара Дж. Рэтклифф; Жюстин Шульц (2008). «GEEQBOX: набор инструментов MATLAB для обобщенных уравнений оценки и квазинаименьших квадратов» . Журнал статистического программного обеспечения . 25 (14): 1–14.
  11. ^ «Процедура GENMOD» . Институт САС.
  12. ^ «Расширенная статистика IBM SPSS» . Веб-сайт IBM SPSS.
  13. ^ «Внедрение GEE компанией Stata» (PDF) . Сайт Статы.
  14. ^ «glmtoolbox: Набор инструментов для анализа данных с использованием обобщенных линейных моделей» . КРАН. 10 октября 2023 г.
  15. ^ «Ну и дела: решатель обобщенных уравнений оценки» . КРАН. 7 ноября 2019 г.
  16. ^ geepack: Пакет обобщенных оценочных уравнений , CRAN, 18 декабря 2020 г. {{citation}}: CS1 maint: отсутствует местоположение издателя ( ссылка )
  17. ^ multgee: решатель GEE для коррелированных номинальных или порядковых многочленных ответов с использованием параметризации локальных отношений шансов , CRAN, 13 мая 2021 г. {{citation}}: CS1 maint: отсутствует местоположение издателя ( ссылка )
  18. ^ Шедден, Керби (23 июня 2022 г.). «Обобщенные оценочные уравнения в Джулии» . Гитхаб . Проверено 24 июня 2022 г.
  19. ^ «Обобщенные оценочные уравнения — статистические модели» .
  20. ^ Андреас Зиглер; Ульрике Грёмпинг (1998). «Обобщенные уравнения оценки: сравнение процедур, доступных в коммерческих пакетах статистического программного обеспечения». Биометрический журнал . 40 (3): 245–260. doi : 10.1002/(sici)1521-4036(199807)40:3<245::aid-bimj245>3.0.co;2-n .
  21. ^ Николас Дж. ХОРТОН; Стюарт Р. ЛИПСИТЦ (1999). «Обзор программного обеспечения для соответствия моделям регрессии обобщенных уравнений оценки». Американский статистик . 53 (2): 160–169. CiteSeerX   10.1.1.22.9325 . дои : 10.1080/00031305.1999.10474451 .
  22. ^ Назанин Нураи; Герт Моленбергс; Эдвин Р. ван ден Хеувел (2014). «GEE для продольных порядковых данных: сравнение R-geepack, R-multgee, R-repolr, SAS-GENMOD, SPSS-GENLIN» (PDF) . Вычислительная статистика и анализ данных . 77 : 70–83. дои : 10.1016/j.csda.2014.03.009 . S2CID   15063953 .

Дальнейшее чтение

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 54380e764b6e6e8c605a73bce11ea4c6__1720541820
URL1:https://arc.ask3.ru/arc/aa/54/c6/54380e764b6e6e8c605a73bce11ea4c6.html
Заголовок, (Title) документа по адресу, URL1:
Generalized estimating equation - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)