Статистика Кокрана-Мантела-Хэнзеля
В статистике тест Кокрана -Мантела-Хэнзеля ( CMH ) — это тест, используемый при анализе стратифицированных или сопоставленных категориальных данных . Это позволяет исследователю проверить связь между бинарным предиктором или лечением и бинарным результатом, таким как случай или контрольный статус, принимая во внимание стратификацию. [ 1 ] В отличие от теста Макнемара , который может обрабатывать только пары, тест CMH обрабатывает слои произвольного размера. Он назван в честь Уильяма Г. Кокрана , Натана Мантеля и Уильяма Хэнзеля . [ 2 ] [ 3 ] Распространение этого теста на категориальный ответ и/или на несколько групп обычно называют статистикой Кокрана-Мантела-Хэнзеля. [ 4 ] Его часто используют в обсервационных исследованиях , в которых невозможно контролировать случайное распределение субъектов на различные виды лечения, но мешающие можно измерить ковариаты.
Определение
[ редактировать ]Мы рассматриваем бинарную переменную результата, такую как статус случая (например, рак легких), и бинарный предиктор, такой как статус лечения (например, курение). Наблюдения сгруппированы в страты. Стратифицированные данные суммируются в серии таблиц сопряженности 2 × 2, по одной для каждой страты. -я такая таблица i непредвиденных обстоятельств:
Уход | Никакого лечения | Итого по строке | |
Случай | И я | С | № 1 я |
Элементы управления | CТам | DОт | № 2 я |
Итого по столбцу | М 1 я | М 2 я | Т я |
Общее отношение шансов таблиц K непредвиденных обстоятельств определяется как:
Нулевая гипотеза заключается в том, что между лечением и результатом нет никакой связи. Точнее, нулевая гипотеза и альтернативная гипотеза . Статистика теста:
Из этого следует распределение асимптотически с 1 df при нулевой гипотезе. [ 1 ]
Стабильность подмножества
[ редактировать ]стандартное соотношение шансов или риска для всех слоев, получив коэффициенты риска. Можно рассчитать , где это количество слоев. Если бы стратификацию удалить, в свернутой таблице остался бы один совокупный коэффициент риска; пусть это будет . [ нужна ссылка ]
Обычно ожидается, что риск события, безусловного для стратификации, будет ограничен между самым высоким и самым низким риском в пределах страт (или идентично отношениям шансов ). Легко построить примеры, когда это не так, и больше или меньше всех для . Это сравнимо, но не идентично парадоксу Симпсона , и, как и в случае с парадоксом Симпсона, трудно интерпретировать статистику и принимать решения на основе нее.
Клемент [ 5 ] определяет статистику как стабильную подмножество тогда и только тогда, когда ограничен между и и статистика «хорошего поведения» как бесконечно дифференцируемая и не зависящая от порядка страт. Тогда статистика CMH является уникальной статистикой с хорошим поведением, удовлетворяющей стабильности подмножества. [ нужна ссылка ]
Связанные тесты
[ редактировать ]- Тест Макнемара может обрабатывать только пары. Тест CMH является обобщением теста Макнемара , поскольку его статистика теста идентична, когда в каждом слое отображается пара. [ 6 ]
- Условная логистическая регрессия является более общей, чем тест CMH, поскольку она может обрабатывать непрерывные переменные и выполнять многомерный анализ. Когда можно применить тест CMH, статистика теста CMH и теста оценки статистика условной логистической регрессии идентичны. [ 7 ]
- Тест Бреслоу – Дэя на гомогенную ассоциацию. Тест CMH предполагает, что эффект лечения однороден во всех слоях. Тест Бреслоу-Дея позволяет проверить это предположение. Это не проблема, если страты небольшие, например пары.
Примечания
[ редактировать ]- ^ Jump up to: а б Агрести, Алан (2002). Категориальный анализ данных . Хобокен, Нью-Джерси: John Wiley & Sons, Inc., стр. 231–232. ISBN 0-471-36093-7 .
- ^ Уильям Г. Кокран (декабрь 1954 г.). «Некоторые методы усиления общих тестов χ2». Биометрия . 10 (4): 417–451. дои : 10.2307/3001616 . JSTOR 3001616 .
- ^ Натан Мантел и Уильям Хэнзель (апрель 1959 г.). «Статистические аспекты анализа данных ретроспективных исследований заболеваний». Журнал Национального института рака . 22 (4): 719–748. дои : 10.1093/jnci/22.4.719 . ПМИД 13655060 .
- ^ Натан Мантел (сентябрь 1963 г.). «Тест хи-квадрат с одной степенью свободы, расширение процедуры Мантеля – Хэнзеля». Журнал Американской статистической ассоциации . 58 (303): 690–700. дои : 10.1080/01621459.1963.10500879 . JSTOR 2282717 .
- ^ Бен Клеменс (июнь 2021 г.). «Анализ внутренней миграции в США с помощью стабильных подмножеств административных данных» . Журнал вычислительной социальной науки . 5 : 351–382. дои : 10.1007/s42001-021-00124-w . S2CID 236308711 .
- ^ Агрести, Алан (2002). Категориальный анализ данных . Хобокен, Нью-Джерси: John Wiley & Sons, Inc., с. 413. ИСБН 0-471-36093-7 .
- ^ День НЭ, Бяр ДП (сентябрь 1979 г.). «Проверка гипотез в исследованиях случай-контроль - эквивалентность статистики Мантеля – Хензеля и тестов логит-оценки». Биометрия . 35 (3): 623–630. дои : 10.2307/2530253 . JSTOR 2530253 . ПМИД 497345 .