тест Макнемара
![]() | Эта статья может быть слишком технической для понимания большинства читателей . ( Ноябрь 2012 г. ) |
Тест Макнемара — это статистический тест , используемый для парных номинальных данных . Он применяется к таблицам сопряженности 2 × 2 с дихотомическим признаком и с совпадающими парами субъектов, чтобы определить, равны ли крайние частоты строк и столбцов (то есть существует ли «предельная однородность »). Он назван в честь Куинна Макнемара , который представил его в 1947 году. [ 1 ] Применением теста в генетике является тест на неравновесие передачи для обнаружения неравновесия по сцеплению . [ 2 ]
Обычно используемыми параметрами для оценки диагностических тестов в медицинских науках являются чувствительность и специфичность . Чувствительность (или отзыв) — это способность теста правильно идентифицировать людей с заболеванием. Специфичность – это способность теста правильно идентифицировать людей, у которых нет заболевания.
Теперь предположим, что на одной и той же группе пациентов проводятся два теста. А также предположим, что эти тесты имеют одинаковую чувствительность и специфичность. В этой ситуации человек увлекается этими выводами и предполагает, что оба теста эквивалентны. Однако это может быть не так. Для этого нам необходимо изучить пациентов с заболеванием и пациентов без заболевания (с помощью эталонного теста). Нам также предстоит выяснить, в чем эти два теста расходятся друг с другом. Именно на этом основан тест Макнемара. Этот тест сравнивает чувствительность и специфичность двух диагностических тестов на одной и той же группе пациентов. [ 3 ]
Определение
[ редактировать ]Тест применяется к таблице непредвиденных обстоятельств 2 × 2, в которой сведены результаты двух тестов на выборке из N субъектов следующим образом.
Тест 2 положительный | Тест 2 отрицательный | Итого по строке | |
Тест 1 положительный | а | б | а + б |
Тест 1 отрицательный | с | д | в + д |
Итого по столбцу | а + с | б + д | Н |
Нулевая гипотеза предельной однородности утверждает, что две предельные вероятности для каждого результата одинаковы, т.е. p a + p b = p a + p c и p c + p d = p b + p d .
Таким образом, нулевая и альтернативная гипотезы [ 1 ]
Здесь p a и т. д. обозначают теоретическую вероятность появления в ячейках с соответствующей меткой.
Макнемара Статистика теста :
При нулевой гипотезе при достаточно большом числе дискордантов (ячейки b и c) имеет распределение хи-квадрат с 1 степенью свободы . Если Результат значителен , это дает достаточные доказательства, чтобы отвергнуть нулевую гипотезу в пользу альтернативной гипотезы, что p b ≠ p c , что будет означать, что предельные пропорции значительно отличаются друг от друга.
Вариации
[ редактировать ]Если либо b, либо c малы ( b + c < 25), то не очень хорошо аппроксимируется распределением хи-квадрат. [ нужна ссылка ] Затем можно использовать точный биномиальный тест, где b сравнивается с биномиальным распределением с параметром размера n = b + c и p = 0,5. По сути, точный биномиальный тест оценивает дисбаланс дискордантов b и c . Чтобы получить двустороннее значение P, значение P крайнего хвоста следует умножить на 2. Для b ≥ c :
что просто в два раза превышает кумулятивную функцию распределения биномиального распределения с p = 0,5 и n = b + c .
Эдвардс [ 4 ] предложил следующую версию теста Макнемара с поправкой на непрерывность для аппроксимации биномиального точного значения P:
Тест Макнемара Mid-P (биномиальный тест Mid-P) рассчитывается путем вычитания половины вероятности наблюдаемого b из точного значения. одностороннее значение P, затем удвойте его, чтобы получить двустороннее среднее значение P: [ 5 ] [ 6 ]
Это эквивалентно:
где второй член — это функция массы вероятности биномиального распределения , а n = b + c . Функции биномиального распределения легко доступны в обычных пакетах программного обеспечения, и можно легко рассчитать средний P-критерий Макнемара. [ 6 ]
Традиционный совет заключался в использовании точного биномиального теста, когда b + c < 25. Однако моделирование показало, что как точный биномиальный тест, так и тест Макнемара с коррекцией непрерывности являются чрезмерно консервативными. [ 6 ] Когда b + c < 6, точное значение P всегда превышает общий уровень значимости 0,05. Первоначальный тест Макнемара был самым мощным, но зачастую несколько либеральным. Версия среднего P была почти такой же мощной, как асимптотический тест Макнемара, и не превышала номинальный уровень значимости.
Примеры
[ редактировать ]В первом примере исследователь пытается определить, оказывает ли лекарство влияние на конкретное заболевание. Всего 314 пациентов, и диагнозы у них установлены (заболевание: есть или отсутствует ) до и после применения препарата, то есть каждый образец можно описать с помощью 1 из 4 комбинаций. Число лиц приведено в таблице, причем диагноз (заболевание: присутствует или отсутствует ) до лечения указан в строках, а диагноз после лечения - в столбцах. Тест требует, чтобы одни и те же испытуемые были включены в измерения «до» и «после» (совпадающие пары).
После: настоящее время | После: отсутствует | Итого по строке | |
До: настоящее время | 101 | 121 | 222 |
До: отсутствует | 59 | 33 | 92 |
Итого по столбцу | 160 | 154 | 314 |
В этом примере нулевая гипотеза «предельной однородности» будет означать отсутствие эффекта от лечения. Из приведенных выше данных статистика теста Макнемара:
имеет значение 21,35, что крайне маловероятно для формирования распределения, подразумеваемого нулевой гипотезой ( p <0,001). Таким образом, тест предоставляет убедительные доказательства, позволяющие отвергнуть нулевую гипотезу об отсутствии эффекта лечения.
Второй пример иллюстрирует различия между асимптотическим тестом Макнемара и альтернативами. [ 6 ] Таблица данных отформатирована, как и раньше, с разными числами в ячейках:
После: настоящее время | После: отсутствует | Итого по строке | |
До: настоящее время | 59 | 6 | 65 |
До: отсутствует | 16 | 80 | 96 |
Итого по столбцу | 75 | 86 | 161 |
Учитывая эти данные, размер выборки (161 пациент) немаленький, однако результаты теста Макнемара и других версий различаются. Точный биномиальный тест дает p = 0,053, а тест Макнемара с поправкой на непрерывность дает = 3,68 и р = 0,055. Асимптотический тест Макнемара дает = 4,55 и p = 0,033, а тест Макнемара со средним P дает p = 0,035. И тест Макнемара, и версия со средним P предоставляют более убедительные доказательства статистически значимого эффекта лечения во втором примере.
Обсуждение
[ редактировать ]Интересное наблюдение при интерпретации теста Макнемара заключается в том, что элементы главной диагонали не влияют на решение о том, является ли (в приведенном выше примере) состояние до или после лечения более благоприятным. Таким образом, сумма b + c может быть небольшой, а статистическая мощность описанных выше тестов может быть низкой, даже если количество пар a + b + c + d велико (см. второй пример выше).
Расширение теста Макнемара существует в ситуациях, когда между парами не обязательно сохраняется независимость; вместо этого существуют кластеры парных данных, в которых пары в кластере могут не быть независимыми, но независимость сохраняется между различными кластерами. [ 7 ] Примером может служить анализ эффективности стоматологической процедуры; в этом случае пара соответствует лечению отдельного зуба у пациентов, которым возможно лечение нескольких зубов; эффективность лечения двух зубов у одного и того же пациента вряд ли будет независимой, но лечение двух зубов у разных пациентов, скорее всего, будет независимым. [ 8 ]
Информация в парах
[ редактировать ]В 1970-х годах было высказано предположение, что сохранение миндалин может защитить от лимфомы Ходжкина . Джон Райс писал: [ 9 ]
У 85 пациентов Ходжкина [...] были братья и сестры того же пола. кто был свободен от заболевания и чей возраст был в пределах 5 лет от пациента. Эти исследователи представили следующую таблицу:
Они рассчитали статистику хи-квадрат [...] [они] допустили ошибку в своем анализе, проигнорировав пары. [...] [их] выборки не были независимыми, потому что братья и сестры были парными [...] мы создаем таблицу, в которой показаны пары:
Именно ко второй таблице можно применить тест Макнемара. Обратите внимание, что сумма чисел во второй таблице равна 85 — количество пар братьев и сестер, тогда как сумма чисел в первой таблице вдвое больше, 170 — количество особей. Вторая таблица дает больше информации, чем первая. Числа в первой таблице можно найти, используя числа из второй таблицы, но не наоборот. Числа в первой таблице дают лишь предельные суммы чисел во второй таблице. Тест Макнемара позволяет сравнить 15 и 7 пары, в которых братья и сестры ранее получали различное лечение миндалин, как соответствующие гипотезе, игнорируя при этом менее информативные 37 и 26, где братья и сестры ранее проходили лечение или их миндалин или их не было.
Сопутствующие тесты и методы
[ редактировать ]- Биномиальный знаковый тест дает точный тест для теста Макнемара.
- является Тест Q Кокрана расширением теста Макнемара для более чем двух «обработок».
- является Точный тест Лидделла точной альтернативой тесту Макнемара. [ 10 ] [ 11 ]
- Тест Стюарта-Максвелла представляет собой другое обобщение теста Макнемара, используемое для проверки предельной однородности в квадратной таблице с более чем двумя строками/столбцами. [ 12 ] [ 13 ] [ 14 ]
- ( Тест Бхапкара 1966 г.) является более мощной альтернативой тесту Стюарта – Максвелла. [ 15 ] [ 16 ] но он имеет тенденцию быть либеральным. Доступны конкурентоспособные альтернативы существующим методам. [ 17 ]
- Критерий Макнемара является частным случаем критерия Кокрана-Мантела-Хэнзеля ; он эквивалентен тесту CMH с одной стратой для каждой из N пар и в каждой страте таблицей 2x2, показывающей парные двоичные ответы. [ 18 ]
- Полиномиальные доверительные интервалы используются для сопоставленных пар двоичных данных.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б Макнемар, Куинн (18 июня 1947 г.). «Обратите внимание на ошибку выборки разницы между коррелирующими пропорциями или процентами». Психометрика . 12 (2): 153–157. дои : 10.1007/BF02295996 . ПМИД 20254758 . S2CID 46226024 .
- ^ Спилман Р.С.; Макгиннис Р.Э.; Юэнс У.Дж. (март 1993 г.). «Тест передачи на неравновесие по сцеплению: область гена инсулина и инсулинозависимый сахарный диабет (ИЗСД)» . Ам Джей Хум Жене . 52 (3): 506–16. ПМК 1682161 . ПМИД 8447318 .
- ^ Хавасс, штат Невада (апрель 1997 г.). «Сравнение чувствительности и специфики двух диагностических процедур, выполненных на одной и той же группе пациентов». Британский журнал радиологии . 70 (832): 360–366. дои : 10.1259/bjr.70.832.9166071 . ISSN 0007-1285 . ПМИД 9166071 .
- ^ Эдвардс, А. (1948). «Примечание о «поправке на непрерывность» при проверке значимости разницы между коррелирующими пропорциями». Психометрика . 13 (3): 185–187. дои : 10.1007/bf02289261 . ПМИД 18885738 . S2CID 33607853 .
- ^ Ланкастер, ХО (1961). «Тестирование значимости в дискретных распределениях». J Am Stat Assoc . 56 (294): 223–234. дои : 10.1080/01621459.1961.10482105 .
- ^ Jump up to: а б с д Фагерланд, МВт; Лидерсен, С.; Лааке, П. (2013). «Тест Макнемара для данных двоичных совпадающих пар: среднее значение p и асимптотика лучше, чем точное условие» . Методология медицинских исследований BMC . 13:91 . дои : 10.1186/1471-2288-13-91 . ПМЦ 3716987 . ПМИД 23848987 .
- ^ Ян, З.; Солнце, Х.; Хардин, JW (2010). «Заметка о тестах кластеризованных двоичных данных совмещенной пары». Биометрический журнал . 52 (5): 638–652. дои : 10.1002/bimj.201000035 . ПМИД 20976694 . S2CID 29461324 .
- ^ Дуркальский, В.Л.; Палеш, Г.Г.; Липсиц, СР; Руст, ПФ (2003). «Анализ кластеризованных данных согласованных пар» . Статистика в медицине . 22 (15): 2417–28. дои : 10.1002/сим.1438 . ПМИД 12872299 . S2CID 25909362 . Архивировано из оригинала 5 января 2013 года . Проверено 1 апреля 2009 г.
- ^ Райс, Джон (1995). Математическая статистика и анализ данных (второе изд.). Бельмонт, Калифорния: Даксбери Пресс . стр. 492–494 . ISBN 978-0-534-20934-6 .
- ^ Лидделл, Д. (1976). «Практические испытания таблиц сопряженности 2 × 2». Журнал Королевского статистического общества . 25 (4): 295–304. дои : 10.2307/2988087 . JSTOR 2988087 .
- ^ «Тест Максвелла, тест Макнемара, тест Каппа» . Rimarcik.com . Проверено 22 ноября 2012 г.
- ^ Сунь, Сюэчжэн; Ян, Чжао (2008). «Обобщенный тест Макнемара на однородность предельных распределений» (PDF) . SAS . Глобальный форум
- ^ Стюарт, Алан (1955). «Тест на однородность предельных распределений в двусторонней классификации». Биометрика . 42 (3/4): 412–416. дои : 10.1093/biomet/42.3-4.412 . JSTOR 2333387 .
- ^ Максвелл, А.Е. (1970). «Сравнение классификации предметов двумя независимыми судьями». Британский журнал психиатрии . 116 (535): 651–655. дои : 10.1192/bjp.116.535.651 . ПМИД 5452368 . S2CID 9211848 .
- ^ «Тест Макнемара на предельную однородность» . Джон-uebersax.com. 30 августа 2006 г. Проверено 22 ноября 2012 г.
- ^ Бхапкар, вице-президент (1966). «Заметка об эквивалентности двух критериев проверки гипотез в категориальных данных». Журнал Американской статистической ассоциации . 61 (313): 228–235. дои : 10.1080/01621459.1966.10502021 . JSTOR 2283057 .
- ^ Ян, З.; Солнце, Х.; Хардин, JW (2012). «Тестирование предельной однородности в политомических данных согласованной пары». Терапевтические инновации и регуляторная наука . 46 (4): 434–438. дои : 10.1177/0092861512442021 . S2CID 123109340 .
- ^ Агрести, Алан (2002). Категориальный анализ данных (PDF) . Хукен, Нью-Джерси: John Wiley & Sons, Inc., с. 413. ИСБН 978-0-471-36093-3 .