Jump to content

тест Макнемара

Тест Макнемара — это статистический тест , используемый для парных номинальных данных . Он применяется к таблицам сопряженности 2 × 2 с дихотомическим признаком и с совпадающими парами субъектов, чтобы определить, равны ли крайние частоты строк и столбцов (то есть существует ли «предельная однородность »). Он назван в честь Куинна Макнемара , который представил его в 1947 году. [ 1 ] Применением теста в генетике является тест на неравновесие передачи для обнаружения неравновесия по сцеплению . [ 2 ]

Обычно используемыми параметрами для оценки диагностических тестов в медицинских науках являются чувствительность и специфичность . Чувствительность (или отзыв) — это способность теста правильно идентифицировать людей с заболеванием. Специфичность – это способность теста правильно идентифицировать людей, у которых нет заболевания.

Теперь предположим, что на одной и той же группе пациентов проводятся два теста. А также предположим, что эти тесты имеют одинаковую чувствительность и специфичность. В этой ситуации человек увлекается этими выводами и предполагает, что оба теста эквивалентны. Однако это может быть не так. Для этого нам необходимо изучить пациентов с заболеванием и пациентов без заболевания (с помощью эталонного теста). Нам также предстоит выяснить, в чем эти два теста расходятся друг с другом. Именно на этом основан тест Макнемара. Этот тест сравнивает чувствительность и специфичность двух диагностических тестов на одной и той же группе пациентов. [ 3 ]

Определение

[ редактировать ]

Тест применяется к таблице непредвиденных обстоятельств 2 × 2, в которой сведены результаты двух тестов на выборке из N субъектов следующим образом.

Тест 2 положительный Тест 2 отрицательный Итого по строке
Тест 1 положительный а б а + б
Тест 1 отрицательный с д в + д
Итого по столбцу а + с б + д Н

Нулевая гипотеза предельной однородности утверждает, что две предельные вероятности для каждого результата одинаковы, т.е. p a + p b = p a + p c и p c + p d = p b + p d .

Таким образом, нулевая и альтернативная гипотезы [ 1 ]

Здесь p a и т. д. обозначают теоретическую вероятность появления в ячейках с соответствующей меткой.

Макнемара Статистика теста :

При нулевой гипотезе при достаточно большом числе дискордантов (ячейки b и c) имеет распределение хи-квадрат с 1 степенью свободы . Если Результат значителен , это дает достаточные доказательства, чтобы отвергнуть нулевую гипотезу в пользу альтернативной гипотезы, что p b p c , что будет означать, что предельные пропорции значительно отличаются друг от друга.

Вариации

[ редактировать ]

Если либо b, либо c малы ( b + c < 25), то не очень хорошо аппроксимируется распределением хи-квадрат. [ нужна ссылка ] Затем можно использовать точный биномиальный тест, где b сравнивается с биномиальным распределением с параметром размера n = b + c и p = 0,5. По сути, точный биномиальный тест оценивает дисбаланс дискордантов b и c . Чтобы получить двустороннее значение P, значение P крайнего хвоста следует умножить на 2. Для b c :

что просто в два раза превышает кумулятивную функцию распределения биномиального распределения с p = 0,5 и n = b + c .

Эдвардс [ 4 ] предложил следующую версию теста Макнемара с поправкой на непрерывность для аппроксимации биномиального точного значения P:

Тест Макнемара Mid-P (биномиальный тест Mid-P) рассчитывается путем вычитания половины вероятности наблюдаемого b из точного значения. одностороннее значение P, затем удвойте его, чтобы получить двустороннее среднее значение P: [ 5 ] [ 6 ]

Это эквивалентно:

где второй член — это функция массы вероятности биномиального распределения , а n = b + c . Функции биномиального распределения легко доступны в обычных пакетах программного обеспечения, и можно легко рассчитать средний P-критерий Макнемара. [ 6 ]

Традиционный совет заключался в использовании точного биномиального теста, когда b + c < 25. Однако моделирование показало, что как точный биномиальный тест, так и тест Макнемара с коррекцией непрерывности являются чрезмерно консервативными. [ 6 ] Когда b + c < 6, точное значение P всегда превышает общий уровень значимости 0,05. Первоначальный тест Макнемара был самым мощным, но зачастую несколько либеральным. Версия среднего P была почти такой же мощной, как асимптотический тест Макнемара, и не превышала номинальный уровень значимости.

В первом примере исследователь пытается определить, оказывает ли лекарство влияние на конкретное заболевание. Всего 314 пациентов, и диагнозы у них установлены (заболевание: есть или отсутствует ) до и после применения препарата, то есть каждый образец можно описать с помощью 1 из 4 комбинаций. Число лиц приведено в таблице, причем диагноз (заболевание: присутствует или отсутствует ) до лечения указан в строках, а диагноз после лечения - в столбцах. Тест требует, чтобы одни и те же испытуемые были включены в измерения «до» и «после» (совпадающие пары).

После: настоящее время После: отсутствует Итого по строке
До: настоящее время 101 121 222
До: отсутствует 59 33 92
Итого по столбцу 160 154 314

В этом примере нулевая гипотеза «предельной однородности» будет означать отсутствие эффекта от лечения. Из приведенных выше данных статистика теста Макнемара:

имеет значение 21,35, что крайне маловероятно для формирования распределения, подразумеваемого нулевой гипотезой ( p <0,001). Таким образом, тест предоставляет убедительные доказательства, позволяющие отвергнуть нулевую гипотезу об отсутствии эффекта лечения.

Второй пример иллюстрирует различия между асимптотическим тестом Макнемара и альтернативами. [ 6 ] Таблица данных отформатирована, как и раньше, с разными числами в ячейках:

После: настоящее время После: отсутствует Итого по строке
До: настоящее время 59 6 65
До: отсутствует 16 80 96
Итого по столбцу 75 86 161

Учитывая эти данные, размер выборки (161 пациент) немаленький, однако результаты теста Макнемара и других версий различаются. Точный биномиальный тест дает p = 0,053, а тест Макнемара с поправкой на непрерывность дает = 3,68 и р = 0,055. Асимптотический тест Макнемара дает = 4,55 и p = 0,033, а тест Макнемара со средним P дает p = 0,035. И тест Макнемара, и версия со средним P предоставляют более убедительные доказательства статистически значимого эффекта лечения во втором примере.

Обсуждение

[ редактировать ]

Интересное наблюдение при интерпретации теста Макнемара заключается в том, что элементы главной диагонали не влияют на решение о том, является ли (в приведенном выше примере) состояние до или после лечения более благоприятным. Таким образом, сумма b + c может быть небольшой, а статистическая мощность описанных выше тестов может быть низкой, даже если количество пар a + b + c + d велико (см. второй пример выше).

Расширение теста Макнемара существует в ситуациях, когда между парами не обязательно сохраняется независимость; вместо этого существуют кластеры парных данных, в которых пары в кластере могут не быть независимыми, но независимость сохраняется между различными кластерами. [ 7 ] Примером может служить анализ эффективности стоматологической процедуры; в этом случае пара соответствует лечению отдельного зуба у пациентов, которым возможно лечение нескольких зубов; эффективность лечения двух зубов у одного и того же пациента вряд ли будет независимой, но лечение двух зубов у разных пациентов, скорее всего, будет независимым. [ 8 ]

Информация в парах

[ редактировать ]

В 1970-х годах было высказано предположение, что сохранение миндалин может защитить от лимфомы Ходжкина . Джон Райс писал: [ 9 ]

У 85 пациентов Ходжкина [...] были братья и сестры того же пола. кто был свободен от заболевания и чей возраст был в пределах 5 лет от пациента. Эти исследователи представили следующую таблицу:

Они рассчитали статистику хи-квадрат [...] [они] допустили ошибку в своем анализе, проигнорировав пары. [...] [их] выборки не были независимыми, потому что братья и сестры были парными [...] мы создаем таблицу, в которой показаны пары:

Именно ко второй таблице можно применить тест Макнемара. Обратите внимание, что сумма чисел во второй таблице равна 85 — количество пар братьев и сестер, тогда как сумма чисел в первой таблице вдвое больше, 170 — количество особей. Вторая таблица дает больше информации, чем первая. Числа в первой таблице можно найти, используя числа из второй таблицы, но не наоборот. Числа в первой таблице дают лишь предельные суммы чисел во второй таблице. Тест Макнемара позволяет сравнить 15 и 7 пары, в которых братья и сестры ранее получали различное лечение миндалин, как соответствующие гипотезе, игнорируя при этом менее информативные 37 и 26, где братья и сестры ранее проходили лечение или их миндалин или их не было.

[ редактировать ]

См. также

[ редактировать ]
  1. ^ Jump up to: а б Макнемар, Куинн (18 июня 1947 г.). «Обратите внимание на ошибку выборки разницы между коррелирующими пропорциями или процентами». Психометрика . 12 (2): 153–157. дои : 10.1007/BF02295996 . ПМИД   20254758 . S2CID   46226024 .
  2. ^ Спилман Р.С.; Макгиннис Р.Э.; Юэнс У.Дж. (март 1993 г.). «Тест передачи на неравновесие по сцеплению: область гена инсулина и инсулинозависимый сахарный диабет (ИЗСД)» . Ам Джей Хум Жене . 52 (3): 506–16. ПМК   1682161 . ПМИД   8447318 .
  3. ^ Хавасс, штат Невада (апрель 1997 г.). «Сравнение чувствительности и специфики двух диагностических процедур, выполненных на одной и той же группе пациентов». Британский журнал радиологии . 70 (832): 360–366. дои : 10.1259/bjr.70.832.9166071 . ISSN   0007-1285 . ПМИД   9166071 .
  4. ^ Эдвардс, А. (1948). «Примечание о «поправке на непрерывность» при проверке значимости разницы между коррелирующими пропорциями». Психометрика . 13 (3): 185–187. дои : 10.1007/bf02289261 . ПМИД   18885738 . S2CID   33607853 .
  5. ^ Ланкастер, ХО (1961). «Тестирование значимости в дискретных распределениях». J Am Stat Assoc . 56 (294): 223–234. дои : 10.1080/01621459.1961.10482105 .
  6. ^ Jump up to: а б с д Фагерланд, МВт; Лидерсен, С.; Лааке, П. (2013). «Тест Макнемара для данных двоичных совпадающих пар: среднее значение p и асимптотика лучше, чем точное условие» . Методология медицинских исследований BMC . 13:91 . дои : 10.1186/1471-2288-13-91 . ПМЦ   3716987 . ПМИД   23848987 .
  7. ^ Ян, З.; Солнце, Х.; Хардин, JW (2010). «Заметка о тестах кластеризованных двоичных данных совмещенной пары». Биометрический журнал . 52 (5): 638–652. дои : 10.1002/bimj.201000035 . ПМИД   20976694 . S2CID   29461324 .
  8. ^ Дуркальский, В.Л.; Палеш, Г.Г.; Липсиц, СР; Руст, ПФ (2003). «Анализ кластеризованных данных согласованных пар» . Статистика в медицине . 22 (15): 2417–28. дои : 10.1002/сим.1438 . ПМИД   12872299 . S2CID   25909362 . Архивировано из оригинала 5 января 2013 года . Проверено 1 апреля 2009 г.
  9. ^ Райс, Джон (1995). Математическая статистика и анализ данных (второе изд.). Бельмонт, Калифорния: Даксбери Пресс . стр. 492–494 . ISBN  978-0-534-20934-6 .
  10. ^ Лидделл, Д. (1976). «Практические испытания таблиц сопряженности 2 × 2». Журнал Королевского статистического общества . 25 (4): 295–304. дои : 10.2307/2988087 . JSTOR   2988087 .
  11. ^ «Тест Максвелла, тест Макнемара, тест Каппа» . Rimarcik.com . Проверено 22 ноября 2012 г.
  12. ^ Сунь, Сюэчжэн; Ян, Чжао (2008). «Обобщенный тест Макнемара на однородность предельных распределений» (PDF) . SAS . Глобальный форум
  13. ^ Стюарт, Алан (1955). «Тест на однородность предельных распределений в двусторонней классификации». Биометрика . 42 (3/4): 412–416. дои : 10.1093/biomet/42.3-4.412 . JSTOR   2333387 .
  14. ^ Максвелл, А.Е. (1970). «Сравнение классификации предметов двумя независимыми судьями». Британский журнал психиатрии . 116 (535): 651–655. дои : 10.1192/bjp.116.535.651 . ПМИД   5452368 . S2CID   9211848 .
  15. ^ «Тест Макнемара на предельную однородность» . Джон-uebersax.com. 30 августа 2006 г. Проверено 22 ноября 2012 г.
  16. ^ Бхапкар, вице-президент (1966). «Заметка об эквивалентности двух критериев проверки гипотез в категориальных данных». Журнал Американской статистической ассоциации . 61 (313): 228–235. дои : 10.1080/01621459.1966.10502021 . JSTOR   2283057 .
  17. ^ Ян, З.; Солнце, Х.; Хардин, JW (2012). «Тестирование предельной однородности в политомических данных согласованной пары». Терапевтические инновации и регуляторная наука . 46 (4): 434–438. дои : 10.1177/0092861512442021 . S2CID   123109340 .
  18. ^ Агрести, Алан (2002). Категориальный анализ данных (PDF) . Хукен, Нью-Джерси: John Wiley & Sons, Inc., с. 413. ИСБН  978-0-471-36093-3 .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 2fc7acc99f91df607d53e6c121e56b2b__1720162680
URL1:https://arc.ask3.ru/arc/aa/2f/2b/2fc7acc99f91df607d53e6c121e56b2b.html
Заголовок, (Title) документа по адресу, URL1:
McNemar's test - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)