Ложноположительные и ложноотрицательные результаты
Ложноположительный результат — это ошибка бинарной классификации , при которой результат теста неправильно указывает на наличие заболевания (например, заболевания, когда заболевания нет), а ложноотрицательный результат — противоположная ошибка, когда результат теста неправильно указывает на отсутствие условия, когда оно действительно присутствует. Это два вида ошибок в двоичном тесте, в отличие от двух видов правильных результатов ( настоящий позитив и истинно отрицательный ). В медицине они известны также как ложноположительные (или ложноотрицательные ) диагнозы , а в статистической классификации — как ложноположительные (или ложноотрицательные ) ошибки . [1]
При проверке статистической гипотезы аналогичные концепции известны как ошибки типа I и типа II , где положительный результат соответствует отклонению нулевой гипотезы , а отрицательный результат соответствует не отклонению нулевой гипотезы. Эти термины часто используются как взаимозаменяемые, но существуют различия в деталях и интерпретации из-за различий между медицинским тестированием и проверкой статистических гипотез.
Ложноположительная ошибка
[ редактировать ]или Ложноположительная ошибка ложноположительный результат — это результат, указывающий на то, что данное условие существует, хотя его нет. Например, тест на беременность, показывающий, что женщина беременна, хотя на самом деле это не так, или осуждение невиновного человека. [2]
Ложноположительная ошибка — это ошибка типа I , когда тест проверяет одно условие и ошибочно дает утвердительное (положительное) решение. Однако важно различать частоту ошибок первого рода и вероятность ложного положительного результата. Последний известен как риск ложноположительных результатов (см. « Неоднозначность в определении уровня ложноположительных результатов» ниже ). [3]
Ложноотрицательная ошибка
[ редактировать ]или Ложноотрицательная ошибка ложноотрицательный результат — это результат теста, который ошибочно указывает на то, что условие не выполняется. Например, когда тест на беременность показывает, что женщина не беременна, но она беременна, или когда лицо, виновное в совершении преступления, оправдано, это ложноотрицательные результаты. Условие «женщина беременна» или «человек виновен» сохраняется, но тест (тест на беременность или судебное разбирательство) не учитывает это условие и ошибочно решает, что человек не беременен или не виноват. [4]
Ложноотрицательная ошибка — это ошибка II рода, возникающая в тесте, в котором проверяется одно условие, а результат теста ошибочен, то есть это условие отсутствует. [5]
Связанные термины
[ редактировать ]Ложноположительные и ложноотрицательные показатели
[ редактировать ]Уровень ложноположительных результатов (FPR) — это доля всех отрицательных результатов, которые все же дают положительные результаты теста, т. е. условная вероятность положительного результата теста с учетом события, которого не было. [6] Уровень ложноположительных результатов зависит от уровня значимости . Специфичность 1 теста равна минус процент ложноположительных результатов. [7]
При проверке статистических гипотез этой дроби присваивается греческая буква α , а 1 − α определяется как специфичность теста. Повышение специфичности теста снижает вероятность ошибок типа I, но может повысить вероятность ошибок типа II (ложноотрицательные результаты, которые отвергают альтернативную гипотезу, когда она верна). [а]
Кроме того, Уровень ложноотрицательных результатов (FNR) — это доля положительных результатов, которые дают отрицательные результаты теста, т. е. условная вероятность отрицательного результата теста при наличии искомого состояния. [8]
При проверке статистических гипотез этой дроби присваивается буква β . « Мощность » (или « чувствительность ») теста равна 1 − β .
Неясность в определении уровня ложноположительных результатов
[ редактировать ]Термин «коэффициент ложного обнаружения» (FDR) использовался Колкухауном (2014). [9] означает вероятность того, что «значимый» результат окажется ложноположительным. Позже Колкухун (2017) [3] использовал термин «ложноположительный риск» (FPR) для той же величины, чтобы избежать путаницы с термином FDR, который используют люди, работающие над множественными сравнениями . Коррекции для множественных сравнений направлены только на исправление частоты ошибок типа I, поэтому результатом является (скорректированное) p -значение . Таким образом, они подвержены той же неверной интерпретации, что и любое другое значение p . Риск ложноположительного результата всегда выше, часто намного выше, чем значение p . [9] [3]
Смешение этих двух идей, ошибка транспонированного условного предложения , причинила много вреда. [10] Из-за неоднозначности обозначений в этой области важно смотреть на определение в каждой статье. Опасности зависимости от p -значений были подчеркнуты в Colquhoun (2017). [3] указав, что даже наблюдение p = 0,001 не обязательно является убедительным доказательством против нулевой гипотезы. Несмотря на то, что отношение правдоподобия в пользу альтернативной гипотезы по сравнению с нулевой близко к 100, если бы гипотеза была неправдоподобной, а априорная вероятность реального эффекта была бы равна 0,1, даже наблюдение p = 0,001 имело бы ложноположительный результат. ставка 8 процентов. Он не достигнет даже 5-процентного уровня. В связи с этим было рекомендовано [3] [11] что каждое значение p должно сопровождаться априорной вероятностью существования реального эффекта, который необходимо было бы предположить, чтобы достичь ложноположительного риска в 5%. Например, если мы наблюдаем p = 0,05 в одном эксперименте, мы должны быть на 87% уверены в том, что существует реальный эффект до того, как эксперимент будет проведен, чтобы достичь риска ложноположительного результата в 5%.
Рабочая характеристика приемника
[ редактировать ]В статье « Рабочая характеристика приемника » рассмотрены параметры статистической обработки сигналов, основанные на соотношениях ошибок различных типов.
См. также
[ редактировать ]- Ошибка базовой ставки
- Ложноположительный показатель
- Положительная и отрицательная прогностическая ценность
- Почему большинство опубликованных результатов исследований являются ложными
Примечания
[ редактировать ]- ^ При разработке алгоритмов обнаружения или тестов необходимо выбирать баланс между рисками ложноотрицательных и ложноположительных результатов. Обычно существует порог того, насколько близко должно быть достигнуто совпадение с данным образцом, прежде чем алгоритм сообщит о совпадении. Чем выше этот порог, тем больше ложноотрицательных результатов и меньше ложноположительных результатов.
Ссылки
[ редактировать ]- ^ Ложноположительные и ложноотрицательные результаты
- ^ Робинсон, Александр; Келлер, Л. Робин; дель Кампо, Кристина (октябрь 2022 г.). «Построение понимания истинно положительных и ложноположительных результатов: правило Байеса» . Журнал инновационного образования «Науки о принятии решений» . 20 (4): 224–234. дои : 10.1111/dsji.12265 . ISSN 1540-4595 .
- ^ Jump up to: а б с д и Колкухун, Дэвид (2017). «Воспроизводимость исследований и неправильная интерпретация p-значений» . Королевское общество открытой науки . 4 (12): 171085. дои : 10.1098/rsos.171085 . ПМК 5750014 . ПМИД 29308247 .
- ^ Альнабулси, Хусейн; Ислам, Рафики; Мамун, Каси (2018). «Новый алгоритм для защиты от атак путем внедрения кода». В Абаваджи - Джемаль Х.; Чу, Ким-Кван Рэймонд; Ислам, Рафикул (ред.). Международная конференция по приложениям и методам кибербезопасности и разведки: Приложения и методы кибербезопасности и разведки . Чам, Швейцария: Springer International Publishing. п. 288. ИСБН 978-3-31967-071-3 .
- ^ Банерджи, А; Читнис, УБ; Джадхав, СЛ; Бхавалкар, Дж.С.; Чаудхури, С. (2009). «Проверка гипотез, ошибки I и II рода» . Индийская психиатрия Дж . 18 (2): 127–31. дои : 10.4103/0972-6748.62274 . ПМК 2996198 . ПМИД 21180491 .
- ^ Бозе, Просенджит; Го, Хуа; Кранакис, Евангелос; Махешвари, Анил; Морен, Пэт; Моррисон, Джейсон; Смид, Мишель; Тан, Ихуэй (2008). «О ложноположительных результатах фильтров Блума». Письма об обработке информации . 108 (4): 210. doi : 10.1016/j.ipl.2008.05.018 .
- ^ Кронин, Пол; Келли, Эйн Мари (2011). «Влияние распространенности населения на количество ложноположительных результатов: упущенный из виду объект». Академическая радиология . 18 (9): 1088. doi : 10.1016/j.acra.2011.04.011 .
- ^ Кронин и Келли, 2011, стр.1087.
- ^ Jump up to: а б Колкухун, Дэвид (2014). «Расследование частоты ложных открытий и неправильной интерпретации p -значений» . Королевское общество открытой науки . 1 (3): 140216. arXiv : 1407.5296 . Бибкод : 2014RSOS....140216C . дои : 10.1098/rsos.140216 . ПМЦ 4448847 . ПМИД 26064558 .
- ^ Колкухун, Дэвид. «Проблема с p-значениями» . Эон . Журнал Эон . Проверено 11 декабря 2016 г.
- ^ Колкухун, Дэвид (2018). «Ложноположительный риск: предложение о том, что делать со значениями p». Американский статистик . 73 : 192–201. arXiv : 1802.04888 . дои : 10.1080/00031305.2018.1529622 . S2CID 85530643 .