Ложноположительный показатель

В статистике при выполнении множественных сравнений коэффициент ложных срабатываний (также известный как коэффициент ложных срабатываний или коэффициент ложных тревог) — это вероятность ложного отклонения нулевой гипотезы для конкретного теста . Доля ложноположительных результатов рассчитывается как соотношение количества негативных событий, ошибочно классифицированных как положительные ( ложноположительные результаты ), и общего количества фактических негативных событий (независимо от классификации).

ложноположительных результатов Уровень (или «коэффициент ложных срабатываний») обычно относится к ожидаемому ложноположительных результатов коэффициенту .

Определение

Уровень ложноположительных результатов составляет ${\boldsymbol {\mathrm {FPR} }}={\frac {\mathrm {FP} }{\mathrm {FP} +\mathrm {TN} }}$

где $\mathrm {FP}$ количество ложных срабатываний, $\mathrm {TN}$ количество истинных отрицательных результатов и $N=\mathrm {FP} +\mathrm {TN}$ общее количество отрицательных фактов.

Уровень значимости, используемый для проверки каждой гипотезы, устанавливается на основе формы вывода ( одновременный вывод или выборочный вывод ) и поддерживающих его критериев (например, FWER или FDR ), которые были заранее определены исследователем.

При выполнении множественных сравнений в такой статистической системе, как указано выше, коэффициент ложных срабатываний (также известный как коэффициент ложных тревог , в отличие от частоты ложных срабатываний / частоты ложных тревог ) обычно относится к вероятности ложного отклонения нулевой гипотезы для конкретной тест . Используя предложенную здесь терминологию, это просто $V/m_{0}$ .

Поскольку V — случайная величина и $m_{0}$ является константой ( $V\leq m_{0}$ ложноположительных результатов ), коэффициент также является случайной величиной и находится в диапазоне от 0 до 1.
Уровень ложноположительных результатов (или «коэффициент ложных срабатываний») обычно относится к ожиданию коэффициента ложноположительных результатов , выражаемому выражением $E(V/m_{0})$ .

Стоит отметить, что эти два определения («коэффициент ложноположительных результатов» / «коэффициент ложноположительных результатов») в некоторой степени взаимозаменяемы. Например, в упомянутой статье ^[1] $V/m_{0}$ служит ложноположительным «скоростью», а не его «отношением».

Классификация множественных проверок гипотез

В следующей таблице определены возможные результаты при проверке нескольких нулевых гипотез. Предположим, у нас есть количество m нулевых гипотез, обозначенных: $H 1, H 2, ..., H m .$ Используя статистический тест , мы отвергаем нулевую гипотезу, если тест признан значимым. Мы не отвергаем нулевую гипотезу, если тест незначим.Суммирование результатов каждого типа по всем H _i дает следующие случайные величины:

	Нулевая гипотеза верна (H ₀ )	Альтернативная гипотеза верна ( _HA )	Общий
Тест признан значимым	$V$	$С$	$Р$
Тест признан незначимым	$В$	$Т$	$m-R$
Общий	$m_{0}$	$m-m_{0}$	$м$

$m$ — общее количество проверенных гипотез.
$m_{0}$ — количество истинных нулевых гипотез , неизвестный параметр
$m-m_{0}$ количество истинных альтернативных гипотез
$V$ — количество ложных срабатываний (ошибка I рода) (также называемых «ложными открытиями»).
$S$ — количество истинных положительных результатов (также называемых «истинными открытиями»).
$T$ — количество ложноотрицательных результатов (ошибка II рода)
$U$ - количество истинных негативов
$R=V+S$ количество отвергнутых нулевых гипотез (также называемых «открытиями», истинными или ложными)

В $m$ проверки гипотез, из которых $m_{0}$ являются истинными нулевыми гипотезами, $R$ — наблюдаемая случайная величина, а $S$ , $T$ , $U$ и $V$ — ненаблюдаемые случайные величины .

Сравнение с другими коэффициентами ошибок

Хотя уровень ложноположительных результатов математически равен уровню ошибок типа I , он рассматривается как отдельный термин по следующим причинам: ^{[ нужна ссылка ]}

Частота ошибок типа I часто связана с априорной установкой уровня значимости исследователем : уровень значимости представляет собой приемлемую частоту ошибок, учитывая, что все нулевые гипотезы верны (гипотеза «глобального нуля»). Таким образом, выбор уровня значимости может быть несколько произвольным (т.е. установка 10% (0,1), 5% (0,05), 1% (0,01) и т. д.).

В отличие от этого, уровень ложноположительных результатов связан с пост-априорным результатом, который представляет собой ожидаемое количество ложноположительных результатов, деленное на общее количество гипотез при реальной комбинации истинных и неверных нулевых гипотез (без учета «глобального «нулевая» гипотеза). Поскольку уровень ложноположительных результатов является параметром, который не контролируется исследователем, его нельзя отождествить с уровнем значимости.

Более того, уровень ложноположительных результатов обычно используется в отношении медицинского теста или диагностического устройства (т.е. «коэффициент ложноположительных результатов определенного диагностического устройства составляет 1%)», тогда как ошибка типа I — это термин, связанный со статистическими тестами, где значение слово «положительный» не так ясно (т.е. «ошибка теста I рода составляет 1%)».

Уровень ложноположительных результатов также не следует путать с уровнем семейных ошибок , который определяется как ${\boldsymbol {\mathrm {FWER} }}=\Pr(V\geq 1)\,$ . По мере роста количества тестов коэффициент семейных ошибок обычно приближается к 1, в то время как уровень ложноположительных результатов остается фиксированным.

Наконец, важно отметить глубокую разницу между частотой ложных срабатываний и частотой ложных открытий : в то время как первая определяется как $E(V/m_{0})$ , второй определяется как $E(V/R)$ .

См. также

Ссылки

^ Берк, Дональд; Брандейдж, Джон; Редфилд, Роберт (1988). «Измерение уровня ложноположительных результатов в программе скрининга инфекций, вызванных вирусом иммунодефицита человека». Медицинский журнал Новой Англии . 319 (15): 961–964. дои : 10.1056/NEJM198810133191501 . ПМИД 3419477 .

[Burke.at.all1988-1] Берк, Дональд; Брандейдж, Джон; Редфилд, Роберт (1988). «Измерение уровня ложноположительных результатов в программе скрининга инфекций, вызванных вирусом иммунодефицита человека». Медицинский журнал Новой Англии . 319 (15): 961–964. дои : 10.1056/NEJM198810133191501 . ПМИД 3419477 .

[1]