Ложноположительный показатель
Эта статья в значительной степени или полностью опирается на один источник . ( июль 2016 г. ) |
В статистике при выполнении множественных сравнений коэффициент ложных срабатываний (также известный как коэффициент ложных срабатываний или коэффициент ложных тревог) — это вероятность ложного отклонения нулевой гипотезы для конкретного теста . Доля ложноположительных результатов рассчитывается как соотношение количества негативных событий, ошибочно классифицированных как положительные ( ложноположительные результаты ), и общего количества фактических негативных событий (независимо от классификации).
ложноположительных результатов Уровень (или «коэффициент ложных срабатываний») обычно относится к ожидаемому ложноположительных результатов коэффициенту .
Определение
[ редактировать ]Уровень ложноположительных результатов составляет
где количество ложных срабатываний, количество истинных отрицательных результатов и общее количество отрицательных фактов.
Уровень значимости, используемый для проверки каждой гипотезы, устанавливается на основе формы вывода ( одновременный вывод или выборочный вывод ) и поддерживающих его критериев (например, FWER или FDR ), которые были заранее определены исследователем.
При выполнении множественных сравнений в такой статистической системе, как указано выше, коэффициент ложных срабатываний (также известный как коэффициент ложных тревог , в отличие от частоты ложных срабатываний / частоты ложных тревог ) обычно относится к вероятности ложного отклонения нулевой гипотезы для конкретной тест . Используя предложенную здесь терминологию, это просто .
Поскольку V — случайная величина и является константой ( ложноположительных результатов ), коэффициент также является случайной величиной и находится в диапазоне от 0 до 1.
Уровень ложноположительных результатов (или «коэффициент ложных срабатываний») обычно относится к ожиданию коэффициента ложноположительных результатов , выражаемому выражением .
Стоит отметить, что эти два определения («коэффициент ложноположительных результатов» / «коэффициент ложноположительных результатов») в некоторой степени взаимозаменяемы. Например, в упомянутой статье [1] служит ложноположительным «скоростью», а не его «отношением».
Классификация множественных проверок гипотез
[ редактировать ]В следующей таблице определены возможные результаты при проверке нескольких нулевых гипотез. Предположим, у нас есть количество m нулевых гипотез, обозначенных: H 1 , H 2 , ..., H m . Используя статистический тест , мы отвергаем нулевую гипотезу, если тест признан значимым. Мы не отвергаем нулевую гипотезу, если тест незначим.Суммирование результатов каждого типа по всем H i дает следующие случайные величины:
Нулевая гипотеза верна (H 0 ) | Альтернативная гипотеза верна ( HA ) | Общий | |
---|---|---|---|
Тест признан значимым | V | С | Р |
Тест признан незначимым | В | Т | |
Общий | м |
- m — общее количество проверенных гипотез.
- — количество истинных нулевых гипотез , неизвестный параметр
- количество истинных альтернативных гипотез
- V — количество ложных срабатываний (ошибка I рода) (также называемых «ложными открытиями»).
- S — количество истинных положительных результатов (также называемых «истинными открытиями»).
- T — количество ложноотрицательных результатов (ошибка II рода)
- U - количество истинных негативов
- количество отвергнутых нулевых гипотез (также называемых «открытиями», истинными или ложными)
В m проверки гипотез, из которых являются истинными нулевыми гипотезами, R — наблюдаемая случайная величина, а S , T , U и V — ненаблюдаемые случайные величины .
Сравнение с другими коэффициентами ошибок
[ редактировать ]Возможно, этот раздел содержит оригинальные исследования . ( февраль 2013 г. ) |
Хотя уровень ложноположительных результатов математически равен уровню ошибок типа I , он рассматривается как отдельный термин по следующим причинам: [ нужна ссылка ]
- Частота ошибок типа I часто связана с априорной установкой уровня значимости исследователем : уровень значимости представляет собой приемлемую частоту ошибок, учитывая, что все нулевые гипотезы верны (гипотеза «глобального нуля»). Таким образом, выбор уровня значимости может быть несколько произвольным (т.е. установка 10% (0,1), 5% (0,05), 1% (0,01) и т. д.).
- В отличие от этого, уровень ложноположительных результатов связан с пост-априорным результатом, который представляет собой ожидаемое количество ложноположительных результатов, деленное на общее количество гипотез при реальной комбинации истинных и неверных нулевых гипотез (без учета «глобального «нулевая» гипотеза). Поскольку уровень ложноположительных результатов является параметром, который не контролируется исследователем, его нельзя отождествить с уровнем значимости.
- Более того, уровень ложноположительных результатов обычно используется в отношении медицинского теста или диагностического устройства (т.е. «коэффициент ложноположительных результатов определенного диагностического устройства составляет 1%)», тогда как ошибка типа I — это термин, связанный со статистическими тестами, где значение слово «положительный» не так ясно (т.е. «ошибка теста I рода составляет 1%)».
Уровень ложноположительных результатов также не следует путать с уровнем семейных ошибок , который определяется как . По мере роста количества тестов коэффициент семейных ошибок обычно приближается к 1, в то время как уровень ложноположительных результатов остается фиксированным.
Наконец, важно отметить глубокую разницу между частотой ложных срабатываний и частотой ложных открытий : в то время как первая определяется как , второй определяется как .
См. также
[ редактировать ]- Ложноположительные и ложноотрицательные результаты
- Ложный уровень покрытия
- Уровень ложного обнаружения
- Чувствительность и специфичность
Ссылки
[ редактировать ]- ^ Берк, Дональд; Брандейдж, Джон; Редфилд, Роберт (1988). «Измерение уровня ложноположительных результатов в программе скрининга инфекций, вызванных вирусом иммунодефицита человека». Медицинский журнал Новой Англии . 319 (15): 961–964. дои : 10.1056/NEJM198810133191501 . ПМИД 3419477 .