Показатели ошибок при проверке гипотез
При статистической проверке гипотез показатель ошибки процедуры проверки гипотез — это скорость, с которой вероятности типа I и типа II экспоненциально уменьшаются в зависимости от размера выборки, используемой в тесте. Например, если вероятность ошибки теста распадается по мере , где — размер выборки, показатель ошибки — .
Формально показатель ошибки теста определяется как предельное значение отношения отрицательного логарифма вероятности ошибки к размеру выборки для больших размеров выборки: . Показатели ошибок для различных проверок гипотез вычисляются с использованием теоремы Санова и других результатов теории больших уклонений .
Показатели ошибок при проверке бинарных гипотез
[ редактировать ]Рассмотрим задачу проверки бинарной гипотезы, в которой наблюдения моделируются как независимые и одинаково распределенные случайные величины в соответствии с каждой гипотезой. Позволять обозначить наблюдения. Позволять обозначают функцию плотности вероятности каждого наблюдения при нулевой гипотезе и пусть обозначают функцию плотности вероятности каждого наблюдения согласно альтернативной гипотезе .
В этом случае возможны два ошибочных события . Ошибка типа 1, также называемая ложноположительным , возникает, когда нулевая гипотеза верна, но ошибочно отвергается. Ошибка типа 2, также называемая ложноотрицательной, возникает, когда альтернативная гипотеза верна, а нулевая гипотеза не отвергается. Вероятность ошибки первого рода обозначается а вероятность ошибки второго рода обозначается .
Оптимальный показатель ошибки для тестирования Неймана – Пирсона
[ редактировать ]В Неймане-Пирсоне [1] версия проверки бинарной гипотезы, заинтересованная в минимизации вероятности ошибки 2-го типа при условии, что вероятность ошибки первого рода меньше или равно заранее заданному уровню . В этой ситуации оптимальной процедурой тестирования является тест отношения правдоподобия . [2] Более того, оптимальный тест гарантирует, что вероятность ошибки типа 2 экспоненциально убывает с размером выборки. в соответствии с . [3] Экспонента ошибки – это расхождение Кульбака–Лейблера между распределениями вероятностей наблюдений при двух гипотезах. Этот показатель также называют показателем леммы Чернова – Штейна.
Оптимальный показатель ошибки для средней вероятности ошибки при проверке байесовской гипотезы
[ редактировать ]В байесовской версии проверки бинарной гипотезы заинтересованы в минимизации средней вероятности ошибки по обеим гипотезам, предполагая априорную вероятность возникновения каждой гипотезы. Позволять обозначают априорную вероятность гипотезы . В этом случае средняя вероятность ошибки определяется выражением . В этом случае критерий отношения правдоподобия снова является оптимальным, а оптимальная ошибка уменьшается по мере того, как где представляет информацию Чернова между двумя распределениями, определяемыми как . [3]
Ссылки
[ редактировать ]- ^ Нейман, Дж .; Пирсон, ES (1933), «О проблеме наиболее эффективных проверок статистических гипотез» (PDF) , Philosophical Transactions of the Royal Society of London A , 231 (694–706): 289–337, Bibcode : 1933RSPTA.231 ..289N , doi : 10.1098/rsta.1933.0009 , JSTOR 91247
- ^ Леманн, Эль ; Романо, Джозеф П. (2005). Проверка статистических гипотез (3-е изд.). Нью-Йорк: Спрингер. ISBN 978-0-387-98864-1 .
- ^ Jump up to: а б Обложка, Томас М .; Томас, Джой А. (2006). Элементы теории информации (2-е изд.). Нью-Йорк: Wiley-Interscience.