Jump to content

Почти уверенная проверка гипотезы

В статистике почти верная проверка гипотез или проверка гипотез использует почти верную сходимость , чтобы определить достоверность статистической гипотезы с вероятностью единица. Это означает, что всякий раз, когда нулевая гипотеза верна, проверка as-гипотезы не сможет отвергнуть нулевую гипотезу wp 1 для всех достаточно больших выборок. Аналогично, всякий раз, когда альтернативная гипотеза верна, проверка гипотезы отвергает нулевую гипотезу с вероятностью единица для всех достаточно больших выборок. Подобным же образом доверительный интервал в конечном итоге содержит интересующий параметр с вероятностью 1. Дембо и Перес (1994) доказали существование почти надежных проверок гипотез.

Описание

[ редактировать ]

Для простоты предположим, что у нас есть последовательность независимых и одинаково распределенных нормальных случайных величин: , со средним и единичная дисперсия. Предположим, что природа или симуляция выбрали истинное значение. , то функция распределения вероятностей среднего значения, , определяется

где брекет Айверсона использовался . Наивный подход к оценке этой функции распределения заключался бы в замене истинного среднего значения в правой части такой оценкой, как выборочное среднее, , но

это означает, что аппроксимация истинной функции распределения будет отличаться от истинного среднего значения на 0,5. Однако, представляет собой не что иное, как односторонний 50% доверительный интервал; в общем, пусть быть критическим значением, используемым в одностороннем доверительный интервал, тогда

Если мы установим , то ошибка аппроксимации уменьшается с 0,5 до 0,05, что составляет 10 раз. Конечно, если положить , затем

Однако это лишь показывает, что математическое ожидание близко к предельному значению. Нааман (2016) показал, что установка уровня значимости на уровне с приводит к конечному числу ошибок I и II рода wp1 при достаточно мягких условиях регулярности. Это означает, что для каждого , существует , такой, что для всех ,

где равенство выполнено wp 1. Таким образом, индикаторная функция одностороннего доверительного интервала является хорошим приближением к истинной функции распределения.

Приложения

[ редактировать ]

Дополнительная остановка

[ редактировать ]

Например, предположим, что исследователь провел эксперимент с размером выборки 10 человек и не нашел статистически значимого результата. Затем предположим, что она решила добавить еще одно наблюдение и повторить этот процесс, пока не будет получен значимый результат. В этом сценарии, учитывая, что первоначальная партия из 10 наблюдений привела к незначительному результату, вероятность того, что эксперимент будет остановлен при некотором конечном размере выборки, равна , может быть ограничено с помощью неравенства Буля

где . Это выгодно отличается от тестирования с фиксированным уровнем значимости, которое имеет конечное время остановки с вероятностью единица; однако эта граница не будет иметь смысла для всех последовательностей уровня значимости, поскольку приведенная выше сумма может быть больше единицы (установка будет одним из примеров). Но даже при использовании такой пропускной способности, если тестирование проводилось партиями по 10, то

что приводит к относительно большой вероятности того, что процесс никогда не закончится.

Предвзятость публикации

[ редактировать ]

Еще один пример эффективности этого подхода: если академический журнал принимает только статьи со значением p менее 0,05, то примерно 1 из 20 независимых исследований с тем же эффектом даст значимый результат, когда его не будет. Однако, если журнал требует минимальный размер выборки 100, а максимальный уровень значимости определяется выражением , то можно было бы ожидать, что примерно в 1 из 250 исследований будет обнаружен эффект, хотя его не было (если бы минимальный размер выборки составлял 30, он все равно был бы 1 из 60). Если максимальный уровень значимости определялся формулой (которые будут иметь лучшую производительность небольшой выборки в отношении ошибок типа I, когда вызывают беспокойство множественные сравнения), можно было бы ожидать, что примерно в 1 из 10 000 исследований будет обнаружен эффект, когда его не было (если бы минимальный размер выборки составлял 30, это было бы 1 из 900). Кроме того, проверка гипотез AS устойчива к множественным сравнениям.

Парадокс Джеффриса-Линдли

[ редактировать ]

Парадокс Линдли возникает, когда

  1. Результат является «значимым» по частотному тесту, например, на уровне 5%, что указывает на достаточные доказательства для отклонения нулевой гипотезы, и
  2. Апостериорная вероятность нулевой гипотезы высока, что указывает на убедительные доказательства того, что нулевая гипотеза лучше согласуется с данными, чем альтернативная гипотеза.

Однако парадокс не применим к проверке гипотез. Сторонники байесовского подхода и сторонники частотного подхода в конечном итоге придут к одному и тому же выводу.

См. также

[ редактировать ]
  • Нааман, Михаил (2016). «Почти надежная проверка гипотез и разрешение парадокса Джеффриса-Линдли». Электронный статистический журнал . 10 (1): 1526–1550.
  • Дембо, Амир; Перес, Юваль (1994). «Топологический критерий проверки гипотез». Анналы статистики . 22 (1): 106–117.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: d3bf54d40e922c3532b604fecbb36400__1549202700
URL1:https://arc.ask3.ru/arc/aa/d3/00/d3bf54d40e922c3532b604fecbb36400.html
Заголовок, (Title) документа по адресу, URL1:
Almost sure hypothesis testing - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)