Биномиальный тест

В статистике биномиальный тест — это точная проверка статистической значимости отклонений от теоретически ожидаемого распределения наблюдений на две категории с использованием выборочных данных.

Использование

Биномиальный тест полезен для проверки гипотез о вероятности ( $\pi$ ) успеха:

H_{0}\colon \pi =\pi _{0}

где $\pi _{0}$ — определяемое пользователем значение от 0 до 1.

Если в выборке размером $n$ есть $k$ успехов, хотя мы ожидаем $n\pi _{0}$ , формула биномиального распределения дает вероятность нахождения этого значения:

\Pr(X=k)={\binom {n}{k}}p^{k}(1-p)^{n-k}

Если нулевая гипотеза $H_{0}$ были верны, то ожидаемое число успехов будет $n\pi _{0}$ . Мы находим наших $p$ -значение для этого теста, если принять во внимание вероятность увидеть результат как экстремальный или даже более экстремальный. Для одностороннего теста это легко вычислить. Предположим, мы хотим проверить, $\pi <\pi _{0}$ . Тогда наш $p$ -значение будет,

p=\sum _{i=0}^{k}\Pr(X=i)=\sum _{i=0}^{k}{\binom {n}{i}}\pi _{0}^{i}(1-\pi _{0})^{n-i}

Аналогичное вычисление можно провести, если мы проверим, $\pi >\pi _{0}$ используя суммирование диапазона от $k$ к $n$ вместо.

Расчет $p$ -значение для двустороннего теста немного сложнее, поскольку биномиальное распределение не является симметричным, если $\pi _{0}\neq 0.5$ . Это означает, что мы не можем просто удвоить $p$ -значение из одностороннего теста. Напомним, что мы хотим рассматривать события, которые являются такими же или более экстремальными, чем то, которое мы видели, поэтому мы должны учитывать вероятность того, что мы увидим событие, которое столь же или менее вероятно, чем $X=k$ . Позволять ${\mathcal {I}}=\{i\colon \Pr(X=i)\leq \Pr(X=k)\}$ обозначают все такие события. Тогда двухвостый $p$ -значение рассчитывается как,

p=\sum _{i\in {\mathcal {I}}}\Pr(X=i)=\sum _{i\in {\mathcal {I}}}{\binom {n}{i}}\pi _{0}^{i}(1-\pi _{0})^{n-i}

Общее использование

Одно из распространенных применений биномиального теста — это случай, когда нулевая гипотеза предполагает , что две категории встречаются с одинаковой частотой ( $H_{0}\colon \pi =0.5$ ), например, подбрасывание монеты. Широко доступны таблицы, показывающие значимость наблюдаемого количества наблюдений в категориях для этого случая. Однако, как показывает пример ниже, биномиальный тест не ограничивается этим случаем.

Когда существует более двух категорий и требуется точный тест, полиномиальный тест , основанный на полиномиальном распределении . вместо биномиального теста необходимо использовать ^[1]

Большие образцы

Для больших выборок, таких как пример ниже, биномиальное распределение хорошо аппроксимируется удобными непрерывными распределениями , и они используются в качестве основы для альтернативных тестов, которые гораздо быстрее вычисляются, таких как критерий хи-квадрат Пирсона и G-тест . Однако для небольших выборок эти приближения не работают, и альтернативы биномиальному тесту нет.

Наиболее обычное (и самое простое) приближение - это стандартное нормальное распределение, в котором выполняется z-тест тестовой статистики. $Z$ , заданный

Z={\frac {k-n\pi }{\sqrt {n\pi (1-\pi )}}}

где $k$ количество успехов, наблюдаемых в выборке размером $n$ и $\pi$ — вероятность успеха согласно нулевой гипотезе. Улучшение этого приближения возможно за счет введения поправки на непрерывность :

Z={\frac {k-n\pi \pm {\frac {1}{2}}}{\sqrt {n\pi (1-\pi )}}}

Для очень больших $n$ , эта поправка на непрерывность не будет иметь значения, но для промежуточных значений, где точный биномиальный тест не работает, она даст существенно более точный результат.

В обозначениях в виде измеренной выборочной доли ${\hat {p}}$ , нулевая гипотеза для пропорции $p_{0}$ и размер выборки $n$ , где ${\hat {p}}=k/n$ и $p_{0}=\pi$ , можно переставить и записать приведенный выше z-тест как

Z={\frac {{\hat {p}}-p_{0}}{\sqrt {\frac {p_{0}(1-p_{0})}{n}}}}

путем деления на $n$ как в числителе, так и в знаменателе, эта форма может быть более знакома некоторым читателям.

Пример

Предположим, у нас есть настольная игра , которая зависит от броска одного кубика и придает особое значение выпадению 6. В конкретной игре кубик бросают 235 раз, и 6 выпадает 51 раз. Если кубик выпал честно, мы ожидаем, что выпадет 6.

235\times 1/6=39.17

раз. Теперь мы заметили, что количество шестерок выше, чем мы могли бы ожидать в среднем по чистой случайности, если бы игральная кость была бы удачной. Но достаточно ли велико это число, чтобы мы могли сделать какой-либо вывод о справедливости кубика? На этот вопрос можно ответить с помощью биномиального теста. Наша нулевая гипотеза будет заключаться в том, что кубик выпал честно (вероятность того, что каждое число, выпавшее на кубике, равна 1/6).

Чтобы найти ответ на этот вопрос с помощью биномиального теста, мы используем биномиальное распределение

B(N=235,p=1/6)

с пмф

f(k,n,p)=\Pr(k;n,p)=\Pr(X=k)={\binom {n}{k}}p^{k}(1-p)^{n-k}

.

Поскольку мы наблюдали значение, превышающее ожидаемое значение, мы могли бы рассмотреть вероятность наблюдения 51 шестёрки или выше при нулевом значении, что представляло бы собой односторонний тест (здесь мы в основном проверяем, смещен ли этот кубик в сторону генерации большего количества шестёрок). чем ожидалось). Чтобы вычислить вероятность появления 51 или более шестерок в выборке из 235 при нулевой гипотезе, мы складываем вероятности получения ровно 51 шестерки, ровно 52 шестерок и так далее до вероятности получения ровно 235 шестерок:

\sum _{i=51}^{235}{235 \choose i}p^{i}(1-p)^{235-i}=0.02654

Если у нас уровень значимости 5%, то этот результат (0,02654 < 5%) указывает на то, что у нас есть достаточно значимые доказательства, чтобы отвергнуть нулевую гипотезу о том, что игральная кость справедлива.

Обычно, когда мы проверяем справедливость игральной кости, нас также интересует, смещена ли игральная кость в сторону генерации меньшего числа шестерок, чем ожидалось, а не только большего количества шестерок, как мы рассматривали в одностороннем тесте выше. Чтобы учесть обе систематические ошибки, мы используем двусторонний тест . Обратите внимание, что для этого мы не можем просто удвоить одностороннее значение p, если только вероятность события не равна 1/2. Это связано с тем, что биномиальное распределение становится асимметричным, когда вероятность отклоняется от 1/2. Существует два метода определения двустороннего p-значения. Один из методов заключается в суммировании вероятности того, что общее отклонение количества событий в любом направлении от ожидаемого значения будет больше или меньше ожидаемого значения. Вероятность этого в нашем примере равна 0,0437. Второй метод предполагает вычисление вероятности того, что отклонение от ожидаемого значения столь же маловероятно или более маловероятно, чем наблюдаемое значение, т.е. путем сравнения функций плотности вероятности. Это может создать незначительную разницу, но в этом примере дает ту же вероятность 0,0437. В обоих случаях двусторонний тест показывает значимость на уровне 5%, указывая на то, что количество наблюдаемых шестерок значительно отличалось для этого кубика от ожидаемого числа на уровне 5%.

В пакетах статистического программного обеспечения

Биномиальные тесты доступны в большинстве программ, используемых в статистических целях. Например

В R приведенный выше пример можно вычислить с помощью следующего кода:
- binom.test(51, 235, 1/6, alternative = "less") (односторонний тест)
- binom.test(51, 235, 1/6, alternative = "greater") (односторонний тест)
- binom.test(51, 235, 1/6, alternative = "two.sided") (двусторонний тест)

В Java с использованием библиотеки Apache Commons :
- new BinomialTest().binomialTest(235, 51, 1.0 / 6, AlternativeHypothesis.LESS_THAN) (односторонний тест)
- new BinomialTest().binomialTest(235, 51, 1.0 / 6, AlternativeHypothesis.GREATER_THAN) (односторонний тест)
- new BinomialTest().binomialTest(235, 51, 1.0 / 6, AlternativeHypothesis.TWO_SIDED) (двусторонний тест)

В SAS тест доступен в процедуре «Частота».

PROC FREQ DATA=DiceRoll ;
	TABLES Roll / BINOMIAL (P=0.166667) ALPHA=0.05 ;
	EXACT  BINOMIAL ;
	WEIGHT Freq ;
RUN;

В SPSS тест можно использовать через меню «Анализ» > «Непараметрический тест» > «Биномиальный».
```
 npar tests 
 /binomial (.5) = node1 node2.
```
В Python используйте SciPy биномтест :
- scipy.stats.binomtest(51, 235, 1.0/6, alternative='greater') (односторонний тест)
- scipy.stats.binomtest(51, 235, 1.0/6, alternative='two-sided') (двусторонний тест)
В MATLAB используйте myBinomTest , который доступен на веб-сайте обмена файлами сообщества Mathworks. myBinomTest напрямую рассчитает значение p для наблюдений с учетом предполагаемой вероятности успеха. [pout]=myBinomTest(51, 235, 1/6) (обычно двусторонний, но при необходимости можно выполнить односторонний тест).
В Stata используйте bitest.
В Microsoft Excel используйте Binom.Dist. Функция принимает параметры (Количество успехов, Испытаний, Вероятность успеха, Кумулятивное). Параметр «Cumulative» принимает логическое значение True или False, где True дает совокупную вероятность обнаружения такого количества успехов (левосторонний тест), а False — точную вероятность обнаружения такого количества успехов.

См. также

Ссылки

^ Хауэлл, Дэвид С. (2007). Статистические методы психологии (6-е изд.). Белмонт, Калифорния: Томсон. ISBN 978-0495012870 .

«Биномиальный тест» . www.graphpad.com .

Внешние ссылки

Калькулятор биномиальной вероятности

[Howell-1] Хауэлл, Дэвид С. (2007). Статистические методы психологии (6-е изд.). Белмонт, Калифорния: Томсон. ISBN 978-0495012870 .

[1]