Вальд-Вольфовиц проводит тест
Тест Уолда-Вольфовица (или просто тест запуска ), названный в честь статистиков Авраама Уолда и Джейкоба Вулфовица, представляет собой непараметрический статистический тест, который проверяет гипотезу случайности для двузначной последовательности данных . Точнее, его можно использовать для проверки гипотезы элементов последовательности о взаимной независимости .
Определение
[ редактировать ]Серия последовательности — это максимальный непустой сегмент последовательности, состоящий из соседних одинаковых элементов. Например, последовательность из 22 элементов
- + + + + − − − + + + − − + + + + + + − − − −
состоит из 6 прогонов длиной 4, 3, 3, 2, 6 и 4. Тест прогона основан на нулевой гипотезе о том, что каждый элемент последовательности независимо извлекается из одного и того же распределения.
Согласно нулевой гипотезе, количество повторов в последовательности из N элементов [ примечание 1 ] — случайная величина которой , условное распределение при наблюдении N + положительных значений [ примечание 2 ] и N − отрицательные значения ( N = N + + N − ) примерно нормальны, при этом: [ 1 ] [ 2 ]
Аналогично, количество запусков равно .
Эти параметры не предполагают, что положительные и отрицательные элементы имеют равные вероятности появления, а лишь предполагают, что элементы независимы и одинаково распределены . Если количество прогонов существенно больше или меньше ожидаемого, гипотеза статистической независимости элементов может быть отвергнута.
Доказательства
[ редактировать ]Моменты
[ редактировать ]Количество запусков . Благодаря независимости ожидание Выписывая все возможности, находим Таким образом, . Теперь упростим выражение, чтобы получить .
Аналогично, дисперсия количества прогонов равна и упростив, получим дисперсию.
Аналогично мы можем вычислить все моменты , но алгебра становится всё уродливее и уродливее.
Асимптотическая нормальность
[ редактировать ]Теорема. Если мы будем выбирать все более и более длинные последовательности, с для некоторых фиксированных , затем сходится по распределению к нормальному распределению со средним значением 0 и дисперсией 1.
Эскиз доказательства. Достаточно доказать асимптотическую нормальность последовательности , что можно доказать с помощью центральной предельной теоремы мартингала .
Приложения
[ редактировать ]Тесты Runs можно использовать для проверки:
- случайность распределения, беря данные в заданном порядке и отмечая + данные, превышающие медиану , и - данные, меньшие медианы (числа, равные медиане, опускаются).
- хорошо ли функция вписывается в набор данных , отмечая данные, превышающие значение функции, знаком +, а другие данные знаком –. Для этого использования тест пробегов, который учитывает знаки, но не расстояния, дополняет тест хи-квадрат , который учитывает расстояния, но не знаки.
Связанные тесты
[ редактировать ]местоположением . Было показано, что критерий Колмогорова-Смирнова более эффективен, чем критерий Вальда-Вольфовица, для обнаружения различий между распределениями, которые различаются исключительно своим Однако обратное верно, если распределения различаются по дисперсии и имеют лишь небольшую разницу в местоположении. [ нужна ссылка ]
Тест Вальда-Вольфовица был расширен для использования с несколькими образцами . [ 3 ] [ 4 ] [ 5 ] [ 6 ]
Примечания
[ редактировать ]Ссылки
[ редактировать ]- ^ «Выполняет тест на обнаружение неслучайности» .
- ^ Образец 33092: Тест Вальда-Вулфовица (или тесты) на случайность.
- ^ Магель, RC; Вибово, SH (1997). «Сравнение возможностей тестов Вальда – Вольфовица и Колмогорова – Смирнова». Биометрический журнал . 39 (6): 665–675. дои : 10.1002/bimj.4710390605 .
- ^ Бартон, Делавэр; Дэвид, ФН (1957). «Множественные пробеги». Биометрика . 44 (1–2): 168–178. дои : 10.1093/biomet/44.1-2.168 .
- ^ Срент П., Смитон, Северная Каролина (2007) Прикладные непараметрические статистические методы, стр. 217–219. Бока-Ратон: Чепмен и Холл / CRC.
- ^ Альхаким, А; Хупер, В. (2008). «Непараметрический тест для нескольких независимых выборок». Журнал непараметрической статистики . 20 (3): 253–261. CiteSeerX 10.1.1.568.6110 . дои : 10.1080/10485250801976741 .