тест Койпера
Критерий Койпера используется в статистике для проверки того, взята ли выборка данных из заданного распределения (одновыборочный тест Койпера) или две выборки данных взяты из одного и того же неизвестного распределения (двухвыборочный тест Койпера). Он назван в честь голландского математика Николааса Койпера . [ 1 ]
Тест Койпера тесно связан с более известным тестом Колмогорова-Смирнова (или тестом КС, как его часто называют). Как и в случае с тестом KS, статистика расхождений D + и Д − представляют собой абсолютные размеры наиболее положительных и наиболее отрицательных различий между двумя кумулятивными функциями распределения сравниваемыми . Хитрость теста Койпера заключается в использовании величины D + + Д − в качестве тестовой статистики. Это небольшое изменение делает критерий Койпера столь же чувствительным как в хвостах, так и в медиане , а также делает его инвариантным относительно циклических преобразований независимой переменной. Тест Андерсона -Дарлинга — еще один тест, который обеспечивает чувствительность на хвостах, равную медиане, но не обеспечивает циклическую инвариантность.
Эта инвариантность относительно циклических преобразований делает тест Койпера неоценимым при проверке циклических изменений в зависимости от времени года, дня недели или времени суток, а также в более общем плане для проверки соответствия круговых распределений вероятностей и различий между ними .
Одновыборочный тест Койпера
[ редактировать ]Статистика одновыборочного теста, , для теста Койпера определяется следующим образом. Пусть F — непрерывная кумулятивная функция распределения , которая должна быть нулевой гипотезой . Обозначим через F n эмпирическую функцию распределения для n независимых и одинаково распределенных (iid) наблюдений X i , которая определяется как
- где – индикаторная функция , равная 1, если и равен 0 в противном случае.
Тогда односторонняя Колмогорова–Смирнова статистика для данной кумулятивной функции распределения F ( x ) равна
где является супремум-функцией . И, наконец, одновыборочный тест Койпера определяется как:
или эквивалентно
где – это минимальная функция .
Таблицы критических точек статистики испытаний доступны, [ 2 ] параметры семейства распределений и к ним относятся определенные случаи, когда тестируемое распределение не полностью известно, поэтому оцениваются .
Асимптотическое распределение статистики дается, [ 1 ]
Для разумное приближение получается из первого члена ряда следующим образом
Двухвыборочный тест Койпера
[ редактировать ]Тест Койпера также можно использовать для проверки того, соответствует ли пара случайных выборок реальной линии или круга общему, но неизвестному распределению. В этом случае статистика Койпера равна
где и – эмпирические функции распределения первой и второй выборки соответственно, — верхняя функция , а – это минимальная функция .
Пример
[ редактировать ]Мы могли бы проверить гипотезу о том, что в некоторые времена года компьютеры выходят из строя чаще, чем в другие. Чтобы проверить это, мы собирали даты, когда тестовый набор компьютеров вышел из строя, и строили эмпирическую функцию распределения . Нулевая гипотеза заключается в том, что отказы распределены равномерно . Статистика Койпера не изменится, если мы изменим начало года, и не требует, чтобы мы разбивали неудачи на месяцы или что-то в этом роде. [ 1 ] [ 3 ] Другой тестовой статистикой, обладающей этим свойством, является статистика Ватсона. [ 3 ] [ 4 ] что связано с тестом Крамера-фон Мизеса .
Однако, если сбои происходят в основном по выходным, многие тесты равномерного распределения, такие как KS и Kuiper, пропустят это, поскольку выходные дни распределены в течение года. Эта неспособность отличить распределения гребенчатой формы от непрерывных равномерных распределений является ключевой проблемой всей статистики, основанной на варианте теста КС. Тест Койпера, примененный к времени событий по модулю одна неделя, способен обнаружить такую закономерность. Использование времени событий, модулированного с помощью теста KS, может привести к разным результатам в зависимости от того, как данные поэтапно распределены. В этом примере тест KS может обнаружить неравномерность, если данные настроены на начало недели в субботу, но не сможет обнаружить неравномерность, если неделя начинается в среду.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б с Койпер, Нью-Хэмпшир (1960). «Тесты, касающиеся случайных точек на окружности». Труды Королевской голландской академии наук, серия A. 63 : 38–47.
- ^ Пирсон, Э.С. , Хартли, Х.О. (1972) Таблицы биометрики для статистиков, Том 2 , CUP. ISBN 0-521-06937-8 (таблица 54)
- ^ Jump up to: а б Уотсон, Г.С. (1961) «Тест на соответствие окружности», Biometrika , 48 (1/2), 109–114 JSTOR 2333135
- ^ Пирсон, Э.С. , Хартли, Х.О. (1972) Таблицы биометрики для статистиков, Том 2 , CUP. ISBN 0-521-06937-8 (стр. 118)