Тест Ван дер Вардена
Названный в честь голландского математика Бартеля Леендерта ван дер Вардена , тест Ван дер Вардена представляет собой статистический тест , подтверждающий k равенство функций распределения населения. Критерий Ван дер Вардена преобразует ранги стандартного критерия Крускала-Уоллиса в квантили стандартного нормального распределения (подробности приведены ниже). Они называются нормальными баллами, и тест рассчитывается на основе этих нормальных баллов.
Версия теста для k -популяций является расширением теста для двух популяций, опубликованного Ван дер Варденом (1952, 1953).
Предыстория [ править ]
Дисперсионный анализ (ANOVA) — это метод анализа данных для изучения значимости факторов ( независимых переменных ) в многофакторной модели. Однофакторную модель можно рассматривать как обобщение двухвыборочного t-критерия . То есть двухвыборочный t-критерий представляет собой проверку гипотезы о том, что два средних значения совокупности равны. Однофакторный дисперсионный анализ проверяет гипотезу о том, что средние значения популяции k равны. Стандартный дисперсионный анализ предполагает, что ошибки (т. е. остатки) имеют нормальное распределение . Если это предположение о нормальности неверно, альтернативой является использование непараметрического теста .
Определение теста [ править ]
Пусть n j ( j = 1, 2, ..., k ) представляет размеры выборки для каждой из k групп (т. е. выборок) в данных. Пусть N обозначает размер выборки для всех групп. Пусть X ij представляет i й значение в j й группа. Нормальные баллы рассчитываются как
где R ( X ij ) обозначает ранг наблюдения X ij и где Φ −1 обозначает нормальную функцию квантиля . Затем среднее значение нормальных баллов для каждого образца можно вычислить как
Дисперсия нормальных показателей может быть рассчитана как
Тогда тест Ван дер Вардена можно определить следующим образом:
- H 0 : Все функции распределения населения k имеют тенденцию давать одно и то же наблюдение.
- H a : По крайней мере одна из популяций имеет тенденцию давать более крупные наблюдения, чем по крайней мере одна из других популяций.
Статистика теста
Для уровня значимости α критическая область равна
где Χ α,k − 1 2 представляет собой α- квантиль распределения хи-квадрат с k − 1 степенями свободы. Нулевая гипотеза отклоняется, если тестовая статистика находится в критической области. Если гипотеза об идентичном распределении отвергается, можно выполнить процедуру множественного сравнения , чтобы определить, какие пары популяций имеют тенденцию различаться. Популяции j 1 и j 2 кажутся разными, если выполняется следующее неравенство:
с t 1 − α/2 (1 − α/2)-квантиль t - распределения .
Сравнение с тестом Крускала-Уоллиса [ править ]
Наиболее распространенным непараметрическим тестом однофакторной модели является тест Крускала-Уоллиса . Критерий Краскала-Уоллиса основан на ранжировании данных. Преимущество теста Ван дер Вардена заключается в том, что он обеспечивает высокую эффективность стандартного анализа ANOVA, когда предположения о нормальности фактически выполняются, но также обеспечивает надежность теста Крускала-Уоллиса, когда предположения о нормальности не выполняются.
Ссылки [ править ]
- Коновер, WJ (1999). Практическая непараметрическая статистика (Третье изд.). Уайли. стр. 396–406.
- ван дер Варден, БЛ (1952). «Порядок тестов для задачи двух выборок и их мощность», Indagationes Mathematicae , 14, 453–458.
- ван дер Варден, BL (1953). «Тесты порядка для задачи двух выборок. II, III», Труды Королевской Нидерландской академии искусств и наук, серия A , 564, 303–310, 311–316.
Эта статья включает общедоступные материалы Национального института стандартов и технологий.