Тест Краскала-Уоллиса

Критерий Краскела -Уоллиса по рангам, Краскал-Уоллис тест [ 1 ] (названный в честь Уильяма Краскала и У. Аллена Уоллиса ), или односторонний дисперсионный анализ по рангам [ 1 ] — это непараметрический статистический тест для проверки того, происходят ли выборки из одного и того же распределения. [ 2 ] [ 3 ] [ 4 ] Он используется для сравнения двух или более независимых выборок одинакового или разного размера. Он расширяет Манна-Уитни U- критерий , который используется для сравнения только двух групп. Параметрическим эквивалентом теста Крускала-Уоллиса является однофакторный дисперсионный анализ (ANOVA).
Значимый критерий Крускала-Уоллиса показывает, что по крайней мере один образец стохастически доминирует над другим образцом. Тест не определяет, где происходит это стохастическое доминирование или для скольких пар групп достигается стохастическое доминирование. Для анализа конкретных пар выборок на предмет стохастического доминирования используется тест Данна. [ 5 ] парные Манна–Уитни тесты с поправкой Бонферрони , [ 6 ] или более мощный, но менее известный тест Коновера-Имана. [ 6 ] иногда используются.
Предполагается, что методы лечения существенно влияют на уровень ответа, и тогда существует порядок среди методов лечения: один имеет тенденцию давать самый низкий ответ, другой дает следующий самый низкий ответ - второй и так далее. [ 7 ] Поскольку это непараметрический метод, критерий Краскела-Уоллиса не предполагает нормального распределения остатков, в отличие от аналогичного одностороннего дисперсионного анализа. Если исследователь может сделать предположения об идентичной форме и масштабировании распределения для всех групп, за исключением любой разницы в медианах, то нулевая гипотеза состоит в том, что медианы всех групп равны, а альтернативная гипотеза состоит в том, что по крайней мере одна медиана популяции одной группы отличается от медианного показателя населения по крайней мере еще одной группы. В противном случае невозможно сказать, вызвано ли отклонение нулевой гипотезы сдвигом локаций или групповой дисперсией. Это та же проблема, что и с тестом Манна-Уитни. [ 8 ] [ 9 ] [ 10 ] Если данные содержат потенциальные выбросы, если распределения населения имеют тяжелые хвосты или если распределения населения значительно искажены, критерий Крускала-Уоллиса более эффективен при обнаружении различий между методами лечения, чем F-критерий ANOVA . С другой стороны, если распределения населения нормальные или имеют легкий хвост и симметричны, то F-критерий ANOVA обычно будет иметь большую мощность, которая представляет собой вероятность отклонения нулевой гипотезы, когда ее действительно следует отвергнуть. [ 11 ] [ 12 ]
Метод
[ редактировать ]
- Проранжируйте все данные из всех групп вместе; т. е. ранжировать данные от 1 до N, игнорируя членство в группе. Присвойте любым связанным значениям среднее значение рангов, которые они получили бы, если бы они не были равными.
- Статистика теста определяется выражением
- где
- общее количество наблюдений во всех группах
- это количество групп
- количество наблюдений в группе
- - ранг (среди всех наблюдений) наблюдения из группы
- средний рейтинг всех наблюдений в группе
- является средним значением всех .
- Если данные не содержат связей, знаменатель выражения для это точно и . Таким образом
Последняя формула содержит только квадраты средних рангов.
- Поправку на ничьи при использовании сокращенной формулы, описанной в предыдущем пункте, можно сделать путем деления к , где - количество группировок разных связанных рангов, и количество связанных значений в группе которые привязаны к определенному значению. Эта поправка обычно мало влияет на значение если нет большого количества связей.
- При выполнении множественных сравнений выборок ошибка типа I имеет тенденцию увеличиваться. Поэтому для корректировки уровня значимости используется процедура Бонферрони , т.е. , где – скорректированный уровень значимости, – начальный уровень значимости, а это количество контрастов. [ 13 ]
- Наконец, решение отвергнуть или нет нулевую гипотезу принимается путем сравнения до критического значения полученный из таблицы или программного обеспечения для заданной значимости или альфа-уровня. Если больше, чем , нулевая гипотеза отвергается. Если возможно (нет связей, выборка не слишком большая), следует сравнить до критического значения, полученного из точного распределения . В противном случае распределение H можно аппроксимировать распределением хи-квадрат с степени свободы. Если некоторые значения малы (т.е. меньше 5), точное вероятностей распределение может сильно отличаться от этого распределения хи-квадрат . Если доступна таблица распределения вероятностей хи-квадрат, критическое значение хи-квадрат , можно найти, введя таблицу по адресу степени свободы и поиск желаемого значения или альфа-уровня. [ 14 ]
- Если статистика незначительна, то нет никаких свидетельств стохастического доминирования между выборками. Однако если тест значим, то по крайней мере один образец стохастически доминирует над другим образцом. Таким образом, исследователь может использовать контрасты выборок между отдельными парами выборок или апостериорные тесты с использованием критерия Данна, который (1) правильно использует те же рейтинги, что и критерий Краскела-Уоллиса, и (2) правильно использует объединенную дисперсию, подразумеваемую нулевым значением. гипотезу теста Крускала-Уоллиса, чтобы определить, какие из пар выборок существенно отличаются. [ 5 ] При сравнении нескольких образцов или тестах частота ошибок типа I имеет тенденцию увеличиваться, что вызывает опасения по поводу множественных сравнений .
Точные таблицы вероятностей
[ редактировать ]Для расчета точных вероятностей теста Крускала – Уоллиса требуется большое количество вычислительных ресурсов. Существующее программное обеспечение обеспечивает точные вероятности только для выборок размером менее 30 участников. Эти программы полагаются на асимптотическое приближение для выборок большего размера.
Доступны точные значения вероятности для выборок большего размера. Спурриер (2003) опубликовал точные таблицы вероятностей для выборок размером до 45 участников. [ 15 ] Мейер и Симан (2006) получили точные распределения вероятностей для выборок размером до 105 участников. [ 16 ]
Точное распределение H
[ редактировать ]Чой и др. [ 17 ] сделал обзор двух методов, которые были разработаны для расчета точного распределения , предложил новый и сравнил точное распределение с его приближением хи-квадрат.
Пример
[ редактировать ]Проверьте разницу уровней озона по месяцам
[ редактировать ]В следующем примере используются данные Chambers et al. [ 18 ]
о ежедневных показаниях озона с 1 мая по 30 сентября 1973 года в Нью-Йорке. Данные находятся в наборе данных R. airquality
, а анализ включен в документацию по функции R kruskal.test
. На рисунке показаны коробчатые диаграммы значений озона по месяцам.
Тест Крускала-Уоллиса обнаруживает значительную разницу (p = 6,901e-06), указывающую на то, что содержание озона различается в течение 5 месяцев.
kruskal.test(Ozone ~ Month, data = airquality)
Kruskal-Wallis rank sum test
data: Ozone by Month
Kruskal-Wallis chi-squared = 29.267, df = 4, p-value = 6.901e-06
Чтобы определить, какие месяцы отличаются, можно провести апостериорные тесты с использованием теста Уилкоксона для каждой пары месяцев с поправкой Бонферрони (или другой) для проверки множественных гипотез.
pairwise.wilcox.test(airquality$Ozone, airquality$Month, p.adjust.method = "bonferroni")
Pairwise comparisons using Wilcoxon rank sum test
data: airquality$Ozone and airquality$Month
5 6 7 8
6 1.0000 - - -
7 0.0003 0.1414 - -
8 0.0012 0.2591 1.0000 -
9 1.0000 1.0000 0.0074 0.0325
P value adjustment method: bonferroni
Апостериорные тесты показывают, что после поправки Бонферрони на множественное тестирование следующие различия являются значимыми (скорректированный р <0,05).
- Месяц 5 против месяцев 7 и 8
- 9-й месяц против 7-го и 8-го месяцев
Выполнение
[ редактировать ]Тест Крускала-Уоллиса можно реализовать во многих инструментах и языках программирования.
- Mathematica реализует тест как
LocationEquivalenceTest
. [ 19 ] - имеет Панель статистических инструментов MATLAB
kruskalwallis
для вычисления p значения для проверки гипотезы и отображения таблицы ANOVA . [ 20 ] - У SAS есть процедура проверки «NPAR1WAY». [ 21 ]
- SPSS реализует тест с помощью процедуры «Непараметрические тесты». [ 22 ]
- В Minitab реализована опция «Непараметрические параметры». [ 23 ]
- В Python пакете SciPy функция
scipy.stats.kruskal
может вернуть результат теста и p значение . [ 24 ] - Базовый пакет R имеет реализацию этого теста, используя
kruskal.test
. [ 25 ] - Java имеет реализацию, предоставленную Apache Commons . [ 26 ]
- У Юлии пакет
HypothesisTests.jl
имеет функциюKruskalWallisTest(groups::AbstractVector{<:Real}...)
для вычисления значения p . [ 27 ]
См. также
[ редактировать ]- Односторонний дисперсионный анализ
- U-тесты Манна-Уитни
- тест Бонферрони
- тест Фридмана
- Тест тренда Джонкхира
- Медианный тест настроения
Ссылки
[ редактировать ]- ^ Перейти обратно: а б H-критерий Крускала-Уоллиса с использованием статистики SPSS , статистики Лаэрда
- ^ Краскал; Уоллис (1952). «Использование рангов в однокритериальном дисперсионном анализе». Журнал Американской статистической ассоциации . 47 (260): 583–621. дои : 10.1080/01621459.1952.10483441 .
- ^ Кордер, Грегори В.; Форман, Дейл И. (2009). Непараметрическая статистика для нестатистиков . Хобокен: Джон Уайли и сыновья. стр. 99–105 . ISBN 9780470454619 .
- ^ Сигел; Кастелян (1988). Непараметрическая статистика для поведенческих наук (второе изд.). Нью-Йорк: МакГроу-Хилл. ISBN 0070573573 .
- ^ Перейти обратно: а б Данн, Олив Джин (1964). «Множественные сравнения с использованием сумм рангов». Технометрика . 6 (3): 241–252. дои : 10.2307/1266041 .
- ^ Перейти обратно: а б Коновер, В. Джей; Иман, Рональд Л. (1979). «О процедурах множественных сличений» (PDF) (Отчет). Лос-Аламосская научная лаборатория . Проверено 28 октября 2016 г.
- ^ Леманн, Э.Л., и Д'Абрера, HJ (1975). Непараметрические методы: статистические методы, основанные на рангах. Холден-Дэй.
- ^ Божественный; Нортон; Барон; Хуарес-Колунга (2018). «Процедура Уилкоксона-Манна-Уитни не удалась при проверке медиан». Американский статистик. дои : 10.1080/00031305.2017.1305291 .
- ^ Харт (2001). «Тест Манна-Уитни — это не просто проверка медиан: различия в разбросе могут иметь важное значение». БМЖ. дои : 10.1136/bmj.323.7309.391 .
- ^ Брюин (2006). «Часто задаваемые вопросы: почему коэффициент Манна-Уитни важен, когда медианы равны?». Калифорнийский университет в Лос-Анджелесе: Статистическая консалтинговая группа.
- ^ Хиггинс, Джеймс Дж.; Джеффри Хиггинс, Джеймс (2004). Введение в современную непараметрическую статистику . Продвинутая серия Даксбери. Пасифик Гоув, Калифорния: Брукс-Коул; Томсон Обучение. ISBN 978-0-534-38775-4 .
- ^ Бергер, Пол Д.; Маурер, Роберт Э.; Челли, Джована Б. (2018). Экспериментальный дизайн . Чам: Международное издательство Springer. дои : 10.1007/978-3-319-64583-4 . ISBN 978-3-319-64582-7 .
- ^ Кордер, Г.В. и Форман, Д.И. (2010). Непараметрическая статистика для нестатистов: пошаговый подход. Хобокен, Нью-Джерси: Уайли.
- ^ Монтгомери, Дуглас К.; Рангер, Джордж К. (2018). Прикладная статистика и вероятность для инженеров . Издание EMEA (Седьмое изд.). Хобокен, Нью-Джерси: Уайли. ISBN 978-1-119-40036-3 .
- ^ Спурриер, Джей Ди (2003). «О нулевом распределении статистики Краскала – Уоллиса». Журнал непараметрической статистики . 15 (6): 685–691. дои : 10.1080/10485250310001634719 .
- ^ Мейер; Моряк (апрель 2006 г.). «Расширенные таблицы критических значений для статистики Краскала – Уоллиса H». Доклад представлен на ежегодном собрании Американской ассоциации исследований в области образования в Сан-Франциско . Таблицы критических значений и точные вероятности от Мейера и Симана доступны для загрузки по адресу http://faculty.virginia.edu/kruskal-wallis/. Архивировано 17 октября 2018 г. на Wayback Machine . Там же можно найти документ, описывающий их работу.
- ^ Вон Чхве, Джэ Вон Ли, Мён Хо Ха и Сын Хо Кан (2003). «Алгоритм расчета точного распределения теста Краскела – Уоллиса». Коммуникации в статистике – моделирование и вычисления (32, номер 4): 1029–1040. дои : 10.1081/SAC-120023876 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Джон М. Чемберс, Уильям С. Кливленд, Бит Кляйнер и Пол А. Тьюки (1983). Графические методы анализа данных . Белмонт, Калифорния: Международная группа Wadsworth, Duxbury Press. ISBN 053498052X .
{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Wolfram Research (2010), LocationEquivalenceTest, функция Wolfram Language, https://reference.wolfram.com/language/ref/LocationEquivalenceTest.html .
- ^ «Тест Краскала-Уоллиса — MATLAB kruskalwallis» . www.mathworks.com . Проверено 6 декабря 2023 г.
- ^ «Процедура NPAR1WAY» . Справочный центр SAS . Проверено 22 декабря 2023 г.
- ^ Рубен Герт ван ден Берг. «Как запустить тест Крускала-Уоллиса в SPSS?» . Учебные пособия по SPSS . Проверено 22 декабря 2023 г.
- ^ «Обзор теста Краскала-Уоллиса» . Поддержка Минитаба . Проверено 22 декабря 2023 г.
- ^ «scipy.stats.kruskal — Руководство по SciPy v1.11.4» . docs.scipy.org . Проверено 6 декабря 2023 г.
- ^ «функция kruskal.test — RDocumentation» . www.rdocumentation.org . Проверено 6 декабря 2023 г.
- ^ «Математика – Руководство пользователя Commons Math — Статистика» . commons.apache.org . Проверено 6 декабря 2023 г.
- ^ «Непараметрические тесты · HypothesisTests.jl» . Сайт juliastats.org . Проверено 6 декабря 2023 г.
Дальнейшее чтение
[ редактировать ]- Дэниел, Уэйн В. (1990). «Односторонний дисперсионный анализ Краскала – Уоллиса по рангам» . Прикладная непараметрическая статистика (2-е изд.). Бостон: PWS-Кент. стр. 226–234. ISBN 0-534-91976-6 .