Тест тренда Джонкхира
В статистике Джонкхира тест тренда [ 1 ] (иногда называемый Джонкхир-Терпстра [ 2 ] test ) — проверка упорядоченной альтернативной гипотезы в рамках дизайна независимых выборок (между участниками). Он похож на тест Крускала-Уоллиса тем, что нулевая гипотеза заключается в том, что несколько независимых выборок относятся к одной и той же совокупности. Однако с помощью критерия Краскала-Уоллиса нет априорного упорядочения популяций, из которых отбираются выборки. При наличии априорного порядка критерий Джонкира имеет большую статистическую мощность , чем критерий Краскела-Уоллиса. Тест был разработан Эймаблем Робертом Джонкхиром , психологом и статистиком в Университетском колледже Лондона .
Нулевую и альтернативную гипотезы удобно выражать через медианы популяции для k популяций (где k > 2). Полагая, что θ i популяции — медиана для i -й популяции, нулевая гипотеза такова:
Альтернативная гипотеза состоит в том, что медианы популяции имеют априорный порядок, например:
- ≤ ≤ ≤
хотя бы с одним строгим неравенством.
Процедура
[ редактировать ]Этот тест можно рассматривать как частный случай Мориса Кендалла . более общего метода ранговой корреляции [ 3 ] и использует S- статистику Кендалла. Это можно вычислить одним из двух способов:
Метод «прямого подсчета»
[ редактировать ]- Расположите образцы в предсказанном порядке
- По очереди для каждого балла подсчитайте, сколько баллов в образцах справа больше, чем рассматриваемый балл. Это П.
- По очереди для каждого балла подсчитайте, сколько баллов в примерах справа меньше рассматриваемого балла. Это Кью .
- С = П – Q
«Морской» метод
[ редактировать ]- Поместите данные в упорядоченную таблицу сопряженности , в которой уровни независимой переменной увеличиваются слева направо, а значения зависимой переменной увеличиваются сверху вниз.
- Для каждой записи в таблице подсчитайте все остальные записи, расположенные к юго-востоку от конкретной записи. Это П.
- Для каждой записи в таблице подсчитайте все остальные записи, расположенные к юго-западу от конкретной записи. Это Кью .
- С = П – Q
Обратите внимание, что связи в независимой переменной всегда будут (отдельные лица «связаны» в том смысле, что они находятся в одной группе), но связи в зависимой переменной могут быть, а могут и не быть. Если связей нет – или связи возникают в пределах конкретной выборки (что не влияет на значение статистики теста) – точные таблицы S доступны ; например, Джонкхир [ 1 ] предоставил избранные таблицы для значений k от 3 до 6 и равных размеров выборок ( m ) от 2 до 5. Лич представил критические значения S для k = 3 с размерами выборок от 2,2,1 до 5,5,5. [ 4 ]
Нормальное приближение к S
[ редактировать ]Стандартное нормальное распределение можно использовать для аппроксимации распределения S при нулевой гипотезе в случаях, когда точные таблицы недоступны. Среднее значение распределения S всегда будет равно нулю, и если предположить, что между значениями в двух (или более) разных выборках нет связей, дисперсия определяется выражением
Где n — общее количество баллов, а t i — количество баллов в i-й выборке. Приближение к стандартному нормальному распределению можно улучшить, используя поправку на непрерывность: S c = | С | – 1. Таким образом, 1 вычитается из положительного значения S и 1 добавляется к отрицательному S. значению Эквивалент z-оценки тогда определяется выражением
Галстуки
[ редактировать ]Если баллы связаны между значениями в двух (или более) разных выборках, точных таблиц для распределения S не существует и необходимо использовать приближение к нормальному распределению. В этом случае к значению S не применяется поправка на непрерывность , а дисперсия определяется выражением
где t i — предельный итог строки, а u i — предельный итог столбца в таблице непредвиденных обстоятельств. Эквивалент z -оценки тогда определяется выражением
Числовой пример
[ редактировать ]В частичном повторении исследования Лофтуса и Палмера участники были случайным образом распределены в одну из трех групп, а затем им показали фильм, в котором две машины врезаются друг в друга. [ 5 ] После просмотра фильма участникам одной группы был задан следующий вопрос: «Как быстро ехали машины в момент контакта друг с другом?» Участников второй группы спросили: «Как быстро ехали машины, когда они столкнулись друг с другом?» Участников третьей группы спросили: «Как быстро ехали машины, когда они врезались друг в друга?» Лофтус и Палмер предсказали, что используемый глагол действия (контактировал, ударился, разбил) повлияет на оценку скорости в милях в час (миль в час), так что глаголы действия, подразумевающие большую энергию, приведут к более высоким расчетным скоростям. Были получены следующие результаты (моделированные данные):
Связались | Наткнулся | разбитый | |
---|---|---|---|
Результаты | 10 | 12 | 20 |
12 | 18 | 25 | |
14 | 20 | 27 | |
16 | 22 | 30 | |
медиана | 13 | 19 | 26 |
Метод «прямого подсчета»
[ редактировать ]- Образцы уже расположены в предсказанном порядке
- Для каждого балла по очереди подсчитайте, сколько баллов в выборках справа больше, чем рассматриваемый балл, чтобы получить P :
- Р = 8 + 7 + 7 + 7 + 4 + 4 + 3 + 3 = 43
- По очереди для каждого балла подсчитайте, сколько баллов в выборках справа меньше рассматриваемого балла, чтобы получить Q :
- Q = 0 + 0 + 1 + 1 + 0 + 0 + 0 + 1 = 3
- С = П – К = 43 – 3
- С = 40
«Морской» метод
[ редактировать ]- Преобразуйте данные в упорядоченную таблицу непредвиденных обстоятельств.
миль в час | Связались | Наткнулся | разбитый | Итоги т я |
---|---|---|---|---|
10 | 1 | 0 | 0 | 1 |
12 | 1 | 1 | 0 | 2 |
14 | 1 | 0 | 0 | 1 |
16 | 1 | 0 | 0 | 1 |
18 | 0 | 1 | 0 | 1 |
20 | 0 | 1 | 1 | 2 |
22 | 0 | 1 | 0 | 1 |
25 | 0 | 0 | 1 | 1 |
27 | 0 | 0 | 1 | 1 |
30 | 0 | 0 | 1 | 1 |
Итоги у я | 4 | 4 | 4 | 12 |
- Для каждой записи в таблице подсчитайте все остальные записи, расположенные к юго-востоку от конкретной записи. Это П :
- P = (1 × 8) + (1 × 7) + (1 × 7) + (1 × 7) + (1 × 4) + (1 × 4) + (1 × 3) + ( 1 × 3) = 43
- Для каждой записи в таблице подсчитайте все остальные записи, расположенные к «юго-западу» конкретной записи. Это К :
- Q = (1 × 2) + (1 × 1) = 3
- С = П - Q = 43 - 3
- С = 40
Использование точных таблиц
[ редактировать ]Когда связей между выборками мало (как в этом примере), Лич предположил, что игнорирование связей и использование точных таблиц обеспечит достаточно точный результат. [ 4 ] Джонкхир предложил разорвать связи с альтернативной гипотезой и затем использовать точные таблицы. [ 1 ] В текущем примере, где одинаковые оценки появляются только в соседних группах, значение S не меняется, если связи разрываются вопреки альтернативной гипотезе. Это можно проверить, заменив 11 миль в час вместо 12 миль в час в выборке Bumped и 19 миль в час вместо 20 миль в час в выборке Smashed и повторно вычислив статистику теста. Из таблиц с k = 3 и m = 4 критическое значение S для α = 0,05 равно 36, и, таким образом, результат будет объявлен статистически значимым на этом уровне.
Вычисление стандартного нормального приближения
[ редактировать ]Как , , и , и
тогда дисперсия S равна
И z определяется выражением
Для α = 0,05 (одностороннее) критическое значение z составляет 1,645, поэтому результат снова будет объявлен значимым на этом уровне. Подобный тест на тенденцию в контексте повторяющихся измерений (внутри участников) и на основе коэффициента ранговой корреляции Спирмена был разработан Пейджем . [ 6 ]
Ссылки
[ редактировать ]- ^ Перейти обратно: а б с Джонкхир, Арканзас (1954). -выборки без распределения «Тест k по упорядоченным альтернативам». Биометрика . 41 : 133–145. дои : 10.2307/2333011 .
- ^ Терпстра, Т.Дж. (1952). «Асимптотическая нормальность и последовательность теста Кендалла против тренда, когда связи присутствуют в одном рейтинге» (PDF) . Indagationes Mathematicae . 14 : 327–333.
- ^ Кендалл, МГ (1962). Методы ранговой корреляции (3-е изд.). Лондон: Чарльз Гриффин.
- ^ Перейти обратно: а б Лич, К. (1979). Введение в статистику: непараметрический подход к социальным наукам . Чичестер: Джон Уайли.
- ^ Лофтус, EF; Палмер, Дж. К. (1974). «Реконструкция разрушения автомобиля: пример взаимодействия языка и памяти». Журнал вербального обучения и вербального поведения . 13 : 585–589. дои : 10.1016/S0022-5371(74)80011-3 .
- ^ Пейдж, Э.Б. (1963). «Упорядоченные гипотезы для нескольких методов лечения: тест значимости линейных рангов». Журнал Американской статистической ассоциации . 58 (301): 216–30. дои : 10.2307/2282965 .
Дальнейшее чтение
[ редактировать ]- Дэниел, Уэйн В. (1990). «Тест Джонкхира – Терпстра для упорядоченных альтернатив» . Прикладная непараметрическая статистика (2-е изд.). Бостон: PWS-Кент. стр. 234–240. ISBN 0-534-91976-6 .