тест Дурбина
Тест Дурбина — это непараметрический статистический тест для сбалансированных неполных планов, который сводится к тесту Фридмана в случае полного блочного плана . При анализе запланированных экспериментов критерий Фридмана является наиболее распространенным непараметрическим тестом для полных блочных планов.
Фон
[ редактировать ]В схеме рандомизированных блоков k блокам применяется к b процедур . При полном блочном проектировании каждая обработка выполняется для каждого блока, а данные упорядочиваются следующим образом:
Лечение 1 | Лечение 2 | Лечение к | ||
---|---|---|---|---|
Блок 1 | х 11 | х 12 | х 1 тыс. | |
Блок 2 | х 21 | х 22 | х 2 тыс. | |
Блок 3 | х 31 | х 32 | х 3 тыс. | |
Блок Б | х б 1 | Х б 2 | х б к |
Для некоторых экспериментов может быть нереально провести все обработки во всех блоках, поэтому может потребоваться выполнить неполный дизайн блока . В этом случае настоятельно рекомендуется запустить сбалансированный неполный дизайн . Сбалансированная неполная блочная конструкция обладает следующими свойствами:
- Каждый блок содержит k экспериментальных единиц.
- Каждое лечение отображается в r блоках.
- Каждое лечение появляется вместе с каждым другим лечением одинаковое количество раз.
Тестовые предположения
[ редактировать ]Тест Дурбина основан на следующих предположениях:
- Блоки b взаимно независимы. Это означает, что результаты в одном блоке не влияют на результаты в других блоках.
- Данные могут быть значимо ранжированы (т. е. данные имеют по крайней мере порядковую шкалу ).
Определение теста
[ редактировать ]Пусть R ( X ij ) будет рангом, присвоенным X ij внутри блока i (т. е. рангами в пределах данной строки). В случае ничьей используются средние ранги. Ранги суммируются для получения
Затем проводится тест Дурбина.
- H 0 : Эффекты лечения идентичны.
- H a : По крайней мере, один метод лечения отличается, по крайней мере, от одного другого метода лечения.
Статистика теста
где
где t — количество процедур, k — количество процедур на блок, b — количество блоков, а r — количество раз, когда появляется каждое лечение.
Для уровня значимости α критическая область определяется выражением
где F α, k − 1, bk − b − t + 1 обозначает α- квантиль распределения F с k − 1 степенями свободы в числителе и bk − b − t + 1 степенями свободы в знаменателе. Нулевая гипотеза отклоняется, если тестовая статистика находится в критической области. Если гипотеза об идентичных эффектах лечения отвергается, часто желательно определить, какие методы лечения различаются (т. е. провести множественные сравнения ). Процедуры i и j считаются разными, если
где R j и R i — сумма столбцов рангов внутри блоков, t 1 − α/2, bk — b — t + 1 обозначает 1 — α/2-квантиль t-распределения с bk — b — t + 1 степень свободы.
Историческая справка
[ редактировать ]T 1 была исходной статистикой, предложенной Джеймсом Дурбином , которая имела приблизительное нулевое распределение (то есть хи-квадрат с степени свободы). Статистика T 2 имеет несколько более точные критические области, поэтому теперь она является предпочтительной статистикой. Статистика T 2 представляет собой двусторонний анализ статистики дисперсии, рассчитанной на рангах R ( X ij ).
Связанные тесты
[ редактировать ]Q-критерий Кокрена применяется для особого случая переменной бинарного отклика (т. е. такой, которая может иметь только один из двух возможных результатов). Критерий Q Кокрана действителен только для проектов с полным блоком.
См. также
[ редактировать ]Ссылки
[ редактировать ]- Коновер, WJ (1999). Практическая непараметрическая статистика (Третье изд.). Уайли. стр. 388–395. ISBN 0-471-16068-7 .
Эта статья включает общедоступные материалы Национального института стандартов и технологий.