Тест дальности Тьюки
Тест диапазона Тьюки , также известный как тест Тьюки , метод Тьюки , тест честной значимости Тьюки или Тьюки HSD ( честно значимое различие ) тест , [1] представляет собой одноэтапную процедуру множественного сравнения и статистический тест . Его можно использовать для правильной интерпретации статистической значимости разницы между средними значениями, выбранными для сравнения из-за их крайних значений.
Этот метод был первоначально разработан и представлен Джоном Тьюки для использования в дисперсионном анализе (ANOVA), и обычно его преподают только в связи с ANOVA. Однако распределение стьюдентизированных диапазонов, используемое для определения уровня значимости различий, учитываемых в тесте Тьюки, имеет гораздо более широкое применение: оно полезно для исследователей, которые искали в собранных данных значительные различия между группами, но затем не могут достоверно определить, насколько значимы их различия. обнаруженное выдающееся различие заключается в использовании стандартных статистических распределений, используемых для других традиционных статистических тестов, для которых данные должны быть выбраны случайным образом. Поскольку при сравнении выдающихся данных они по определению выбирались не случайным образом, а скорее специально, потому что они были экстремальными, они требуют другой, более строгой интерпретации, обусловленной вероятной частотой и размером стьюдентизированного диапазона ; современная практика « интеллектуального анализа данных » является примером его использования.
Разработка
[ редактировать ]Тест назван в честь Джона Тьюки . [2] он сравнивает все возможные пары средних и основан на стьюдентизированном распределении диапазонов ( q ) (это распределение аналогично распределению t из t -теста . См. ниже). [3] [ нужна полная цитата ]
Тест Тьюки сравнивает средства каждого лечения со средствами любого другого лечения; то есть оно применяется одновременно ко множеству всех парных сравнений
и определяет любую разницу между двумя средними значениями, превышающую ожидаемую стандартную ошибку . Коэффициент доверия для набора , когда все размеры выборки равны, точно равен для любого Для неравных размеров выборки коэффициент достоверности больше, чем Другими словами, метод Тьюки консервативен при неравных размерах выборок .
За этим тестом часто следует статистическая процедура Compact Letter Display (CLD), чтобы сделать результаты этого теста более прозрачными для аудитории, не связанной со статистикой.
Предположения
[ редактировать ]- Проверяемые наблюдения независимы внутри и между группами. [ нужна ссылка ]
- Подгруппы, связанные с каждым средним значением в тесте, распределены нормально . [ нужна ссылка ]
- Внутриподгрупповая дисперсия одинакова во всех подгруппах, связанных с каждым средним значением в тесте ( однородность дисперсии ). [ нужна ссылка ]
Тестовая статистика
[ редактировать ]Тест Тьюки основан на формуле, очень похожей на формулу t -критерия . Фактически, тест Тьюки по сути является t -тестом, за исключением того, что он корректирует частоту семейных ошибок .
Формула теста Тьюки:
где Y A и Y B — два сравниваемых средних значения, а SE — стандартная ошибка суммы средних значений. Значение q s представляет собой тестовую статистику выборки. (Обозначение | x | означает абсолютное значение x ) ; величину x со знаком + , независимо от исходного знака x .
Эту статистику теста qs из затем можно сравнить со значением q для выбранного уровня значимости α таблицы стьюдентизированного распределения диапазонов . Если q s значение больше критического значения q α, полученного из распределения, говорят, что два средних значения существенно различаются на уровне [3]
Поскольку гипотеза сравниваемые средние относятся и той же для совокупности т.е. что ( теста Тьюки утверждает , нулевая все одной к ) с тем же стандартным отклонением модели σ , оцененным с помощью объединенной стандартной ошибки , для всех образцов; его расчет обсуждается в следующих разделах. Это приводит к предположению о нормальности теста Тьюки.
стьюдентизированного диапазона ( q ) Распределение
[ редактировать ]Метод Тьюки использует стьюдентизированное распределение диапазонов . Предположим, что мы берем выборку размером n из каждой из k популяций с одинаковым нормальным распределением N ( µ , σ 2 ) и предположим, что является наименьшим из этих выборочных средних и является наибольшим из этих выборочных средних, и предположим, что S 2 — это объединенная выборочная дисперсия этих выборок. Тогда следующая случайная величина имеет распределение по стьюдентизированному диапазону:
Это определение статистики q, данное выше, является основой критически значимого значения q α, обсуждаемого ниже, и основано на этих трех факторах:
- частота ошибок типа I , или вероятность отклонения истинной нулевой гипотезы;
- количество сравниваемых субпопуляций;
- количество степеней свободы для каждого среднего
( df = N − k ) , где N — общее количество наблюдений.)
Распределение q сведено в таблицы и встречается во многих учебниках по статистике. В некоторых таблицах распределение q приведено без учета фактор. Чтобы понять, что это за таблица, мы можем вычислить результат для k = 2 и сравнить его с результатом t-распределения Стьюдента с теми же степенями свободы и тем же α .
Кроме того, R предлагает кумулятивную функцию распределения ( ptukey
) и функция квантиля ( qtukey
) для q .
Доверительные пределы
[ редактировать ]Тьюки Пределы доверия для всех парных сравнений с коэффициентом доверия не менее 1 − α равны
Обратите внимание, что точечная оценка и предполагаемая дисперсия такие же, как и для одного попарного сравнения. Единственная разница между доверительными пределами для одновременных сравнений и границами для одного сравнения – это кратность оцененного стандартного отклонения.
Также обратите внимание, что размеры выборок должны быть равными при использовании подхода стьюдентизированного диапазона. — это стандартное отклонение всего плана, а не только двух сравниваемых групп. Возможна работа с неравными размерами выборок. В этом случае необходимо рассчитать предполагаемое стандартное отклонение для каждого парного сравнения, как это формализовано Клайдом Крамером в 1956 году, поэтому процедуру для неравных размеров выборки иногда называют методом Тьюки – Крамера , который заключается в следующем:
где n i и n j — размеры групп i и j соответственно. Также применяются степени свободы для всей конструкции.
Сравнение тестов ANOVA и тестов Тьюки – Крамера
[ редактировать ]И ANOVA, и тест Тьюки – Крамера основаны на одних и тех же предположениях. Однако эти два теста для k групп (т.е. µ 1 = µ 2 = ... = µ k ) могут привести к логическим противоречиям, когда k > 2 , даже если предположения выполняются.
Можно сгенерировать набор псевдослучайных выборок строго отрицательной меры, так что гипотеза µ 1 = µ 2 отвергается на уровне значимости. в то время как µ 1 = µ 2 = µ 3 не отвергается даже при [4]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^
Лоури, Ричард. «Односторонний дисперсионный анализ – независимые выборки» . Вассар.edu . Архивировано из оригинала 17 октября 2008 года . Проверено 4 декабря 2008 г.
- Также иногда описывается как «честно», см., например.
- Также иногда описывается как «честно», см., например.
- ^ Тьюки, Джон (1949). «Сравнение отдельных средств в дисперсионном анализе». Биометрия . 5 (2): 99–114. дои : 10.2307/3001913 . JSTOR 3001913 . ПМИД 18151955 .
- ^ Перейти обратно: а б Линтон, ЛР; Хардер, Л.Д. (2007). Конспект лекций (Отчет). Биология 315: Количественная биология. Калгари, AB: Университет Калгари.
- ^ Гурвич В.; Наумова, М. (2021). «Логические противоречия в однофакторном дисперсионном анализе и тестах множественных сравнений Тьюки – Крамера с более чем двумя группами наблюдений» . Симметрия . 13 (8): 1387. arXiv : 2104.07552 . Бибкод : 2021Symm...13.1387G . дои : 10.3390/sym13081387 .
Дальнейшее чтение
[ редактировать ]- Монтгомери, Дуглас К. (2013). Планирование и анализ экспериментов (8-е изд.). Уайли. Раздел 3.5.7.
Внешние ссылки
[ редактировать ]- «Метод Тьюки» . Электронный справочник по статистическим методам. itl.nist.gov/div898/handbook . СЕМАТЕХ. Национальный институт стандартов и технологий / Министерство торговли США .