Метод Ньюмана-Кейлса
Ньюмана -Кейлса или Стьюдента-Ньюмана-Кейлса (SNK) Метод представляет собой пошаговую процедуру множественных сравнений , используемую для определения выборочных средних значений , которые значительно отличаются друг от друга. [1] Ему было присвоено имя Студента (1927 г.), [2] Д. Ньюман, [3] и М. Кеулс. [4] Эту процедуру часто используют в качестве апостериорного теста выявляется значительная разница между тремя или более выборочными средними значениями всякий раз, когда с помощью дисперсионного анализа (ANOVA) . [1] Метод Ньюмана-Кейлса аналогичен тесту диапазона Тьюки , поскольку обе процедуры используют стьюдентизированную статистику диапазона . [5] [6] В отличие от теста диапазона Тьюки, метод Ньюмана-Кейлса использует разные критические значения для разных пар сравнений средних. Таким образом, процедура с большей вероятностью выявит существенные различия между групповыми средними и допустит ошибки типа I , неправильно отвергая нулевую гипотезу, когда она верна. Другими словами, процедура Неймана-Кейлса более эффективна , но менее консервативна, чем критерий диапазона Тьюки. [6] [7]
История и контроль частоты ошибок типа I
[ редактировать ]Метод Ньюмана-Кейлса был предложен Ньюманом в 1939 году и развит Кейлсом в 1952 году. Это было до того, как Тьюки представил различные определения коэффициента ошибок (1952a, [8] 1952б, [9] 1953 [10] ).Метод Ньюмана-Кейлса контролирует частоту семейных ошибок (FWER) в слабом, но не в сильном смысле: [11] [12] процедура Ньюмана-Кейлса контролирует риск отклонения нулевой гипотезы, если все средние равны (глобальная нулевая гипотеза), но не контролирует риск отклонения частичных нулевых гипотез. Например, когда сравниваются четыре средних значения, при частичной нулевой гипотезе, что µ1=μ2 и µ3=μ4=μ+дельта с ненулевой дельтой, процедура Ньюмана-Кейлса имеет вероятность отклонения µ1=μ2 или ц3=ц4 или и то, и другое. В этом примере, если дельта очень велика, процедура Ньюмана-Кейлса почти эквивалентна двум t-критериям Стьюдента, проверяющим ц1=ц2 и ц3=ц4 при номинальной частоте ошибок типа I альфа, без процедуры многократного тестирования; поэтому FWER увеличивается почти вдвое. [11] В худшем случае FWER процедуры Ньюмана-Кейлса равна 1-(1-альфа)^int(J/2), где int(J/2) представляет собой целую часть общего числа групп, разделенную на 2. [12] Следовательно, при наличии двух или трех групп процедура Ньюмана-Кейлса имеет сильный контроль над FWER, но не для четырех и более групп. В 1995 году Бенджамини и Хохберг представили новый, более либеральный и более мощный критерий для решения подобных проблем: частоты ложных открытий (FDR). контроль [13] В 2006 году Шаффер показал (путем обширного моделирования), что метод Ньюмана-Кейлса контролирует FDR с некоторыми ограничениями. [14]
Необходимые предположения
[ редактировать ]Допущения теста Ньюмана-Кейлса по существу такие же, как и для t-теста независимых групп : нормальность , однородность дисперсии и независимые наблюдения . Тест достаточно устойчив к нарушениям нормальности. Нарушение однородности дисперсии может оказаться более проблематичным, чем в случае с двумя выборками, поскольку MSE основывается на данных всех групп. Предположение о независимости наблюдений важно и не должно нарушаться.
Процедуры
[ редактировать ]Метод Ньюмана-Кейлса использует поэтапный подход при сравнении выборочных средних значений. [15] Перед любым сравнением средних все выборочные средние упорядочиваются по возрастанию или убыванию, тем самым создавая упорядоченный диапазон ( p ) выборочных средних. [1] [15] Затем проводится сравнение между наибольшим и наименьшим выборочным средним значением в наибольшем диапазоне. [15] Если предположить, что наибольший диапазон составляет четыре средних значения (или p = 4), значительная разница между наибольшим и наименьшим средними значениями, выявленная методом Ньюмана-Кейлса, приведет к отклонению нулевой гипотезы для этого конкретного диапазона средних значений. Следующее по величине сравнение двух выборочных средних будет тогда выполнено в меньшем диапазоне из трех средних (или p = 3). Если нет существенных различий между двумя средними выборками в пределах любого заданного диапазона, это поэтапное сравнение средних выборочных значений будет продолжаться до тех пор, пока не будет выполнено окончательное сравнение с наименьшим диапазоном, состоящим всего из двух средних. Если между двумя выборочными средними нет существенной разницы, то все нулевые гипотезы в этом диапазоне будут сохранены, и дальнейшие сравнения в меньших диапазонах не требуются.
Средние значения | 2 | 4 | 6 | 8 |
---|---|---|---|---|
2 | 2 | 4 | 6 | |
4 | 2 | 4 | ||
6 | 2 |
Чтобы определить, существует ли значительная разница между двумя средними значениями с одинаковыми размерами выборки, метод Ньюмана-Кеулса использует формулу, идентичную той, которая используется в тесте диапазона Тьюки , который вычисляет значение q , беря разницу между двумя средними выборками и разделив его на стандартную ошибку:
где представляет собой значение стьюдентизированного диапазона , и являются наибольшим и наименьшим выборочным средним значением в пределах диапазона, - это дисперсия ошибок, взятая из таблицы ANOVA, и — размер выборки (количество наблюдений в выборке). Если сравнения проводятся со средними значениями неравных размеров выборки ( ), то формула Ньюмана-Кейлса будет скорректирована следующим образом:
где и представляют размеры выборки двух выборочных средних. В обоих случаях MSE (среднеквадратическая ошибка) берется из ANOVA, проведенного на первом этапе анализа.
После расчета вычисленное значение q можно сравнить с критическим значением q (или ), которую можно найти в таблице распределения q на основе уровня значимости ( ), ошибки степеней свободы ( ) из таблицы ANOVA и диапазон ( ) образцов средств, подлежащих испытанию. [16] Если вычисленное значение q равно критическому значению q или превышает его , то нулевая гипотеза ( H 0 : μ A = μ B ) для этого конкретного диапазона средних значений может быть отклонена. [16] Поскольку количество средних значений в диапазоне меняется при каждом последующем парном сравнении, критическое значение статистики q также меняется при каждом сравнении, что делает метод Неймана-Кейлса более мягким и, следовательно, более эффективным, чем критерий диапазона Тьюки. Таким образом, если с помощью метода Ньюмана-Кейлса было обнаружено, что парное сравнение значительно отличается, оно не обязательно может существенно отличаться при анализе с помощью критерия диапазона Тьюки. [7] [16] И наоборот, если при использовании метода Ньюмана-Кейлса было обнаружено, что парное сравнение не имеет существенных различий, оно не может существенно отличаться и при использовании критерия диапазона Тьюки. [7]
Ограничения
[ редактировать ]Процедура Ньюмана-Кейлса не может создать доверительный интервал для каждой средней разницы или для точных значений p с поправкой на множественность из-за ее последовательного характера. [ нужна ссылка ] Результаты несколько сложно интерпретировать, поскольку трудно сформулировать, какие нулевые гипотезы были проверены. [ нужна ссылка ]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б с Де Мут, Джеймс Э. (2006). Базовая статистика и приложения фармацевтической статистики (2-е изд.). Бока-Ратон, Флорида: Чепмен и Холл/CRC. стр. 229–259. ISBN 978-0-8493-3799-4 .
- ^ Студент (1927). «Ошибки рутинного анализа». Биометрика . 19 (1/2): 151–164. дои : 10.2307/2332181 . JSTOR 2332181 .
- ^ Ньюман, Д. (1939). «Распределение диапазона в выборках нормальной популяции, выраженное через независимую оценку стандартного отклонения». Биометрика . 31 (1): 20–30. дои : 10.1093/biomet/31.1-2.20 .
- ^ Кеулс, М. (1952). «Использование «студентизированного диапазона» в связи с дисперсионным анализом» (PDF) . Эвфитика . 1 (2): 112–122. дои : 10.1007/bf01908269 . S2CID 19365087 . Архивировано из оригинала (PDF) 4 ноября 2014 г.
- ^ Брота, К.Д. (1989). Экспериментальный дизайн в поведенческих исследованиях (1-е изд.). Нью-Дели, Индия: New Age International (P) Ltd., стр. 81–96. ISBN 978-81-224-0215-5 .
- ^ Jump up to: а б Шескин, Дэвид Дж. (1989). Справочник по параметрическим и непараметрическим статистическим процедурам (3-е изд.). Бока-Ратон, Флорида: CRC Press. стр. 665–756. ISBN 978-1-58488-440-8 .
- ^ Jump up to: а б с Робертс, Максвелл; Руссо, Риккардо (1999). «Наблюдение за однофакторным межсубъектным дисперсионным анализом». Руководство для студентов по дисперсионному анализу . Файли, Великобритания: J&L Composition Ltd., стр. 82–109. ISBN 978-0-415-16564-8 .
- ^ Тьюки, JW (1952a). «Памятки для поправок на различные виды ошибок. Неопубликованная рукопись». Браун, 1984 год .
- ^ Тьюки, JW (1952b). «Памятки для множественных сравнений. Неопубликованная рукопись». Браун, 1984 год .
- ^ Тьюки, JW (1953). «Проблема множественных сравнений. Неопубликованная рукопись». Браун, 1984 год .
- ^ Jump up to: а б Прощан, Майкл А.; Бриттен, Эрика Х. (30 апреля 2020 г.). «Основы сильного и слабого контроля частоты семейных ошибок» . Статистика в медицине . 39 (9): 1407–1413. дои : 10.1002/сим.8463 . ISSN 0277-6715 . ПМИД 32106332 . S2CID 211556180 .
- ^ Jump up to: а б Кесельман, HJ; Кесельман, Джоан К.; Игры, Пол А. (1991). «Максимальная частота ошибок типа I для всей семьи: наименьшая значимая разница, процедуры Ньюмана-Кеулса и другие процедуры множественного сравнения» . Психологический вестник . 110 (1): 155–161. дои : 10.1037/0033-2909.110.1.155 . ISSN 0033-2909 .
- ^ Бенджамини Ю., Хохберг Ю. (1995). «Контроль количества ложных обнаружений: новый и мощный подход к множественному тестированию» (PDF) . Журнал Королевского статистического общества. Серия Б (Методическая) . 57 (1): 289–300. дои : 10.1111/j.2517-6161.1995.tb02031.x . JSTOR 2346101 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Шаффер, Джульетта П. (2007). «Контроль частоты ложных открытий с помощью ограничений: новый взгляд на тест Ньюмана-Кейлса». Биометрический журнал . 49 (1): 136–143. дои : 10.1002/bimj.200610297 . ПМИД 17342955 . S2CID 32625652 .
- ^ Jump up to: а б с Зубакер, Ларри Э. (1993). Процедуры множественного сравнения (количественные приложения в социальных науках) (2-е изд.). Ньюберри-Парк, Калифорния: Чепмен и Холл / CRC. стр. 27–45. ISBN 978-0-8039-4177-9 .
- ^ Jump up to: а б с Зар, Джеррольд Х. (1999). Биостатистический анализ (4-е изд.). Ньюберри-Парк, Калифорния: Прентис-Холл. стр. 208–230. ISBN 978-0-13-081542-2 .