ANOVA по рангам
В статистике одной из целей дисперсионного анализа (ANOVA) является анализ различий в средних значениях между группами. Тестовая статистика F предполагает независимость наблюдений, однородную дисперсию и нормальность совокупности . ANOVA по рангам — это статистика, предназначенная для ситуаций, когда предположение о нормальности нарушается.
Логика F- теста на средние значения
[ редактировать ]Статистика F представляет собой отношение числителя к знаменателю. Рассмотрим случайно выбранных испытуемых, которые впоследствии случайным образом распределяются по группам A, B и C. При истинности нулевой гипотезы вариабельность (или сумма квадратов) оценок некоторой зависимой переменной будет одинаковой внутри каждой группы. знаменатель отношения F. При делении на степени свободы (т.е. на основе количества субъектов в группе) получается
Рассматривайте среднее значение для каждой группы как балл и вычисляйте вариабельность (опять же, сумму квадратов) этих трех баллов. При делении на степени свободы (т. е. на основе количества групп) получается числитель отношения F.
При истинности нулевой гипотезы выборочное распределение отношения F зависит от степеней свободы числителя и знаменателя.
Смоделируйте лечение, применяемое к группе А, увеличивая каждый балл на X. (Эта модель поддерживает основное предположение об однородных дисперсиях. На практике редко – если вообще возможно – увеличение X в групповом среднем происходит за счет увеличения балл каждого участника на X.) Это сместит единицы распределения X в положительную сторону, но не окажет никакого влияния на изменчивость внутри группы. Однако теперь разница между средними баллами трех групп увеличится. Если результирующее соотношение F повышает значение до такой степени, что оно превышает порог того, что представляет собой редкое событие (называемое уровнем альфа), говорят, что тест Anova F отвергает нулевую гипотезу о равных средних между тремя группами, в В пользу альтернативной гипотезы о том, что по крайней мере одна из групп имеет большее среднее значение (в данном примере это группа А).
Борьба с нарушением нормальности популяции
[ редактировать ]Ранжирование — одна из многих процедур, используемых для преобразования данных, которые не соответствуют предположению о нормальности . Коновер и Иман представили обзор четырех основных типов ранговых преобразований (RT). [1] Один метод заменяет каждое исходное значение данных его рангом (от 1 для наименьшего значения до N для наибольшего). Эта ранговая процедура была рекомендована как устойчивая к ненормальным ошибкам, устойчивая к выбросам и высокоэффективная для многих распределений. Это может привести к получению известной статистики (например, к результатам ранжирования двух независимых выборок по сумме рангов Уилкоксона / U-критерию Манна-Уитни ) и обеспечивает желаемую надежность и повышенную статистическую мощность , которые искомы. Например, исследования Монте-Карло показали, что ранговое преобразование в схеме t-критерия для двух независимых выборок может быть успешно распространено на односторонний дисперсионный анализ независимых выборок, а также на многомерный Хотеллинга для двух независимых выборок. T 2 макеты [2] Пакеты коммерческого статистического программного обеспечения (например, SAS) сопровождались рекомендациями для аналитиков данных провести процедуру ранжирования своих наборов данных (например, PROC RANK) перед проведением стандартного анализа с использованием параметрических процедур. [3] [4] [5]
Сбой ранжирования в факторном дисперсионном анализе и других сложных макетах.
[ редактировать ]ANOVA по рангам означает, что стандартный дисперсионный анализ рассчитывается на основе данных, преобразованных в ранги. Также было предложено провести факторный дисперсионный анализ рангов исходных оценок. [6] [7] [8] Однако исследования Монте-Карло [9] [10] [11] [12] и последующие асимптотические исследования [13] [14] обнаружили, что ранговое преобразование не подходит для тестирования эффектов взаимодействия в факторном плане 4x3 и 2x2x2. По мере того, как количество эффектов (т. е. основных, взаимодействия) становится ненулевым, а величина ненулевых эффектов увеличивается, увеличивается ошибка типа I , что приводит к полному отказу статистики с такой высокой величиной, как 100% вероятность принятия ложноположительного решения. Аналогичным образом было обнаружено, что ранговое преобразование все чаще терпит неудачу в схеме двух зависимых выборок по мере увеличения корреляции между оценками до и после тестирования. [15] Также было обнаружено, что проблема частоты ошибок типа I усугублялась в контексте ковариационного анализа, особенно по мере увеличения корреляции между ковариатой и зависимой переменной. [16]
Трансформация рядов
[ редактировать ]Вариантом преобразования рангов является «квантильная нормализация», при которой к рангам применяется дальнейшее преобразование так, что результирующие значения имеют некоторое определенное распределение (часто нормальное распределение с указанным средним значением и дисперсией). Дальнейший анализ данных, нормализованных по квантилю, может затем предположить это распределение для расчета значений значимости. Однако было показано, что два конкретных типа вторичных преобразований, случайные нормальные оценки и трансформация ожидаемых нормальных оценок, значительно увеличивают ошибки типа I и серьезно снижают статистическую мощность. [17]
Нарушение гомоскедастичности
[ редактировать ]ANOVA по рангам никогда не рекомендовался, когда основное предположение об однородных дисперсиях нарушалось либо само по себе, либо в сочетании с нарушением предположения о нормальности совокупности. [ нужна ссылка ] В целом, ранговая статистика становится неустойчивой по отношению к ошибкам типа I из-за отклонений от гомоскедастичности даже быстрее, чем параметрические аналоги, которые разделяют то же предположение. [ нужна ссылка ]
Дополнительная информация
[ редактировать ]Кепнер и Вакерли резюмировали литературу, отметив, что «к концу 1980-х годов объем литературы по методам RT быстро расширялся по мере того, как были получены новые идеи, как положительные, так и отрицательные, относительно полезности метода. Обеспокоенные тем, что методы RT будут использоваться неправильно, Савиловский и др. (1989, стр. 255) предостерегают практикующих врачей от использования этих тестов «за исключением тех конкретных ситуаций, когда характеристики тестов хорошо понятны». [18] По мнению Хетманспергера и Маккина, [19] «Савиловский (1990) [20] представляет собой отличный обзор непараметрических подходов к тестированию взаимодействия» в ANOVA.
Примечания
[ редактировать ]- ^ Коновер, WJ; Иман, Р.Л. (1981). «Ранговые преобразования как мост между параметрической и непараметрической статистикой» . Американский статистик . 35 (3): 124–129. дои : 10.2307/2683975 . JSTOR 2683975 . Архивировано из оригинала 02 марта 2011 г.
- ^ Нанна, MJ (2002). "Отель Т" 2 против рангового преобразования с реальными данными Лайкерта» . Журнал современных прикладных статистических методов . 1 : 83–99. doi : 10.22237/jmasm/1020255180 .
- ^ Институт SAS. (1985). Руководство по SAS/stat для персональных компьютеров (5-е изд.). Кэри, Северная Каролина: Автор.
- ^ Институт SAS. (1987). Руководство по SAS/stat для персональных компьютеров (6-е изд.). Кэри, Северная Каролина: Автор.
- ^ *Институт SAS. (2008). Руководство пользователя SAS/STAT 9.2: Введение в непараметрический анализ. Кэри, Северная Каролина. Автор.
- ^ Коновер, WJ; Иман, Р.Л. (1976). «О некоторых альтернативных процедурах использования рангов для анализа экспериментальных планов». Коммуникации в статистике - теория и методы . А5 (14): 1349–1368. дои : 10.1080/03610927608827447 .
- ^ Иман, Р.Л. (1974). «Исследование мощности рангового преобразования для модели двусторонней классификации, когда могут присутствовать взаимодействия». Канадский статистический журнал . 2 (2): 227–239. дои : 10.2307/3314695 . JSTOR 3314695 .
- ^ Иман, Р.Л., и Коновер, В.Дж. (1976). Сравнение нескольких ранговых тестов для двусторонней схемы (SAND76-0631). Альбукерке, Нью-Мексико: Sandia Laboratories.
- ^ Савиловский, С. (1985). Надежный и степенной анализ тестов ANOVA 2x2x2, рангового преобразования, случайных нормальных оценок и тестов преобразования ожидаемых нормальных оценок . Неопубликованная докторская диссертация, Университет Южной Флориды.
- ^ Савиловский, С.; Блэр, Р.К. и Хиггинс, Дж.Дж. (1989). «Исследование ошибки I рода и степенных свойств процедуры рангового преобразования в факторном дисперсионном анализе». Журнал образовательной статистики . 14 (3): 255–267. дои : 10.2307/1165018 . JSTOR 1165018 .
- ^ Блэр, Р.К.; Савиловский, С.С. и Хиггинс, Дж.Дж. (1987). «Ограничения статистики рангового преобразования в тестах на взаимодействие». Коммуникации в статистике — моделирование и вычисления . Б16 (4): 1133–1145. дои : 10.1080/03610918708812642 .
- ^ Савиловский, С. (1990). «Непараметрические тесты взаимодействия при планировании эксперимента». Обзор образовательных исследований . 60 (1): 91–126. дои : 10.3102/00346543060001091 . S2CID 146336002 .
- ^ Томпсон, Г.Л. (1991). «Заметка о преобразовании рангов для взаимодействий». Биометрика . 78 (3): 697–701. дои : 10.1093/biomet/78.3.697 .
- ^ Томпсон, GL; Амманн, LP (1989). «Эффективность рангового преобразования в двусторонних моделях без взаимодействия». Журнал Американской статистической ассоциации . 84 (405): 325–330. дои : 10.1080/01621459.1989.10478773 .
- ^ Блэр, Р.К.; Хиггинс, Джей-Джей (1985). «Сравнение мощности статистики рангового преобразования парных выборок со статистикой знаковых рангов Уилкоксона». Журнал образовательной и поведенческой статистики . 10 (4): 368–383. дои : 10.3102/10769986010004368 . S2CID 121958144 .
- ^ Хедрик, TC (1997). Ошибка типа I и мощность ковариационного анализа рангового преобразования (ANCOVA) в факторной схеме 3 x 4 . Неопубликованная докторская диссертация, Университет Южной Флориды.
- ^ Савиловский, С. (1985). «Сравнение теста случайных нормальных результатов при распределениях F и хи-квадрат с тестом ANOVA 2x2x2» . Флоридский журнал исследований в области образования . 27 : 83–97.
- ^ Кепнер, Джеймс Л.; Вакерли, Деннис Д. (1996). «О методах преобразования рангов для сбалансированных неполных планов с повторными измерениями». Журнал Американской статистической ассоциации . 91 (436): 1619–1625. дои : 10.1080/01621459.1996.10476730 . JSTOR 2291588 .
- ^ Хеттманспергер, ТП; Маккин, JW (1998). Робастные непараметрические статистические методы . Статистическая библиотека Кендалла. Том. 5 (Первое изд.). Лондон: Эдвард Арнольд. стр. xiv+467 стр. ISBN 0-340-54937-8 . МР 1604954 .
- ^ Савиловский, С. (1990). «Непараметрические тесты взаимодействия при планировании эксперимента». Обзор образовательных исследований . 60 : 91–126. дои : 10.3102/00346543060001091 . S2CID 146336002 .