Многомерный дисперсионный анализ

В статистике многомерный дисперсионный анализ ( МАНОВА ) — это процедура сравнения средних значений многомерной выборки. Как многомерная процедура, она используется при наличии двух и более зависимых переменных . [1] и часто за ним следуют тесты значимости, включающие отдельные зависимые переменные по отдельности. [2]
Независимо от изображения, зависимыми переменными могут быть k показателей удовлетворенности жизнью, измеренные в последовательные моменты времени, и p показателей удовлетворенности работой, измеренные в последовательные моменты времени. В этом случае существуют k + p зависимые переменные, линейная комбинация которых соответствует многомерному нормальному распределению, однородности многомерной дисперсионно-ковариационной матрицы и линейной зависимости, без мультиколлинеарности и каждая без выбросов.
Модель [ править ]
Предполагать -мерные наблюдения, где 'е наблюдение закреплен за группой и распределяется вокруг центра группы с многомерным гауссовским шумом:
с ANOVA Отношения
MANOVA — это обобщенная форма одномерного дисперсионного анализа (ANOVA), [1] хотя, в отличие от одномерного дисперсионного анализа , он использует ковариацию между переменными результата при проверке статистической значимости средних различий.
Там, где в одномерном дисперсионном анализе появляются суммы квадратов , в многомерном дисперсионном анализе определенные положительно определенные матрицы появляются . Диагональные элементы представляют собой те же суммы квадратов, которые появляются в одномерном дисперсионном анализе. Внедиагональные записи представляют собой соответствующие суммы произведений. При предположениях о нормальности распределения ошибок аналог суммы квадратов ошибок имеет распределение Уишарта .
Проверка гипотез [ править ]
Сначала определите следующее матрицы:
- : где -я строка равна
- : где -я строка — лучший прогноз с учетом членства в группе . Это среднее значение по всем наблюдениям в группе. : .
- : где -я строка — лучший прогноз при отсутствии информации. Это эмпирическое среднее значение для всех наблюдения
Тогда матрица является обобщением суммы квадратов, объясненной группой, и является обобщением остаточной суммы квадратов . [3] [4] Обратите внимание, что в качестве альтернативы можно также говорить о ковариациях, когда вышеупомянутые матрицы масштабируются на 1/(n-1), поскольку последующая тестовая статистика не меняется при умножении и той же ненулевой константой.
Самый распространенный [3] [5] статистика представляет собой сводку, основанную на корнях (или собственных значениях) матрицы
- Сэмюэл Стэнли Уилкс распределяется как лямбда (Λ)
- KC Sreedharan Pillai – MS Bartlett трасса , [6]
- след Лоули- Хотеллинга ,
- Самый большой корень Роя (также называемый самым большим корнем Роя ),
Продолжается обсуждение достоинств каждого из них. [1] хотя величайший корень приводит только к границе значимости, которая обычно не представляет практического интереса. Еще одна сложность заключается в том, что, за исключением наибольшего корня Роя, распределение этих статистических данных при нулевой гипотезе не является прямым и может быть только аппроксимировано, за исключением нескольких случаев малой размерности.Алгоритм распределения наибольшего корня Роя при нулевой гипотезе был получен в [7] а распределение при альтернативе изучается в . [8]
Самое известное приближение для лямбды Уилкса было получено Ч.Р. Рао .
В случае двух групп все статистические данные эквивалентны, и критерий сводится к Т-квадрату Хотеллинга .
Введение ковариат (MANCOVA) [ править ]
Можно также проверить, существует ли групповой эффект после поправки на ковариаты. Для этого выполните описанную выше процедуру, но замените с предсказаниями общей линейной модели , содержащей группу и ковариаты, и заменить с предсказаниями общей линейной модели, содержащей только ковариаты (и отрезок). Затем представляют собой дополнительную сумму квадратов, объясняемую добавлением информации о группировке и — остаточная сумма квадратов модели, содержащей группировку и ковариаты. [4]
Обратите внимание, что в случае несбалансированных данных порядок добавления ковариат имеет значение.
Корреляция зависимых переменных [ править ]


На мощность MANOVA влияют корреляции зависимых переменных и размеры эффекта, связанные с этими переменными. Например, при наличии двух групп и двух зависимых переменных мощность MANOVA минимальна, когда корреляция равна отношению меньшего к большему стандартизованному размеру эффекта. [9]
См. также [ править ]
- Перестановочный анализ дисперсии для непараметрической альтернативы
- Дискриминантный функциональный анализ
- Канонический корреляционный анализ
- Многомерный дисперсионный анализ (Викиверситет)
- Проектирование повторяющихся мер
Ссылки [ править ]
- ^ Jump up to: Перейти обратно: а б с Варн, RT (2014). «Букварь по многомерному дисперсионному анализу (MANOVA) для ученых-бихевиористов» . Практическая оценка, исследования и оценка . 19 (17): 1–10.
- ^ Стивенс, JP (2002). Прикладная многомерная статистика для социальных наук. Махва, Нью-Джерси: Лоуренс Эрблаум.
- ^ Jump up to: Перейти обратно: а б Андерсон, Т.В. (1994). Введение в многомерный статистический анализ . Уайли.
- ^ Jump up to: Перейти обратно: а б Кржановский, WJ (1988). Принципы многомерного анализа. Взгляд пользователя . Издательство Оксфордского университета.
- ^ Калифорнийский университет в Лос-Анджелесе: Службы академических технологий, Группа статистического консалтинга. «Вывод с аннотациями статистики — MANOVA» . Проверено 10 февраля 2024 г.
- ^ «Основные понятия MANOVA – реальная статистика с использованием Excel» . www.real-statistics.com . Проверено 5 апреля 2018 г.
- ^ Чиани, М. (2016), «Распределение наибольшего корня матрицы для теста Роя в многомерном дисперсионном анализе», Journal of Multivariate Analysis , 143 : 467–471, arXiv : 1401.3987v3 , doi : 10.1016/j.jmva .2015.10.007 , S2CID 37620291
- ^ И. М. Джонстон, Б. Надлер «Крупнейший корневой тест Роя с альтернативами первого ранга» препринт arXiv arXiv: 1310.6581 (2013)
- ^ Фране, Эндрю (2015). «Мощность и контроль ошибок типа I для одномерных сравнений в многомерных двухгрупповых планах». Многомерное поведенческое исследование . 50 (2): 233–247. дои : 10.1080/00273171.2014.968836 . ПМИД 26609880 . S2CID 1532673 .
Внешние ссылки [ править ]
