Многомерная задача Беренса – Фишера
В статистике многомерная проблема Беренса-Фишера — это проблема проверки равенства средних значений двух многомерных нормальных распределений, когда ковариационные матрицы неизвестны и, возможно, не равны. Поскольку это обобщение одномерной задачи Беренса-Фишера , оно наследует все трудности, возникающие в одномерной задаче.
Обозначения и формулировка задачи
[ редактировать ]Позволять быть независимыми случайными выборками из двух -вариации нормальных распределений с неизвестными средними векторами и неизвестные матрицы дисперсии . Индекс относится к первой или второй популяции, а это наблюдение из население .
Многомерная задача Беренса – Фишера заключается в проверке нулевой гипотезы. что средства равны по сравнению с альтернативой неравенства:
Определим некоторые статистики, которые используются в различных попытках решить многомерную задачу Беренса-Фишера, по формуле
Образец означает и матрицы суммы квадратов достаточны для многомерных нормальных параметров , поэтому достаточно сделать вывод, основываясь только на этой статистике. Распределения и независимы и являются соответственно многомерными нормальными и Уишартами : [ 1 ]
Фон
[ редактировать ]В случае равенства дисперсионных матриц распределение Статистика, как известно, представляет собой F-распределение при нулевом значении и нецентральное F-распределение при альтернативном варианте. [ 1 ]
Основная проблема заключается в том, что когда истинные значения матрицы дисперсии неизвестны, то при нулевой гипотезе вероятность отклонения далеко в тест зависит от неизвестных матриц дисперсии. [ 1 ] На практике эта зависимость вредит выводам, когда матрицы дисперсии находятся далеко друг от друга или когда размер выборки недостаточно велик для их точной оценки. [ 1 ]
Теперь средние векторы независимы и нормально распределены:
но сумма не соответствует распределению Уишарта, [ 1 ] что усложняет вывод.
Предлагаемые решения
[ редактировать ]Предлагаемые решения основаны на нескольких основных стратегиях: [ 2 ] [ 3 ]
- Вычислить статистику, имитирующую статистические данные и которые имеют приблизительную распределение с оцененными степенями свободы (df).
- Используйте обобщенные значения p на основе обобщенных тестовых переменных .
- Используйте принцип объединения-пересечения Роя. [ 3 ] [ 4 ] [ 5 ]
Подходы с использованием T 2 с приблизительными степенями свободы
[ редактировать ]Ниже, указывает оператор трассировки .
Они (1965)
[ редактировать ](как цитирует [ 6 ] )
где
Йохансен (1980)
[ редактировать ](как цитирует [ 6 ] )
где
и
Нел и Ван дер Мерве (1986)
[ редактировать ](как цитирует [ 6 ] )
где
Комментарии к производительности
[ редактировать ]Ким (1992) предложил решение, основанное на варианте . Хотя его мощность высока, тот факт, что он не инвариантен, делает его менее привлекательным. Исследования с помощью моделирования, проведенные Субраманиамом и Субраманиамом (1973), показывают, что размер теста Яо ближе к номинальному уровню, чем размер теста Джеймса. Кристенсен и Ренчер (1997) провели численные исследования, сравнив несколько из этих процедур тестирования, и пришли к выводу, что тесты Кима, Нела и Ван дер Мерве имели наибольшую мощность. Однако эти две процедуры не инвариантны.
Кришнамурти и Ю (2004)
[ редактировать ]Кришнамурти и Ю (2004) предложили процедуру, которая корректирует приблизительную df Нела и Вар дер Мерве (1986) для знаменателя под нулевым распределением, чтобы сделать его инвариантным. Они показывают, что приблизительные степени свободы лежат в интервале чтобы убедиться, что степени свободы не отрицательны. Они сообщают о численных исследованиях, которые показывают, что их процедура столь же эффективна, как тест Неля и Ван дер Мерве для меньшего измерения, и более эффективна для большего измерения. В целом они утверждают, что их процедура лучше, чем инвариантные процедуры Яо (1965) и Йохансена (1980). Таким образом, по состоянию на 2004 год процедура Кришнамурти и Ю (2004) имеет наиболее известный размер и эффективность.
Тестовая статистика в процедуре Кришнмурти и Ю следует распределению где
Ссылки
[ редактировать ]- ^ Jump up to: а б с д и Андерсон, Т.В. (2003). Введение в многомерный статистический анализ (3-е изд.). Хобокен, Нью-Джерси: Wiley Interscience . п. 259. ИСБН 0-471-36091-0 .
- ^ Кристенсен, ВФ; AC Ренчер (1997). «Сравнение частоты ошибок типа I и уровней мощности для семи решений многомерной задачи Беренса-Фишера». Коммуникации в статистике – моделирование и вычисления . 26 (4): 1251–1273. дои : 10.1080/03610919708813439 .
- ^ Jump up to: а б Пак, Джунён; Бимал Синха (2007). Некоторые аспекты многомерной задачи Беренса – Фишера (PDF) (Технический отчет).
- ^ Олкин, Ингрэм; Джек Л. Томский (1981). «Новый класс многомерных тестов, основанный на принципе объединения-пересечения» . Анналы статистики . 9 (4): 792–802. дои : 10.1214/aos/1176345519 .
- ^ Гамедж, Дж.; Т. Мэтью; С. Вираханди (2004). «Обобщенные p-значения и обобщенные доверительные области для многомерной задачи Беренса-Фишера и MANOVA» . Журнал многомерного анализа . 88 : 177–189. дои : 10.1016/s0047-259x(03)00065-4 .
- ^ Jump up to: а б с Кришнамурти, К.; Дж. Ю (2004). «Модифицированный тест Неля и Ван дер Мерве для многомерной задачи Беренса-Фишера». Статистика и вероятностные буквы . 66 (2): 161–169. дои : 10.1016/j.spl.2003.10.012 .
- Родригес-Кортес, Ф.Дж. и Нагар, ДК (2007). Процентные точки для проверки равенства средних векторов. Журнал Нигерийского математического общества , 26:85–95.
- Гупта А.К., Нагар Д.К., Матеу Дж. и Родригес-Кортес Ф.Дж. (2013). Процентные точки тестовой статистики, полезные в манове со структурированными ковариационными матрицами. Журнал прикладной статистики , 20:29-41.