F -критерий равенства дисперсий

В статистике F -тест равенства дисперсий — это проверка нулевой гипотезы о том, что две нормальные популяции имеют одинаковую дисперсию . Теоретически любой F -тест можно рассматривать как сравнение двух дисперсий, но в этой статье обсуждается конкретный случай двух популяций, где используемая статистика теста представляет собой отношение двух выборочных дисперсий . ^[1] Эта конкретная ситуация важна для математической статистики , поскольку она представляет собой основной примерный случай, в котором F -распределение . может быть получено ^[2] Для применения в прикладной статистике есть опасения ^[3] что тест настолько чувствителен к предположению о нормальности, что было бы нецелесообразно использовать его в качестве рутинного теста на равенство дисперсий. Другими словами, это тот случай, когда «приблизительная нормальность» (которая в аналогичных контекстах часто оправдывается с помощью центральной предельной теоремы ) недостаточно хороша, чтобы сделать процедуру проверки приблизительно допустимой в приемлемой степени.

Тест [ править ]

Пусть X ₁ , ..., X _n и Y ₁ , ..., Y _m — независимые и одинаково распределенные выборки из двух популяций, каждая из которых имеет нормальное распределение . Ожидаемые значения для двух совокупностей могут быть разными, и гипотеза, которую необходимо проверить, состоит в том, что дисперсии равны. Позволять

{\overline {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}{\text{  and  }}{\overline {Y}}={\frac {1}{m}}\sum _{i=1}^{m}Y_{i}

быть образец означает . Позволять

S_{X}^{2}={\frac {1}{n-1}}\sum _{i=1}^{n}\left(X_{i}-{\overline {X}}\right)^{2}{\text{  and  }}S_{Y}^{2}={\frac {1}{m-1}}\sum _{i=1}^{m}\left(Y_{i}-{\overline {Y}}\right)^{2}

быть выборочными дисперсиями . Тогда тестовая статистика

F={\frac {S_{X}^{2}}{S_{Y}^{2}}}

имеет F-распределение с n - 1 и m - 1 степенями свободы, если верна нулевая гипотеза равенства дисперсий. В противном случае оно соответствует F-распределению, масштабированному по отношению истинных дисперсий. Нулевая гипотеза отклоняется, если F слишком велико или слишком мало в зависимости от желаемого уровня альфа (т. е. статистической значимости ).

Свойства [ править ]

Известно, что этот F-тест чрезвычайно чувствителен к отклонениям от нормальности . ^[4]^[5] поэтому тест Левена , тест Бартлетта или тест Брауна-Форсайта являются лучшими тестами для проверки равенства двух дисперсий. (Однако все эти тесты создают экспериментальное увеличение ошибок типа I , когда они проводятся в качестве проверки предположения о гомоскедастичности перед проверкой эффектов. ^[6]) F-критерии на равенство дисперсий можно использовать на практике с осторожностью, особенно там, где требуется быстрая проверка, и при условии сопутствующей диагностической проверки: практические учебники ^[7] предлагают как графическую, так и формальную проверку предположения.

F-тесты используются для других статистических проверок гипотез , таких как проверка различий в средних значениях в трех или более группах или в факторных планах. Эти F-тесты, как правило, не являются надежными , когда есть нарушения предположения о том, что каждая совокупность следует нормальному распределению , особенно для небольших уровней альфа и несбалансированных макетов. ^[8] Однако для больших уровней альфа (например, не менее 0,05) и сбалансированных макетов F-тест является относительно надежным, хотя (если предположение о нормальности не выполняется) он страдает от потери сравнительной статистической мощности по сравнению с непараметрическим методом. аналоги.

Обобщение [ править ]

Непосредственное обобщение проблемы, изложенной выше, относится к ситуациям, когда существует более двух групп или популяций, и гипотеза состоит в том, что все дисперсии равны. Эту проблему решают тест Хартли и тест Бартлетта .

См. также [ править ]

Ссылки [ править ]

^ Снедекор, Джордж В. и Кокран, Уильям Г. (1989), Статистические методы, восьмое издание, Издательство Университета штата Айова.
^ Джонсон, Н.Л., Коц, С., Балакришнан, Н. (1995) Непрерывные одномерные распределения, Том 2 , Wiley. ISBN 0-471-58494-0 (раздел 27.1)
^ Агрести А. и Катери М. (2021), Основы статистики для специалистов по данным: с R и Python, CRC Press. ISBN 978-0-367-74845-6 (раздел 5.3.2)
^ Коробка, ГЭП (1953). «Ненормальность и тесты на дисперсии». Биометрика . 40 (3/4): 318–335. дои : 10.1093/biomet/40.3-4.318 . JSTOR 2333350 .
^ Марковски, Кэрол А; Марковски, Эдвард П. (1990). «Условия эффективности предварительного дисперсионного теста». Американский статистик . 44 (4): 322–326. дои : 10.2307/2684360 . JSTOR 2684360 .
^ Савиловский, С. (2002). «Ферма, Шуберт, Эйнштейн и Беренс-Фишер: вероятная разница между двумя средствами, когда σ ₁² ≠ п ₂²« , Журнал современных прикладных статистических методов , 1 (2), 461–472.
^ Рис, DG (2001) Основная статистика (4-е издание) , Chapman & Hall/CRC, ISBN 1-58488-007-4 . Раздел 10.15
^ Блер, Р.К. (1981). «Реакция на« Последствия невыполнения предположений, лежащих в основе анализа дисперсии и ковариации с фиксированными эффектами » ». Обзор образовательных исследований . 51 (4): 499–507. дои : 10.3102/00346543051004499 . S2CID 121873115 .

[1] Снедекор, Джордж В. и Кокран, Уильям Г. (1989), Статистические методы, восьмое издание, Издательство Университета штата Айова.

[2] Джонсон, Н.Л., Коц, С., Балакришнан, Н. (1995) Непрерывные одномерные распределения, Том 2 , Wiley. ISBN 0-471-58494-0 (раздел 27.1)

[3] Агрести А. и Катери М. (2021), Основы статистики для специалистов по данным: с R и Python, CRC Press. ISBN 978-0-367-74845-6 (раздел 5.3.2)

[4] Коробка, ГЭП (1953). «Ненормальность и тесты на дисперсии». Биометрика . 40 (3/4): 318–335. дои : 10.1093/biomet/40.3-4.318 . JSTOR 2333350 .

[5] Марковски, Кэрол А; Марковски, Эдвард П. (1990). «Условия эффективности предварительного дисперсионного теста». Американский статистик . 44 (4): 322–326. дои : 10.2307/2684360 . JSTOR 2684360 .

[6] Савиловский, С. (2002). «Ферма, Шуберт, Эйнштейн и Беренс-Фишер: вероятная разница между двумя средствами, когда σ ₁² ≠ п ₂²« , Журнал современных прикладных статистических методов , 1 (2), 461–472.

[7] Рис, DG (2001) Основная статистика (4-е издание) , Chapman & Hall/CRC, ISBN 1-58488-007-4 . Раздел 10.15

[8] Блер, Р.К. (1981). «Реакция на« Последствия невыполнения предположений, лежащих в основе анализа дисперсии и ковариации с фиксированными эффектами » ». Обзор образовательных исследований . 51 (4): 499–507. дои : 10.3102/00346543051004499 . S2CID 121873115 .

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]