F -критерий равенства дисперсий
В статистике F -тест равенства дисперсий — это проверка нулевой гипотезы о том, что две нормальные популяции имеют одинаковую дисперсию . Теоретически любой F -тест можно рассматривать как сравнение двух дисперсий, но в этой статье обсуждается конкретный случай двух популяций, где используемая статистика теста представляет собой отношение двух выборочных дисперсий . [1] Эта конкретная ситуация важна для математической статистики , поскольку она представляет собой основной примерный случай, в котором F -распределение . может быть получено [2] Для применения в прикладной статистике есть опасения [3] что тест настолько чувствителен к предположению о нормальности, что было бы нецелесообразно использовать его в качестве рутинного теста на равенство дисперсий. Другими словами, это тот случай, когда «приблизительная нормальность» (которая в аналогичных контекстах часто оправдывается с помощью центральной предельной теоремы ) недостаточно хороша, чтобы сделать процедуру проверки приблизительно допустимой в приемлемой степени.
Тест [ править ]
Пусть X 1 , ..., X n и Y 1 , ..., Y m — независимые и одинаково распределенные выборки из двух популяций, каждая из которых имеет нормальное распределение . Ожидаемые значения для двух совокупностей могут быть разными, и гипотеза, которую необходимо проверить, состоит в том, что дисперсии равны. Позволять
быть образец означает . Позволять
быть выборочными дисперсиями . Тогда тестовая статистика
имеет F-распределение с n - 1 и m - 1 степенями свободы, если верна нулевая гипотеза равенства дисперсий. В противном случае оно соответствует F-распределению, масштабированному по отношению истинных дисперсий. Нулевая гипотеза отклоняется, если F слишком велико или слишком мало в зависимости от желаемого уровня альфа (т. е. статистической значимости ).
Свойства [ править ]
Известно, что этот F-тест чрезвычайно чувствителен к отклонениям от нормальности . [4] [5] поэтому тест Левена , тест Бартлетта или тест Брауна-Форсайта являются лучшими тестами для проверки равенства двух дисперсий. (Однако все эти тесты создают экспериментальное увеличение ошибок типа I , когда они проводятся в качестве проверки предположения о гомоскедастичности перед проверкой эффектов. [6] ) F-критерии на равенство дисперсий можно использовать на практике с осторожностью, особенно там, где требуется быстрая проверка, и при условии сопутствующей диагностической проверки: практические учебники [7] предлагают как графическую, так и формальную проверку предположения.
F-тесты используются для других статистических проверок гипотез , таких как проверка различий в средних значениях в трех или более группах или в факторных планах. Эти F-тесты, как правило, не являются надежными , когда есть нарушения предположения о том, что каждая совокупность следует нормальному распределению , особенно для небольших уровней альфа и несбалансированных макетов. [8] Однако для больших уровней альфа (например, не менее 0,05) и сбалансированных макетов F-тест является относительно надежным, хотя (если предположение о нормальности не выполняется) он страдает от потери сравнительной статистической мощности по сравнению с непараметрическим методом. аналоги.
Обобщение [ править ]
Непосредственное обобщение проблемы, изложенной выше, относится к ситуациям, когда существует более двух групп или популяций, и гипотеза состоит в том, что все дисперсии равны. Эту проблему решают тест Хартли и тест Бартлетта .
См. также [ править ]
Ссылки [ править ]
- ^ Снедекор, Джордж В. и Кокран, Уильям Г. (1989), Статистические методы, восьмое издание, Издательство Университета штата Айова.
- ^ Джонсон, Н.Л., Коц, С., Балакришнан, Н. (1995) Непрерывные одномерные распределения, Том 2 , Wiley. ISBN 0-471-58494-0 (раздел 27.1)
- ^ Агрести А. и Катери М. (2021), Основы статистики для специалистов по данным: с R и Python, CRC Press. ISBN 978-0-367-74845-6 (раздел 5.3.2)
- ^ Коробка, ГЭП (1953). «Ненормальность и тесты на дисперсии». Биометрика . 40 (3/4): 318–335. дои : 10.1093/biomet/40.3-4.318 . JSTOR 2333350 .
- ^ Марковски, Кэрол А; Марковски, Эдвард П. (1990). «Условия эффективности предварительного дисперсионного теста». Американский статистик . 44 (4): 322–326. дои : 10.2307/2684360 . JSTOR 2684360 .
- ^ Савиловский, С. (2002). «Ферма, Шуберт, Эйнштейн и Беренс-Фишер: вероятная разница между двумя средствами, когда σ 1 2 ≠ п 2 2 « , Журнал современных прикладных статистических методов , 1 (2), 461–472.
- ^ Рис, DG (2001) Основная статистика (4-е издание) , Chapman & Hall/CRC, ISBN 1-58488-007-4 . Раздел 10.15
- ^ Блер, Р.К. (1981). «Реакция на« Последствия невыполнения предположений, лежащих в основе анализа дисперсии и ковариации с фиксированными эффектами » ». Обзор образовательных исследований . 51 (4): 499–507. дои : 10.3102/00346543051004499 . S2CID 121873115 .