тест Левена
В статистике дисперсий тест Левена — это статистический вывод, используемый для оценки равенства переменной , рассчитанной для двух или более групп. [ 1 ] Этот тест используется потому, что некоторые распространенные статистические процедуры предполагают, что дисперсии совокупностей, из которых взяты разные выборки, равны. Тест Левена оценивает это предположение. Он проверяет нулевую гипотезу о том, что дисперсии генеральной совокупности равны (так называемая однородность дисперсии или гомоскедастичность ). Если результирующее p значение теста Левена меньше некоторого уровня значимости (обычно 0,05), полученные различия в выборочных дисперсиях вряд ли возникнут на основе случайной выборки из совокупности с равными дисперсиями. Таким образом, нулевая гипотеза о равных дисперсиях отвергается и делается вывод о наличии разницы между дисперсиями в генеральной совокупности.
Критерий Левена использовался в прошлом перед сравнением средних значений для принятия решения о том, использовать ли объединенный t-критерий или t-критерий Уэлча для двух выборочных тестов или дисперсионного анализа , или модифицированный однофакторный дисперсионный анализ Уэлча для многоуровневых тестов. . Однако было показано, что такая двухэтапная процедура может заметно увеличить ошибку типа 1, полученную с помощью t-тестов, и поэтому не рекомендуется. [ 2 ] Вместо этого предпочтительный подход — во всех случаях просто использовать тест Уэлча. [ 2 ]
Тест Левена также можно использовать в качестве основного теста для ответа на отдельный вопрос о том, имеют ли две подвыборки в данной совокупности равные или разные дисперсии. [ 3 ]
Тест Левена был разработан и назван в честь американского статистика и генетика Говарда Левена .
Определение
[ редактировать ]Тест Левена эквивалентен однофакторному дисперсионному анализу между группами (ANOVA), где зависимой переменной является абсолютное значение разницы между оценкой и средним значением группы, к которой принадлежит оценка (показано ниже как ). Статистика теста, , эквивалентно статистика, которая будет получена с помощью такого ANOVA, и определяется следующим образом:
где
- - количество различных групп, к которым относятся отобранные случаи,
- это количество случаев в группа,
- – общее количество случаев во всех группах,
- – значение измеряемой переменной для этот случай из группа,
(Используются оба определения, хотя второе, строго говоря, представляет собой тест Брауна – Форсайта – сравнение см. ниже.)
- является средним значением для группы ,
- это среднее из всех .
Тестовая статистика приблизительно F-распределено с и степеней свободы, и, следовательно, значение результата из протестировано против где является квантилем F-распределения, причем и степени свободы и — выбранный уровень значимости (обычно 0,05 или 0,01).
Сравнение с тестом Брауна – Форсайта
[ редактировать ]Тест Брауна-Форсайта использует медиану вместо среднего значения при вычислении разброса внутри каждой группы ( против. , выше). Хотя оптимальный выбор зависит от основного распределения, рекомендуется определение, основанное на медиане, как выбор, который обеспечивает хорошую устойчивость ко многим типам ненормальных данных, сохраняя при этом хорошую статистическую мощность . [ 3 ] Если кто-то знает основное распределение данных, это может указывать на использование одного из других вариантов. Браун и Форсайт провели исследования Монте-Карло , которые показали, что использование усеченного среднего дает лучший результат, когда базовые данные следуют распределению Коши ( распределение с тяжелым хвостом ), а медиана работает лучше всего, когда базовые данные следуют распределению хи-квадрат с четырьмя степенями распределения. свобода (сильно искаженное распределение ). Использование среднего значения обеспечивает наилучшую мощность для симметричных распределений с умеренным хвостом.
Реализации программного обеспечения
[ редактировать ]Многие программы для работы с электронными таблицами и статистические пакеты, такие как R , Python , Julia и MATLAB, включают реализации теста Левена.
Язык/Программа | Функция | Примечания |
---|---|---|
Питон | scipy.stats.levene(group1, group2, group3) |
См . [1] |
МАТЛАБ | vartestn(data,groups,'TestType','LeveneAbsolute') |
См . [2] |
Р | leveneTest(lm(y ~ x, data=data)) |
См . [3] |
Юлия | HypothesisTests.LeveneTest(group1, group2, group3) |
См . [4] |
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Левен, Ховард (1960). «Надежные тесты на равенство дисперсий». В Ингрэме Олкине ; Гарольд Хотеллинг ; и др. (ред.). Вклад в теорию вероятности и статистики: очерки в честь Гарольда Хотеллинга . Издательство Стэнфордского университета. стр. 278–292.
- ^ Jump up to: а б Циммерманн, Дональд В. (2004). «Заметка о предварительных проверках равенства дисперсий» . Британский журнал математической и статистической психологии . 57 (1): 173–81. дои : 10.1348/000711004849222 .
- ^ Jump up to: а б Деррик, Б; Рак, А; Тохер, Д; Уайт, П. (2018). «Тест на равенство дисперсий между двумя выборками, которые содержат как парные наблюдения, так и независимые наблюдения» (PDF) . Журнал прикладных количественных методов . 13 (2): 36–47.