Полиномиальный тест
В статистике полиномиальный тест — это проверка нулевой гипотезы о том, что параметры полиномиального распределения равны заданным значениям; он используется для категориальных данных . [1]
Начиная с образца предметы, каждый из которых, как было замечено, попадает в один из категории. Можно определить как наблюдаемое количество элементов в каждой ячейке. Следовательно
Далее определяем вектор параметров где: Это значения параметров при нулевой гипотезе .
Точная вероятность наблюдаемой конфигурации при нулевой гипотезе определяется выражением
Вероятность значимости для теста — это вероятность появления наблюдаемого набора данных или набора данных, менее вероятного, чем наблюдаемый, если нулевая гипотеза верна. Используя точный тест , это рассчитывается как
где сумма колеблется по всем исходам, столь же вероятным, как наблюдаемый, или менее вероятным. На практике это становится вычислительно обременительным, поскольку и увеличивается, поэтому, вероятно, стоит использовать точные тесты только для небольших выборок. Для более крупных выборок асимптотические приближения достаточно точны и их легче вычислить.
Одним из таких приближений является отношение правдоподобия . согласно которой каждое значение альтернативную гипотезу, Можно определить заменяется оценкой максимального правдоподобия Точная вероятность наблюдаемой конфигурации согласно альтернативной гипотезе определяется выражением
Натуральный логарифм отношения правдоподобия, между этими двумя вероятностями, умноженными на тогда это статистика для теста отношения правдоподобия
(Фактор выбран для того, чтобы сделать статистику асимптотически распределенной по хи-квадрату для удобного сравнения со знакомой статистикой, обычно используемой для того же приложения.)
Если нулевая гипотеза верна, то как увеличивается, распространение сходится к хи-квадрату с степени свободы. Однако давно известно (например, Лоули [2] ), что для конечных объемов выборки моменты больше, чем у хи-квадрат, что увеличивает вероятность ошибок типа I (ложных срабатываний). Разница между моментами хи-квадрат и моментами тестовой статистики является функцией Уильямс [3] показал, что первый момент можно сопоставить, если если статистика теста делится на коэффициент, определяемый формулой
В особом случае, когда нулевая гипотеза состоит в том, что все значения равны (т.е. предусматривает равномерное распределение), это упрощает
Впоследствии Смит и др . [4] вывел делительный множитель, который соответствует первому моменту, насколько В случае равных значений этот фактор
Нулевую гипотезу также можно проверить с помощью критерия хи-квадрат Пирсона.
где ожидаемое количество случаев в категории при нулевой гипотезе. Эта статистика также сходится к распределению хи-квадрат с степеней свободы, когда нулевая гипотеза верна, но делает это как бы снизу, а не сверху, как делает, поэтому может быть предпочтительнее неисправленной версии для небольших выборок. [ нужна ссылка ]
Ссылки
[ редактировать ]- ^ Читай, ТРК; Кресси, НАК (1988). Статистика согласия для дискретных многомерных данных . Нью-Йорк, штат Нью-Йорк: Springer-Verlag. ISBN 0-387-96682-Х .
- ^ Лоули, Д.Н. (1956). «Общий метод аппроксимации распределения критериев отношения правдоподобия». Биометрика . 43 : 295–303. дои : 10.1093/biomet/43.3-4.295 .
- ^ Уильямс, Д.А. (1976). «Улучшенные тесты отношения правдоподобия для полных таблиц непредвиденных обстоятельств». Биометрика . 63 : 33–37. дои : 10.1093/biomet/63.1.33 .
- ^ Смит, П.Дж.; Рэй, Д.С.; Мандершайд, RW; Мандершайд, С. (1981). «Аппроксимация моментов и распределение статистики отношения правдоподобия для полиномиального согласия». Журнал Американской статистической ассоциации . 76 (375). Американская статистическая ассоциация: 737–740. дои : 10.2307/2287541 . JSTOR 2287541 .