Минимальная оценка хи-квадрат
В статистике минимальная оценка хи-квадрат — это метод оценки ненаблюдаемых величин на основе наблюдаемых данных. [1]
В некоторых тестах хи-квадрат отклоняется нулевая гипотеза о распределении населения, если указанная статистика теста слишком велика, тогда как эта статистика будет иметь приблизительно распределение хи-квадрат, если нулевая гипотеза верна. При минимальной оценке хи-квадрат находятся значения параметров, которые делают эту тестовую статистику минимально возможной.
Одним из последствий его использования является то, что тестовая статистика действительно имеет распределение приблизительно хи-квадрат при размере выборки большом . Обычно количество степеней свободы для каждого параметра, оцениваемого этим методом, уменьшается на 1.
Иллюстрация на примере
[ редактировать ]Предположим, некоторая случайная величина принимает значения из множества целых неотрицательных чисел 1, 2, 3, . . . . данных . Берется простая случайная выборка размером 20, в результате чего получается следующий набор Желательно проверить нулевую гипотезу о том, что популяция, из которой была взята эта выборка, подчиняется распределению Пуассона .
Оценка максимального правдоподобия среднего показателя по популяции составляет 3,3. Можно применить критерий хи-квадрат Пирсона , чтобы определить, является ли распределение населения распределением Пуассона с ожидаемым значением 3,3. Однако в нулевой гипотезе не указывалось, что это конкретное распределение Пуассона, а только то, что это некоторое распределение Пуассона, а число 3,3 взято из данных, а не из нулевой гипотезы. Эмпирическое правило гласит, что при оценке параметра число степеней свободы уменьшается на 1, в данном случае с 9 (поскольку ячеек 10) до 8. Можно было бы надеяться, что результирующая тестовая статистика будет иметь приблизительно Распределение хи-квадрат, когда нулевая гипотеза верна. Однако в целом это не тот случай, когда используется оценка максимального правдоподобия. Однако асимптотически это верно, когда используется минимальная оценка хи-квадрат.
Нахождение минимальной оценки хи-квадрат
[ редактировать ]Минимальная оценка хи-квадрат среднего значения совокупности λ - это число, которое минимизирует статистику хи-квадрат.
где a — предполагаемое ожидаемое число в ячейке «> 8», а «20» появляется, потому что это размер выборки. Значение a в 20 раз превышает вероятность того, что случайная величина, распределенная по Пуассону, превышает 8, и ее легко вычислить как 1 минус сумма вероятностей, соответствующих от 0 до 8. С помощью тривиальной алгебры последний член просто сводится к a . Численные вычисления показывают, что значение λ , которое минимизирует статистику хи-квадрат, составляет около 3,5242. Это минимальная оценка λ по хи-квадрату . Для этого значения λ статистика хи-квадрат составляет около 3,062764. Там 10 ячеек. Если бы нулевая гипотеза задавала одно распределение, а не требовала оценки λ , то нулевое распределение тестовой статистики было бы распределением хи-квадрат с 10 - 1 = 9 степенями свободы. Поскольку необходимо было оценить λ , теряется еще одна степень свободы. Ожидаемое значение случайной величины хи-квадрат с 8 степенями свободы равно 8. Таким образом, наблюдаемое значение, 3,062764, весьма скромное, и нулевая гипотеза не отвергается.
Примечания и ссылки
[ редактировать ]- ^ Берксон, Джозеф (1980). «Минимум хи-квадрат, а не максимальная вероятность!» . Анналы статистики . 8 (3): 457–487. дои : 10.1214/aos/1176345003 . JSTOR 2240587 .