Поправка Йейтса на непрерывность
![]() | Эта статья может быть слишком технической для понимания большинства читателей . ( Май 2024 г. ) |
В статистике критерий хи - поправка Йейтса на непрерывность (или квадрат Йейтса ) используется в определенных ситуациях при проверке независимости в таблице сопряженности . Он направлен при исправлении ошибки, вносимой предположением, что дискретные вероятности частот в таблице можно аппроксимировать непрерывным распределением ( хи-квадрат ). В отличие от стандартной статистики хи-квадрат Пирсона, она приблизительно несмещена .
Поправка на ошибку аппроксимации
[ редактировать ]Использование распределения хи-квадрат для интерпретации статистики хи-квадрат Пирсона требует предположения, что дискретная вероятность наблюдаемых биномиальных частот в таблице может быть аппроксимирована непрерывным распределением хи-квадрат . Это предположение не совсем верно и вносит некоторую погрешность.
Чтобы уменьшить ошибку аппроксимации, Фрэнк Йейтс английский путем вычитания 0,5 из разницы между каждым наблюдаемым значением и его ожидаемым значением статистик предложил поправку на непрерывность, которая корректирует формулу критерия хи-квадрат Пирсона в таблице сопряженности 2 × 2. . [ 1 ] Это уменьшает полученное значение хи-квадрат и, таким образом, увеличивает его p-значение .
Эффект поправки Йейтса заключается в предотвращении переоценки статистической значимости небольших данных. Эта формула в основном используется, когда хотя бы в одной ячейке таблицы ожидаемое значение меньше 5.
Ниже приводится исправленная версия Йейтса статистики хи-квадрат Пирсона :
где:
- O i = наблюдаемая частота
- E i = ожидаемая (теоретическая) частота, утверждаемая нулевой гипотезой.
- N = количество различных событий
стол 2×2
[ редактировать ]Вкратце, для таблицы 2 × 2 со следующими записями:
С | Ф | ||
---|---|---|---|
А | а | б | а+б |
Б | с | д | с+д |
а+с | б+д | Н |
В некоторых случаях это лучше.
Всегда следует применять поправку Йейтса, поскольку она будет способствовать повышению точности полученного значения p. [ нужна ссылка ] Однако в ситуациях с большими размерами выборки использование поправки мало повлияет на значение тестовой статистики и, следовательно, на значение p.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Йейтс, Ф (1934). «Таблица непредвиденных обстоятельств, включающая малые числа и χ 2 тест». Приложение к журналу Королевского статистического общества 1 (2): 217–235. JSTOR 2983604