Тест Жарка-Бера
В статистике критерий Харка-Бера представляет собой критерий согласия, определяющий, имеют ли выборочные данные асимметрию и эксцесс, соответствующие нормальному распределению . Тест назван в честь Карлоса Харке и Анила К. Бера . Статистика теста всегда неотрицательна. Если оно далеко от нуля, это означает, что данные не имеют нормального распределения.
Тестовая статистика JB определяется как
где n — количество наблюдений (или степеней свободы вообще); S выборки — асимметрия , K — эксцесс выборки :
где и – оценки третьего и четвертого центральных моментов соответственно — выборочное среднее , и — оценка второго центрального момента, дисперсии .
Если данные поступают из нормального распределения, JB статистика асимптотически имеет распределение хи-квадрат с двумя степенями свободы , поэтому статистику можно использовать для проверки гипотезы о том, что данные взяты из нормального распределения . Нулевая гипотеза представляет собой совместную гипотезу о том, что асимметрия равна нулю, а избыточный эксцесс равен нулю. Выборки из нормального распределения имеют ожидаемую асимметрию 0 и ожидаемый избыточный эксцесс, равный 0 (что соответствует эксцессу, равному 3). Как показывает определение JB , любое отклонение от этого значения увеличивает статистику JB.
Для небольших выборок приближение хи-квадрат слишком чувствительно и часто отвергает нулевую гипотезу, когда она верна. Более того, распределение p значений отклоняется от равномерного распределения и становится с перекосом вправо унимодальным распределением , особенно для малых значений p . Это приводит к большой частоте ошибок первого рода . В таблице ниже показаны некоторые значения p , аппроксимированные распределением хи-квадрат, которые отличаются от их истинных альфа-уровней для небольших выборок.
Рассчитанные значения p , эквивалентные истинным альфа-уровням при заданных размерах выборки Истинный уровень α 20 30 50 70 100 0.1 0.307 0.252 0.201 0.183 0.1560 0.05 0.1461 0.109 0.079 0.067 0.062 0.025 0.051 0.0303 0.020 0.016 0.0168 0.01 0.0064 0.0033 0.0015 0.0012 0.002
(Эти значения были аппроксимированы с использованием моделирования Монте-Карло в Matlab )
В реализации MATLAB аппроксимация хи-квадрат для распределения статистики JB используется только для больших размеров выборки (> 2000). Для меньших выборок используется таблица, полученная на основе моделирования Монте-Карло, для интерполяции значений p . [ 1 ]
История
[ редактировать ]Статистические данные были получены Карлосом М. Харком и Анилом К. Бера во время работы над докторской диссертацией. Диссертация в Австралийском национальном университете.
Тест Жара – Бера в регрессионном анализе
[ редактировать ]По мнению Роберта Холла, Дэвида Лилиена и др. (1995) при использовании этого теста вместе с множественным регрессионным анализом правильная оценка будет следующей:
где n — количество наблюдений, а k — количество регрессоров при исследовании остатков уравнения.
Реализации
[ редактировать ]- ALGLIB включает реализацию теста Жарка-Бера на C++, C#, Delphi, Visual Basic и т. д.
- gretl включает реализацию теста Жарка – Бера.
- Джулия включает реализацию теста Жарке-Бера JarqueBeraTest в пакет HypothesisTests . [ 2 ]
- MATLAB включает реализацию теста Жарка – Бера, функцию «jbtest».
- Statsmodels Python включает реализацию теста Жарка-Бера «statsmodels.stats.stattools.py».
- R включает реализации теста Жарка-Бера: jarque.bera.test в пакете tseries , [ 3 ] например, и jarque.test пакета в моментах . [ 4 ]
- Wolfram включает встроенную функцию JarqueBeraALMTest. [ 5 ] и не ограничивается тестированием распределения Гаусса.
См. также
[ редактировать ]- Критерий К-квадрата Д'Агостино , еще один тест, основанный на эксцессе и асимметрии.
Ссылки
[ редактировать ]- ^ «Анализ JB-Test в MATLAB» . Матворкс . Проверено 24 мая 2009 г.
- ^ «Тесты временных рядов» . Сайт juliastats.org . Проверено 4 февраля 2020 г.
- ^ «tseries: анализ временных рядов и вычислительные финансы» . Р-проект .
- ^ «моменты: моменты, кумулянты, асимметрия, эксцесс и связанные с ними тесты» . Р-проект .
- ^ «JarqueBeraALMTest — документация по языку Wolfram» . ссылка.wolfram.com . Проверено 26 октября 2017 г.
Дальнейшее чтение
[ редактировать ]- Харке, Карлос М .; Бера, Анил К. (1980). «Эффективные тесты на нормальность, гомоскедастичность и серийную независимость остатков регрессии». Письма по экономике . 6 (3): 255–259. дои : 10.1016/0165-1765(80)90024-5 .
- Харке, Карлос М .; Бера, Анил К. (1981). «Эффективные тесты на нормальность, гомоскедастичность и серийную независимость остатков регрессии: данные Монте-Карло». Письма по экономике . 7 (4): 313–318. дои : 10.1016/0165-1765(81)90035-5 .
- Харке, Карлос М .; Бера, Анил К. (1987). «Тест на нормальность наблюдений и остатков регрессии». Международный статистический обзор . 55 (2): 163–172. дои : 10.2307/1403192 . JSTOR 1403192 .
- Судить; и др. (1988). Введение, теория и практика эконометрики (3-е изд.). стр. 890–892.
- Холл, Роберт Э.; Лилиен, Дэвид М.; и др. (1995). Руководство пользователя EViews . стр. 141.