Статистика Дурбина – Ватсона
![]() | Эта статья включает список общих ссылок , но в ней отсутствуют достаточные соответствующие встроенные цитаты . ( декабрь 2012 г. ) |
В статистике статистика Дурбина -Ватсона представляет собой тестовую статистику, используемую для обнаружения наличия автокорреляции с задержкой 1 в остатках (ошибках прогнозирования) из регрессионного анализа . Он назван в честь Джеймса Дурбина и Джеффри Уотсона . Распределение на небольшой выборке этого отношения было получено Джоном фон Нейманом (von Neumann, 1941). Дурбин и Уотсон (1950, 1951) применили эту статистику к остаткам регрессии наименьших квадратов и разработали тесты границ для нулевой гипотезы о том, что ошибки серийно не коррелируют с альтернативой, согласно которой они следуют авторегрессионному процессу первого порядка. Обратите внимание, что распределение этой тестовой статистики не зависит от оцененных коэффициентов регрессии и дисперсии ошибок. [ 1 ]
Аналогичную оценку можно также провести с помощью теста Бреуша-Годфри и теста Люнга-Бокса .
Вычисление и интерпретация статистики Дурбина – Ватсона
[ редактировать ]Если остаток , определяемый Дурбина-Ватсона теста статистика
где это количество наблюдений. Для больших , приблизительно равно , где — это выборочная автокорреляция остатков при лаге 1. [ 2 ] следовательно, указывает на отсутствие автокорреляции. Стоимость всегда лежит между и . Если статистика Дурбина-Ватсона существенно меньше 2, есть свидетельства положительной серийной корреляции. Грубо говоря, если коэффициент Дурбина-Ватсона меньше 1,0, это может быть поводом для тревоги. Малые значения указывают на то, что последовательные члены ошибки положительно коррелируют. Если , последовательные члены ошибки отрицательно коррелируют. В регрессиях это может означать занижение уровня статистической значимости .
Чтобы проверить положительную автокорреляцию по значимости , тестовая статистика сравнивается с нижними и верхними критическими значениями ( и ):
- Если , существуют статистические данные о том, что члены ошибок положительно автокоррелируют.
- Если , нет никаких статистических доказательств того, что члены ошибок положительно автокоррелируют.
- Если , тест неубедителен.
Положительная серийная корреляция — это серийная корреляция, при которой положительная ошибка для одного наблюдения увеличивает вероятность положительной ошибки для другого наблюдения.
Чтобы проверить отрицательную автокорреляцию по значимости , тестовая статистика сравнивается с нижними и верхними критическими значениями ( и ):
- Если , существуют статистические данные о том, что члены ошибок отрицательно автокоррелируют.
- Если , нет никаких статистических доказательств того, что члены ошибок отрицательно автокоррелируют.
- Если , тест неубедителен.
Отрицательная серийная корреляция подразумевает, что положительная ошибка для одного наблюдения увеличивает вероятность отрицательной ошибки для другого наблюдения, а отрицательная ошибка для одного наблюдения увеличивает вероятность положительной ошибки для другого.
Критические значения, и , различаются по уровню значимости ( ) и степени свободы в уравнении регрессии. Их вывод сложен: статистики обычно получают их из приложений к статистическим текстам.
Если матрица проектирования регрессии известны точные критические значения распределения при нулевой гипотезе серийная корреляция не может быть вычислена. По нулевой гипотезе распространяется как
где количество наблюдений и – количество переменных регрессии; тот являются независимыми стандартными нормальными случайными величинами; и являются ненулевыми собственными значениями где это матрица, которая преобразует остатки в статистика, т.е. . [ 3 ] Доступен ряд вычислительных алгоритмов для определения процентилей этого распределения. [ 4 ]
Хотя серийная корреляция не влияет на согласованность оцененных коэффициентов регрессии, она влияет на нашу способность проводить достоверные статистические тесты. Во-первых, F-статистика для проверки общей значимости регрессии может быть завышена при положительной серийной корреляции, поскольку среднеквадратическая ошибка (MSE) будет иметь тенденцию недооценивать дисперсию ошибки генеральной совокупности. Во-вторых, положительная серийная корреляция обычно приводит к тому, что обычные стандартные ошибки метода наименьших квадратов (OLS) для коэффициентов регрессии недооценивают истинные стандартные ошибки. Как следствие, если в регрессии присутствует положительная серийная корреляция, стандартный линейный регрессионный анализ обычно приводит к вычислению искусственно малых стандартных ошибок для коэффициента регрессии. Эти небольшие стандартные ошибки приведут к завышению расчетной t-статистики, указывая на значимость там, где ее, возможно, нет. Завышенная t-статистика, в свою очередь, может привести к тому, что мы неправильно отвергнем нулевые гипотезы о совокупных значениях параметров регрессионной модели чаще, чем мы бы это сделали, если бы стандартные ошибки были правильно оценены.
Если статистика Дурбина-Ватсона указывает на наличие серийной корреляции остатков, это можно исправить с помощью процедуры Кокрейна-Оркатта .
Статистика Дурбина-Ватсона, хотя и отображается во многих программах регрессионного анализа, в определенных ситуациях неприменима. Например, если в состав объясняющих переменных включены лагированные зависимые переменные, то использовать этот тест нецелесообразно. Следует использовать h-критерий Дурбина (см. ниже) или тесты отношения правдоподобия, которые действительны в больших выборках.
h-статистика Дурбина
[ редактировать ]Статистика Дурбина-Ватсона смещена для моделей авторегрессионного скользящего среднего , поэтому автокорреляция недооценивается. Но для больших выборок можно легко вычислить несмещенную нормально распределенную h-статистику:
используя статистику Дурбина – Уотсона d и оцененную дисперсию
коэффициента регрессии лагированной зависимой переменной при условии, что
Реализации в пакетах статистики
[ редактировать ]- Р :
dwtest
функция в пакете lmtest,durbinWatsonTest
(или сокращенно дедвейт) в комплектации автомобиля, иpdwtest
иpbnftest
для панельных моделей в пакете plm. [ 5 ] - MATLAB : функция dwtest в панели инструментов статистики.
- Mathematica : статистика Дурбина-Ватсона ( d ) включена в качестве опции в функцию LinearModelFit.
- SAS : это стандартный вывод при использовании модели процесса и опция (dw) при использовании процедуры регистрации.
- EViews : автоматически рассчитывается при использовании регрессии OLS.
- gretl : автоматически рассчитывается при использовании регрессии OLS.
- Стата : команда
estat dwatson
, следующийregress
в данных временных рядов. [ 6 ] Также доступны тест LM Энгла для авторегрессионной условной гетероскедастичности (ARCH), тест зависящей от времени волатильности, тест Бреуша-Годфри и альтернативный тест Дурбина для серийной корреляции. Все (кроме -dwatson-) тестируются отдельно для серийных корреляций более высокого порядка. Тест Бреуша-Годфри и альтернативный тест Дурбина также допускают использование регрессоров, которые не являются строго экзогенными. - Excel : хотя в Microsoft Excel 2007 нет специальной функции Дурбина – Ватсона, d -статистику можно рассчитать с помощью
=SUMXMY2(x_array,y_array)/SUMSQ(array)
- Minitab : опцию отчета о статистике в окне «Сеанс» можно найти в поле «Параметры» в разделе «Регрессия» и в поле «Результаты» в разделе «Общая регрессия».
- Python : функция durbin_watson включена в пакет statsmodels (
statsmodels.stats.stattools.durbin_watson
), но статистических таблиц критических значений там нет. - SPSS : включен в качестве опции в функцию регрессии.
- Юлия : функция DurbinWatsonTest доступна в пакете HypothesisTests . [ 7 ]
См. также
[ редактировать ]Примечания
[ редактировать ]- ^ Чаттерджи, Самприт; Симонов, Джеффри (2013). Справочник по регрессионному анализу . Джон Уайли и сыновья. ISBN 1118532813 .
- ^ Гуджарати (2003), с. 469
- ^ Дурбин, Дж.; Уотсон, GS (1971). «Тестирование серийной корреляции в регрессии наименьших квадратов.III». Биометрика . 58 (1): 1–19. дои : 10.2307/2334313 .
- ^ Фарбразер, RW (1980). «Алгоритм AS 153: процедура Пана для определения хвостовых вероятностей статистики Дурбина-Ватсона». Журнал Королевского статистического общества, серия C. 29 (2): 224–227.
- ^ Хатека, Нирадж Р. (2010). «Тесты для выявления автокорреляции» . Принципы эконометрики: введение (с использованием R) . Публикации SAGE. стр. 379–82. ISBN 978-81-321-0660-9 .
- ^ «Временные ряды постоценки регресса — инструменты постоценки для регрессии с временными рядами» (PDF) . Руководство по Стате .
- ^ «Тесты временных рядов» . Сайт juliastats.org . Проверено 4 февраля 2020 г.
Ссылки
[ редактировать ]- Дурбин, Дж.; Уотсон, GS (1950). «Тестирование серийной корреляции в регрессии наименьших квадратов, I». Биометрика . 37 (3–4): 409–428. дои : 10.1093/biomet/37.3-4.409 . JSTOR 2332391 .
- Дурбин, Дж.; Уотсон, GS (1951). «Тестирование серийной корреляции в регрессии наименьших квадратов, II». Биометрика . 38 (1–2): 159–179. дои : 10.1093/biomet/38.1-2.159 . JSTOR 2332325 .
- Гуджарати, Дамодар Н.; Портер, Дон К. (2009). Основная эконометрика (5-е изд.). Бостон: МакГроу-Хилл Ирвин. ISBN 978-0-07-337577-9 .
- Кмента, Ян (1986). Элементы эконометрики (второе изд.). Нью-Йорк: Макмиллан. стр. 328–332 . ISBN 0-02-365070-2 .
- Нойман, Джон фон (1941). «Распределение отношения среднеквадратической последовательной разности к дисперсии» . Анналы математической статистики . 12 (4): 367–395. дои : 10.1214/aoms/1177731677 . JSTOR 2235951 .
- Вербек, Марно (2012). Путеводитель по современной эконометрике (4-е изд.). Чичестер: Джон Уайли и сыновья. стр. 117–118. ISBN 978-1-119-95167-4 .
Внешние ссылки
[ редактировать ]- Таблица для высоких n и k. Архивировано 7 августа 2011 г. на Wayback Machine.
- Лекция по эконометрике (тема: статистика Дурбина – Ватсона) на YouTube Марка Тома