Тест Гольдфельда – Квандта

В статистике тест Гольдфельда -Квандта проверяет гетероскедастичность в регрессионном анализе. Это достигается путем разделения набора данных на две части или группы, поэтому тест иногда называют тестом с двумя группами. Тест Гольдфельда-Квандта — один из двух тестов, предложенных в статье 1965 года Стивеном Голдфельдом и Ричардом Квандтом . В статье описаны как параметрический, так и непараметрический тест, но термин «тест Гольдфельда – Квандта» обычно ассоциируется только с первым.
Тест
[ редактировать ]
В контексте множественной регрессии (или одномерной регрессии) гипотеза, которую необходимо проверить, заключается в том, что дисперсии ошибок регрессионной модели не являются постоянными, а вместо этого монотонно связаны с заранее определенной объясняющей переменной . Например, могут быть собраны данные о доходах и потреблении, а потребление регрессировано по отношению к доходу. Если дисперсия увеличивается по мере увеличения уровня дохода, то доход можно использовать в качестве объясняющей переменной. В противном случае можно выбрать третью переменную (например, богатство или доход за прошлый период). [ 1 ]
Параметрический тест
[ редактировать ]Параметрический тест выполняется путем проведения отдельного анализа методом наименьших квадратов для двух подмножеств исходного набора данных: эти подмножества определяются так, чтобы наблюдения, для которых предварительно идентифицированная независимая переменная принимает наименьшие значения, находились в одном подмножестве, а более высокие значения - в другом. . Подмножества не обязательно должны быть одинакового размера и содержать все наблюдения между ними. Параметрический тест предполагает, что ошибки имеют нормальное распределение . Здесь существует дополнительное предположение, что обе матрицы плана для двух подмножеств данных имеют полный ранг. Используемая тестовая статистика представляет собой соотношение среднеквадратических остаточных ошибок для регрессий в двух подмножествах. Эта тестовая статистика соответствует F-тесту равенства дисперсий , и одно- или двусторонний тест может быть подходящим в зависимости от того, известно или нет направление предполагаемого отношения дисперсии ошибки к объясняющей переменной. [ 2 ]
Увеличение количества наблюдений, попадающих в «середину» порядка, увеличит мощность теста, но уменьшит степени свободы статистики теста. В результате этого компромисса обычно можно увидеть, что тест Гольдфельда-Квандта выполняется путем исключения средней трети наблюдений с меньшей долей исключенных наблюдений по мере увеличения размера выборки. [ 3 ] [ 4 ]
Непараметрический тест
[ редактировать ]Второй тест, предложенный в статье, является непараметрическим и, следовательно, не основан на предположении, что ошибки имеют нормальное распределение . Для этого теста к полному набору данных подгоняется одна регрессионная модель. Квадраты остатков перечислены в соответствии с порядком заранее определенной объясняющей переменной. Тестовая статистика, используемая для проверки однородности, представляет собой количество пиков в этом списке: т.е. подсчет количества случаев, в которых квадрат остатка больше, чем все предыдущие квадраты остатков. [ 5 ] Критические значения для этой тестовой статистики создаются с помощью аргумента, связанного с тестами перестановок .
Преимущества и недостатки
[ редактировать ]Параметрический тест Гольдфельда-Квандта предлагает простую и интуитивно понятную диагностику гетероскедастических ошибок в одномерной или многомерной регрессионной модели. Однако некоторые недостатки возникают при определенных спецификациях или по сравнению с другими диагностическими методами, а именно с тестом Бреуша-Пагана , поскольку тест Гольдфельда-Квандта является своего рода специальным тестом. [ 6 ] Прежде всего, критерий Гольдфельда-Квандта требует, чтобы данные были упорядочены по известной объясняющей переменной. Параметрический тест упорядочивается по этой объясняющей переменной от наименьшего к наибольшему. Если структура ошибки зависит от неизвестной переменной или ненаблюдаемой переменной, тест Гольдфельда-Квандта мало что дает. Кроме того, дисперсия ошибок должна быть монотонной функцией указанной объясняющей переменной. Например, столкнувшись с квадратичной функцией, отображающей объясняющую переменную на дисперсию ошибки, тест Гольдфельда – Квандта может неправильно принять нулевую гипотезу о гомоскедастических ошибках. [ нужна ссылка ]
Надежность
[ редактировать ]К сожалению, тест Гольдфельда-Квандта не очень устойчив к ошибкам спецификации. [ 7 ] Тест Гольдфельда-Квандта обнаруживает негомоскедастические ошибки, но не может отличить гетероскедастическую структуру ошибок от основной проблемы спецификации, такой как неправильная функциональная форма или пропущенная переменная. [ 7 ] Джерри Терсби предложил модификацию теста Голдфельда-Квандта, используя вариант теста RESET Рэмси , чтобы обеспечить некоторую степень устойчивости. [ 7 ]
Небольшие образцы свойств
[ редактировать ]Герберт Глейзер в своей статье 1969 года, описывающей тест Глейзера , предлагает небольшой эксперимент с выборкой , чтобы проверить мощность и чувствительность теста Гольдфельда-Квандта. Его результаты показывают ограниченный успех теста Гольдфельда-Квандта, за исключением случаев «чистой гетероскедастичности», когда дисперсия может быть описана как функция только базовой объясняющей переменной. [ 8 ]
Реализации программного обеспечения
[ редактировать ]- В R тест Гольдфельда-Квандта можно реализовать с помощью
gqtest
функцияlmtest
пакет (только параметрический F-тест), [ 9 ] [ 10 ] или с помощьюgoldfeld_quandt
функцияskedastic
пакет (как параметрический F-тест, так и непараметрический тест пиков). [ 11 ]
См. также
[ редактировать ]Тест Бреуша – Пэгана
Тест глазури
Парковый тест
Белый тест
Примечания
[ редактировать ]- ^ Голдфельд, Стивен М.; Квандт, RE (июнь 1965 г.). «Некоторые тесты на гомоскедастичность». Журнал Американской статистической ассоциации . 60 (310): 539–547. дои : 10.1080/01621459.1965.10480811 . JSTOR 2282689 .
- ^ Кеннеди, Питер (2008). Руководство по эконометрике (6-е изд.). Блэквелл. п. 116. ИСБН 978-1-4051-8257-7 .
- ^ Кеннеди (2008), с. 124
- ^ Рууд, Пол А. (2000). Введение в классическую эконометрическую теорию . Издательство Оксфордского университета. п. 424. ИСБН 0-19-511164-8 .
- ^ Гольдфельд и Квандт (1965), с. 542
- ^ Кук, Р. Деннис; Вайсберг, С. (апрель 1983 г.). «Диагностика гетероскедастичности в регрессии». Биометрика . 70 (1): 1–10. дои : 10.1093/biomet/70.1.1 . hdl : 11299/199411 . JSTOR 2335938 .
- ^ Jump up to: а б с Терсби, Джерри (май 1982 г.). «Неверная спецификация, гетероскедастичность и тесты Чоу и Гольдфельда-Квандта». Обзор экономики и статистики . 64 (2): 314–321. дои : 10.2307/1924311 . JSTOR 1924311 .
- ^ Глейзер, Х. (март 1969 г.). «Новый тест на гетероскедастичность». Журнал Американской статистической ассоциации . 64 (325): 316–323. дои : 10.1080/01621459.1969.10500976 . JSTOR 2283741 .
- ^ «lmtest: тестирование моделей линейной регрессии» . КРАН .
- ^ Кляйбер, Кристиан; Зейлейс, Ахим (2008). Прикладная эконометрика с R . Нью-Йорк: Спрингер. стр. 102–103. ISBN 978-0-387-77316-2 .
- ^ «Скедастик: диагностика гетероскедастичности для моделей линейной регрессии» . КРАН .