Стандартные ошибки, согласованные с гетероскедастичностью
Тема согласованных с гетероскедастичностью ( HC ), стандартных ошибок, возникает в статистике и эконометрике в контексте линейной регрессии и анализа временных рядов . Они также известны как устойчивые к гетероскедастичности стандартные ошибки (или просто устойчивые стандартные ошибки ), стандартные ошибки Эйкера-Хубера-Уайта (также стандартные ошибки Хубера-Уайта или стандартные ошибки Уайта ), [1] признать вклад Фридхельма Эйкера , [2] Питер Дж. Хубер , [3] и Халберт Уайт . [4]
В регрессионном моделировании и моделировании временных рядов основные формы моделей используют предположение, что ошибки или возмущения u i имеют одинаковую дисперсию во всех точках наблюдения. Когда это не так, говорят, что ошибки гетероскедастичны или имеют гетероскедастичность , и это поведение будет отражено в остатках. оценивается по подобранной модели. Стандартные ошибки, согласованные с гетероскедастичностью, используются для подбора модели, которая содержит гетероскедастические остатки. Первый такой подход был предложен Хубером (1967), и с тех пор были разработаны дальнейшие усовершенствованные процедуры для перекрестных данных, данных временных рядов и оценки GARCH .
Стандартные ошибки, согласующиеся с гетероскедастичностью и отличающиеся от классических стандартных ошибок, могут указывать на неправильную спецификацию модели. Замена стандартных ошибок, согласованных с гетероскедастичностью, не устраняет эту неправильную спецификацию, которая может привести к смещению коэффициентов. В большинстве ситуаций проблему следует найти и устранить. [5] Другие типы корректировок стандартных ошибок, такие как кластерные стандартные ошибки или стандартные ошибки HAC , можно рассматривать как расширение стандартных ошибок HC.
История
[ редактировать ]Стандартные ошибки, согласованные с гетероскедастичностью, были введены Фридхельмом Эйкером . [6] [7] и популяризирован в эконометрике Халбертом Уайтом .
Проблема
[ редактировать ]Рассмотрим модель линейной регрессии для скаляра .
где представляет собой вектор-столбец k x 1 независимых переменных (признаков), представляет собой вектор-столбец k × 1 параметров, подлежащих оценке, и это остаточная ошибка .
Обычная оценка методом наименьших квадратов (OLS)
где вектор наблюдений , и обозначает матрицу сложенных значения, наблюдаемые в данных.
Если ошибки выборки имеют одинаковую дисперсию и некоррелированы , то оценка методом наименьших квадратов имеет СИНИЙ цвет (лучшая линейная несмещенная оценка), а его дисперсия оценивается с помощью
где являются остатками регрессии.
Когда члены ошибки не имеют постоянной дисперсии (т. е. предположение о неверно), оценка OLS теряет свои желательные свойства. Формулу дисперсии теперь невозможно упростить:
где
Хотя точечная оценка МНК остается несмещенной, она не является «лучшей» в смысле минимальной среднеквадратической ошибки, а оценка дисперсии МНК не дает последовательной оценки дисперсии оценок МНК.
Однако для любой нелинейной модели (например, логит- и пробит -моделей) гетероскедастичность имеет более серьезные последствия: оценки максимального правдоподобия параметров будут смещены (в неизвестном направлении), а также противоречивы (если функция правдоподобия не равна модифицировано для правильного учета точной формы гетероскедастичности). [8] [9] Как отметил Грин , «простое вычисление устойчивой ковариационной матрицы для несогласованной в противном случае оценки не дает ее искупления». [10]
Решение
[ редактировать ]Если ошибки регрессии независимы, но имеют отчетливые отклонения , затем который можно оценить с помощью . Это дает оценку Уайта (1980), часто называемую HCE (оценка, согласованная с гетероскедастичностью):
где как указано выше обозначает матрицу сложенных значения из данных. Оценку можно получить с помощью обобщенного метода моментов (ОММ).
В литературе (включая статью Уайта) также часто обсуждается ковариационная матрица. принадлежащий -последовательное предельное распределение:
где
и
Таким образом,
и
Какая именно ковариационная матрица вызывает беспокойство, зависит от контекста.
Альтернативные оценки были предложены Маккинноном и Уайтом (1985), которые корректируют неравные отклонения остатков регрессии из-за различного кредитного плеча . [11] В отличие от асимптотической оценки Уайта, их оценки несмещены, когда данные гомоскедастичны.
Из четырех широко доступных различных вариантов, часто обозначаемых как HC0-HC3, спецификация HC3, по-видимому, работает лучше всего, при этом тесты основаны на оценщике HC3, обеспечивающем большую мощность и более близкое к целевому размеру , особенно на небольших выборках. Чем больше выборка, тем меньше разница между разными оценками. [12]
Альтернативой явному моделированию гетероскедастичности является использование метода повторной выборки, такого как дикий бутстрап . Учитывая, что стьюдентизированный бутстрап , который стандартизирует повторную выборку статистики по ее стандартной ошибке, дает асимптотическое уточнение, [13] Тем не менее устойчивые к гетероскедастичности стандартные ошибки остаются полезными.
Вместо учета гетероскедастических ошибок большинство линейных моделей можно преобразовать, чтобы включить в них гомоскедастические ошибки (если только ошибка не является гетероскедастической по своей конструкции, например, в линейной вероятностной модели ). Один из способов сделать это — использовать взвешенный метод наименьших квадратов , который также обладает улучшенными свойствами эффективности.
См. также
[ редактировать ]- Дельта-метод
- Обобщенные наименьшие квадраты
- Обобщенные оценочные уравнения
- Взвешенные наименьшие квадраты , альтернативная формулировка
- Тест Уайта — тест на наличие гетероскедастичности.
- Оценщик Ньюи – Уэста
- Оценка квазимаксимального правдоподобия
Программное обеспечение
[ редактировать ]- EViews : EViews версии 8 предлагает три различных метода для надежного метода наименьших квадратов: M-оценка (Huber, 1973), S-оценка (Rousseeuw и Yohai, 1984) и MM-оценка (Yohai 1987). [14]
- Юля :
CovarianceMatrices
Пакет предлагает несколько методов для построения гетероскедастических робастных дисперсионных ковариационных матриц. [15] - МАТЛАБ : См.
hac
функция в наборе инструментов Эконометрика. [16] - Python : пакет Statsmodel предлагает различные надежные оценки стандартных ошибок, см. в statsmodels.reгрессия.linear_model.ReprofitResults. дополнительные описания
- Р :
vcovHC()
команда из пакет для сэндвичей . [17] [18] - КРЫСЫ : Опция Robusterrors доступна во многих командах регрессии и оптимизации ( Линрег , нллс и др.).
- Был :
robust
вариант, применимый во многих процедурах, основанных на псевдоправдоподобии. [19] - Гретл : вариант
--robust
нескольким командам оценки (например,ols
) в контексте набора поперечных данных дает устойчивые стандартные ошибки. [20]
Ссылки
[ редактировать ]- ^ Кляйбер, К.; Зейлейс, А. (2006). «Прикладная эконометрика с R» (PDF) . Конференция UseR-2006 . Архивировано из оригинала (PDF) 22 апреля 2007 г.
- ^ Эйкер, Фридхельм (1967). «Предельные теоремы для регрессии с неравными и зависимыми ошибками» . Труды Пятого симпозиума Беркли по математической статистике и теории вероятностей . Том. 5. С. 59–82. МР 0214223 . Збл 0217.51201 .
- ^ Хубер, Питер Дж. (1967). «Поведение оценок максимального правдоподобия в нестандартных условиях» . Труды Пятого симпозиума Беркли по математической статистике и теории вероятностей . Том. 5. С. 221–233. МР 0216620 . Збл 0212.21504 .
- ^ Уайт, Халберт (1980). «Оценщик ковариационной матрицы, согласованный с гетероскедастичностью, и прямой тест на гетероскедастичность». Эконометрика . 48 (4): 817–838. CiteSeerX 10.1.1.11.7646 . дои : 10.2307/1912934 . JSTOR 1912934 . МР 0575027 .
- ^ Кинг, Гэри; Робертс, Маргарет Э. (2015). «Как устойчивые стандартные ошибки выявляют методологические проблемы, которые они не устраняют, и что с этим делать» . Политический анализ . 23 (2): 159–179. дои : 10.1093/pan/mpu015 . ISSN 1047-1987 .
- ^ Эйкер, Ф. (1963). «Асимптотическая нормальность и непротиворечивость оценок наименьших квадратов для семейств линейных регрессий» . Анналы математической статистики . 34 (2): 447–456. дои : 10.1214/aoms/1177704156 .
- ^ Эйкер, Фридхельм (январь 1967 г.). «Предельные теоремы для регрессий с неравными и зависимыми ошибками» . Труды Пятого симпозиума Беркли по математической статистике и вероятности, Том 1: Статистика . 5 (1): 59–83.
- ^ Джайлз, Дэйв (8 мая 2013 г.). «Надежные стандартные ошибки для нелинейных моделей» . Эконометрический бит .
- ^ Гуггисберг, Майкл (2019). «Неверно определенные модели дискретного выбора и стандартные ошибки Хубера-Уайта». Журнал эконометрических методов . 8 (1). дои : 10.1515/jem-2016-0002 .
- ^ Грин, Уильям Х. (2012). Эконометрический анализ (Седьмое изд.). Бостон: Pearson Education. стр. 692–693. ISBN 978-0-273-75356-8 .
- ^ Маккиннон, Джеймс Г .; Уайт, Халберт (1985). «Некоторые гетероскедастически-согласованные средства оценки ковариационной матрицы с улучшенными свойствами конечной выборки». Журнал эконометрики . 29 (3): 305–325. дои : 10.1016/0304-4076(85)90158-7 . hdl : 10419/189084 .
- ^ Лонг, Дж. Скотт; Эрвин, Лори Х. (2000). «Использование стандартных ошибок, согласованных с гетероскедастичностью, в модели линейной регрессии» . Американский статистик . 54 (3): 217–224. дои : 10.2307/2685594 . ISSN 0003-1305 .
- ^ К., Дэвисон, Энтони (2010). Методы начальной загрузки и их применение . Кембриджский университет. Нажимать. ISBN 978-0-521-57391-7 . OCLC 740960962 .
{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ «Надежная регрессия EViews 8» .
- ^ CovarianceMatrices: надежные средства оценки ковариационной матрицы
- ^ «Оценщики ковариации, согласованные с гетероскедастичностью и автокорреляцией» . Набор инструментов эконометрики .
- ^ сэндвич: надежные средства оценки ковариационной матрицы
- ^ Кляйбер, Кристиан; Зейлейс, Ахим (2008). Прикладная эконометрика с Р. Нью-Йорк: Спрингер. стр. 106–110. ISBN 978-0-387-77316-2 .
- ^ См. онлайн-справку по
_robust
вариант иregress
команда. - ^ «Надежная оценка ковариационной матрицы» (PDF) . Руководство пользователя Gretl, глава 19 .
Дальнейшее чтение
[ редактировать ]- Фридман, Дэвид А. (2006). «О так называемой «сэндвич-оценке Хубера» и «устойчивых стандартных ошибках» ». Американский статистик . 60 (4): 299–302. дои : 10.1198/000313006X152207 . S2CID 6222876 .
- Хардин, Джеймс В. (2003). «Сэндвич-оценка дисперсии». В Фомби, Томас Б.; Хилл, Р. Картер (ред.). Оценка максимального правдоподобия неверно определенных моделей: двадцать лет спустя . Амстердам: Эльзевир. стр. 45–74. ISBN 0-7623-1075-8 .
- Хейс, Эндрю Ф.; Цай, Ли (2007). «Использование средств оценки стандартной ошибки, согласованных с гетероскедастичностью, в регрессии OLS: введение и программная реализация» . Методы исследования поведения . 39 (4): 709–722. дои : 10.3758/BF03192961 . ПМИД 18183883 .
- Кинг, Гэри ; Робертс, Маргарет Э. (2015). «Как устойчивые стандартные ошибки выявляют методологические проблемы, которые они не устраняют, и что с этим делать» . Политический анализ . 23 (2): 159–179. дои : 10.1093/pan/mpu015 .
- Вулдридж, Джеффри М. (2009). «Устойчивый к гетероскедастичности вывод после оценки МНК». Вводная эконометрика: современный подход (Четвертое изд.). Мейсон: Юго-западный. стр. 265–271. ISBN 978-0-324-66054-8 .
- Буя, Андреас и др. «Модели как аппроксимации — заговор случайных регрессоров и отклонений моделей против классического вывода в регрессии». Статистическая наука (2015): 1. pdf.