Jump to content

Поправка Хекмана

Поправка Хекмана — это статистический метод, позволяющий исправить погрешность неслучайно выбранных выборок или иным образом случайно усеченных зависимых переменных , что является широко распространенной проблемой в количественных социальных науках при использовании данных наблюдений . [1] Концептуально это достигается путем явного моделирования индивидуальной вероятности выборки каждого наблюдения (так называемое уравнение отбора) вместе с условным ожиданием зависимой переменной (так называемое уравнение результата). Полученная функция правдоподобия математически похожа на тобит-модель для цензурированных зависимых переменных — связь, впервые установленную Джеймсом Хекманом в 1974 году. [2] Хекман также разработал двухэтапный подход к функции управления для оценки этой модели: [3] что позволяет избежать вычислительной нагрузки , связанной с совместной оценкой обоих уравнений , хотя и за счет неэффективности . [4] Хекман получил Нобелевскую премию по экономике в 2000 году за свою работу в этой области. [5]

Статистический анализ, основанный на неслучайно отобранных выборках, может привести к ошибочным выводам. Коррекция Хекмана, двухэтапный статистический подход, предлагает средства коррекции неслучайно выбранных выборок.

Хекман рассматривал смещение от использования неслучайно выбранных выборок для оценки поведенческих взаимосвязей как ошибку спецификации. Он предлагает двухэтапный метод оценки для исправления систематической ошибки. Коррекция использует идею функции управления и ее легко реализовать. Коррекция Хекмана включает в себя предположение о нормальности , обеспечивает тест на предвзятость выборки и формулу для модели с поправкой на предвзятость.

Предположим, что исследователь хочет оценить факторы, определяющие предложения заработной платы, но имеет доступ к наблюдениям по заработной плате только тех, кто работает. Поскольку работающие люди выбираются из населения не случайным образом, оценка факторов, определяющих заработную плату, по работающей подгруппе населения может привести к смещению. Коррекция Хекмана происходит в два этапа.

На первом этапе исследователь формулирует модель , основанную на экономической теории вероятности работы . Канонической спецификацией этого отношения является пробит- регрессия вида

где D указывает на занятость ( D = 1, если респондент трудоустроен, и D = 0 в противном случае), Z — вектор объясняющих переменных, — вектор неизвестных параметров, а Φ — кумулятивная функция распределения стандартного нормального распределения . Оценка модели дает результаты, которые можно использовать для прогнозирования вероятности трудоустройства для каждого человека.

На втором этапе исследователь корректирует самоотбор, включая преобразование этих предсказанных индивидуальных вероятностей в качестве дополнительной объясняющей переменной. Уравнение заработной платы может быть указано:

где обозначает базовое предложение заработной платы, которое не соблюдается, если респондент не работает. Тогда условное ожидание заработной платы при условии, что человек работает, составит

В предположении, что члены ошибок в совокупности нормальны , мы имеем

где ρ — корреляция между ненаблюдаемыми детерминантами склонности к работе. и ненаблюдаемые факторы, определяющие предложение заработной платы u , σ   u — стандартное отклонение , и обратное соотношение Миллса, оцениваемое как . Это уравнение демонстрирует идею Хекмана о том, что выборку выборки можно рассматривать как форму систематической ошибки из-за пропущенных переменных , зависящую как от X , так и от X. это как если бы выборка была выбрана случайно. Уравнение заработной платы можно оценить, заменив с оценками Пробита из первого этапа, построив термин и включение его в качестве дополнительной объясняющей переменной в оценку линейной регрессии уравнения заработной платы. С , коэффициент на может быть нулевым, только если , поэтому проверяем нулевое значение коэффициента при равен нулю, эквивалентен проверке селективности образца.

Достижения Хекмана породили большое количество эмпирических приложений в экономике, а также в других социальных науках. Исходный метод впоследствии был обобщен Хекманом и другими. [6]

Статистический вывод

[ редактировать ]

Поправка Хекмана представляет собой двухэтапную M-оценку, в которой ковариационная матрица, сгенерированная оценкой OLS на втором этапе, противоречива. [7] Правильные стандартные ошибки и другие статистические данные могут быть сгенерированы на основе асимптотического приближения или путем повторной выборки, например, с помощью начальной загрузки . [8]

Недостатки

[ редактировать ]
  • Двухэтапный оценщик, описанный выше, представляет собой оценщик максимального правдоподобия с ограниченной информацией (LIML). В асимптотической теории и в конечных выборках, как показано моделированием Монте-Карло, оценка полной информации (FIML) демонстрирует лучшие статистические свойства. Однако оценщик FIML сложнее реализовать с вычислительной точки зрения. [9]
  • Каноническая модель предполагает, что ошибки в целом нормальны. Если это предположение не соответствует действительности, то оценщик, как правило, непоследователен и может давать ошибочные выводы в небольших выборках. [10] В таких случаях можно использовать полупараметрические и другие надежные альтернативы. [11]
  • Модель получает формальную идентификацию на основании предположения о нормальности, когда одни и те же ковариаты появляются в уравнении отбора и в уравнении интереса, но идентификация будет ненадежной, если в хвостах нет большого количества наблюдений, где существует существенная нелинейность обратного отношения Миллса. Как правило, для получения достоверных оценок требуется ограничение исключения: должна быть хотя бы одна переменная, которая появляется с ненулевым коэффициентом в уравнении выбора, но не появляется в интересующем уравнении, по сути, это инструмент . Если такой переменной нет, может быть трудно внести поправку на селективность выборки. [9] Причина этого двоякая: без инструмента идентификация опирается на предположение о функциональной форме, которое обычно считается очень слабым. [12] Более того, даже если предположение верно, выбранная функция может быть очень близка к линейной функциональной форме в исследуемой области, вызывая проблему мультиколлинеарности на втором этапе.

Реализации в пакетах статистики

[ редактировать ]
  • Р : Процедуры типа Хекмана доступны как часть sampleSelection упаковка. [13] [14]
  • Стата : команда heckman предоставляет модель выбора Хекмана. [15] [16]

См. также

[ редактировать ]
  1. ^ Уиншип, Кристофер; Маре, Роберт Д. (1992). «Модели систематической ошибки отбора выборки». Ежегодный обзор социологии . 18 : 327–350. дои : 10.1146/annurev.so.18.080192.001551 .
  2. ^ Хекман, Джеймс (1974). «Теневые цены, рыночная заработная плата и предложение рабочей силы». Эконометрика . 42 (4): 679–694. дои : 10.2307/1913937 . JSTOR   1913937 .
  3. ^ Хекман, Джеймс (1976). «Общая структура статистических моделей усечения, выборки выборки и ограниченных зависимых переменных, а также простая система оценки для таких моделей» . Анналы экономических и социальных измерений . 5 (4): 475–492.
  4. ^ Навата, Кадзумицу (1994). «Оценка моделей смещения выборки с помощью оценщика максимального правдоподобия и двухэтапного оценщика Хекмана». Письма по экономике . 45 (1): 33–40. дои : 10.1016/0165-1765(94)90053-1 .
  5. ^ Учитель, Луи (12 октября 2000 г.). «Два американца получили Нобелевскую премию по экономике» . Нью-Йорк Таймс .
  6. ^ Ли, Лунг-Фей (2001). «Самоотбор». В Балтаги Б. (ред.). Спутник теоретической эконометрики . Оксфорд: Блэквелл. стр. 383–409. дои : 10.1002/9780470996249.ch19 . ISBN  9780470996249 .
  7. ^ Амемия, Такеши (1985). Продвинутая эконометрика . Кембридж: Издательство Гарвардского университета. стр. 368–372 . ISBN  0-674-00560-0 .
  8. ^ Кэмерон, А. Колин ; Триведи, Правин К. (2005). «Последовательная двухэтапная m-оценка» . Микроэконометрика: методы и приложения . Нью-Йорк: Издательство Кембриджского университета. стр. 200–202. ISBN  0-521-84805-9 .
  9. ^ Jump up to: а б Пухани, П. (2000). «Поправка Хекмана для отбора выборки и ее критика». Журнал экономических обзоров . 14 (1): 53–68. дои : 10.1111/1467-6419.00104 .
  10. ^ Гольдбергер, А. (1983). «Аномальная ошибка выбора» . В Карлине, Сэмюэл ; Амемия, Такеши ; Гудман, Лео (ред.). Исследования в области эконометрики, временных рядов и многомерной статистики . Нью-Йорк: Академическая пресса. стр. 67–84 . ISBN  0-12-398750-4 .
  11. ^ Ньюи, Уитни; Пауэлл, Дж.; Уокер, Джеймс Р. (1990). «Полупараметрическая оценка моделей выбора: некоторые эмпирические результаты». Американский экономический обзор . 80 (2): 324–28. JSTOR   2006593 .
  12. ^ Льюбель, Артур (01 декабря 2019 г.). «Зоопарк идентификации: значения идентификации в эконометрике» . Журнал экономической литературы . 57 (4): 835–903. дои : 10.1257/jel.20181361 . ISSN   0022-0515 .
  13. ^ Тоомет, О.; Хеннингсен, А. (2008). «Примеры моделей выбора в R: Package sampleSelection» . Журнал статистического программного обеспечения . 27 (7): 1–23. дои : 10.18637/jss.v027.i07 .
  14. ^ «sampleSelection: Модели выбора выборки» . Р-проект . 3 мая 2019 г.
  15. ^ «Хекман — модель выбора Хекмана» (PDF) . Руководство по Стате .
  16. ^ Кэмерон, А. Колин; Триведи, Правин К. (2010). Микроэконометрика с использованием Stata (пересмотренная ред.). Колледж-Стейшн: Stata Press. стр. 556–562. ISBN  978-1-59718-073-3 .

Дальнейшее чтение

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 1a1001270b68218ca0d15af57f022b5a__1702359300
URL1:https://arc.ask3.ru/arc/aa/1a/5a/1a1001270b68218ca0d15af57f022b5a.html
Заголовок, (Title) документа по адресу, URL1:
Heckman correction - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)