Оценка инструментальных переменных
В статистике , эконометрике , эпидемиологии и смежных дисциплинах метод инструментальных переменных ( IV ) используется для оценки причинно-следственных связей , когда контролируемые эксперименты невозможны или когда лечение не удается успешно применить к каждой единице в рандомизированном эксперименте. [1] Интуитивно понятно, что IV используются, когда интересующая объясняющая переменная коррелирует с ошибкой (эндогенной), и в этом случае обычные методы наименьших квадратов и ANOVA дают смещенные результаты. Действительный инструмент вызывает изменения в объясняющей переменной (коррелирует с эндогенной переменной), но не оказывает независимого влияния на зависимую переменную и не коррелирует с ошибкой, что позволяет исследователю выявить причинное влияние объясняющей переменной на зависимую. переменная.
Методы инструментальных переменных позволяют проводить последовательную оценку, когда объясняющие переменные (ковариаты) коррелируют с ошибками в регрессионной модели. Такая корреляция может возникнуть, когда:
- изменения зависимой переменной меняют значение хотя бы одной из ковариат («обратная» причинно-следственная связь),
- имеются пропущенные переменные , которые влияют как на зависимые, так и на независимые переменные, или
- ковариаты подвержены неслучайной ошибке измерения .
Объясняющие переменные, которые страдают от одной или нескольких из этих проблем в контексте регрессии, иногда называют эндогенными . В этой ситуации обычный метод наименьших квадратов дает смещенные и противоречивые оценки. [2] Однако, если инструмент доступен, согласованные оценки все равно можно получить. Инструмент — это переменная, которая сама по себе не входит в объясняющее уравнение, но коррелирует с эндогенными объясняющими переменными при условии, что они зависят от значения других ковариат.
В линейных моделях есть два основных требования для использования IV:
- Инструмент должен быть коррелирован с эндогенными объясняющими переменными, при условии, что с другими ковариатами. Если эта корреляция сильная, то говорят, что инструмент имеет сильную первую стадию . Слабая корреляция может привести к ошибочным выводам об оценках параметров и стандартных ошибках. [3] [4]
- Инструмент не может быть соотнесен с ошибкой в поясняющем уравнении, при условии, что другие ковариаты. Другими словами, инструмент не может страдать от той же проблемы, что и исходная переменная прогнозирования. Если это условие выполняется, то говорят, что инструмент удовлетворяет ограничению исключения .
Пример
[ редактировать ]Неформально, пытаясь оценить причинное влияние некоторой переменной X («ковариата» или «объясняющая переменная») на другую Y («зависимую переменную»), инструментом является третья переменная Z которая влияет на Y только через свое влияние на X. ,
Например, предположим, что исследователь желает оценить причинное влияние курения ( X ) на общее состояние здоровья ( Y ). [5] Корреляция между курением и здоровьем не означает, что курение приводит к ухудшению здоровья, поскольку другие переменные, такие как депрессия, могут влиять как на здоровье, так и на курение, или потому, что здоровье может влиять на курение. Невозможно проводить контролируемые эксперименты по изучению статуса курения среди населения в целом. Исследователь может попытаться оценить причинное влияние курения на здоровье на основе данных наблюдений, используя ставку налога на табачные изделия ( Z ) в качестве инструмента курения. Ставка налога на табачные изделия является разумным выбором в качестве инструмента, поскольку исследователь предполагает, что ее можно коррелировать со здоровьем только через ее влияние на курение. Если затем исследователь обнаружит, что налоги на табачные изделия и состояние здоровья коррелируют, это можно рассматривать как свидетельство того, что курение вызывает изменения в здоровье.
История
[ редактировать ]Впервые инструментальная переменная использовалась в книге Филипа Райта , вышедшей в 1928 году , наиболее известного своим превосходным описанием производства, транспортировки и продажи растительных и животных масел в начале 1900-х годов в США. [6] [7] а в 1945 году Олав Рейерсоль применил тот же подход в контексте моделей ошибок в переменных в своей диссертации, дав этому методу название. [8]
Райт попытался определить спрос и предложение на сливочное масло, используя панельные данные о ценах и количествах, продаваемых в Соединенных Штатах. Идея заключалась в том, что регрессионный анализ мог бы создать кривую спроса или предложения, поскольку они формируются путем изменения цен и объемов спроса или предложения. Проблема заключалась в том, что данные наблюдений образовывали не кривую спроса или предложения как таковую, а скорее облако точечных наблюдений, которые принимали разные формы в различных рыночных условиях. Казалось, что сделать выводы из данных оставалось невозможным.
Проблема заключалась в том, что цена влияла как на спрос, так и на предложение, поэтому функцию, описывающую только один из двух факторов, нельзя было построить непосредственно на основе данных наблюдений. Райт правильно пришел к выводу, что ему нужна переменная, которая коррелировала бы либо со спросом, либо с предложением, но не с обоими сразу, то есть инструментальная переменная.
После долгих размышлений Райт решил использовать региональные осадки в качестве инструментальной переменной: он пришел к выводу, что осадки влияют на производство травы и, следовательно, на производство молока и, в конечном итоге, на предложение масла, но не на спрос на масло. Таким образом, он смог построить уравнение регрессии, используя только инструментальные переменные цены и предложения. [9]
Формальные определения инструментальных переменных с использованием контрфактов и графических критериев были даны Джудеей Перл в 2000 году. [10] Ангрист и Крюгер (2001) представляют обзор истории и использования методов инструментальных переменных. [11] Понятия причинности в эконометрике и их связь с инструментальными переменными и другими методами обсуждаются Хекманом (2008). [12]
Теория
[ редактировать ]Хотя идеи, лежащие в основе IV, распространяются на широкий класс моделей, очень распространенным контекстом для IV является линейная регрессия. Традиционно, [13] определяется инструментальная переменнаякак переменная Z , которая коррелирует с независимой переменной X и не коррелирует с «членом ошибки» U в линейном уравнении
является вектором. представляет собой матрицу, обычно со столбцом единиц и, возможно, с дополнительными столбцами для других ковариат. Рассмотрим, как инструмент позволяет быть восстановлены. Напомним, что OLS решает такой, что (когда мы минимизируем сумму квадратов ошибок, , условие первого порядка в точности .) Если считается, что истинная модель имеет по любой из причин, перечисленных выше — например, если есть пропущенная переменная , которая влияет на обе и отдельно — тогда эта МНК процедура не даст причинного воздействия на . OLS просто выберет параметр, при котором результирующие ошибки будут выглядеть некоррелированными с .
Рассмотрим для простоты случай с одной переменной. Предположим, мы рассматриваем регрессию с одной переменной и константой (возможно, никаких других ковариат не требуется или, возможно, мы частично исключили любые другие соответствующие ковариаты):
В этом случае коэффициент при интересующем регрессоре определяется выражением . Замена на дает
где это то, каким был бы предполагаемый вектор коэффициентов, если бы x не коррелировал с u . В этом случае можно показать, что является несмещенной оценкой Если в базовой модели, в которую мы верим, МНК дает коэффициент, который не отражает основной причинный эффект интереса. IV помогает решить эту проблему, определив параметры не основываясь на том, не коррелирует с , но в зависимости от того, является ли другая переменная не коррелирует с . Если теория предполагает, что связано с (первая стадия), но не коррелирует с (ограничение исключения), тогда IV может идентифицировать интересующий причинный параметр, в котором OLS не работает. Поскольку существует несколько конкретных способов использования и получения оценок IV даже только в линейном случае (IV, 2SLS, GMM), мы оставим дальнейшее обсуждение для раздела «Оценка» ниже.
Графическое определение
[ редактировать ]Методы IV были разработаны для гораздо более широкого класса нелинейных моделей. Общие определения инструментальных переменных с использованием контрфактического и графического формализма были даны Перлом (2000; стр. 248). [10] Графическое определение требует, чтобы Z удовлетворял следующим условиям:
где означает d -разделение и обозначает граф , в котором все стрелки, входящие в X, обрезаны.
Контрфактическое определение требует, чтобы Z удовлетворяло
где Y x обозначает значение, которого Y достиг бы, если бы X было x и выступает за независимость.
Если есть дополнительные ковариаты W, то приведенные выше определения изменяются так, что квалифицируется как инструмент, если данные критерии являются условными для W. Z
Суть определения Перла такова:
- Интересующие уравнения являются «структурными», а не «регрессионными».
- Термин ошибки U обозначает все экзогенные факторы, влияющие на Y, когда X остается постоянным.
- Прибор Z должен быть независим U. от
- Инструмент Z не должен влиять на Y , если X остается постоянным (ограничение исключения).
- Инструмент Z не должен быть независимым X. от
Эти условия не зависят от конкретных функциональныхформе уравнений и поэтому применимы кнелинейные уравнения, где U может быть неаддитивным(см. Непараметрический анализ). Они также применимы к системе из несколькихуравнения, в которых X (и другие факторы) влияют на Y черезнесколько промежуточных переменных. Инструментальная переменная не обязательно должна бытьпричина Х ; доверенное лицо такой причины также может бытьиспользуется, если он удовлетворяет условиям 1–5. [10] Ограничение исключения (условие 4) является избыточным; это следует из условий 2 и 3.
Выбор подходящих инструментов
[ редактировать ]Поскольку U не наблюдается, требование того, чтобы Z было независимым от U , не может быть выведено из данных и вместо этого должно быть определено из структуры модели, т. е. процесса генерации данных. Причинные графы являются представлением этой структуры, и графическое определение, данное выше, можно использовать для быстрого определения того, может ли переменная Z квалифицироваться как инструментальная переменная с учетом набора ковариат W . Чтобы увидеть, как это сделать, рассмотрим следующий пример.
- Рисунок 1. Близость считается инструментальной переменной с учетом количества часов работы библиотеки.
- Рисунок 2: , который используется для определения того, является ли близость инструментальной переменной.
- Рисунок 3. Близость не может считаться инструментальной переменной с учетом количества часов работы библиотеки.
- Рисунок 4. Близость считается инструментальной переменной, если мы не включаем часы работы библиотеки в качестве ковариаты.
Предположим, мы хотим оценить влияние университетской программы репетиторства на средний балл ( GPA ). Взаимосвязь между посещением программы репетиторства и средним баллом может быть нарушена рядом факторов. Учащиеся, посещающие программу репетиторства, могут больше заботиться о своих оценках или испытывать трудности с работой. Это смешение показано на рисунках 1–3 справа через двунаправленную дугу между программой репетиторства и средним баллом успеваемости. Если студентов распределяют по общежитиям случайным образом, близость студенческого общежития к программе обучения является естественным кандидатом на роль инструментальной переменной.
Однако что, если программа обучения находится в библиотеке колледжа? В этом случае близость также может привести к тому, что учащиеся будут проводить больше времени в библиотеке, что, в свою очередь, повысит их средний балл (см. Рисунок 1). Используя причинно-следственный граф, изображенный на рисунке 2, мы видим, что близость не квалифицируется как инструментальная переменная, поскольку она связана с GPA через путь близость. Часы работы библиотеки средний балл в . Однако, если мы контролируем часы работы библиотеки, добавляя ее в качестве ковариаты, тогда близость становится инструментальной переменной, поскольку близость отделена от среднего балла за время работы библиотеки в [ нужна ссылка ] .
Теперь предположим, что мы заметили, что «природные способности» учащегося влияют на количество часов, проведенных им в библиотеке, а также на его или ее средний балл, как показано на рисунке 3. Используя причинно-следственный график, мы видим, что часы работы в библиотеке — это коллайдер и обусловленность на нем открывает путь Близость Часы работы библиотеки средний балл. В результате близость не может использоваться в качестве инструментальной переменной.
Наконец, предположим, что часы работы в библиотеке на самом деле не влияют на средний балл, потому что студенты, которые не учатся в библиотеке, просто учатся в другом месте, как показано на рисунке 4. В этом случае контроль за часами в библиотеке по-прежнему открывает ложный путь от близости к среднему баллу. Однако если мы не будем контролировать часы работы библиотеки и удалим их как ковариату, то близость снова можно будет использовать в качестве инструментальной переменной.
Оценка
[ редактировать ]Теперь мы вернемся к механике IV и расширим ее более подробно. Предположим, что данные генерируются процессом вида
где
- я индексирую наблюдения,
- — i -е значение зависимой переменной,
- представляет собой вектор i -ых значений независимой переменной(й) и константы,
- — i -е значение ненаблюдаемой ошибки, представляющей все причины кроме , и
- представляет собой ненаблюдаемый вектор параметров.
Вектор параметров является причинно-следственным воздействием на изменения на одну единицу каждого элемента , удерживая все другие причины постоянный. Эконометрическая цель состоит в том, чтобы оценить . Для простоты предположим, что результаты e некоррелированы и взяты из распределений с одинаковой дисперсией (то есть, что ошибки серийно некоррелированы и гомоскедастичны ).
Предположим также, что предложена регрессионная модель номинально той же формы. Учитывая случайную выборку T наблюдений этого процесса, обычная оценка методом наименьших квадратов равна
где X , y и e столбцы длины T. обозначают векторы - Это уравнение аналогично уравнению, включающему во введении (это матричная версия этого уравнения). Когда X и e некоррелированы , равное нулю , при определенных условиях регулярности второй член имеет ожидаемое значение, обусловленное X и сходящееся к нулю в пределе, поэтому оценка является несмещенной и последовательной. Когда X и другие неизмеренные переменные, причинные переменные, свернутые в термин e, коррелируют, однако оценка OLS обычно является смещенной и непоследовательной для β . В этом случае допустимо использовать оценки для прогнозирования значений y при заданных значениях X , но оценка не восстанавливает причинное влияние X на y .
Чтобы восстановить базовый параметр , мы вводим набор переменных Z , который сильно коррелирует с каждым эндогенным компонентом X, но (в нашей базовой модели) не коррелирует с e . Для простоты можно считать X матрицей T × 2, состоящей из столбца констант и одной эндогенной переменной, а Z — матрицей T × 2, состоящей из столбца констант и одной инструментальной переменной. Однако этот метод обобщается: X представляет собой матрицу константы и, скажем, пяти эндогенных переменных, а Z представляет собой матрицу, состоящую из константы и пяти инструментов. В последующем обсуждении мы будем предполагать, что X представляет собой матрицу T × K , и оставим это значение K неуказанным. Оценка, в которой X и Z являются матрицами T × K, называется только что идентифицированной .
Предположим, что связь между каждым эндогенным компонентом x i и инструментами определяется выражением
Наиболее распространенная спецификация IV использует следующую оценку:
Эта спецификация приближается к истинному параметру по мере увеличения выборки, при условии, что в истинной модели:
Пока в базовом процессе, который генерирует данные, соответствующее использование оценщика IV позволит идентифицировать этот параметр. Это работает, потому что IV находит уникальный параметр, который удовлетворяет и поэтому оттачивает истинный базовый параметр по мере роста размера выборки.
Теперь расширение: предположим, что инструментов больше, чем ковариат в интересующем уравнении, так что Z представляет собой матрицу T × M с M > K . Это часто называют случаем чрезмерной идентификации . В этом случае обобщенный метод моментов можно использовать (ОММ). Оценщик GMM IV
где относится к матрице проекции .
Это выражение превращается в первое, когда количество инструментов равно количеству ковариат в интересующем уравнении. Следовательно, сверхидентифицированный IV является обобщением только что идентифицированного IV.
Существует эквивалентная недостаточно идентифицированная оценка для случая, когда m < k . Поскольку параметры являются решениями набора линейных уравнений, недостаточно идентифицированная модель, использующая набор уравнений не имеет единственного решения.
Интерпретация как двухэтапный метод наименьших квадратов
[ редактировать ]Одним из вычислительных методов, который можно использовать для расчета оценок IV, является двухэтапный метод наименьших квадратов (2SLS или TSLS). На первом этапе каждая объясняющая переменная, которая является эндогенной ковариатой в уравнении интереса, подвергается регрессии по всем экзогенным переменным в модели, включая как экзогенные ковариаты в уравнении интереса, так и исключенные инструменты. Прогнозируемые значения этих регрессий получаются:
Этап 1: регрессия каждого столбца X на Z , ( ):
и сохраните прогнозируемые значения:
На втором этапе интересующая регрессия оценивается как обычно, за исключением того, что на этом этапе каждая эндогенная ковариата заменяется прогнозируемыми значениями из первого этапа:
Этап 2: Регресс Y по прогнозируемым значениям первого этапа:
что дает
Этот метод применим только в линейных моделях. Для категориальных эндогенных ковариат может возникнуть соблазн использовать первый этап, отличный от обычного метода наименьших квадратов, например, пробит-модель для первого этапа, за которым следует МНК для второго. В эконометрической литературе это широко известно как запрещенная регрессия . [15] поскольку оценки параметров IV второго этапа согласуются только в особых случаях. [16]
Полученная оценка численно идентично выражению, показанному выше. Необходимо внести небольшую поправку в сумму квадратов остатков в подобранной модели на втором этапе, чтобы ковариационная матрица рассчитывается правильно.
Непараметрический анализ
[ редактировать ]Когда форма структурных уравнений неизвестна, инструментальная переменная все еще можно определить с помощью уравнений:
где и две произвольные функции и не зависит от . Однако в отличие от линейных моделей измерения и не позволяют выявить средний причинный эффект на , обозначенный ACE
Балке и Перл [1997] получили точные границы ACE и показали, что они могут предоставить ценную информацию о знаке и размере ACE. [17]
В линейном анализе не существует теста, опровергающего предположение о том, что является инструментальным по отношению к паре . Это не тот случай, когда является дискретным. Перл (2000) показал, что для всех и , следующее ограничение, называемое «Инструментальное неравенство», должно выполняться всякий раз, когда удовлетворяет двум приведенным выше уравнениям: [10]
Интерпретация при неоднородности эффекта лечения
[ редактировать ]Изложенное выше предполагает, что причинный эффект, представляющий интерес, не меняется в зависимости от наблюдения, то есть что является константой. Как правило, разные субъекты по-разному реагируют на изменения в «лечении» x . Когда эта возможность признается, средний эффект изменения x на y в популяции может отличаться от эффекта в данной субпопуляции. Например, средний эффект от программы профессионального обучения может существенно различаться в зависимости от группы людей, которые фактически проходят обучение, и группы, которая предпочитает не проходить обучение. По этим причинам методы IV используют неявные предположения о поведенческой реакции или, в более общем плане, предположения о корреляции между реакцией на лечение и склонностью к лечению. [18]
Стандартный оценщик IV может восстанавливать локальные средние эффекты лечения (LATE), а не средние эффекты лечения (ATE). [1] Имбенс и Ангрист (1994) демонстрируют, что линейную оценку IV можно интерпретировать в слабых условиях как средневзвешенное значение местных средних эффектов лечения, где веса зависят от эластичности эндогенного регрессора к изменениям инструментальных переменных. Грубо говоря, это означает, что влияние переменной обнаруживается только для субпопуляций, на которые влияют наблюдаемые изменения в инструментах, и что субпопуляции, которые больше всего реагируют на изменения в инструментах, будут иметь наибольшее влияние на величину оценки IV.
Например, если исследователь использует наличие колледжа, предоставляющего землю, в качестве инструмента высшего образования в регрессии доходов, он определяет влияние колледжа на доходы в подгруппе населения, которая получила бы высшее образование, если бы колледж существовал, но которая не получить ученую степень, если нет колледжа. Без дополнительных предположений этот эмпирический подход ничего не говорит исследователю о влиянии колледжа на людей, которые либо всегда, либо никогда не получат высшее образование, независимо от того, существует ли местный колледж.
Проблема слабых инструментов
[ редактировать ]Как отмечают Баунд, Джегер и Бейкер (1995), проблема возникает из-за выбора «слабых» инструментов, инструментов, которые плохо предсказывают эндогенный предиктор вопроса в уравнении первой стадии. [19] В этом случае прогнозирование предсказателя вопроса инструментом будет плохим, а прогнозируемые значения будут иметь очень небольшие вариации. Следовательно, они вряд ли добьются большого успеха в предсказании конечного результата, если их использовать вместо предсказателя вопроса в уравнении второго этапа.
В контексте рассмотренного выше примера курения и здоровья табачные налоги являются слабым инструментом борьбы с курением, если статус курения в значительной степени не реагирует на изменения налогов. Если более высокие налоги не побуждают людей бросить курить (или не начать курить), то изменение налоговых ставок ничего не говорит нам о влиянии курения на здоровье. Если налоги влияют на здоровье не через воздействие на курение, а через другие каналы, тогда инструменты недействительны, и подход инструментальных переменных может привести к вводящим в заблуждение результатам. Например, места и времена с относительно заботящимся о своем здоровье населением могут как вводить высокие налоги на табачные изделия, так и демонстрировать лучшее здоровье, даже если уровень курения остается постоянным, поэтому мы бы наблюдали корреляцию между налогами на здоровье и табачные изделия, даже если бы курение не имело никакого эффекта. на здоровье. В этом случае было бы ошибкой делать вывод о причинном влиянии курения на здоровье на основе наблюдаемой корреляции между налогами на табачные изделия и здоровьем.
Тестирование слабых инструментов
[ редактировать ]Силу инструментов можно оценить напрямую, поскольку наблюдаемы как эндогенные ковариаты, так и сами инструменты. [20] Общее эмпирическое правило для моделей с одним эндогенным регрессором таково: F-статистика относительно нуля , при которой исключенные инструменты не имеют значения в регрессии первого этапа, должна быть больше 10.
Статистические выводы и проверка гипотез
[ редактировать ]Когда ковариаты являются экзогенными, свойства малой выборки оценщика МНК могут быть получены простым способом путем вычисления моментов оценщика, обусловленного X . Когда некоторые из ковариат являются эндогенными, так что осуществляется оценка инструментальных переменных, простые выражения для моментов оценки не могут быть получены таким образом. Как правило, средства оценки инструментальных переменных имеют только желаемые асимптотические, а не конечные выборочные свойства, и вывод основан на асимптотических аппроксимациях выборочного распределения средства оценки. Даже когда инструменты не коррелируют с ошибкой в интересующем уравнении и когда инструменты не являются слабыми, свойства конечной выборки средства оценки инструментальных переменных могут быть плохими. Например, точно идентифицированные модели создают оценки конечной выборки без моментов, поэтому можно сказать, что оценка не является ни смещенной, ни несмещенной, номинальный размер тестовой статистики может быть существенно искажен, а оценки обычно могут быть далеки от истинного значения. параметра. [21]
Тестирование ограничения исключения
[ редактировать ]Предположение о том, что инструменты не коррелируют с ошибкой в уравнении интереса, не поддается проверке в точно идентифицированных моделях. Если модель переопределена, имеется доступная информация, которую можно использовать для проверки этого предположения. Самый распространенный тест этих чрезмерно идентифицирующих ограничений , называемый тестом Саргана-Хансена , основан на наблюдении, что остатки не должны быть коррелированы с набором экзогенных переменных, если инструменты действительно экзогенны. [22] Статистику теста Саргана – Хансена можно рассчитать как (количество наблюдений, умноженное на коэффициент детерминации ) из МНК-регрессии остатков на набор экзогенных переменных. Эта статистика будет асимптотически хи-квадрат с m - k степенями свободы при условии, что член ошибки не коррелирует с инструментами.
См. также
[ редактировать ]- Функция управления (эконометрика) - Статистические методы коррекции проблем эндогенности.
- Оптимальные инструменты . Метод повышения эффективности оценок в моделях условного момента.
Ссылки
[ редактировать ]- ^ Перейти обратно: а б Имбенс, Г.; Ангрист, Дж. (1994). «Идентификация и оценка локальных средних эффектов лечения» . Эконометрика . 62 (2): 467–476. дои : 10.2307/2951620 . JSTOR 2951620 . S2CID 153123153 .
- ^ Буллок, Дж. Г.; Грин, ДП; Ха, ЮВ (2010). «Да, но каков механизм? (Не ждите простого ответа)». Журнал личности и социальной психологии . 98 (4): 550–558. CiteSeerX 10.1.1.169.5465 . дои : 10.1037/a0018933 . ПМИД 20307128 . S2CID 7913867 .
- ^ https://www.stata.com/meeting/5nasug/wiv.pdf [ нужна полная цитата ]
- ^ Николс, Остин (23 июля 2006 г.). «Слабые инструменты: обзор и новые методы» .
{{cite journal}}
: Для цитирования журнала требуется|journal=
( помощь ) - ^ Ли, JP; Шембри, М. (2004). «Метод инструментальных переменных: цена на сигареты позволила лучше оценить влияние курения на SF-12». Журнал клинической эпидемиологии . 57 (3): 284–293. дои : 10.1016/j.jclinepi.2003.08.006 . ПМИД 15066689 .
- ^ Эпштейн, Рой Дж. (1989). «Падение OLS в структурных оценках». Оксфордские экономические документы . 41 (1): 94–107. doi : 10.1093/oxfordjournals.oep.a041930 . JSTOR 2663184 .
- ^ Сток, Джеймс Х.; Требби, Франческо (2003). «Ретроспективы: кто изобрел инструментальную регрессию переменных?» . Журнал экономических перспектив . 17 (3): 177–194. дои : 10.1257/089533003769204416 .
- ^ Рейерсёль, Олав (1945). Анализ конфлюенса с помощью инструментальных наборов переменных . Архив математики, астрономии и физики. Том. 32А. Уппсала: Алмквист и Викселлс. OCLC 793451601 .
- ^ Вулдридж, Дж.: Вводная эконометрика . Юго-Западный, Скарборо, Канада, 2009 г.
- ^ Перейти обратно: а б с д Перл, Дж. (2000). Причинность: модели, рассуждения и выводы . Нью-Йорк: Издательство Кембриджского университета . ISBN 978-0-521-89560-6 .
- ^ Ангрист, Дж.; Крюгер, А. (2001). «Инструментальные переменные и поиск идентификации: от спроса и предложения к естественным экспериментам» . Журнал экономических перспектив . 15 (4): 69–85. дои : 10.1257/jep.15.4.69 . hdl : 1721.1/63775 .
- ^ Хекман, Дж. (2008). «Эконометрическая причинность». Международный статистический обзор . 76 (1): 1–27. дои : 10.1111/j.1751-5823.2007.00024.x .
- ^ Боуден, Р.Дж.; Теркингтон, Д.А. (1984). Инструментальные переменные . Кембридж, Англия: Издательство Кембриджского университета.
- ^ Дэвидсон, Рассел; Маккиннон, Джеймс (1993). Оценка и вывод в эконометрике . Нью-Йорк: Издательство Оксфордского университета. ISBN 978-0-19-506011-9 .
- ^ Вулдридж, Дж. (2010). Эконометрический анализ перекрестных и панельных данных. Эконометрический анализ перекрестных и панельных данных. МТИ Пресс. [ нужна страница ]
- ^ Лергенмюллер, Саймон (2017). Двухэтапная замена предикторов для данных времени до события (Диссертация). hdl : 10852/57801 .
- ^ Балке, А.; Перл, Дж. (1997). «Границы эффекта лечения, полученные в исследованиях с несовершенным соблюдением режима». Журнал Американской статистической ассоциации . 92 (439): 1172–1176. CiteSeerX 10.1.1.26.3952 . дои : 10.1080/01621459.1997.10474074 . S2CID 18365761 .
- ^ Хекман, Дж. (1997). «Инструментальные переменные: исследование неявных поведенческих предположений, используемых при оценке программ». Журнал человеческих ресурсов . 32 (3): 441–462. дои : 10.2307/146178 . JSTOR 146178 .
- ^ Баунд, Дж.; Джагер, Д.А.; Бейкер, Р.М. (1995). «Проблемы с оценкой инструментальных переменных, когда корреляция между инструментами и эндогенной объясняющей переменной слаба». Журнал Американской статистической ассоциации . 90 (430): 443. doi : 10.1080/01621459.1995.10476536 .
- ^ Сток, Дж.; Райт, Дж.; Його, М. (2002). «Обзор слабых инструментов и их идентификация в обобщенном методе моментов». Журнал Американской статистической ассоциации . 20 (4): 518–529. CiteSeerX 10.1.1.319.2477 . дои : 10.1198/073500102288618658 . S2CID 14793271 .
- ^ Нельсон, ЧР; Старц, Р. (1990). «Некоторые дополнительные результаты по точным свойствам малой выборки инструментального средства оценки переменных» . Эконометрика . 58 (4): 967–976. дои : 10.2307/2938359 . JSTOR 2938359 . S2CID 119872226 .
- ^ Хаяси, Фумио (2000). «Тестирование сверхидентифицирующих ограничений» . Эконометрика . Принстон: Издательство Принстонского университета. стр. 217–221. ISBN 978-0-691-01018-2 .
Дальнейшее чтение
[ редактировать ]- Грин, Уильям Х. (2008). Эконометрический анализ (Шестое изд.). Река Аппер-Седл: Пирсон Прентис-Холл. стр. 314–353 . ISBN 978-0-13-600383-0 .
- Гуджарати, Дамодар Н .; Портер, Дон К. (2009). Основная эконометрика (Пятое изд.). Нью-Йорк: МакГроу-Хилл Ирвин. стр. 711–736 . ISBN 978-0-07-337577-9 .
- Сарган, Денис (1988). Лекции по углубленной эконометрической теории . Оксфорд: Бэзил Блэквелл. стр. 42–67. ISBN 978-0-631-14956-9 .
- Вулдридж, Джеффри М. (2013). Вводная эконометрика: современный подход (Пятое международное изд.). Мейсон, Огайо: Юго-Запад. стр. 490–528. ISBN 978-1-111-53439-4 .
Библиография
[ редактировать ]- Вулдридж, Дж. (1997): Методы квазиправдоподобия для подсчета данных, Справочник по прикладной эконометрике, том 2, изд. М. Х. Песаран и П. Шмидт, Оксфорд, Блэквелл, стр. 352–406.
- Терза, СП (1998): «Оценка моделей подсчета с эндогенным переключением: отбор образцов и эффекты эндогенного лечения». Журнал эконометрики (84), стр. 129–154.
- Вулдридж, Дж. (2002): «Эконометрический анализ перекрестных и панельных данных», MIT Press , Кембридж, Массачусетс.
Внешние ссылки
[ редактировать ]- Глава из Дэниела Макфаддена учебника
- Лекция по эконометрике (тема: инструментальная переменная) на YouTube Марка Тома .
- Лекция по эконометрике (тема: двухэтапный метод наименьших квадратов) на YouTube Марка Тома