Линейная вероятностная модель
В статистике линейная вероятностная модель (LPM) является частным случаем модели бинарной регрессии . Здесь зависимая переменная для каждого наблюдения принимает значения, равные 0 или 1. Вероятность наблюдения 0 или 1 в любом отдельном случае рассматривается как зависящая от одной или нескольких объясняющих переменных . Для «модели линейной вероятности» это соотношение особенно простое и позволяет аппроксимировать модель с помощью линейной регрессии .
Модель предполагает, что для бинарного результата ( испытание Бернулли ) и связанный с ним вектор независимых переменных, , [1]
Для этой модели
и, следовательно, вектор параметров β можно оценить с помощью метода наименьших квадратов . Такой способ установки будет неэффективен, [1] и может быть улучшено путем принятия итеративной схемы, основанной на взвешенных наименьших квадратах , [1] в котором модель из предыдущей итерации используется для получения оценок условных отклонений, , который будет варьироваться в зависимости от наблюдения. Этот подход может быть связан с подбором модели по максимальному правдоподобию . [1]
Недостатком этой модели является то, что, если не наложены ограничения на оценочные коэффициенты могут подразумевать вероятности вне единичного интервала . такие модели, как логит-модель или пробит-модель По этой причине чаще используются .
Формулировка со скрытой переменной
[ редактировать ]Более формально, LPM может возникнуть из формулировки со скрытой переменной (обычно ее можно найти в литературе по эконометрике). [2] ), следующим образом: предположим следующую модель регрессии со скрытой (ненаблюдаемой) зависимой переменной:
Критическим предположением здесь является то, что член ошибки этой регрессии представляет собой симметричную относительно нуля равномерную случайную величину и, следовательно, имеет нулевое среднее значение. Кумулятивная функция распределения вот
Определите переменную индикатора если , и ноль в противном случае, и рассмотрим условную вероятность
Но это модель линейной вероятности.
с отображением
Этот метод является общим устройством для получения условно-вероятностной модели двоичной переменной: если мы предположим, что распределение члена ошибки является логистическим, мы получим логит-модель , а если мы предположим, что это нормальное распределение, мы получим пробит модель и, если предположить, что это логарифм распределения Вейбулла, дополнительная логарифмическая модель .
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б с д Кокс, доктор медицинских наук (1970). «Простая регрессия». Анализ двоичных данных . Лондон: Метуэн. стр. 33–42. ISBN 0-416-10400-2 .
- ^ Амемия, Такеши (1981). «Модели качественного ответа: опрос». Журнал экономической литературы . 19 (4): 1483–1536.
Дальнейшее чтение
[ редактировать ]- Олдрич, Джон Х .; Нельсон, Форрест Д. (1984). «Модель линейной вероятности» . Модели линейной вероятности, логита и пробита . Мудрец. стр. 9–29. ISBN 0-8039-2133-0 .
- Амемия, Такеши (1985). «Модели качественного реагирования» . Продвинутая эконометрика . Оксфорд: Бэзил Блэквелл. стр. 267–359. ISBN 0-631-13345-3 .
- Вулдридж, Джеффри М. (2013). «Двоичная зависимая переменная: модель линейной вероятности». Вводная эконометрика: современный подход (5-е международное изд.). Мейсон, Огайо: Юго-Запад. стр. 238–243. ISBN 978-1-111-53439-4 .
- Хоррас, Уильям К. и Рональд Л. Оахака. «Результаты по смещению и несогласованности метода наименьших квадратов для модели линейной вероятности». Письма по экономике, 2006: Том. 90, С. 321–327.