Смешанный логит

Смешанная логит — это полностью общая статистическая модель для изучения дискретного выбора . Она преодолевает три важных ограничения стандартной логит-модели, допуская случайные вариации вкусов у выбирающих, неограниченные модели замещения при выборе и корреляцию ненаблюдаемых факторов с течением времени. ^[1] Смешанный логит может выбрать любой дистрибутив $f$ для случайных коэффициентов, в отличие от пробита, который ограничен нормальным распределением. Его называют «смешанным логитом», потому что вероятность выбора представляет собой смесь логитов, при этом $f$ как распределение смешивания. ^[2] Было показано, что смешанная логит-модель может с любой степенью точности аппроксимировать любую истинно случайную модель полезности дискретного выбора при соответствующей спецификации переменных и распределении коэффициентов. ^[3]

Случайное изменение вкуса

«Вкусовые» коэффициенты стандартной логит-модели, или $\beta$ фиксированы, что означает, что $\beta$ они одинаковы для всех. Смешанный логит имеет разные $\beta$ для каждого человека (т. е. каждого лица, принимающего решения.)

В стандартной логит-модели полезность человека $n$ для альтернативы $i$ является:

U_{ni}=\beta x_{ni}+\varepsilon _{ni}

с

\varepsilon _{ni}

~ экстремальное значение iid

Для смешанной логит-модели эта спецификация обобщается, позволяя $\beta _{n}$ быть случайным. Полезность человека $n$ для альтернативы $i$ в смешанной логит-модели:

U_{ni}=\beta _{n}x_{ni}+\varepsilon _{ni}

с

\varepsilon _{ni}

~ экстремальное значение iid

\quad \beta _{n}\sim f(\beta |\theta )

где θ – параметры распределения $\beta _{n}$ над генеральной совокупностью, например среднее значение и дисперсия $\beta _{n}$ .

При условии включения $\beta _{n}$ , вероятность того, что человек $n$ выбирает альтернативу $i$ стандартная формула логита:

L_{ni}(\beta _{n})={\frac {e^{\beta _{n}X_{ni}}}{\sum _{j}e^{\beta _{n}X_{nj}}}}

Однако, поскольку $\beta _{n}$ случайна и неизвестна, вероятность (безусловного) выбора представляет собой интеграл этой логит-формулы по плотности $\beta _{n}$ .

P_{ni}=\int L_{ni}(\beta )f(\beta |\theta )d\beta

Эту модель также называют логит-моделью случайных коэффициентов, поскольку $\beta _{n}$ является случайной величиной. Это позволяет наклонам полезности (т. е. предельной полезности ) быть случайными, что является расширением модели случайных эффектов , в которой только точка пересечения была стохастической.

Любая функция плотности вероятности может быть задана для распределения коэффициентов в совокупности, т. е. для $f(\beta |\theta )$ . Наиболее широко используемый дистрибутив — нормальный, главным образом из-за его простоты. Для коэффициентов, которые принимают один и тот же знак для всех людей, таких как ценовой коэффициент, который обязательно отрицателен, или коэффициент желательного атрибута, используются распределения с поддержкой только с одной стороны от нуля, такие как логарифмически нормальное. ^[4]^[5] Когда коэффициенты логически не могут быть неограниченно большими или малыми, часто используются ограниченные распределения, такие как $S_{b}$ или треугольные распределения.

Неограниченные шаблоны замены

Смешанная логит-модель может представлять собой общую схему замещения, поскольку она не демонстрирует свойство логит-ограничивающей независимости от нерелевантных альтернатив (IIA). Процентное изменение лично $n$ безусловная вероятность выбора альтернативы $i$ учитывая процентное изменение m -го атрибута альтернативы $j$ ( эластичность $P_{ni}$ относительно $x_{nj}^{m}$ ) является

{\text{Elasticity}}_{P_{ni},x_{nj}^{m}}=-{\frac {x_{nj}^{m}}{P_{ni}}}\int \beta ^{m}L_{ni}(\beta )L_{nj}(\beta )f(\beta )d\beta =-x_{nj}^{m}\int \beta ^{m}L_{nj}(\beta ){\frac {L_{ni}(\beta )}{P_{ni}}}f(\beta )d\beta

где $\beta ^{m}$ является m- м элементом $\beta$ . ^[1]^[5] Из этой формулы видно, что десятипроцентное сокращение $P_{ni}$ не обязательно подразумевать (как в случае с логитом) десятипроцентное сокращение каждой альтернативы. $P_{nj}$ . ^[1] Причина в том, что относительные проценты зависят от соотношения между условной вероятностью того, что человек $n$ выберу альтернативу $i,L_{ni},$ и условная вероятность того, что человек $n$ выберу альтернативу $j,L_{nj},$ по различным розыгрышам $\beta$ .

Корреляция ненаблюдаемых факторов с течением времени

Стандартный логит не принимает во внимание какие-либо ненаблюдаемые факторы, которые сохраняются с течением времени для данного лица, принимающего решения. Это может стать проблемой, если вы используете панельные данные, которые представляют собой повторяющиеся выборы с течением времени. Применяя стандартную логит-модель к панельным данным, вы предполагаете, что ненаблюдаемые факторы, влияющие на выбор человека, являются новыми каждый раз, когда человек делает выбор. Это очень маловероятное предположение. Чтобы принять во внимание как случайные изменения вкуса, так и корреляцию ненаблюдаемых факторов с течением времени, полезность для респондента n альтернативы i в момент времени t определяется следующим образом:

U_{nit}=\beta _{n}X_{nit}+\varepsilon _{nit}

где индекс t — измерение времени. Мы по-прежнему делаем логит-предположение, которое заключается в том, что $\varepsilon$ является крайним значением iid. Это означает, что $\varepsilon$ независима от времени, людей и альтернатив. $\varepsilon$ по сути, это просто белый шум. Однако корреляция во времени и альтернативах возникает из-за общего эффекта $\beta$ s, которые определяют полезность в каждый период времени и каждую альтернативу.

Чтобы изучить корреляцию явно, предположим, что β . обычно распределяются со средним значением ${\bar {\beta }}$ и дисперсия $\sigma ^{2}$ . Тогда уравнение полезности принимает вид:

U_{nit}=({\bar {\beta }}+\sigma \eta _{n})X_{nit}+\varepsilon _{nit}

и η представляет собой стандартную нормальную плотность. Переставляя, уравнение принимает вид:

U_{nit}={\bar {\beta }}X_{nit}+(\sigma \eta _{n}X_{nit}+\varepsilon _{nit})

U_{nit}={\bar {\beta }}X_{nit}+e_{nit}

где ненаблюдаемые факторы собраны в $e_{nit}=\sigma \eta _{n}X_{nit}+\varepsilon _{nit}$ . Из ненаблюдаемых факторов $\varepsilon _{nit}$ независима во времени и $\sigma \eta _{n}X_{nit}$ не является независимым от времени или альтернатив.

Тогда ковариация между альтернативами $i$ и $j$ является,

{\text{Cov}}(e_{nit},e_{njt})=\sigma ^{2}(X_{nit}X_{njt})

и ковариация между временем $t$ и $q$ является

{\text{Cov}}(e_{nit},e_{niq})=\sigma ^{2}(X_{nit}X_{niq})

Указав соответствующим образом X, можно получить любой образец ковариации во времени и альтернативах.

При условии включения $\beta _{n}$ , вероятность последовательности выборов, сделанных человеком, представляет собой просто произведение логит-вероятности каждого отдельного выбора, сделанного этим человеком:

L_{n}(\beta _{n})=\prod _{t}{\frac {e^{\beta _{n}X_{nit}}}{\sum _{j}e^{\beta _{n}X_{njt}}}}

с $\varepsilon _{nit}$ независима во времени. Тогда (безусловная) вероятность последовательности выборов представляет собой просто интеграл от этого произведения логитов по плотности $\beta$ .

P_{ni}=\int L_{n}(\beta )f(\beta |\theta )d\beta

Моделирование

К сожалению, не существует закрытой формы для интеграла, входящего в вероятность выбора, и поэтому исследователю приходится моделировать P _n . К счастью для исследователя, смоделировать P _n может быть очень просто. Необходимо выполнить четыре основных шага

1. Возьмите функцию плотности вероятности, которую вы указали для «вкусовых» коэффициентов. То есть взять ничью из $f(\beta |\theta )$ и обозначить розыгрыш $\beta ^{r}$ , для $r=1$ представляющий первый розыгрыш.