Заказанный логит

В статистике упорядоченная логит-модель (также упорядоченная логистическая регрессия или модель пропорциональных шансов ) представляет собой модель порядковой регрессии , то есть модель регрессии для порядковых зависимых переменных , впервые рассмотренную Питером МакКаллагом . ^[1] Например, если на один вопрос опроса нужно ответить выбором между «плохо», «удовлетворительно», «хорошо», «очень хорошо» и «отлично» , и цель анализа состоит в том, чтобы увидеть, насколько хорошо это Ответ можно предсказать по ответам на другие вопросы, некоторые из которых могут быть количественными, тогда можно использовать упорядоченную логистическую регрессию. Его можно рассматривать как расширение модели логистической регрессии , которое применяется к дихотомическим зависимым переменным и допускает более двух (упорядоченных) категорий ответов.

Модель и предположение о пропорциональных шансах

Модель применяется только к данным, которые соответствуют предположению о пропорциональных шансах , смысл которого можно проиллюстрировать следующим образом. Предположим, есть пять результатов: «плохо», «удовлетворительно», «хорошо», «очень хорошо» и «отлично». Мы предполагаем, что вероятности этих результатов определяются как p ₁ ( x ), p ₂ ( x ), p ₃ ( x ), p ₄ ( x ), p ₅ ( x ), все из которых являются функциями некоторой независимой переменной. (с) х . Тогда для фиксированного значения x логарифмы шансов ( а не логарифмы вероятностей) ответа определенными способами равны:

{\begin{aligned}{\text{poor: }}&\log {\frac {p_{1}(x)}{p_{2}(x)+p_{3}(x)+p_{4}(x)+p_{5}(x)}},\\[8pt]{\text{poor or fair: }}&\log {\frac {p_{1}(x)+p_{2}(x)}{p_{3}(x)+p_{4}(x)+p_{5}(x)}},\\[8pt]{\text{poor, fair, or good: }}&\log {\frac {p_{1}(x)+p_{2}(x)+p_{3}(x)}{p_{4}(x)+p_{5}(x)}},\\[8pt]{\text{poor, fair, good, or very good: }}&\log {\frac {p_{1}(x)+p_{2}(x)+p_{3}(x)+p_{4}(x)}{p_{5}(x)}}\end{aligned}}

Предположение о пропорциональных шансах гласит, что числа, добавляемые к каждому из этих логарифмов для получения следующего, одинаковы независимо от x . Другими словами, разница между логарифмом шансов на плохое или удовлетворительное здоровье минус логарифм шансов на плохое здоровье одинакова независимо от x ; аналогично, логарифм шансов иметь плохое, удовлетворительное или хорошее здоровье минус логарифм шансов иметь плохое или удовлетворительное здоровье одинаков, независимо от x ; и т. д. ^[2]

Примеры категорий ответов с множественным упорядочением включают рейтинги облигаций, опросы общественного мнения с ответами от «полностью согласен» до «категорически не согласен», уровни государственных расходов на государственные программы (высокий, средний или низкий), выбранный уровень страхового покрытия ( нет, частичная или полная) и статус занятости (не занят, занят неполный рабочий день или полностью занят). ^[3]

Упорядоченный логит можно получить из модели со скрытыми переменными, аналогичной той, из которой двоичную логистическую регрессию можно вывести . Предположим, что основной процесс, который необходимо охарактеризовать,

y^{*}=\mathbf {x} ^{\mathsf {T}}\beta +\varepsilon ,\,

где $y^{*}$ — ненаблюдаемая зависимая переменная (возможно, точный уровень согласия с утверждением, предложенным социологом); $\mathbf {x}$ – вектор независимых переменных; $\varepsilon$ — член ошибки , предполагающий, что он соответствует стандартному логистическому распределению; и $\beta$ — вектор коэффициентов регрессии, который мы хотим оценить. Далее предположим, что, хотя мы не можем наблюдать $y^{*}$ вместо этого мы можем наблюдать только категории ответов

y={\begin{cases}0&{\text{if }}y^{*}\leq \mu _{1},\\1&{\text{if }}\mu _{1}<y^{*}\leq \mu _{2},\\2&{\text{if }}\mu _{2}<y^{*}\leq \mu _{3},\\\vdots \\N&{\text{if }}\mu _{N}<y^{*}\end{cases}}

где параметры $\mu _{i}$ являются внешними конечными точками наблюдаемых категорий. Тогда метод упорядоченной логиты будет использовать наблюдения над y , которые являются формой цензурированных данных о y* , чтобы соответствовать вектору параметров. $\beta$ .

Оценка

Как обычно, оценка максимального правдоподобия или байесовский вывод являются наиболее распространенными способами подбора параметров такой модели. ^[4] Оценочные параметры указывают направление и величину влияния каждой независимой переменной на вероятность попадания зависимой переменной в более высокую или низкую категорию.

Приложения

Упорядоченные логистические регрессии использовались во многих областях, таких как транспорт, ^[5] маркетинг ^[6] или управление стихийными бедствиями. ^[7]

В клинических исследованиях эффект, который лекарство может оказать на пациента, можно смоделировать с помощью порядковой регрессии. Независимые переменные могут включать использование или неиспользование препарата, а также контрольные переменные, такие как демографические данные и данные из истории болезни. Зависимую переменную можно ранжировать по следующему списку: полное излечение, улучшение симптомов, отсутствие изменений, ухудшение симптомов или смерть. ^{[ нужна ссылка ]}

Другим примером применения являются вопросы типа Лайкерта, обычно используемые в опросах, где респонденты оценивают свое согласие по упорядоченной шкале (например, от «Категорически не согласен» до «Полностью согласен»). Упорядоченная пробит-модель обеспечивает подходящую подгонку к этим данным, сохраняя порядок вариантов ответа, но не делая предположений об интервальных расстояниях между вариантами. ^[8]

См. также

Ссылки

^ МакКаллах, Питер (1980). «Модели регрессии для порядковых данных». Журнал Королевского статистического общества . Серия Б (Методическая). 42 (2): 109–142. дои : 10.1111/j.2517-6161.1980.tb01109.x . JSTOR 2984952 .
^ Грин, Уильям Х. (2012). Эконометрический анализ (Седьмое изд.). Бостон: Pearson Education. стр. 827–831. ISBN 978-0-273-75356-8 .
^ Грин, Уильям Х. (2012). Эконометрический анализ (Седьмое изд.). Бостон: Pearson Education. стр. 824–827. ISBN 978-0-273-75356-8 .
^ Грин, Уильям Х.; Хеншер, Дэвид А. (08 апреля 2010 г.). Моделирование упорядоченного выбора: учебник для начинающих . Издательство Кембриджского университета. ISBN 978-1-139-48595-1 .
^ дель Олио, Луиджи; Ибеас, Ангел; Сесин, Патрисия (01 ноября 2010 г.). «Моделирование восприятия пользователем качества автобусного транспорта» . Транспортная политика . 17 (6): 388–397. дои : 10.1016/j.tranpol.2010.04.006 . ISSN 0967-070X .
^ Катахира, Хотака (февраль 1990 г.). «Картирование восприятия с использованием упорядоченного логит-анализа» . Маркетинговая наука . 9 (1): 1–17. дои : 10.1287/mksc.9.1.1 . ISSN 0732-2399 .
^ Ловреглио, Руджеро; Кулиговский, Эрика; Уолпол, Эмили; Линк, Эрик; Гвинн, Стив (01 ноября 2020 г.). «Калибровка модели принятия решений о лесном пожаре с использованием моделирования гибридного выбора» . Международный журнал по снижению риска стихийных бедствий . 50 : 101770. doi : 10.1016/j.ijdrr.2020.101770 . ISSN 2212-4209 .
^ Лидделл, Т; Крушке, Дж (2018). «Анализ порядковых данных с помощью метрических моделей: что может пойти не так?» (PDF) . Журнал экспериментальной социальной психологии . 79 : 328–348. дои : 10.1016/j.jesp.2018.08.009 .

Дальнейшее чтение

Беккер, Уильям Э.; Кеннеди, Питер Э. (1992). «Графическое представление упорядоченного пробита». Эконометрическая теория . 8 (1): 127–131. дои : 10.1017/S0266466600010781 .
Гельман, Эндрю; Хилл, Дженнифер (2007). Анализ данных с использованием регрессии и многоуровневых/иерархических моделей . Нью-Йорк: Издательство Кембриджского университета. стр. 119–124. ISBN 978-0-521-68689-1 .
Хардин, Джеймс; Хильбе, Джозеф (2007). Обобщенные линейные модели и расширения (2-е изд.). Колледж-Стейшн: Stata Press. ISBN 978-1-59718-014-6 .
Вудворд, Марк (2005). Эпидемиология: дизайн исследования и анализ данных (2-е изд.). Чепмен и Холл/CRC. ISBN 978-1-58488-415-6 .
Вулдридж, Джеффри (2010). Эконометрический анализ перекрестных и панельных данных (второе изд.). Кембридж: MIT Press. стр. 643–666. ISBN 978-0-262-23258-6 .

Внешние ссылки

Саймон, Стив (22 сентября 2004 г.). «Размер выборки для порядкового результата» . СТАТИСТИКА — Попытка Стива преподавать статистику . Проверено 22 августа 2014 г.
Родригес, Герман. «Упорядоченные логит-модели» . Принстонский университет .

[1] МакКаллах, Питер (1980). «Модели регрессии для порядковых данных». Журнал Королевского статистического общества . Серия Б (Методическая). 42 (2): 109–142. дои : 10.1111/j.2517-6161.1980.tb01109.x . JSTOR 2984952 .

[2] Грин, Уильям Х. (2012). Эконометрический анализ (Седьмое изд.). Бостон: Pearson Education. стр. 827–831. ISBN 978-0-273-75356-8 .

[3] Грин, Уильям Х. (2012). Эконометрический анализ (Седьмое изд.). Бостон: Pearson Education. стр. 824–827. ISBN 978-0-273-75356-8 .

[4] Грин, Уильям Х.; Хеншер, Дэвид А. (08 апреля 2010 г.). Моделирование упорядоченного выбора: учебник для начинающих . Издательство Кембриджского университета. ISBN 978-1-139-48595-1 .

[5] дель Олио, Луиджи; Ибеас, Ангел; Сесин, Патрисия (01 ноября 2010 г.). «Моделирование восприятия пользователем качества автобусного транспорта» . Транспортная политика . 17 (6): 388–397. дои : 10.1016/j.tranpol.2010.04.006 . ISSN 0967-070X .

[6] Катахира, Хотака (февраль 1990 г.). «Картирование восприятия с использованием упорядоченного логит-анализа» . Маркетинговая наука . 9 (1): 1–17. дои : 10.1287/mksc.9.1.1 . ISSN 0732-2399 .

[7] Ловреглио, Руджеро; Кулиговский, Эрика; Уолпол, Эмили; Линк, Эрик; Гвинн, Стив (01 ноября 2020 г.). «Калибровка модели принятия решений о лесном пожаре с использованием моделирования гибридного выбора» . Международный журнал по снижению риска стихийных бедствий . 50 : 101770. doi : 10.1016/j.ijdrr.2020.101770 . ISSN 2212-4209 .

[Liddell-8] Лидделл, Т; Крушке, Дж (2018). «Анализ порядковых данных с помощью метрических моделей: что может пойти не так?» (PDF) . Журнал экспериментальной социальной психологии . 79 : 328–348. дои : 10.1016/j.jesp.2018.08.009 .

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]