Логит

В статистике логит связанной ( / ˈ l oʊ dʒ ɪ t / LOH -jit ) функция является функцией квантиля, со стандартным логистическим распределением . Он имеет множество применений в анализе данных и машинном обучении, особенно при преобразовании данных .
Математически логит является обратной стандартной логистической функцией. , поэтому логит определяется как
По этой причине логит также называют логарифмом шансов , поскольку он равен логарифму шансов . где р — вероятность. Таким образом, логит — это тип функции, которая отображает значения вероятности из к действительным числам в , [1] аналогично функции пробит .
Определение
[ редактировать ]Если p — вероятность , то p /(1 − p ) — соответствующие шансы ; логит вероятности - это логарифм шансов, т.е.:
Основание используемой функции логарифма не имеет большого значения в настоящей статье, если оно больше 1, но натуральный логарифм с основанием e наиболее часто используется . Выбор базы соответствует выбору логарифмической единицы для значения: база 2 соответствует шеннону , база е — « нат », а база 10 — хартли ; эти единицы особенно используются в теоретико-информационных интерпретациях. Для каждого выбора базы функция logit принимает значения от отрицательной до положительной бесконечности.
любого «Логистическая» функция числа определяется обратным логитом :
Разница между логитами двух вероятностей представляет собой логарифм отношения шансов ( R ), что обеспечивает сокращение для записи правильной комбинации отношений шансов только путем сложения и вычитания :
История
[ редактировать ]Было исследовано несколько подходов для адаптации методов линейной регрессии к области, где выходными данными является значение вероятности. , вместо любого действительного числа . Во многих случаях такие усилия были сосредоточены на моделировании этой проблемы путем картирования диапазона к а затем запускаем линейную регрессию для этих преобразованных значений. [2]
В 1934 году Честер Иттнер Блисс использовал кумулятивную функцию нормального распределения для выполнения этого отображения и назвал свою модель пробитом , что означает « вероятность без нее ». Однако это более затратно в вычислительном отношении. [2]
В 1944 году Джозеф Берксон использовал журнал шансов и назвал эту функцию logit , сокращение от « log istic un it », следуя аналогии с пробитом:
«Я использую этот термин [логит] для вслед за Блиссом, назвавшим аналогичную функцию, линейную на для нормальной кривой «пробит».
- Джозеф Берксон (1944) [3]
Логарифмические коэффициенты широко использовались Чарльзом Сандерсом Пирсом (конец 19 века). [4] Г. А. Барнард в 1949 году ввёл широко используемый термин «логарифм шансов» ; [5] [6] лог-шанс события — это логит вероятности события. [7] Барнард также ввел термин «лоды» как абстрактную форму «логарифма шансов». [8] но предположил, что «на практике обычно следует использовать термин «шансы», поскольку он более знаком в повседневной жизни». [9]
Использование и свойства
[ редактировать ]- Логит в логистической регрессии является частным случаем функции связи в обобщенной линейной модели : это каноническая функция связи для распределения Бернулли .
- Более абстрактно, логит — это естественный параметр биномиального распределения ; см. Экспоненциальное семейство § Биномиальное распределение .
- Логит-функция является отрицательной производной двоичной функции энтропии .
- Логит также занимает центральное место в вероятностной Раша модели измерения . , которая, помимо других областей, находит применение в психологической и образовательной оценке
- Функцию обратного логита (т. е. логистическую функцию ) также иногда называют функцией выхода . [10]
- В эпидемиологии болезней растений логистические модели, модели Гомпертца и мономолекулярные модели известны под общим названием модели семейства Ричардса.
- Функция логарифма шансов вероятностей часто используется в алгоритмах оценки состояния. [11] из-за его численного преимущества в случае малых вероятностей. Вместо умножения очень маленьких чисел с плавающей запятой, вероятности логарифмических шансов можно просто суммировать для вычисления совместной вероятности (логарифмических шансов). [12] [13]
Сравнение с пробитом
[ редактировать ]
С функцией логит (и моделью логит ) тесно связаны пробит-функция и пробит-модель . Логит квантильными и пробит являются сигмовидными функциями с областью значений от 0 до 1, что делает их обе функциями , то есть обратными кумулятивной функции распределения (CDF) распределения вероятностей . Фактически, логит — это функция квантиля логистического распределения , а пробит — функция квантиля нормального распределения . Пробит - функция обозначается , где — это CDF стандартного нормального распределения, как только что упоминалось:
Как показано на графике справа, функции логит и пробит очень похожи, когда функция пробит масштабируется так, что ее наклон при y = 0 соответствует наклону логит . В результате пробит-модели иногда используются вместо логит-моделей, поскольку для некоторых приложений (например, в теории ответа на задание ) реализация проще. [14]
См. также
[ редактировать ]- Сигмовидная функция , обратная логит-функции
- Дискретный выбор двоичного логита, полиномиального логита, условного логита, вложенного логита, смешанного логита, разнесенного логита и упорядоченного логита.
- Ограниченная зависимая переменная
- Логит-анализ в маркетинге
- Полиномиальный логит
- Оги , кривая аналогичной формы
- Персептрон
- Probit , еще одна функция с тем же доменом и диапазоном, что и logit.
- Подсчет очков за поездку
- Преобразование данных (статистика)
- Арксин (преобразование)
- Быстрая модель
Ссылки
[ редактировать ]![]() | Эта статья включает список общих ссылок , но в ней отсутствуют достаточные соответствующие встроенные цитаты . ( Ноябрь 2010 г. ) |
- ^ «Логит/Пробит» (PDF) .
- ↑ Перейти обратно: Перейти обратно: а б Крамер, Дж. С. (2003). «Истоки и развитие логит-модели» (PDF) . Кембриджский университет.
- ^ Берксон 1944 , с. 361, сноска 2.
- ^ Стиглер, Стивен М. (1986). История статистики: измерение неопределенности до 1900 года . Кембридж, Массачусетс: Belknap Press издательства Гарвардского университета. ISBN 978-0-674-40340-6 .
- ^ Хильбе, Джозеф М. (2009), Модели логистической регрессии , CRC Press, стр. 3, ISBN 9781420075779 .
- ^ Барнард 1949 , с. 120.
- ^ Крамер, Дж. С. (2003), Логит-модели из экономики и других областей , издательство Кембриджского университета, стр. 13, ISBN 9781139438193 .
- ^ Барнард 1949 , с. 120 128.
- ^ Барнард 1949 , с. 136.
- ^ «R: Обратная логит-функция» . Архивировано из оригинала 6 июля 2011 г. Проверено 18 февраля 2011 г.
- ^ Трун, Себастьян (2003). «Изучение сеточных карт занятости с помощью моделей прямых датчиков». Автономные роботы . 15 (2): 111–127. дои : 10.1023/А:1025584807625 . ISSN 0929-5593 . S2CID 2279013 .
- ^ Стайлер, Алекс (2012). «Статистические методы в робототехнике» (PDF) . п. 2 . Проверено 26 января 2017 г.
- ^ Дикманн, Дж.; Аппенродт, Н.; Клаппштейн, Дж.; Блохер, Х.Л.; Мюнцигер, М.; Сайлер, А.; Хан, М.; Бренк, К. (01 января 2015 г.). «Заставить Берту видеть еще больше: вклад радара» . Доступ IEEE . 3 : 1233–1247. дои : 10.1109/ACCESS.2015.2454533 . ISSN 2169-3536 .
- ^ Альберт, Джеймс Х. (2016). «Логит, пробит и другие функции ответа». Справочник по теории реагирования на предметы . Том. Два. Чепмен и Холл. стр. 3–22. дои : 10.1201/b19166-1 .
- Берксон, Джозеф (1944). «Применение логистической функции к биоанализу». Журнал Американской статистической ассоциации . 39 (227 (сентябрь)): 357–365. дои : 10.2307/2280041 . JSTOR 2280041 .
- Барнард, Джордж Альфред (1949). «Статистический вывод». Журнал Королевского статистического общества . Б. 11 (2): 115–149. JSTOR 2984075 .
Внешние ссылки
[ редактировать ]Дальнейшее чтение
[ редактировать ]- Эштон, Уинифред Д. (1972). Логит-преобразование: с особым акцентом на его использование в биоанализе . Статистические монографии и курсы Гриффина. Том. 32. Чарльз Гриффин. ISBN 978-0-85264-212-2 .