Jump to content

Логарифм вероятности

В теории вероятностей и информатике логарифм вероятности это просто логарифм вероятности . [1] Использование логарифмических вероятностей означает представление вероятностей в логарифмическом масштабе. , вместо стандартного единичный интервал .

Поскольку вероятности независимых событий умножаются, а логарифмы преобразуют умножение в сложение, логарифмические вероятности независимых событий складываются. Таким образом, логарифмические вероятности практичны для вычислений и имеют интуитивную интерпретацию с точки зрения теории информации : отрицательное ожидаемое значение логарифмических вероятностей представляет собой информационную энтропию события. Точно так же вероятности часто преобразуются в логарифмическую шкалу, и соответствующую логарифмическую вероятность можно интерпретировать как степень, в которой событие поддерживает статистическую модель . Логарифмическая вероятность широко используется в реализациях вероятностных вычислений и изучается как отдельная концепция в некоторых приложениях теории информации, таких как обработка естественного языка .

Мотивация

[ редактировать ]

Представление вероятностей таким способом имеет несколько практических преимуществ:

  1. Скорость. Поскольку умножение обходится дороже, чем сложение, произведение большого количества вероятностей часто происходит быстрее, если они представлены в логарифмической форме. (Преобразование в форму журнала является дорогостоящим, но производится только один раз.) Умножение возникает в результате расчета вероятности возникновения нескольких независимых событий: вероятность того, что все независимые события, представляющие интерес, произойдут, является произведением вероятностей всех этих событий.
  2. Точность. Использование логарифмических вероятностей повышает числовую стабильность , когда вероятности очень малы, из-за того, как компьютеры аппроксимируют действительные числа . [1]
  3. Простота. Многие распределения вероятностей имеют экспоненциальную форму. Логарифм этих распределений исключает экспоненциальную функцию, разворачивая экспоненту. Например, логарифмическая вероятность функции плотности вероятности нормального распределения равна вместо . Логарифмические вероятности облегчают выполнение некоторых математических манипуляций.
  4. Оптимизация. Поскольку наиболее распространенные распределения вероятностей — особенно экспоненциальное семейство — являются только логарифмически вогнутыми , [2] [3] а вогнутость целевой функции играет ключевую роль в максимизации такой функции, как вероятность, оптимизаторы лучше работают с логарифмическими вероятностями.

Проблемы представительства

[ редактировать ]

Функция логарифма не определена для нуля, поэтому логарифмические вероятности могут представлять только ненулевые вероятности. Поскольку логарифм числа в интервал отрицательный, часто используются отрицательные логарифмические вероятности. В этом случае логарифмические вероятности в следующих формулах будут инвертированы .

Для логарифма можно выбрать любое основание.

Основные манипуляции

[ редактировать ]

В этом разделе мы будем называть вероятности в логарифмическом пространстве. и для краткости:

Произведение вероятностей соответствует сложению в логарифмическом пространстве.

Сумма вероятностей немного сложнее вычислить в логарифмическом пространстве, требуя вычисления одной экспоненты и одного логарифма.

Однако во многих приложениях умножение вероятностей (дающее вероятность наступления всех независимых событий) используется чаще, чем их сложение (дающее вероятность наступления хотя бы одного из взаимоисключающих событий). Кроме того, в некоторых ситуациях можно избежать затрат на вычисление сложения, просто используя в качестве приближения наибольшую вероятность. Поскольку вероятности неотрицательны, это дает нижнюю оценку. Это приближение используется в обратном порядке, чтобы получить непрерывное приближение функции max .

Дополнение в пространстве журнала

[ редактировать ]

Приведенная выше формула является более точной, чем , если воспользоваться асимметрией формулы сложения. должен быть большим (наименее отрицательным) из двух операндов. Это также приводит к правильному поведению, если один из операндов имеет значение с плавающей запятой отрицательной бесконечности , что соответствует нулевой вероятности.

Эта величина неопределенна и в результате будет равна NaN .
Это желаемый ответ.

Сама по себе приведенная выше формула неправильно даст неопределенный результат в случае, когда оба аргумента равны. . Это следует проверить отдельно, чтобы вернуть .

По численным причинам следует использовать функцию, которая вычисляет ( log1p ) напрямую.

См. также

[ редактировать ]
  1. ^ Jump up to: а б Пих, Крис. «Вероятность для компьютерщиков — Логарифм вероятностей» . Проверено 20 июля 2023 г.
  2. ^ Касс, Роберт Э.; Вос, Пол В. (1997). Геометрические основы асимптотического вывода . Нью-Йорк: Джон Уайли и сыновья. п. 14. ISBN  0-471-82668-5 .
  3. ^ Пападопулос, Алекос (25 сентября 2013 г.). «Почему мы всегда помещаем log() перед совместным PDF-файлом, когда используем MLE (оценка максимального правдоподобия)?» . Обмен стеками .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 0dab2c0880799142af0bd6f6215a5514__1718264820
URL1:https://arc.ask3.ru/arc/aa/0d/14/0dab2c0880799142af0bd6f6215a5514.html
Заголовок, (Title) документа по адресу, URL1:
Log probability - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)