Jump to content

Логсумэксп

LogSumExp ( LSE ) (также называемый RealSoftMax [1] или multivariable softplus ) функция представляет собой гладкий максимум плавное приближение к функции максимума , в основном используемое алгоритмами машинного обучения . [2] Он определяется как логарифм суммы экспонент аргументов:

Характеристики

[ редактировать ]

LogSumExp: Область применения функции , реальное координатное пространство и его кодомен , реальная линия . Это приближение к максимуму со следующими границами Первое неравенство является строгим, если только . Второе неравенство является строгим, если все аргументы не равны.(Доказательство: Пусть . Затем . Применение логарифма к неравенству дает результат.)

Кроме того, мы можем масштабировать функцию, чтобы сделать границы более жесткими. Рассмотрим функцию . Затем (Доказательство: заменить каждый с для некоторых в приведенных выше неравенствах, чтобы дать и, поскольку наконец, разделив на дает результат.)

Кроме того, если вместо этого мы умножим на отрицательное число, мы, конечно, найдем сравнение с функция:

Функция LogSumExp является выпуклой и строго возрастает всюду в своей области определения. [3] Он не является строго выпуклым, поскольку аффинен ( линейен плюс константа) на диагональных и параллельных прямых: [4]

В остальном, кроме этого направления, оно строго выпуклое ( гессиан имеет ранг ), поэтому, например, ограничение гиперплоскостью , трансверсальной диагонали, приводит к строго выпуклой функции. Видеть , ниже.

Письмо частные производные : это означает, что градиент LogSumExp является функцией softmax .

Выпуклое сопряжение LogSumExp — это отрицательная энтропия .

трюк с log-sum-exp для вычислений в логарифмической области

[ редактировать ]

Функция LSE часто встречается, когда обычные арифметические вычисления выполняются в логарифмическом масштабе , например, в логарифмической вероятности . [5]

Подобно тому, как операции умножения в линейном масштабе становятся простыми сложениями в логарифмическом масштабе, операция сложения влинейный масштаб становится LSE в логарифмическом масштабе:

Общей целью использования вычислений в логарифмической области является повышение точности и избежание проблем с переполнением и переполнением.когда очень маленькие или очень большие числа представляются напрямую (т. е. в линейной области) с использованием ограниченной точностичисла с плавающей запятой. [6]

К сожалению, использование LSE напрямую в этом случае может снова вызвать проблемы с переполнением/недополнением. Таким образом,Вместо этого необходимо использовать следующий эквивалент (особенно, если точность приведенного выше приближения «max» недостаточна).

где

Многие математические библиотеки, такие как IT++, предоставляют стандартную процедуру LSE и используют эту формулу внутри себя.

Строго выпуклая функция типа log-sum-exp.

[ редактировать ]

LSE выпукла, но не строго выпукла.Мы можем определить строго выпуклую функцию типа log-sum-exp [7] добавив дополнительный аргумент, равный нулю:

Эта функция является собственным генератором Брегмана (строго выпуклым и дифференцируемым ). Он встречается, например, в машинном обучении как кумулянт полиномиального/биномиального семейства.

В тропическом анализе это сумма в лог-полукольце .

См. также

[ редактировать ]
  1. ^ Чжан, Астон; Липтон, Зак; Ли, Му; Смола, Алекс. «Погружение в глубокое обучение, упражнения главы 3» . www.d2l.ai. ​Проверено 27 июня 2020 г.
  2. ^ Нильсен, Франк; Сунь, Ке (2016). «Гарантированные границы расходимости Кульбака-Лейблера одномерных смесей с использованием кусочных неравенств логарифмической суммы-эксперимента» . Энтропия . 18 (12): 442. arXiv : 1606.05850 . Бибкод : 2016Entrp..18..442N . дои : 10.3390/e18120442 . S2CID   17259055 .
  3. ^ Эль Гауи, Лоран (2017). Модели оптимизации и приложения .
  4. ^ «Выпуклый анализ — О строгой выпуклости функции log-sum-exp — Математический Stack Exchange» . stackexchange.com .
  5. ^ МакЭлрит, Ричард. Статистическое переосмысление . OCLC   1107423386 .
  6. ^ «Практические вопросы: Числовая устойчивость» . CS231n Сверточные нейронные сети для визуального распознавания .
  7. ^ Нильсен, Франк; Хаджерес, Гаэтан (2018). «Информационная геометрия Монте-Карло: двойной плоский случай». arXiv : 1803.07225 [ cs.LG ].


Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 26402cd06a09892a04ee00248c5bf7ab__1719163260
URL1:https://arc.ask3.ru/arc/aa/26/ab/26402cd06a09892a04ee00248c5bf7ab.html
Заголовок, (Title) документа по адресу, URL1:
LogSumExp - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)