Jump to content

Плавный максимум

В математике индексированного гладкий максимум семейства чисел x 1 , ..., x n является гладким приближением к максимума . функции имеется в виду параметрическое семейство функций такой, что для любого α функция является гладким, и семейство сходится к максимальной функции как . понятие гладкого минимума Аналогично определяется . Во многих случаях одно семейство аппроксимирует оба: максимум, когда параметр стремится к положительной бесконечности, минимум, когда параметр стремится к отрицательной бесконечности; в символах, как и как . Этот термин также можно свободно использовать для обозначения конкретной гладкой функции, которая ведет себя аналогично максимуму, не обязательно являясь частью параметризованного семейства.

Больцмановский оператор

[ редактировать ]
Smoothmax (-x, x) в зависимости от x для различных значений параметров. Очень гладкий для =0,5 и более резким для =8.

При больших положительных значениях параметра , следующая формулировка представляет собой гладкую дифференцируемую аппроксимацию максимальной функции. При больших по абсолютной величине отрицательных значениях параметра он приближается к минимуму.

имеет следующие свойства:

  1. как
  2. это среднее арифметическое его входов
  3. как

Градиент тесно связан с softmax и определяется выражением

Это делает функцию softmax полезной для методов оптимизации, использующих градиентный спуск .

Этот оператор иногда называют оператором Больцмана. [1] после распределения Больцмана .

ЛогСумЭксп

[ редактировать ]

Еще один плавный максимум — LogSumExp :

Это также можно нормализовать, если все неотрицательны, что дает функцию с областью определения и диапазон :

The термин корректирует тот факт, что путем отмены всех экспонент, кроме одной нулевой, и если все равны нулю.

Меллоумакс

[ редактировать ]

Оператор mellowmax [1] определяется следующим образом:

Это нерасширяющийся оператор. Как , он действует как максимум. Как , оно действует как среднее арифметическое. Как , он действует как минимум. Этот оператор можно рассматривать как конкретную реализацию среднего квазиарифметического значения . Его также можно вывести из принципов теории информации как способа регуляризации политики с функцией затрат, определяемой дивергенцией KL. Ранее оператор использовался в других областях, например, в энергетике. [2]

Еще один плавный максимум — это p-норма :

который сходится к как .

Преимущество p-нормы в том, что это норма . По существу, он масштабно-инвариантен ( однороден ): , и оно удовлетворяет неравенству треугольника .

Гладкая максимальная единица

[ редактировать ]

Следующий бинарный оператор называется гладкой максимальной единицей (SMU): [3]

где является параметром. Как , и таким образом .

См. также

[ редактировать ]
  1. ^ Перейти обратно: а б Асади, Кавош; Литтман, Майкл Л. (2017). «Альтернативный оператор Softmax для обучения с подкреплением» . ПМЛР . 70 : 243–252. arXiv : 1612.05628 . Проверено 6 января 2023 г.
  2. ^ Сафак, Айсель (февраль 1993 г.). «Статистический анализ суммы степеней нескольких коррелированных логнормальных компонентов» . Транзакции IEEE по автомобильным технологиям . 42 (1): {58–61. дои : 10.1109/25.192387 . Проверено 6 января 2023 г.
  3. ^ Бисвас, Кошик; Кумар, Сандип; Банерджи, Шилпак; Ашиш Кумар Пандей (2021). «SMU: функция плавной активации для глубоких сетей с использованием техники максимального сглаживания». arXiv : 2111.04682 [ cs.LG ].

https://www.johndcook.com/soft_maximum.pdf

М. Ланге, Д. Зюльке, О. Хольц и Т. Виллманн, «Применение lp-норм и их гладких аппроксимаций для градиентного векторного квантования обучения», в Proc. ЕСАНН , апрель 2014 г., стр. 271–276.( https://www.elen.ucl.ac.be/Proceedings/esann/esannpdf/es2014-153.pdf )

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 96f09454641916b76735f27d3a57db97__1688621880
URL1:https://arc.ask3.ru/arc/aa/96/97/96f09454641916b76735f27d3a57db97.html
Заголовок, (Title) документа по адресу, URL1:
Smooth maximum - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)