Jump to content

Софтплюс

График функции softplus и функции линейного изменения .

В математике и обучении функция softplus машинном

Это плавное приближение (по сути, аналитическая функция ) к функции линейного изменения , которая в машинном обучении известна как выпрямитель или ReLU (выпрямленная линейная единица) . Для большого негатива это , то есть чуть выше 0, а для больших положительных это , так чуть выше .

Имена софтплюс [1] [2] и ГладРеЛУ [3] используются в машинном обучении. Название «softplus» (2000), по аналогии с более ранним softmax (1989), предположительно связано с тем, что это плавное ( мягкое ) приближение положительной части x , которое иногда обозначается надстрочным индексом plus , .

[ редактировать ]

Производная softplus — это логистическая функция :

Логистическая сигмоидальная функция представляет собой гладкую аппроксимацию производной выпрямителя, ступенчатой ​​функции Хевисайда .

ЛогСумЭксп

[ редактировать ]

Многопараметрическим обобщением softplus с одной переменной является LogSumExp с первым аргументом, установленным в ноль:

Функция LogSumExp

и его градиент — softmax ; softmax с первым аргументом, равным нулю, представляет собой многовариантное обобщение логистической функции. И LogSumExp, и softmax используются в машинном обучении.

Выпуклое сопряжение

[ редактировать ]

Выпуклое сопряжение (в частности, преобразование Лежандра ) функции softplus представляет собой отрицательную двоичную энтропию (с основанием e ). Это связано с тем, что (согласно определению преобразования Лежандра: производные являются обратными функциями) производная softplus — это логистическая функция, обратной функцией которой является logit , которая является производной отрицательной двоичной энтропии.

Softplus можно интерпретировать как логистические потери (как положительное число), поэтому в соответствии с двойственностью минимизация логистических потерь соответствует максимизации энтропии. Это оправдывает принцип максимальной энтропии как минимизации потерь.

Альтернативные формы

[ редактировать ]

Эту функцию можно аппроксимировать следующим образом:

Сделав замену переменных , это эквивалентно

Параметр резкости могут быть включены:

  1. ^ Дугас, Чарльз; Бенджио, Йошуа; Белиль, Франсуа; Надо, Клод; Гарсия, Рене (2000). «Включение функциональных знаний второго порядка для лучшего ценообразования опционов» (PDF) . Материалы 13-й Международной конференции по нейронным системам обработки информации (NIPS'00) . Массачусетский технологический институт Пресс: 451–457. Поскольку сигмоида h имеет положительную первую производную, ее примитивная форма, которую мы называем softplus, является выпуклой.
  2. ^ Ксавье Глорот; Антуан Борд; Йошуа Бенджио (2011). Нейронные сети с глубоким разреженным выпрямителем (PDF) . АЙСТАТС. Функции активации выпрямителя и softplus. Второй вариант является более гладкой версией первого.
  3. ^ «Прямой уровень линейного блока плавного выпрямителя (SmoothReLU)» . Руководство разработчика по библиотеке ускорения Intel Data Analytics . 2017 . Проверено 4 декабря 2018 г.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 347577e3de729277bf03b4ceefb15cc4__1721177460
URL1:https://arc.ask3.ru/arc/aa/34/c4/347577e3de729277bf03b4ceefb15cc4.html
Заголовок, (Title) документа по адресу, URL1:
Softplus - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)