Jump to content

Субпроизводная

(Перенаправлено с Субградиента )
Выпуклая функция (синяя) и «касательные линии» в точке (красный).

В математике субпроизводные на выпуклые функции , (или субградиент) обобщают производную которые не обязательно дифференцируемы . Совокупность субпроизводных в точке называется субдифференциалом в этой точке. [1] Субпроизводные возникают в выпуклом анализе , изучении выпуклых функций , часто в связи с выпуклой оптимизацией .

Позволять вещественная выпуклая функция, определенная на отрезке вещественной прямой. Такая функция не обязательно должна быть дифференцируемой во всех точках: например, абсолютного значения функция недифференцируемо, когда . Однако, как видно на графике справа (где синего цвета имеет недифференцируемые изломы, подобные функции абсолютного значения), для любого в области определения функции можно провести линию, проходящую через точку и который всюду либо касается графика f , либо находится под ним . Наклон такой прямой называется субпроизводной .

Определение [ править ]

Строго говоря, субпроизводная выпуклой функции в какой-то момент в открытом интервале это действительное число такой, что

для всех . Согласно обратной теореме о среднем значении , набор субпроизводных в для выпуклой функции — непустой замкнутый интервал , где и односторонние пределы
Интервал всех субпроизводных называется субдифференциалом функции в , обозначенный . Если выпукла, то ее субдифференциал в любой точке непуст. Более того, если его субдифференциал в содержит ровно одну субпроизводную, то дифференцируема в и . [2]

Пример [ править ]

Рассмотрим функцию который является выпуклым. Тогда субдифференциалом в начале координат является интервал . Субдифференциал в любой точке это одноэлементный набор , а субдифференциал в любой точке это одноэлементный набор . Это похоже на функцию знака , но не является однозначной в , вместо этого включая все возможные производные.

Свойства [ править ]

  • Выпуклая функция дифференцируема в тогда и только тогда, когда субдифференциал является одноэлементным множеством, т.е. .
  • точка является глобальным минимумом выпуклой функции тогда и только тогда, когда нуль содержится в субдифференциале. Например, на рисунке выше можно провести горизонтальную «касательную линию» к графику в . Это последнее свойство является обобщением того факта, что производная функции, дифференцируемой в локальном минимуме, равна нулю.
  • Если и являются выпуклыми функциями с субдифференциалами и с будучи внутренней точкой одной из функций, то субдифференциал является (где оператор сложения обозначает сумму Минковского ). Это звучит так: «Субдифференциал суммы есть сумма субдифференциалов». [3]

Субградиент [ править ]

Понятия субпроизводной и субдифференциала можно обобщить на функции нескольких переменных. Если - вещественная выпуклая функция, определенная на выпуклом открытом множестве в евклидовом пространстве. , вектор в этом пространстве называется субградиентом в точке если для любого у одного есть это

где точка обозначает скалярное произведение . Набор всех субградиентов в называется субдифференциалом и обозначается . Субдифференциал всегда представляет собой непустой выпуклый компакт .

Эти концепции далее обобщаются на выпуклые функции. на выпуклом множестве в локально выпуклом пространстве . Функциональный в двойном пространстве называется субградиентом в в если для всех ,

Набор всех субградиентов в называется субдифференциалом и снова обозначается . Субдифференциал всегда является выпуклым замкнутым множеством . Это может быть пустой набор; рассмотрим, например, неограниченный оператор , который является выпуклым, но не имеет субградиента. Если непрерывен, субдифференциал непуст.

История [ править ]

Субдифференциал выпуклых функций был введен Жан-Жаком Моро и Р. Тирреллом Рокафелларом в начале 1960-х годов. Обобщенный субдифференциал для невыпуклых функций был введен Ф. Х. Кларком и Р. Т. Рокафелларом в начале 1980-х годов. [4]

См. также [ править ]

Ссылки [ править ]

  1. ^ Бубек, С. (2014). Теория выпуклой оптимизации машинного обучения. ArXiv, абс/1405.4980.
  2. ^ Рокафеллар, RT (1970). Выпуклый анализ . Издательство Принстонского университета. п. 242 [теорема 25.1]. ISBN  0-691-08069-0 .
  3. ^ Лемарешаль, Клод; Хириар-Уррути, Жан-Батист (2001). Основы выпуклого анализа . Шпрингер-Верлаг Берлин Гейдельберг. стр. 183 . ISBN  978-3-642-56468-0 .
  4. ^ Кларк, Фрэнк Х. (1983). Оптимизация и негладкий анализ . Нью-Йорк: Джон Уайли и сыновья . стр. xiii+308. ISBN  0-471-87504-Х . МР   0709590 .
  • Борвейн, Джонатан; Льюис, Адриан С. (2010). Выпуклый анализ и нелинейная оптимизация: теория и примеры (2-е изд.). Нью-Йорк: Спрингер. ISBN  978-0-387-31256-9 .
  • Хириар-Уррути, Жан-Батист; Лемарешаль, Клод (2001). Основы выпуклого анализа . Спрингер. ISBN  3-540-42205-6 .
  • Залинеску, К. (2002). Выпуклый анализ в общих векторных пространствах . World Scientific Publishing Co., Inc., стр. xx+367. ISBN  981-238-067-1 . МР   1921556 .

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: d22242a6925c9475df4d51c301285829__1710243600
URL1:https://arc.ask3.ru/arc/aa/d2/29/d22242a6925c9475df4d51c301285829.html
Заголовок, (Title) документа по адресу, URL1:
Subderivative - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)