Субпроизводная

В математике субпроизводные на выпуклые функции , (или субградиент) обобщают производную которые не обязательно дифференцируемы . Совокупность субпроизводных в точке называется субдифференциалом в этой точке. ^[1] Субпроизводные возникают в выпуклом анализе , изучении выпуклых функций , часто в связи с выпуклой оптимизацией .

Позволять $f:I\to \mathbb {R}$ — вещественная выпуклая функция, определенная на отрезке вещественной прямой. Такая функция не обязательно должна быть дифференцируемой во всех точках: например, абсолютного значения функция $f(x)=|x|$ недифференцируемо, когда $x=0$ . Однако, как видно на графике справа (где $f(x)$ синего цвета имеет недифференцируемые изломы, подобные функции абсолютного значения), для любого $x_{0}$ в области определения функции можно провести линию, проходящую через точку $(x_{0},f(x_{0}))$ и который всюду либо касается графика f , либо находится под ним . Наклон такой прямой называется субпроизводной .

Определение [ править ]

Строго говоря, субпроизводная выпуклой функции $f:I\to \mathbb {R}$ в какой-то момент $x_{0}$ в открытом интервале $I$ это действительное число $c$ такой, что

f(x)-f(x_{0})\geq c(x-x_{0})

для всех

x\in I

. Согласно обратной теореме о среднем значении , набор субпроизводных в

x_{0}

для выпуклой функции — непустой замкнутый интервал

[a,b]

, где

a

и

b

односторонние пределы

a=\lim _{x\to x_{0}^{-}}{\frac {f(x)-f(x_{0})}{x-x_{0}}},

b=\lim _{x\to x_{0}^{+}}{\frac {f(x)-f(x_{0})}{x-x_{0}}}.

Интервал

[a,b]

всех субпроизводных называется субдифференциалом функции

f

в

x_{0}

, обозначенный

\partial f(x_{0})

. Если

f

выпукла, то ее субдифференциал в любой точке непуст. Более того, если его субдифференциал в

x_{0}

содержит ровно одну субпроизводную, то

f

дифференцируема в

x_{0}

и

\partial f(x_{0})=\{f'(x_{0})\}

. ^[2]

Пример [ править ]

Рассмотрим функцию $f(x)=|x|$ который является выпуклым. Тогда субдифференциалом в начале координат является интервал $[-1,1]$ . Субдифференциал в любой точке $x_{0}<0$ это одноэлементный набор $\{-1\}$ , а субдифференциал в любой точке $x_{0}>0$ это одноэлементный набор $\{1\}$ . Это похоже на функцию знака , но не является однозначной в $0$ , вместо этого включая все возможные производные.

Свойства [ править ]

Выпуклая функция $f:I\to \mathbb {R}$ дифференцируема в $x_{0}$ тогда и только тогда, когда субдифференциал является одноэлементным множеством, т.е. $\{f'(x_{0})\}$ .
точка $x_{0}$ является глобальным минимумом выпуклой функции $f$ тогда и только тогда, когда нуль содержится в субдифференциале. Например, на рисунке выше можно провести горизонтальную «касательную линию» к графику $f$ в $(x_{0},f(x_{0}))$ . Это последнее свойство является обобщением того факта, что производная функции, дифференцируемой в локальном минимуме, равна нулю.
Если $f$ и $g$ являются выпуклыми функциями с субдифференциалами $\partial f(x)$ и $\partial g(x)$ с $x$ будучи внутренней точкой одной из функций, то субдифференциал $f+g$ является $\partial (f+g)(x)=\partial f(x)+\partial g(x)$ (где оператор сложения обозначает сумму Минковского ). Это звучит так: «Субдифференциал суммы есть сумма субдифференциалов». ^[3]

Субградиент [ править ]

Понятия субпроизводной и субдифференциала можно обобщить на функции нескольких переменных. Если $f:U\to \mathbb {R}$ - вещественная выпуклая функция, определенная на выпуклом открытом множестве в евклидовом пространстве. $\mathbb {R} ^{n}$ , вектор $v$ в этом пространстве называется субградиентом в точке $x_{0}\in U$ если для любого $x\in U$ у одного есть это

f(x)-f(x_{0})\geq v\cdot (x-x_{0}),

где точка обозначает скалярное произведение . Набор всех субградиентов в $x_{0}$ называется субдифференциалом $x_{0}$ и обозначается $\partial f(x_{0})$ . Субдифференциал всегда представляет собой непустой выпуклый компакт .

Эти концепции далее обобщаются на выпуклые функции. $f:U\to \mathbb {R}$ на выпуклом множестве в локально выпуклом пространстве $V$ . Функциональный $v^{*}$ в двойном пространстве $V^{*}$ называется субградиентом в $x_{0}$ в $U$ если для всех $x\in U$ ,

f(x)-f(x_{0})\geq v^{*}(x-x_{0}).

Набор всех субградиентов в $x_{0}$ называется субдифференциалом $x_{0}$ и снова обозначается $\partial f(x_{0})$ . Субдифференциал всегда является выпуклым замкнутым множеством . Это может быть пустой набор; рассмотрим, например, неограниченный оператор , который является выпуклым, но не имеет субградиента. Если $f$ непрерывен, субдифференциал непуст.

История [ править ]

Субдифференциал выпуклых функций был введен Жан-Жаком Моро и Р. Тирреллом Рокафелларом в начале 1960-х годов. Обобщенный субдифференциал для невыпуклых функций был введен Ф. Х. Кларком и Р. Т. Рокафелларом в начале 1980-х годов. ^[4]

См. также [ править ]

Ссылки [ править ]

^ Бубек, С. (2014). Теория выпуклой оптимизации машинного обучения. ArXiv, абс/1405.4980.
^ Рокафеллар, RT (1970). Выпуклый анализ . Издательство Принстонского университета. п. 242 [теорема 25.1]. ISBN 0-691-08069-0 .
^ Лемарешаль, Клод; Хириар-Уррути, Жан-Батист (2001). Основы выпуклого анализа . Шпрингер-Верлаг Берлин Гейдельберг. стр. 183 . ISBN 978-3-642-56468-0 .
^ Кларк, Фрэнк Х. (1983). Оптимизация и негладкий анализ . Нью-Йорк: Джон Уайли и сыновья . стр. xiii+308. ISBN 0-471-87504-Х . МР 0709590 .

Борвейн, Джонатан; Льюис, Адриан С. (2010). Выпуклый анализ и нелинейная оптимизация: теория и примеры (2-е изд.). Нью-Йорк: Спрингер. ISBN 978-0-387-31256-9 .
Хириар-Уррути, Жан-Батист; Лемарешаль, Клод (2001). Основы выпуклого анализа . Спрингер. ISBN 3-540-42205-6 .
Залинеску, К. (2002). Выпуклый анализ в общих векторных пространствах . World Scientific Publishing Co., Inc., стр. xx+367. ISBN 981-238-067-1 . МР 1921556 .

Внешние ссылки [ править ]

«Использование $\lim \limits _{h\to 0}{\frac {f(x+h)-f(x-h)}{2h}}$ « . Stack Exchange . 18 сентября 2011 г.

[1] Бубек, С. (2014). Теория выпуклой оптимизации машинного обучения. ArXiv, абс/1405.4980.

[2] Рокафеллар, RT (1970). Выпуклый анализ . Издательство Принстонского университета. п. 242 [теорема 25.1]. ISBN 0-691-08069-0 .

[3] Лемарешаль, Клод; Хириар-Уррути, Жан-Батист (2001). Основы выпуклого анализа . Шпрингер-Верлаг Берлин Гейдельберг. стр. 183 . ISBN 978-3-642-56468-0 .

[4] Кларк, Фрэнк Х. (1983). Оптимизация и негладкий анализ . Нью-Йорк: Джон Уайли и сыновья . стр. xiii+308. ISBN 0-471-87504-Х . МР 0709590 .

[1]

[2]

[3]

[4]