Jump to content

Структурная минимизация рисков

Структурная минимизация риска (SRM) — индуктивный принцип использования в машинном обучении . Обычно в машинном обучении обобщенную модель необходимо выбирать из конечного набора данных, что приводит к проблеме переоснащения — модель становится слишком сильно адаптированной к особенностям обучающего набора и плохо обобщается на новые данные. Принцип SRM решает эту проблему, балансируя между сложностью модели и ее успешностью при подборе обучающих данных. Этот принцип был впервые изложен в книге 1974 года. [1] Владимиром Вапником и Алексеем Червоненкисом и использует измерение венчурного капитала .

На практике минимизация структурного риска реализуется путем минимизации , где – ошибка поезда, функция называется функцией регуляризации, а является константой. выбирается так, что принимает большие значения параметров которые принадлежат подмножествам пространства параметров высокой емкости. Минимизация по сути, ограничивает емкость доступных подмножеств пространства параметров, тем самым контролируя компромисс между минимизацией ошибки обучения и минимизацией ожидаемого разрыва между ошибкой обучения и ошибкой теста. [2]

Проблему SRM можно сформулировать в терминах данных. Учитывая n точек данных, состоящих из данных x и меток y, цель часто выражается следующим образом:

Первый член представляет собой среднеквадратичную ошибку (MSE) между значением изученной модели, , и данные метки . Этот член является ошибкой обучения, , об этом говорилось ранее. Второй член ставит априор над весами, чтобы способствовать разреженности и наказывать большие веса. Коэффициент компромисса, , — это гиперпараметр, который придает большее или меньшее значение термину регуляризации. Больше поощряет более редкие веса за счет более оптимального MSE и меньшего ослабляет регуляризацию, позволяя модели соответствовать данным. Обратите внимание, что как веса становятся равными нулю, и так как , модель обычно страдает от переобучения.


См. также [ править ]

Ссылки [ править ]

  1. ^ Vapnik, V. N.; Chervonenkis, A. Ya. (1974). Teoriya raspoznavaniya obrazov [ Theory of Pattern Recognition ] (in Russian). Nauka, Moscow.
  2. ^ ЛеКун, Янн. «Градиентное обучение, применяемое для распознавания документов» (PDF) .

Внешние ссылки [ править ]


Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: f21fb041565912f6e0b6890e289cefae__1705973160
URL1:https://arc.ask3.ru/arc/aa/f2/ae/f21fb041565912f6e0b6890e289cefae.html
Заголовок, (Title) документа по адресу, URL1:
Structural risk minimization - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)