Jump to content

Рпроп

Rprop , сокращение от отказоустойчивого обратного распространения ошибки обучения , представляет собой эвристику для контролируемого обучения в с прямой связью искусственных нейронных сетях . Это первого порядка оптимизации алгоритм . Этот алгоритм был создан Мартином Ридмиллером и Генрихом Брауном в 1992 году. [1]

Подобно правилу обновления Манхэттена , Rprop учитывает только знак частной производной по всем шаблонам (а не величину) и действует независимо от каждого «веса». Для каждого веса, если произошло изменение знака частной производной функции полной ошибки по сравнению с последней итерацией, значение обновления для этого веса умножается на коэффициент η. , где η < 1. Если последняя итерация дала тот же знак, значение обновления умножается на коэффициент η. + , где η + > 1. Значения обновления рассчитываются для каждого веса указанным выше способом, и, наконец, каждый вес изменяется на свое собственное значение обновления в направлении, противоположном частной производной этого веса, чтобы минимизировать функцию общей ошибки. η + эмпирически установлено равным 1,2 и η до 0,5. [ нужна ссылка ]

Rprop может привести к очень большому увеличению или уменьшению веса, если градиенты велики, что является проблемой при использовании мини-пакетов, а не полных пакетов. RMSprop решает эту проблему, сохраняя скользящее среднее квадратов градиентов для каждого веса и деля градиент на квадратный корень из среднего квадрата. [ нужна ссылка ]

RPROP — это алгоритм пакетного обновления . После алгоритма каскадной корреляции и алгоритма Левенберга-Марквардта Rprop является одним из самых быстрых механизмов обновления веса. [ нужна ссылка ]

Вариации

[ редактировать ]

Мартин Ридмиллер разработал три алгоритма, каждый из которых получил название RPROP. Игель и Хюскен дали им имена и добавили новый вариант: [2] [3]

  1. RPROP+ определен в разделе «Прямой адаптивный метод для более быстрого обучения с обратным распространением ошибки: алгоритм RPROP» . [4]
  2. RPROP- определяется в разделе « Расширенное контролируемое обучение в многослойных персептронах – от обратного распространения ошибки до алгоритмов адаптивного обучения» . Возврат удален из RPROP+. [5]
  3. iRPROP- определен в Rprop – Описание и детали реализации. [6] и был заново изобретен Игелем и Хюскеном. [3] Этот вариант очень популярен и наиболее прост.
  4. iRPROP+ определен в разделе «Улучшение алгоритма обучения Rprop» и очень надежен и обычно быстрее, чем три других варианта. [2] [3]
  1. ^ Мартин Ридмиллер и Генрих Браун: Rprop - алгоритм быстрого адаптивного обучения. Материалы Международного симпозиума по компьютерным и информационным наукам VII, 1992 г.
  2. ^ Перейти обратно: а б Кристиан Игель и Михаэль Хюскен. Улучшение алгоритма обучения Rprop . Второй международный симпозиум по нейронным вычислениям (NC 2000), стр. 115–121, ICSC Academic Press, 2000 г.
  3. ^ Перейти обратно: а б с Кристиан Игель и Михаэль Хюскен. Эмпирическая оценка улучшенного алгоритма обучения Rprop . Нейрокомпьютинг 50:105-123, 2003.
  4. ^ Мартин Ридмиллер и Генрих Браун. Прямой адаптивный метод для более быстрого обучения обратного распространения ошибки: алгоритм Rprop . Труды Международной конференции IEEE по нейронным сетям, 586–591, IEEE Press, 1993.
  5. ^ Мартин Ридмиллер. Расширенное контролируемое обучение в многослойных перцептронах — от обратного распространения ошибки до алгоритмов адаптивного обучения . Компьютерные стандарты и интерфейсы 16 (5), 265–278, 1994 г.
  6. ^ Мартин Ридмиллер. Rprop — Описание и детали реализации . Технический отчет, 1994 г.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 6bfab9760d0a2374e4984f112028cfbc__1718065440
URL1:https://arc.ask3.ru/arc/aa/6b/bc/6bfab9760d0a2374e4984f112028cfbc.html
Заголовок, (Title) документа по адресу, URL1:
Rprop - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)