Jump to content

Выбор на основе вознаграждения

Отбор на основе вознаграждения — это метод, используемый в эволюционных алгоритмах для выбора потенциально полезных решений для рекомбинации. Вероятность быть выбранным для человека пропорциональна совокупному вознаграждению, полученному этим человеком. Совокупное вознаграждение может быть рассчитано как сумма индивидуального вознаграждения и вознаграждения, унаследованного от родителей.

Описание [ править ]

Выбор на основе вознаграждения можно использовать в рамках многорукого бандита для многоцелевой оптимизации, чтобы получить лучшее приближение к фронту Парето . [1]

Новорожденный и его родители получают вознаграждение , если был выбран для новой популяции , в противном случае награда равна нулю. Возможны несколько определений вознаграждения:

  • 1. , если новорожденная особь был выбран для новой популяции .
  • 2. , где - это ранг вновь добавленного индивидуума в популяцию лица. Ранг можно вычислить, используя хорошо известную процедуру недоминируемой сортировки . [2]
  • 3. , где - вклад индикатора гиперобъема отдельного человека населению . Награда если вновь добавленная особь улучшит качество популяции, которое измеряется как ее гиперобъемный вклад в объективное пространство.
  • 4. Ослабление вышеуказанного вознаграждения, предполагающее наложение штрафных очков в зависимости от ранга за -й преобладающий фронт Парето:

Отбор, основанный на вознаграждении, может быстро определить наиболее плодотворные направления поиска за счет максимизации совокупного вознаграждения отдельных лиц.

См. также [ править ]

Ссылки [ править ]

  1. ^ Лощилов И.; М. Шенауэр; М. Себаг (2011). «Не все родители равны для MO-CMA-ES» (PDF) . Эволюционная многокритериальная оптимизация 2011 (EMO 2011) . Springer Verlag, LNCS 6576. стр. 31–45. Архивировано из оригинала (PDF) 4 июня 2012 г.
  2. ^ Деб, К.; Пратап, А.; Агарвал, С.; Мейариван, Т. (2002). «Быстрый и элитарный многоцелевой генетический алгоритм: NSGA-II». Транзакции IEEE в эволюционных вычислениях . 6 (2): 182–197. CiteSeerX   10.1.1.17.7771 . дои : 10.1109/4235.996017 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 05e80e6c415e7d41ff09a80c098e945e__1695924120
URL1:https://arc.ask3.ru/arc/aa/05/5e/05e80e6c415e7d41ff09a80c098e945e.html
Заголовок, (Title) документа по адресу, URL1:
Reward-based selection - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)