Категория : Обучение с подкреплением
Обучение с подкреплением (RL) — это область машинного обучения, связанная с тем, как программные агенты должны действовать в среде, чтобы максимизировать некоторое понятие совокупного вознаграждения.
Страницы в категории «Обучение с подкреплением»
Следующие 12 страниц относятся к этой категории из 12. Этот список может не отражать недавние изменения .