Jump to content

Теория двойного управления

Теория двойного управления — это раздел теории управления , изучающий управление системами, характеристики которых изначально неизвестны. [1] [2] Ее называют двойной , потому что при управлении такой системой контролер преследует двоякую цель:

  • (1) Действие : максимально эффективно управлять системой на основе текущих знаний о системе.
  • (2) Исследование : экспериментировать с системой, чтобы узнать о ее поведении и лучше контролировать ее в будущем.

Эти две цели могут частично противоречить друг другу.В контексте обучения с подкреплением это известно как компромисс между исследованием и эксплуатацией (например, « Многорукий бандит#Эмпирическая мотивация »).

Теория двойного управления была разработана Александром Ароновичем Фельдбаумом в 1960 году. Он показал, что в принципе оптимальное решение можно найти с помощью динамического программирования , но это часто непрактично; в результате был разработан ряд методов разработки неоптимальных двойных контроллеров.

Проведем аналогию : если вы едете на новой машине, вы хотите добраться до пункта назначения дешево и плавно, но вы также хотите увидеть, насколько хорошо машина разгоняется, тормозит и управляется, чтобы лучше почувствовать, как ею управлять. , поэтому для этой цели вы проделаете несколько тестовых маневров. Аналогичным образом, двойной контроллер подает в систему так называемый зондирующий (или исследовательский) сигнал, который может ухудшить краткосрочные характеристики, но улучшит управление в будущем.

  1. ^ Фельдбаум, Н. А. (1 июня 1963 г.). «Задачи теории двойного управления». Тома трудов МФБ . 2-й Международный конгресс МФБ по автоматическому и дистанционному управлению: теория, Базель, Швейцария, 1963. 1 (2): 541–550. дои : 10.1016/S1474-6670(17)69687-3 . ISSN   1474-6670 .
  2. ^ Чен, Вэнь-Хуа; Роудс, Каллум; Лю, Цунцзя (01 ноября 2021 г.). «Двойной контроль эксплуатации и исследования (DCEE) при автономном поиске» (PDF) . Автоматика . 133 : 109851. doi : 10.1016/j.automatica.2021.109851 . ISSN   0005-1098 . S2CID   228372721 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: b86eb7e35cc0cde5e1bfbc648464ddcd__1704898140
URL1:https://arc.ask3.ru/arc/aa/b8/cd/b86eb7e35cc0cde5e1bfbc648464ddcd.html
Заголовок, (Title) документа по адресу, URL1:
Dual control theory - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)