Jump to content

Управление машинным обучением

Управление машинным обучением ( MLC ) — это раздел машинного обучения , интеллектуального управления и теории управления. который решает задачи оптимального управления методами машинного обучения .Ключевые приложения — сложные нелинейные системы.для которых методы линейной теории управления неприменимы.

Виды проблем и задач [ править ]

Обычно встречаются четыре типа проблем.

  • Идентификация параметров управления: MLC преобразуется в идентификацию параметров. [1] если структура закона управления задана, но параметры неизвестны. Одним из примеров является генетический алгоритм оптимизации коэффициентов ПИД-регулятора. [2] или оптимальное управление с дискретным временем. [3]
  • Проектирование управления как задача регрессии первого рода: MLC аппроксимирует общее нелинейное отображение сигналов датчиков на команды срабатывания, если сигналы датчиков и оптимальная команда срабатывания известны для каждого состояния. Одним из примеров является вычисление обратной связи датчика на основе известной обратной связи полного состояния . Нейронная сеть обычно используется для этой задачи. [4]
  • Проектирование управления как проблема регрессии второго рода: MLC может также идентифицировать произвольные нелинейные законы управления, которые минимизируют функцию стоимости объекта. При этом не требуется знать ни модель, ни структуру закона управления, ни оптимизирующую команду срабатывания. Оптимизация основана только на эффективности управления (функция стоимости), измеренной на предприятии. Генетическое программирование — мощный метод регрессии для этой цели. [5]
  • Управление обучением с подкреплением. Закон управления может постоянно обновляться в зависимости от измеренных изменений производительности (вознаграждений) с использованием обучения с подкреплением . [6]

MLC включает в себя, например, управление нейронной сетью, управление на основе генетических алгоритмов, генетический программный контроль,контроль обучения с подкреплением, и имеет методологическое совпадение с другими видами контроля, основанными на данных,как искусственный интеллект и управление роботами .

Приложения [ править ]

MLC был успешно примененко многим задачам нелинейного управления,исследование неизвестных и часто неожиданных механизмов срабатывания.Примеры приложений включают в себя

Что касается всех общих нелинейных методов,MLC не обеспечивает гарантированной сходимости. оптимальность или надежность для широкого диапазона условий эксплуатации.

Ссылки [ править ]

  1. ^ Томас Бек и Ханс-Пол Швефель (весна 1993 г.) «Обзор эволюционных алгоритмов оптимизации параметров» , Journal of Evolutionary Computation (MIT Press) , vol. 1, нет. 1, стр. 1-23
  2. Перейти обратно: Перейти обратно: а б Н. Бенар, Ж. Понс-Пра, Ж. Перио, Ж. Бугеда, Ж.-П. Бонне и Э. Моро, (2015) «Многовходной генетический алгоритм для экспериментальной оптимизации повторного присоединения после обратной ступени с поверхностным плазменным приводом» , статья AIAA 2015-2957 на 46-й конференции AIAA по плазмодинамике и лазерам, Даллас, Техас , США, стр. 1–23.
  3. ^ Збигнев Михалевич, Цезарь З. ​​Яников и Яцек Б. Кравчик (июль 1992 г.) «Модифицированный генетический алгоритм для задач оптимального управления» , [Компьютеры и математика с приложениями], том. 23, № 12, с. 83-94.
  4. ^ К. Ли, Дж. Ким, Д. Бэбкок и Р. Гудман (1997) «Применение нейронных сетей для управления турбулентностью для уменьшения сопротивления» , Physics of Fluids , vol. 6, нет. 9, стр. 1740-1747 гг.
  5. ^ DC Дракопулос и С. Кент (декабрь 1997 г.) «Генетическое программирование для прогнозирования и контроля» , Neural Computing & Applications (Springer), vol. 6, нет. 4, стр. 214–228.
  6. ^ Эндрю Г. Барто (декабрь 1994 г.) «Контроль обучения с подкреплением» , Current Opinion in Neurobiology , vol. 6, нет. 4, стр. 888–893.
  7. ^ Димитрис. К. Дракопулос и Антония. Дж. Джонс (1994) Нейрогенетический адаптивный контроль ориентации , Neural Computing & Applications (Springer), vol. 2, нет. 4, стр. 183-204.
  8. ^ Джонатан А. Райт, Хизер А. Лусмор и Разие Фармани (2002) «Оптимизация теплового проектирования и управления зданием с помощью многокритериального генетического алгоритма» , [Энергия и здания], том 34, № 9, стр. 959-972 .
  9. ^ Стивен Дж. Брантон и Бернд Р. Ноак (2015) Управление турбулентностью с обратной связью: прогресс и проблемы , Обзоры прикладной механики , том. 67, нет. 5, статья 050801, стр. 1-48.
  10. ^ Дж. Джавади-Могаддам и А. Багери (2010 «Адаптивная система управления генетическими алгоритмами на основе нейро-нечеткого скользящего режима для подводного корабля с дистанционным управлением» , Expert Systems with Applications , том 37, № 1, стр. 647- 660.
  11. ^ Питер Дж. Флеминг, RC Purshouse (2002 «Эволюционные алгоритмы в разработке систем управления: обзор» Control Engineering Practice , том 10, № 11, стр. 1223-1241)

Дальнейшее чтение [ править ]

  • Димитрис К. Дракопулос (август 1997 г.) «Алгоритмы эволюционного обучения для нейронного адаптивного управления» , Springer. ISBN   978-3-540-76161-7 .
  • Томас Дюрье, Стивен Л. Брантон и Бернд Р. Ноак (ноябрь 2016 г.) «Управление машинным обучением — укрощение нелинейной динамики и турбулентности» , Springer. ISBN   978-3-319-40624-4 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 67ff11e295a04c336c7182cf3665ba02__1696386600
URL1:https://arc.ask3.ru/arc/aa/67/02/67ff11e295a04c336c7182cf3665ba02.html
Заголовок, (Title) документа по адресу, URL1:
Machine learning control - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)