Jump to content

Оффлайн обучение

В машинном обучении системы, использующие автономное обучение, не меняют свою аппроксимацию целевой функции после завершения начальной фазы обучения. [1]

В то время как при онлайн-обучении известен только набор возможных элементов, при офлайн-обучении учащемуся известны личность элементов, а также порядок их представления. [2]

Приложения для управления робототехникой

[ редактировать ]

Способность роботов учиться равна созданию таблицы (информации) , заполненной значениями. Одним из способов сделать это является программирование путем демонстрации . Здесь таблица заполнена значениями учителем-человеком. Демонстрация осуществляется либо в виде прямой политики числового управления , равной траектории, либо в виде косвенной целевой функции . заранее заданной [3]

Офлайн-обучение работает в пакетном режиме . На шаге 1 задача демонстрируется и сохраняется в таблице, а на шаге 2 задача воспроизводится роботом. [4] Конвейер медленный и неэффективный, поскольку между демонстрацией поведения и воспроизведением навыков существует задержка. [5] [6]

Короткий пример поможет понять идею. Предположим, робот должен изучить задачу следования за стеной , а внутренняя таблица робота пуста. Прежде чем робот будет активирован в режиме воспроизведения, человек-демонстратор должен научить его поведению. Он управляет роботом с помощью телеуправления , и на этапе обучения создается таблица навыков. Этот процесс называется автономным, поскольку программное обеспечение для управления роботом ничего не делает, а человек-оператор использует устройство в качестве указательного устройства для движения вдоль стены. [6]

См. также

[ редактировать ]
  1. ^ Бишоп, Кристофер М. (17 августа 2006 г.). Распознавание образов и машинное обучение . Нью-Йорк: Спрингер. ISBN  978-0-387-31073-2 .
  2. ^ Бен-Давид, Шай; Кушилевиц, Эяль; Мансур, Ишай (1 октября 1997 г.). «Онлайн-обучение против офлайн-обучения» . Машинное обучение . 29 (1): 45–63. дои : 10.1023/А:1007465907571 . ISSN   0885-6125 .
  3. ^ Байчи, Андреа и Лоузи, Дилан П. и О'Мэлли, Марсия К. и Драган, Анка Д. (2017). «Изучение целей робота на основе физического взаимодействия с человеком». Труды исследований машинного обучения . 78 . ПМЛР: 217–226. {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  4. ^ Мейер-Делиус, Дэниел и Бейнхофер, Максимилиан и Бургард, Вольфрам (2012). Сеточные модели занятости для картографирования роботов в меняющихся условиях . Двадцать шестая конференция AAAI по искусственному интеллекту. {{cite conference}}: CS1 maint: несколько имен: список авторов ( ссылка )
  5. ^ Лука Петернель, Эрхан Озтоп и Ян Бабич (2016). Общий метод управления онлайн-обучением роботов с участием человека на основе локально-взвешенной регрессии . Международная конференция IEEE/RSJ по интеллектуальным роботам и системам (IROS), 2016 г. IEEE. дои : 10.1109/iros.2016.7759574 .
  6. ^ Jump up to: а б Джун, Ли и Дакетт, Том (2003). Обучение поведению роботов с помощью динамически адаптивной сети RBF: эксперименты в автономном и онлайн-обучении . Учеб. 2 Стажер. Конф. на компьютере. Интеллект, робототехника и автономные системы, CIRAS. Гражданин. {{cite conference}}: CS1 maint: несколько имен: список авторов ( ссылка )


Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: b86854c597b7bf7b2b9de6b5b5f47b2f__1703179380
URL1:https://arc.ask3.ru/arc/aa/b8/2f/b86854c597b7bf7b2b9de6b5b5f47b2f.html
Заголовок, (Title) документа по адресу, URL1:
Offline learning - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)