Оффлайн обучение

В машинном обучении системы, использующие автономное обучение, не меняют свою аппроксимацию целевой функции после завершения начальной фазы обучения. ^[1]

В то время как при онлайн-обучении известен только набор возможных элементов, при офлайн-обучении учащемуся известны личность элементов, а также порядок их представления. ^[2]

Приложения для управления робототехникой

Способность роботов учиться равна созданию таблицы (информации) , заполненной значениями. Одним из способов сделать это является программирование путем демонстрации . Здесь таблица заполнена значениями учителем-человеком. Демонстрация осуществляется либо в виде прямой политики числового управления , равной траектории, либо в виде косвенной целевой функции . заранее заданной ^[3]

Офлайн-обучение работает в пакетном режиме . На шаге 1 задача демонстрируется и сохраняется в таблице, а на шаге 2 задача воспроизводится роботом. ^[4] Конвейер медленный и неэффективный, поскольку между демонстрацией поведения и воспроизведением навыков существует задержка. ^[5]^[6]

Короткий пример поможет понять идею. Предположим, робот должен изучить задачу следования за стеной , а внутренняя таблица робота пуста. Прежде чем робот будет активирован в режиме воспроизведения, человек-демонстратор должен научить его поведению. Он управляет роботом с помощью телеуправления , и на этапе обучения создается таблица навыков. Этот процесс называется автономным, поскольку программное обеспечение для управления роботом ничего не делает, а человек-оператор использует устройство в качестве указательного устройства для движения вдоль стены. ^[6]

См. также

Онлайн-обучение , противоположная модель
Инкрементное обучение , модель обучения для постепенного расширения знаний.

Ссылки

^ Бишоп, Кристофер М. (17 августа 2006 г.). Распознавание образов и машинное обучение . Нью-Йорк: Спрингер. ISBN 978-0-387-31073-2 .
^ Бен-Давид, Шай; Кушилевиц, Эяль; Мансур, Ишай (1 октября 1997 г.). «Онлайн-обучение против офлайн-обучения» . Машинное обучение . 29 (1): 45–63. дои : 10.1023/А:1007465907571 . ISSN 0885-6125 .
^ Байчи, Андреа и Лоузи, Дилан П. и О'Мэлли, Марсия К. и Драган, Анка Д. (2017). «Изучение целей робота на основе физического взаимодействия с человеком». Труды исследований машинного обучения . 78 . ПМЛР: 217–226. {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
^ Мейер-Делиус, Дэниел и Бейнхофер, Максимилиан и Бургард, Вольфрам (2012). Сеточные модели занятости для картографирования роботов в меняющихся условиях . Двадцать шестая конференция AAAI по искусственному интеллекту. {{cite conference}}: CS1 maint: несколько имен: список авторов ( ссылка )
^ Лука Петернель, Эрхан Озтоп и Ян Бабич (2016). Общий метод управления онлайн-обучением роботов с участием человека на основе локально-взвешенной регрессии . Международная конференция IEEE/RSJ по интеллектуальным роботам и системам (IROS), 2016 г. IEEE. дои : 10.1109/iros.2016.7759574 .
^ Jump up to: ^а ^б Джун, Ли и Дакетт, Том (2003). Обучение поведению роботов с помощью динамически адаптивной сети RBF: эксперименты в автономном и онлайн-обучении . Учеб. 2 Стажер. Конф. на компьютере. Интеллект, робототехника и автономные системы, CIRAS. Гражданин. {{cite conference}}: CS1 maint: несколько имен: список авторов ( ссылка )

Эта статья о компьютерах незавершена . Вы можете помочь Википедии, расширив ее .

[1] Бишоп, Кристофер М. (17 августа 2006 г.). Распознавание образов и машинное обучение . Нью-Йорк: Спрингер. ISBN 978-0-387-31073-2 .

[2] Бен-Давид, Шай; Кушилевиц, Эяль; Мансур, Ишай (1 октября 1997 г.). «Онлайн-обучение против офлайн-обучения» . Машинное обучение . 29 (1): 45–63. дои : 10.1023/А:1007465907571 . ISSN 0885-6125 .

[3] Байчи, Андреа и Лоузи, Дилан П. и О'Мэлли, Марсия К. и Драган, Анка Д. (2017). «Изучение целей робота на основе физического взаимодействия с человеком». Труды исследований машинного обучения . 78 . ПМЛР: 217–226. {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )

[4] Мейер-Делиус, Дэниел и Бейнхофер, Максимилиан и Бургард, Вольфрам (2012). Сеточные модели занятости для картографирования роботов в меняющихся условиях . Двадцать шестая конференция AAAI по искусственному интеллекту. {{cite conference}}: CS1 maint: несколько имен: список авторов ( ссылка )

[5] Лука Петернель, Эрхан Озтоп и Ян Бабич (2016). Общий метод управления онлайн-обучением роботов с участием человека на основе локально-взвешенной регрессии . Международная конференция IEEE/RSJ по интеллектуальным роботам и системам (IROS), 2016 г. IEEE. дои : 10.1109/iros.2016.7759574 .

[Jun2003-6] Jump up to: ^а ^б Джун, Ли и Дакетт, Том (2003). Обучение поведению роботов с помощью динамически адаптивной сети RBF: эксперименты в автономном и онлайн-обучении . Учеб. 2 Стажер. Конф. на компьютере. Интеллект, робототехника и автономные системы, CIRAS. Гражданин. {{cite conference}}: CS1 maint: несколько имен: список авторов ( ссылка )

[1]

[2]

[3]

[4]

[5]

[6]