~~~~~~~~~~~~~~~~~~~~ Arc.Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~ 
Номер скриншота №:
✰ 8B7B9C2B31FA4BDD6194C792CE7333CE__1701972480 ✰
Заголовок документа оригинал.:
✰ Programming by demonstration - Wikipedia ✰
Заголовок документа перевод.:
✰ Программирование путем демонстрации — Википедия ✰
Снимок документа находящегося по адресу (URL):
✰ https://en.wikipedia.org/wiki/Programming_by_demonstration ✰
Адрес хранения снимка оригинал (URL):
✰ https://arc.ask3.ru/arc/aa/8b/ce/8b7b9c2b31fa4bdd6194c792ce7333ce.html ✰
Адрес хранения снимка перевод (URL):
✰ https://arc.ask3.ru/arc/aa/8b/ce/8b7b9c2b31fa4bdd6194c792ce7333ce__translat.html ✰
Дата и время сохранения документа:
✰ 16.06.2024 10:31:53 (GMT+3, MSK) ✰
Дата и время изменения документа (по данным источника):
✰ 7 December 2023, at 21:08 (UTC). ✰ 

~~~~~~~~~~~~~~~~~~~~~~ Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~~ 
Сервисы Ask3.ru: 
 Архив документов (Снимки документов, в формате HTML, PDF, PNG - подписанные ЭЦП, доказывающие существование документа в момент подписи. Перевод сохраненных документов на русский язык.)https://arc.ask3.ruОтветы на вопросы (Сервис ответов на вопросы, в основном, научной направленности)https://ask3.ru/answer2questionТоварный сопоставитель (Сервис сравнения и выбора товаров) ✰✰
✰ https://ask3.ru/product2collationПартнерыhttps://comrades.ask3.ru


Совет. Чтобы искать на странице, нажмите Ctrl+F или ⌘-F (для MacOS) и введите запрос в поле поиска.
Arc.Ask3.ru: далее начало оригинального документа

Программирование путем демонстрации — Википедия Jump to content

Программирование путем демонстрации

Из Википедии, бесплатной энциклопедии

В информатике , программирование путем демонстрации ( PbD ) — это метод разработки конечного пользователя позволяющий обучать компьютер или робот новому поведению путем демонстрации задачи для передачи напрямую, а не программирования ее с помощью машинных команд.

Термины «программирование на примере» (PbE) и «программирование на демонстрации » (PbD) появились в исследованиях по разработке программного обеспечения еще в середине 1980-х годов. [1] определить способ определения последовательности операций без необходимости изучения языка программирования. Обычное различие между этими терминами в литературе состоит в том, что в PbE пользователь предоставляет прототипный продукт компьютерного выполнения, например строку желаемых результатов запроса ; в то время как в PbD пользователь выполняет последовательность действий, которые должен повторить компьютер, обобщая ее для использования в различных наборах данных.

Эти два термина сначала не различались, но затем PbE, как правило, использовался в основном исследователями-разработчиками программного обеспечения, а PbD, как правило, использовался исследователями робототехники. Сегодня PbE относится к совершенно другой концепции, поддерживаемой новыми языками программирования, похожими на симуляторы. Эту структуру можно противопоставить синтезу байесовских программ .

роботов демонстрации путем Программирование

Парадигма PbD в первую очередь привлекательна для индустрии робототехники из-за затрат, связанных с разработкой и обслуживанием программ для роботов. В этой области оператор часто имеет неявные знания о поставленной задаче (он/она знает, как это сделать), но обычно не имеет навыков программирования (или времени), необходимых для перенастройки робота. Таким образом, демонстрация того, как выполнить задачу на примерах, позволяет освоить навык без явного программирования каждой детали.

Первые стратегии PbD, предложенные в робототехнике, были основаны на методах обучения , руководства или воспроизведения , которые заключались в следующем: в основном это перемещение робота (через специальный интерфейс или вручную) через набор соответствующих конфигураций, которые робот следует принимать последовательно (положение, ориентацию, состояние захвата). Затем этот метод постепенно совершенствовался. основное внимание уделяется дистанционному управлению и использованию различных интерфейсов, таких как зрение.

Однако в этих методах PbD по-прежнему использовалось прямое повторение, что было полезно в промышленности только при создании сборочной линии, использующей одни и те же компоненты продукта. Чтобы применить эту концепцию к продуктам с различными вариантами или применить программы к новым роботам, решающим моментом стал вопрос обобщения. Для решения этого вопроса предприняты первые попытки обобщения навыка. в основном основывались на помощи пользователя посредством вопросов о намерениях пользователя. Затем были использованы различные уровни абстракций. предложено решить проблему обобщения, в основном дихотомизированную в методах обучения на символическом уровне или на уровне траектории.

Развитие роботов-гуманоидов естественным образом вызвало растущий интерес к программированию роботов путем демонстрации. Поскольку человекоподобный робот по своей природе должен адаптироваться к новым условиям, важен не только внешний вид человека, но и алгоритмы, используемые для его управления, требуют гибкости и универсальности. Из-за постоянно меняющейся среды и огромного разнообразия задач, которые должен выполнять робот, от робота требуется способность постоянно осваивать новые навыки и адаптировать существующие навыки к новым контекстам.

Исследования в области PbD также постепенно отходили от своей первоначальной чисто инженерной точки зрения и переходили к междисциплинарному подходу, используя идеи нейробиологии и социальных наук для имитации процесса имитации у людей и животных. С ростом внимания к этому направлению работ в робототехнике понятие программирования роботов путем демонстрации (также известное как RPD или RbD) также постепенно заменялось более биологическим названием « Обучение путем имитации» .

импринтированные стабильные векторные поля ( NiVF ) Нейронно -

Нейронно-импринтированные стабильные векторные поля [2] (NiVF) был представлен как новая схема обучения на ESANN 2013 и показывает, как впечатывать векторные поля в нейронные сети, такие как машины экстремального обучения (ELM), гарантированно стабильным образом. Кроме того, статья получила награду за лучшую студенческую работу. Сети представляют собой движения, в которых асимптотическая устойчивость обеспечивается посредством ограничений, выведенных из теории устойчивости Ляпунова. Показано, что этот подход успешно выполняет стабильные и плавные движения «точка-точка», усвоенные на основе движений руки человека.

Также можно изучить кандидата Ляпунова, который используется для стабилизации динамической системы. [3] По этой причине необходима схема нейронного обучения, которая оценивает стабильные динамические системы на основе демонстраций, основанных на двухэтапном процессе: сначала оценивается управляемый данными кандидат на функцию Ляпунова. Во-вторых, стабильность обеспечивается посредством нового метода учета локальных ограничений в нейронном обучении. Это позволяет изучать стабильную динамику, одновременно сохраняя точность динамической системы и надежно генерируя сложные движения.

Диффеоморфные преобразования [ править ]

Диффеоморфные преобразования оказываются особенно пригодными для существенного повышения обучаемости динамических систем роботизированных движений. Стабильная оценка динамических систем (SEDS) — интересный подход к изучению инвариантных ко времени систем для управления движениями роботов. Однако это ограничивается динамическими системами только с квадратичными функциями Ляпунова. Новый подход Тау-СЭДС [4] преодолевает эти ограничения математически элегантным способом.

Параметризованные навыки [ править ]

После демонстрации задачи человеком-оператором траектория сохраняется в базе данных. Облегчение доступа к необработанным данным реализуется с помощью параметризованных навыков. [5] Навык запрашивает базу данных и генерирует траекторию. Например, сначала в базу данных движений отправляется навык «открытый захват (медленный)», и в ответ предоставляется сохраненное движение робота-манипулятора. Параметры навыка позволяют изменять политику для выполнения внешних ограничений .

Навык — это интерфейс между названиями задач, заданными на естественном языке , и лежащим в их основе пространственно-временным движением в трехмерном пространстве, состоящем из точек. Отдельные навыки можно объединить в задачу для определения более длинных последовательностей движений с точки зрения высокого уровня. Для практического применения различные действия сохраняются в библиотеке навыков . Для дальнейшего повышения уровня абстракции навыки можно преобразовать в примитивы динамического движения (DMP). Они на лету генерируют траекторию движения робота, которая на момент демонстрации была неизвестна. Это помогает повысить гибкость решателя. [6]

Нероботизированное использование [ править ]

Для конечных пользователей, желающих автоматизировать рабочий процесс в сложном инструменте (например, Photoshop ), наиболее простым случаем PbD является средство записи макросов .

См. также [ править ]

Ссылки [ править ]

  1. ^ Халберт, Дэн (ноябрь 1984 г.). «Программирование на примерах» (PDF) . Калифорнийский университет в Беркли (докторская диссертация) . Проверено 28 июля 2012 г. {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )
  2. ^ А. Лемм, К. Нойманн, Р.Ф. Рейнхарт, Дж. Дж. Стейл (2013). «Нейронно-импринтированные стабильные векторные поля» (PDF) . Учеб. Европа. Симп. Об искусственных нейронных сетях : 327–332. {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  3. ^ А. Лемм, К. Нейман и Дж. Дж. Стейл (2013). «Нейронное обучение стабильных динамических систем на основе управляемых данными кандидатов Ляпунова» (PDF) . Международная конференция IEEE/RSJ по интеллектуальным роботам и системам , 2013 г. стр. 1216–1222. дои : 10.1109/IROS.2013.6696505 . ISBN  978-1-4673-6358-7 . S2CID   1612856 . {{cite book}}: CS1 maint: несколько имен: список авторов ( ссылка )
  4. ^ К. Нойманн и Дж. Дж. Стейл (2015). «Изучение движений роботов с помощью устойчивых динамических систем при диффеоморфных преобразованиях» (PDF) . Робототехника и автономные системы . 70 (С): 1–15. дои : 10.1016/j.robot.2015.04.006 .
  5. ^ Первез, Аффан и Ли, Донхей (2018). «Изучение примитивов динамического движения, параметризованных задачами, с использованием смеси GMM» (PDF) . Интеллектуальная сервисная робототехника . 11 (1). Спрингер: 61–78. дои : 10.1007/s11370-017-0235-8 . S2CID   3398752 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  6. ^ Ализаде, Тохид; Садуанов, Батырхан (2017). «Программирование роботов путем демонстрации выполнения нескольких задач в общей среде». Международная конференция IEEE 2017 по мультисенсорному слиянию и интеграции интеллектуальных систем (MFI) . IEEE. стр. 608–613. дои : 10.1109/mfi.2017.8170389 . ISBN  978-1-5090-6064-1 . S2CID   40697084 .

Внешние ссылки [ править ]

Обзорные статьи [ редактировать ]

Специальные выпуски журналов [ править ]

и люди Ключевые лаборатории

Видео [ править ]

Робот, который учится готовить омлет:

  • «Короткая версия», YouTube , Франция .
  • «Длинная версия», YouTube , Франция .

Робот, который учится откручивать бутылку с колой:

  • «Открути бутылку из-под кока-колы», YouTube , DE .
Arc.Ask3.Ru: конец оригинального документа.
Arc.Ask3.Ru
Номер скриншота №: 8B7B9C2B31FA4BDD6194C792CE7333CE__1701972480
URL1:https://en.wikipedia.org/wiki/Programming_by_demonstration
Заголовок, (Title) документа по адресу, URL1:
Programming by demonstration - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть, любые претензии не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, денежную единицу можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)