Jump to content

Диалоговая система

(Перенаправлено из Диалоговых систем )

Автоматизированный онлайн-помощник на сайте – пример, где диалоговые системы являются основными компонентами

Диалоговая система , или диалоговый агент ( CA ), — это компьютерная система, предназначенная для общения с человеком. Диалоговые системы использовали один или несколько режимов общения как на входном, так и на выходном канале: текст, речь, графика, тактильные ощущения, жесты и другие режимы.

Элементы диалоговой системы не определены, поскольку эта идея находится в стадии исследования. [ нужна ссылка ] однако они отличаются от чат-бота . [1] Типичный с графическим пользовательским интерфейсом мастер ведет своего рода диалог, но он включает в себя очень мало общих компонентов диалоговой системы, а состояние диалога тривиально.

Предыстория [ править ]

После диалоговых систем, основанных только на обработке письменного текста, начиная с начала шестидесятых годов, [2] Первая говорящая диалоговая система была выпущена проектом DARPA в США в 1977 году. [3] После окончания этого пятилетнего проекта некоторые европейские проекты выпустили первую диалоговую систему, способную говорить на многих языках (также французском, немецком и итальянском). [4] Эти первые системы использовались в телекоммуникационной отрасли для предоставления различных телефонных услуг в конкретных областях, например, автоматизированная повестка дня и обслуживание столов для поездов.

Компоненты [ править ]

Какие наборы компонентов включены в диалоговую систему и то, как эти компоненты распределяют обязанности, различается от системы к системе. Принципиальным элементом любой диалоговой системы является менеджер диалога , который является компонентом, управляющим состоянием диалога и стратегией диалога. Типичный цикл деятельности в диалоговой системе состоит из следующих фаз: [5]

  1. Пользователь говорит, и ввод преобразуется в обычный текст системным распознавателем/декодером ввода , который может включать в себя:
  2. Текст анализируется блоком понимания естественного языка (NLU), который может включать в себя:
  3. Семантическая информация анализируется менеджером диалогов , который сохраняет историю и состояние диалога и управляет общим потоком разговора.
  4. Обычно менеджер диалога связывается с одним или несколькими менеджерами задач , которые знают конкретную область задач.
  5. Менеджер диалогов выдает выходные данные с помощью генератора выходных данных , который может включать в себя:
  6. Наконец, выходные данные визуализируются с использованием средства рендеринга вывода , которое может включать в себя:

Диалоговые системы, основанные на текстовом интерфейсе (например, текстовый чат), содержат только этапы 2–5.

Типы систем [ править ]

Диалоговые системы делятся на следующие категории, которые перечислены здесь по нескольким параметрам. Многие категории частично совпадают, и различия могут быть недостаточно четко установлены.

Системы естественного диалога [ править ]

«Система естественного диалога — это форма диалоговой системы, которая пытается улучшить удобство использования и удовлетворенность пользователей путем имитации человеческого поведения» [6] (Берг, 2014). Он рассматривает особенности диалога между людьми (например, поддиалоги и смену тем) и стремится интегрировать их в диалоговые системы для взаимодействия человека и машины. Часто (разговорные) диалоговые системы требуют от пользователя адаптации к системе, поскольку система способна понимать лишь очень ограниченный словарный запас, не способна реагировать на изменения темы и не позволяет пользователю влиять на ход диалога. Смешанная инициатива — это способ дать пользователю возможность активно участвовать в диалоге, а не только отвечать на вопросы . Однако самого существования смешанной инициативы недостаточно, чтобы ее можно было отнести к системе естественного диалога. Другие важные аспекты включают в себя: [6]

  • Адаптивность системы
  • Поддержка неявного подтверждения
  • Использование проверочных вопросов
  • Возможность исправить уже предоставленную информацию.
  • Чрезмерная информативность (дайте больше информации, чем просили)
  • Поддержка отрицаний
  • Понимайте ссылки, анализируя дискурс и анафору
  • Генерация естественного языка для предотвращения монотонных и повторяющихся подсказок.
  • Адаптивная и учитывающая ситуацию формулировка
  • Социальное поведение (приветствия, тот же уровень формальности, что и у пользователя, вежливость)
  • Качество распознавания и синтеза речи

Хотя большинство этих аспектов являются вопросами множества различных исследовательских проектов, существует недостаток инструментов, поддерживающих разработку диалоговых систем, рассматривающих эти темы. [7] За исключением VoiceXML , который фокусируется на интерактивных системах голосового ответа и является основой для многих систем разговорного диалога в промышленности (приложения поддержки клиентов) и AIML , известного своим чат-ботом ALICE , ни одна из них не объединяет лингвистические функции, такие как диалоговые действия или генерация языка. Таким образом, NADIA (исследовательский прототип) дает представление о том, как восполнить этот пробел, и сочетает в себе некоторые из вышеупомянутых аспектов, таких как генерация естественного языка, адаптивная формулировка и поддиалоги.

Производительность [ править ]

Некоторые авторы измеряют производительность диалоговой системы по проценту совершенно правильных предложений, сравнивая модели предложений (этот показатель называется Точностью концептуального предложения). [8] или понимание предложения [4] ).

Приложения [ править ]

Диалоговые системы могут поддерживать широкий спектр приложений в сфере бизнеса, образования, государственного управления, здравоохранения и развлечений. [9] Например:

  • Ответы на вопросы клиентов о продуктах и ​​услугах через веб-сайт компании или интранет-портал.
  • агентов по обслуживанию клиентов База знаний : позволяет агентам вводить вопрос клиента и давать им ответ.
  • Управляемые продажи : упрощение транзакций путем предоставления ответов и рекомендаций в процессе продаж, особенно для сложных продуктов, продаваемых начинающим клиентам.
  • Справочная служба : ответы на внутренние вопросы сотрудников, например, ответы на вопросы отдела кадров.
  • Навигация по веб-сайту: направление клиентов к соответствующим частям сложных веб-сайтов — консьерж веб-сайта.
  • Техническая поддержка: реагирование на технические проблемы, например диагностика проблем с продуктом или устройством.
  • Персонализированное обслуживание: диалоговые агенты могут использовать внутренние и внешние базы данных для персонализации взаимодействия, например, ответов на вопросы о остатках на счетах, предоставления информации о портфолио, доставки часто летающих пассажиров или информации о членстве.
  • Обучение или образование: они могут давать советы по решению проблем, пока пользователь учится.
  • Простые диалоговые системы широко используются для снижения нагрузки на людей в колл-центрах . В этом и других приложениях промышленной телефонии функциональность, предоставляемая диалоговыми системами, известна как интерактивный голосовой ответ или IVR.
  • Поддержите ученого в задачах манипулирования и анализа данных, например, в геномике. [10]

В некоторых случаях диалоговые агенты могут взаимодействовать с пользователями, используя искусственных персонажей. Эти агенты тогда называются воплощенными агентами .

Наборы инструментов и архитектуры [ править ]

Обзор существующих рамок, языков и технологий для определения диалоговых систем.

Имя и ссылки Тип системы Описание Принадлежность Окружающая среда Комментарии
АИМЛ чаттербота Язык Диалект XML для создания программных агентов на естественном языке. Ричард Уоллес, Pandorabots, Inc.
ЧатСкрипт чаттербота Язык Язык/движок для создания программных агентов на естественном языке. Брюс Уилкокс
Инструментарий CSLU
Среда прототипирования речевого интерфейса на основе состояний Школа науки и техники OGI
М. МакТир
Рон Коул
публикации с 1999 года.
НЛУИ-сервер Независимый от предметной области инструментарий Полная многоязычная платформа для создания пользовательского интерфейса на естественном языке. систем LinguaSys встроенная поддержка диалогов смешанной инициативы
Олимп Полная основа для внедрения систем разговорного диалога Университет Карнеги-Меллон [1]
Некстнова Мультимодальная платформа Платформа для разработки мультимодальных программных приложений. На основе XML диаграммы состояний (SCXML) Понвиа Технолоджи, Инк.
VXML
Голосовой XML
Разговорный диалог Язык разметки мультимодальных диалогов Первоначально разработано AT&T , затем управляется отраслевым консорциумом и, наконец, W3C. является спецификацией Пример прежде всего для телефонии.
СОЛЬ язык разметки Язык разметки мультимодальных диалогов Майкрософт «не достиг уровня зрелости VoiceXML в процессе стандартизации».
Quack.com — QXML Среда разработки Компания куплена AOL
OpenDial Независимый от предметной области инструментарий Гибридная символическая/статистическая структура для систем разговорного диалога, реализованная на Java. Университет Осло
НАДИЯ диалоговый движок и моделирование диалогов Создание естественных диалогов/диалоговых систем. Поддерживает акты диалога, смешанную инициативу, НЛГ. Реализовано на Java. Маркус М. Берг создавать диалоговые файлы на основе XML, грамматику указывать не нужно, публикации начиная с 2014 года.

См. также [ править ]

Ссылки [ править ]

  1. ^ Клювер, Тина. «От чат-ботов к диалоговым системам». Разговорные агенты и взаимодействие на естественном языке: методы и эффективные практики. IGI Global, 2011. 1-22.
  2. ^ Мактир, Майкл, Зораида Каллехас и Дэвид Гриол, Диалоговый интерфейс: общение с интеллектуальными устройствами , Springer, 2016.
  3. ^ Джанкарло Пирани (редактор), Передовые алгоритмы и архитектуры для понимания речи , Vol. 1. Springer Science & Business Media, 2013.
  4. Перейти обратно: Перейти обратно: а б Альберто Чарамелла, Отчет об оценке характеристик прототипа , пакет работ «Солнечные часы 8000» (1993).
  5. ^ Джурафски и Мартин (2009), Обработка речи и языка. Международное издание Пирсона, ISBN   978-0-13-504196-3 , Глава 24
  6. Перейти обратно: Перейти обратно: а б Берг, Маркус М. (2014), Моделирование естественных диалогов в контексте речевых информационных и управляющих систем , Akademische Verlagsgesellschaft AKA , ISBN  978-3-89838-508-4
  7. ^ Берг, Маркус М. (2015), «NADIA: упрощенный подход к разработке систем естественного диалога», Системы обработки естественного языка и информационные системы , Конспекты лекций по информатике, том. 9103, стр. 144–150, номер doi : 10.1007/978-3-319-19581-0_12 , ISBN.  978-3-319-19580-3
  8. ^ Бангалор, Шринивас и Майкл Джонстон. «Надежное понимание мультимодальных интерфейсов». Компьютерная лингвистика 35.3 (2009): 345–397.
  9. ^ Лестер, Дж.; Брантинг, К.; Мотт, Б. (2004), «Разговорные агенты» (PDF) , Практическое руководство по интернет-вычислениям , Chapman & Hall
  10. ^ Кровари; Пидо; Пиноли; Бернаскони; Чанакоглу; Гарзотто; Кери (2021), «GeCoAgent: диалоговый агент для расширения возможностей извлечения и анализа геномных данных», ACM Transactions on Computing for Healthcare , 3 , ACM New York, NY: 1–29, doi : 10.1145/3464383 , hdl : 11311/1192262 , S2CID   245855725

Дальнейшее чтение [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: dcf6f2dcab1f86d63279c972233dda40__1711988700
URL1:https://arc.ask3.ru/arc/aa/dc/40/dcf6f2dcab1f86d63279c972233dda40.html
Заголовок, (Title) документа по адресу, URL1:
Dialogue system - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)