Диалоговая система
Эта статья нуждается в дополнительных цитатах для проверки . ( июнь 2022 г. ) |
Диалоговая система , или диалоговый агент ( CA ), — это компьютерная система, предназначенная для общения с человеком. Диалоговые системы использовали один или несколько режимов общения как на входном, так и на выходном канале: текст, речь, графика, тактильные ощущения, жесты и другие режимы.
Элементы диалоговой системы не определены, поскольку эта идея находится в стадии исследования. [ нужна ссылка ] однако они отличаются от чат-бота . [1] Типичный с графическим пользовательским интерфейсом мастер ведет своего рода диалог, но он включает в себя очень мало общих компонентов диалоговой системы, а состояние диалога тривиально.
Предыстория [ править ]
После диалоговых систем, основанных только на обработке письменного текста, начиная с начала шестидесятых годов, [2] Первая говорящая диалоговая система была выпущена проектом DARPA в США в 1977 году. [3] После окончания этого пятилетнего проекта некоторые европейские проекты выпустили первую диалоговую систему, способную говорить на многих языках (также французском, немецком и итальянском). [4] Эти первые системы использовались в телекоммуникационной отрасли для предоставления различных телефонных услуг в конкретных областях, например, автоматизированная повестка дня и обслуживание столов для поездов.
Компоненты [ править ]
Какие наборы компонентов включены в диалоговую систему и то, как эти компоненты распределяют обязанности, различается от системы к системе. Принципиальным элементом любой диалоговой системы является менеджер диалога , который является компонентом, управляющим состоянием диалога и стратегией диалога. Типичный цикл деятельности в диалоговой системе состоит из следующих фаз: [5]
- Пользователь говорит, и ввод преобразуется в обычный текст системным распознавателем/декодером ввода , который может включать в себя:
- Текст анализируется блоком понимания естественного языка (NLU), который может включать в себя:
- Идентификация имени собственного
- тегирование части речи
- Синтаксический/семантический парсер
- Семантическая информация анализируется менеджером диалогов , который сохраняет историю и состояние диалога и управляет общим потоком разговора.
- Обычно менеджер диалога связывается с одним или несколькими менеджерами задач , которые знают конкретную область задач.
- Менеджер диалогов выдает выходные данные с помощью генератора выходных данных , который может включать в себя:
- Наконец, выходные данные визуализируются с использованием средства рендеринга вывода , которое может включать в себя:
Диалоговые системы, основанные на текстовом интерфейсе (например, текстовый чат), содержат только этапы 2–5.
Типы систем [ править ]
Диалоговые системы делятся на следующие категории, которые перечислены здесь по нескольким параметрам. Многие категории частично совпадают, и различия могут быть недостаточно четко установлены.
- по модальности
- по устройству
- телефонные системы
- КПК- системы
- автомобильные системы
- роботизированные системы
- настольные / ноутбуковые системы
- родной
- браузерные системы
- in- виртуальная машина
- в виртуальной среде
- роботы
- по стилю
- командный
- меню управляемый
- естественный язык
- речевое граффити
- по инициативе
- системная инициатива
- инициатива пользователя
- смешанная инициатива
Системы естественного диалога [ править ]
В этом разделе может быть придан чрезмерный вес определенным идеям, происшествиям или противоречиям . Пожалуйста, помогите создать более сбалансированную презентацию . Обсудите и решите эту проблему, прежде чем удалять это сообщение. ( май 2017 г. ) |
«Система естественного диалога — это форма диалоговой системы, которая пытается улучшить удобство использования и удовлетворенность пользователей путем имитации человеческого поведения» [6] (Берг, 2014). Он рассматривает особенности диалога между людьми (например, поддиалоги и смену тем) и стремится интегрировать их в диалоговые системы для взаимодействия человека и машины. Часто (разговорные) диалоговые системы требуют от пользователя адаптации к системе, поскольку система способна понимать лишь очень ограниченный словарный запас, не способна реагировать на изменения темы и не позволяет пользователю влиять на ход диалога. Смешанная инициатива — это способ дать пользователю возможность активно участвовать в диалоге, а не только отвечать на вопросы . Однако самого существования смешанной инициативы недостаточно, чтобы ее можно было отнести к системе естественного диалога. Другие важные аспекты включают в себя: [6]
- Адаптивность системы
- Поддержка неявного подтверждения
- Использование проверочных вопросов
- Возможность исправить уже предоставленную информацию.
- Чрезмерная информативность (дайте больше информации, чем просили)
- Поддержка отрицаний
- Понимайте ссылки, анализируя дискурс и анафору
- Генерация естественного языка для предотвращения монотонных и повторяющихся подсказок.
- Адаптивная и учитывающая ситуацию формулировка
- Социальное поведение (приветствия, тот же уровень формальности, что и у пользователя, вежливость)
- Качество распознавания и синтеза речи
Хотя большинство этих аспектов являются вопросами множества различных исследовательских проектов, существует недостаток инструментов, поддерживающих разработку диалоговых систем, рассматривающих эти темы. [7] За исключением VoiceXML , который фокусируется на интерактивных системах голосового ответа и является основой для многих систем разговорного диалога в промышленности (приложения поддержки клиентов) и AIML , известного своим чат-ботом ALICE , ни одна из них не объединяет лингвистические функции, такие как диалоговые действия или генерация языка. Таким образом, NADIA (исследовательский прототип) дает представление о том, как восполнить этот пробел, и сочетает в себе некоторые из вышеупомянутых аспектов, таких как генерация естественного языка, адаптивная формулировка и поддиалоги.
Производительность [ править ]
Некоторые авторы измеряют производительность диалоговой системы по проценту совершенно правильных предложений, сравнивая модели предложений (этот показатель называется Точностью концептуального предложения). [8] или понимание предложения [4] ).
Приложения [ править ]
Диалоговые системы могут поддерживать широкий спектр приложений в сфере бизнеса, образования, государственного управления, здравоохранения и развлечений. [9] Например:
- Ответы на вопросы клиентов о продуктах и услугах через веб-сайт компании или интранет-портал.
- агентов по обслуживанию клиентов База знаний : позволяет агентам вводить вопрос клиента и давать им ответ.
- Управляемые продажи : упрощение транзакций путем предоставления ответов и рекомендаций в процессе продаж, особенно для сложных продуктов, продаваемых начинающим клиентам.
- Справочная служба : ответы на внутренние вопросы сотрудников, например, ответы на вопросы отдела кадров.
- Навигация по веб-сайту: направление клиентов к соответствующим частям сложных веб-сайтов — консьерж веб-сайта.
- Техническая поддержка: реагирование на технические проблемы, например диагностика проблем с продуктом или устройством.
- Персонализированное обслуживание: диалоговые агенты могут использовать внутренние и внешние базы данных для персонализации взаимодействия, например, ответов на вопросы о остатках на счетах, предоставления информации о портфолио, доставки часто летающих пассажиров или информации о членстве.
- Обучение или образование: они могут давать советы по решению проблем, пока пользователь учится.
- Простые диалоговые системы широко используются для снижения нагрузки на людей в колл-центрах . В этом и других приложениях промышленной телефонии функциональность, предоставляемая диалоговыми системами, известна как интерактивный голосовой ответ или IVR.
- Поддержите ученого в задачах манипулирования и анализа данных, например, в геномике. [10]
В некоторых случаях диалоговые агенты могут взаимодействовать с пользователями, используя искусственных персонажей. Эти агенты тогда называются воплощенными агентами .
Наборы инструментов и архитектуры [ править ]
Обзор существующих рамок, языков и технологий для определения диалоговых систем.
Имя и ссылки | Тип системы | Описание | Принадлежность | Окружающая среда | Комментарии |
---|---|---|---|---|---|
АИМЛ | чаттербота Язык | Диалект XML для создания программных агентов на естественном языке. | Ричард Уоллес, Pandorabots, Inc. | ||
ЧатСкрипт | чаттербота Язык | Язык/движок для создания программных агентов на естественном языке. | Брюс Уилкокс | ||
Инструментарий CSLU | Среда прототипирования речевого интерфейса на основе состояний | Школа науки и техники OGI М. МакТир Рон Коул | публикации с 1999 года. | ||
НЛУИ-сервер | Независимый от предметной области инструментарий | Полная многоязычная платформа для создания пользовательского интерфейса на естественном языке. систем | LinguaSys | встроенная поддержка диалогов смешанной инициативы | |
Олимп | Полная основа для внедрения систем разговорного диалога | Университет Карнеги-Меллон | [1] | ||
Некстнова | Мультимодальная платформа | Платформа для разработки мультимодальных программных приложений. На основе XML диаграммы состояний (SCXML) | Понвиа Технолоджи, Инк. | ||
VXML Голосовой XML | Разговорный диалог | Язык разметки мультимодальных диалогов | Первоначально разработано AT&T , затем управляется отраслевым консорциумом и, наконец, W3C. является спецификацией | Пример | прежде всего для телефонии. |
СОЛЬ | язык разметки | Язык разметки мультимодальных диалогов | Майкрософт | «не достиг уровня зрелости VoiceXML в процессе стандартизации». | |
Quack.com — QXML | Среда разработки | Компания куплена AOL | |||
OpenDial | Независимый от предметной области инструментарий | Гибридная символическая/статистическая структура для систем разговорного диалога, реализованная на Java. | Университет Осло | ||
НАДИЯ | диалоговый движок и моделирование диалогов | Создание естественных диалогов/диалоговых систем. Поддерживает акты диалога, смешанную инициативу, НЛГ. Реализовано на Java. | Маркус М. Берг | создавать диалоговые файлы на основе XML, грамматику указывать не нужно, публикации начиная с 2014 года. |
См. также [ править ]
Ссылки [ править ]
- ^ Клювер, Тина. «От чат-ботов к диалоговым системам». Разговорные агенты и взаимодействие на естественном языке: методы и эффективные практики. IGI Global, 2011. 1-22.
- ^ Мактир, Майкл, Зораида Каллехас и Дэвид Гриол, Диалоговый интерфейс: общение с интеллектуальными устройствами , Springer, 2016.
- ^ Джанкарло Пирани (редактор), Передовые алгоритмы и архитектуры для понимания речи , Vol. 1. Springer Science & Business Media, 2013.
- ↑ Перейти обратно: Перейти обратно: а б Альберто Чарамелла, Отчет об оценке характеристик прототипа , пакет работ «Солнечные часы 8000» (1993).
- ^ Джурафски и Мартин (2009), Обработка речи и языка. Международное издание Пирсона, ISBN 978-0-13-504196-3 , Глава 24
- ↑ Перейти обратно: Перейти обратно: а б Берг, Маркус М. (2014), Моделирование естественных диалогов в контексте речевых информационных и управляющих систем , Akademische Verlagsgesellschaft AKA , ISBN 978-3-89838-508-4
- ^ Берг, Маркус М. (2015), «NADIA: упрощенный подход к разработке систем естественного диалога», Системы обработки естественного языка и информационные системы , Конспекты лекций по информатике, том. 9103, стр. 144–150, номер doi : 10.1007/978-3-319-19581-0_12 , ISBN. 978-3-319-19580-3
- ^ Бангалор, Шринивас и Майкл Джонстон. «Надежное понимание мультимодальных интерфейсов». Компьютерная лингвистика 35.3 (2009): 345–397.
- ^ Лестер, Дж.; Брантинг, К.; Мотт, Б. (2004), «Разговорные агенты» (PDF) , Практическое руководство по интернет-вычислениям , Chapman & Hall
- ^ Кровари; Пидо; Пиноли; Бернаскони; Чанакоглу; Гарзотто; Кери (2021), «GeCoAgent: диалоговый агент для расширения возможностей извлечения и анализа геномных данных», ACM Transactions on Computing for Healthcare , 3 , ACM New York, NY: 1–29, doi : 10.1145/3464383 , hdl : 11311/1192262 , S2CID 245855725
Дальнейшее чтение [ править ]
- Уилл, Томас (2007). Создание динамического речевого диалога . ВДМ Верлаг Доктор Мюллер . ISBN 978-3-8364-4990-8 .