Пользовательский интерфейс на естественном языке
Пользовательский интерфейс на естественном языке ( LUI или NLUI ) — это тип компьютерного человеческого интерфейса , в котором лингвистические явления, такие как глаголы, фразы и предложения, действуют как элементы управления пользовательского интерфейса для создания, выбора и изменения данных в программных приложениях.
В дизайне интерфейсов интерфейсы на естественном языке востребованы из-за их скорости и простоты использования, но большинство из них страдают от проблем с пониманием широкого спектра неоднозначных входных данных . [ 1 ] Интерфейсы на естественном языке являются активной областью исследований в области обработки естественного языка и компьютерной лингвистики . Интуитивный общий интерфейс на естественном языке — одна из активных целей Semantic Web .
Текстовые интерфейсы в разной степени «естественны». Многие формальные (неестественные) языки программирования включают в себя идиомы естественного человеческого языка. Аналогичным образом, традиционную поисковую систему по ключевым словам можно охарактеризовать как «поверхностный» пользовательский интерфейс на естественном языке.
Обзор
[ редактировать ]Поисковая система на естественном языке теоретически могла бы находить целевые ответы на вопросы пользователей (в отличие от поиска по ключевым словам). Например, при столкновении с вопросом вида «В каком штате США самый высокий подоходный налог ?» обычные поисковые системы игнорируют этот вопрос и вместо этого выполняют поиск по ключевым словам «штат», «доход» и «налог». С другой стороны, поиск на естественном языке пытается использовать обработку естественного языка, чтобы понять природу вопроса, а затем выполнить поиск и вернуть подмножество сети, содержащее ответ на вопрос. Если это сработает, результаты будут иметь более высокую релевантность, чем результаты поисковой системы по ключевым словам, из-за включения вопроса. [ нужна ссылка ]
История
[ редактировать ]Прототипы интерфейсов Nl появились уже в конце шестидесятых — начале семидесятых годов. [ 2 ]
- SHRDLU , интерфейс на естественном языке, который манипулирует блоками в виртуальном «мире блоков».
- Lunar — интерфейс на естественном языке к базе данных, содержащей химические анализы Аполлона-11, лунных пород выполненные Уильямом А. Вудсом .
- Chat-80 преобразовывал английские вопросы в выражения Пролога , которые сравнивались с базой данных Пролога. Код Chat-80 получил широкое распространение и лег в основу нескольких других экспериментальных интерфейсов Nl. Онлайн-демонстрация доступна на веб-сайте LPA. [ 3 ]
- ELIZA , написанная Джозефом Вайзенбаумом в Массачусетском технологическом институте между 1964 и 1966 годами, имитировала работу психотерапевта и управлялась путем обработки ответов пользователей на сценарии. Не используя почти никакой информации о человеческих мыслях и эмоциях, сценарий ДОКТОРА иногда обеспечивал поразительно человеческое взаимодействие. Онлайн-демонстрация доступна на веб-сайте LPA. [ 4 ]
- Янус также является одной из немногих систем, поддерживающих временные вопросы.
- Интеллект от Trinzic (образован в результате слияния AICorp и Aion).
- BBN Язык языка основан на опыте разработки систем «Русь» и «Ирус» .
- IBM Языковой доступ
- Вопросы и ответы от Symantec .
- Datatalker от Natural Language Inc.
- Локи из BIM Systems.
- Английский волшебник от корпорации лингвистических технологий .
Проблемы
[ редактировать ]Интерфейсы на естественном языке в прошлом заставляли пользователей антропоморфизировать компьютер или, по крайней мере, приписывать машинам больше интеллекта, чем это оправдано. Со стороны пользователя это привело к нереалистичным ожиданиям возможностей системы. Такие ожидания затруднят изучение ограничений системы, если пользователи будут приписывать ей слишком большие возможности, и в конечном итоге приведут к разочарованию, когда система не сможет работать так, как ожидалось, как это было в эпоху ИИ зимой 1970-х и 80-х годов.
В статье 1995 года под названием «Интерфейсы естественного языка для баз данных – введение» описаны некоторые проблемы: [ 2 ]
- Модификатор вложения
- Запрос «Перечислить всех сотрудников компании, имеющих водительские права» неоднозначен, если вы не знаете, что компании не могут иметь водительские права.
- Соединение и дизъюнкция
- «Перечислить всех заявителей, живущих в Калифорнии и Аризоне», звучит неоднозначно, если только вы не знаете, что человек не может жить в двух местах одновременно.
- Разрешение анафоры
- определить, что пользователь подразумевает под «он», «она» или «оно», в самоссылающемся запросе.
Другими целями, которые следует учитывать в более общем плане, являются скорость и эффективность интерфейса. Во всех алгоритмах эти два момента являются основным моментом, который будет определять, будут ли одни методы лучше других и, следовательно, будут иметь больший успех на рынке. Кроме того, дополнительного внимания требует локализация на нескольких языковых сайтах, поскольку это связано с различиями в структуре предложений и синтаксических различиях между большинством языков.
Наконец, что касается используемых методов, то основная задача, которую предстоит решить, — это создание общего алгоритма, способного распознавать весь спектр разных голосов, не принимая во внимание национальность, пол или возраст. Существенные различия между извлеченными признаками – даже у говорящих, говорящих одно и то же слово или фразу, – должны быть успешно преодолены.
Использование и применение
[ редактировать ]Интерфейс на естественном языке порождает технологии, используемые для множества различных приложений.
Некоторые из основных применений:
- Диктовка на сегодняшний день является наиболее распространенным применением систем автоматического распознавания речи (ASR). Сюда входят медицинские транскрипции, юридические и деловые диктанты, а также общая обработка текста. В некоторых случаях для повышения точности системы используются специальные словари.
- Командование и управление . Системы ASR, предназначенные для выполнения функций и действий в системе, определяются как системы управления и контроля. Такие фразы, как «Открыть Netscape» и «Запустить новый xterm», сделают именно это.
- Телефония : некоторые системы УАТС/ голосовой почты позволяют вызывающим абонентам произносить команды вместо нажатия кнопок для отправки определенных тональных сигналов.
- Носимые устройства : поскольку ввод данных для носимых устройств ограничен, разговор является естественной возможностью.
- Медицинские, инвалидные , многие люди испытывают трудности с набором текста из-за физических ограничений, таких как травмы от повторяющихся перенапряжений (RSI), мышечная дистрофия и многие другие. Например, люди с нарушениями слуха могут использовать систему, подключенную к их телефону, для преобразования речи звонящего в текст.
- Встроенные приложения некоторых новых сотовых телефонов включают в себя систему распознавания речи C&C, позволяющую произносить такие слова, как «позвонить домой». Это может стать важным фактором в будущем автоматического распознавания речи и Linux .
Ниже перечислены и определены некоторые приложения, которые используют распознавание естественного языка и поэтому имеют встроенные утилиты, перечисленные выше.
Вездесущность
[ редактировать ]Ubiquity, надстройка для Mozilla Firefox , представляет собой набор быстрых и простых команд, основанных на естественном языке, которые действуют как гибридные веб-сервисы, что позволяет пользователям получать информацию и связывать ее с текущими и другими веб-страницами.
Вольфрам Альфа
[ редактировать ]Wolfram Alpha — это онлайн-сервис, который отвечает на фактические запросы напрямую, вычисляя ответ на основе структурированных данных, а не предоставляя список документов или веб-страниц, которые могут содержать ответ, как это сделала бы поисковая система . [ 5 ] Об этом было объявлено в марте 2009 года Стивеном Вольфрамом , и оно было опубликовано 15 мая 2009 года. [ 6 ]
Сири
[ редактировать ]Siri — это интеллектуальное приложение личного помощника , интегрированное с операционной системой iOS . Приложение использует обработку естественного языка , чтобы отвечать на вопросы и давать рекомендации.
Маркетинговые заявления Siri включают в себя то, что она со временем адаптируется к индивидуальным предпочтениям пользователя и персонализирует результаты, а также выполняет такие задачи, как заказ столика на ужин во время попытки поймать такси. [ 7 ]
Другие
[ редактировать ]- Ask.com – Первоначальная идея Ask Jeeves (Ask.com) заключалась в традиционном поиске по ключевым словам с возможностью получения ответов на вопросы, заданные на повседневном, естественном языке. Текущая версия Ask.com по-прежнему поддерживает это, с добавленной поддержкой математических, словарных и конверсионных вопросов.
- Брэйна [ 8 ] – Braina – это интерфейс на естественном языке для ОС Windows , который позволяет вводить или произносить предложения на английском языке, чтобы выполнить определенное действие или найти информацию.
- GNOME Do — позволяет быстро находить различные артефакты среды GNOME (приложения, контакты Evolution и Pidgin, закладки Firefox, исполнители и альбомы Rhythmbox и т. д.) и выполнять с ними основные действия (запуск, открытие, электронная почта, чат, воспроизведение, и т. д.). [ 9 ]
- hakia – хакиа была поисковой системой в Интернете. Компания изобрела новую инфраструктуру, альтернативную индексированию, в которой использовался алгоритм SemanticRank — сочетание решений из дисциплин онтологической семантики, нечеткой логики, компьютерной лингвистики и математики. Хакиа закрылась в 2014 году.
- Lexxe – Lexxe представляла собой поисковую систему в Интернете, которая использовала обработку запросов на естественном языке (семантический поиск). Поиск можно осуществлять по ключевым словам, фразам и вопросам, например «Сколько лет Википедии?» Lexxe закрыла свои поисковые системы в 2015 году.
- Pikimal – Pikimal использовал естественный язык, привязанный к предпочтениям пользователя, для предоставления рекомендаций по поиску по шаблону. Пикимал закрылся в 2015 году.
- Powerset . 11 мая 2008 г. компания представила инструмент для поиска в фиксированном подмножестве Википедии с использованием разговорных фраз, а не ключевых слов. [ 10 ] 1 июля 2008 года он был куплен Microsoft . [ 11 ]
- Q-go . Технология Q-go предоставляет пользователям релевантные ответы на запросы на веб-сайте компании или в корпоративной интрасети, сформулированные как в естественных предложениях, так и в виде ключевых слов. Q-go была приобретена RightNow Technologies в 2011 году.
- Yebol – Yebol представляла собой вертикальную поисковую систему «решений», которая разработала платформу семантического поиска, основанную на знаниях. Алгоритмы искусственного интеллекта Yebol, основанные на человеческом интеллекте, автоматически группируют и классифицируют результаты поиска, веб-сайты, страницы и контент, которые они представляют в визуально индексированном формате, который больше соответствует первоначальным намерениям человека. Йеболь использовал алгоритмы ассоциации, ранжирования и кластеризации для анализа связанных ключевых слов или веб-страниц. Yebol интегрировал обработку естественного языка, метасинтетически спроектированные открытые сложные системы и машинные алгоритмы с человеческим знанием для каждого запроса, чтобы создать веб-каталог, который фактически «обучается», используя алгоритмы корреляции, кластеризации и классификации для автоматического создания запроса на знания, который был сохраняется и регенерируется вперед. [ 12 ]
См. также
[ редактировать ]- Диалоговый пользовательский интерфейс
- Естественный пользовательский интерфейс
- Программирование на естественном языке
- Голосовой пользовательский интерфейс
- Чат-бот — компьютерная программа, имитирующая человеческие разговоры.
- Шумный текст
- Ответ на вопрос
- Поиск по выбору
- Семантический поиск
- Семантический запрос
- Семантическая сеть
Ссылки
[ редактировать ]- ^ Хилл, И. (1983). «Естественный язык против компьютерного языка». В книге М. Сайма и М. Кумбса (ред.) Проектирование для связи человека с компьютером. Академическая пресса.
- ^ Перейти обратно: а б Интерфейсы естественного языка для баз данных. Введение. И. Андрутсопулос, Г. Д. Ричи, П. Таниш, Департамент искусственного интеллекта Эдинбургского университета
- ^ «Демо-версия Чата-80» . Архивировано из оригинала 11 ноября 2016 года . Проверено 29 января 2018 г.
- ^ «ЭЛИЗА демо» . Архивировано из оригинала 26 ноября 2016 года . Проверено 29 января 2018 г.
- ^ Джонсон, Бобби (9 марта 2009 г.). «Британская поисковая система «может конкурировать с Google» » . Хранитель . Проверено 9 марта 2009 г.
- ^ «Вот и тихий запуск» . Блог Wolfram Alpha. 08 мая 2009 г. Проверено 20 октября 2009 г.
- ^ «iOS — Сири» . Яблоко . Проверено 29 января 2018 г.
- ^ «Braina — программное обеспечение искусственного интеллекта для Windows» . www.brainasoft.com . Проверено 29 января 2018 г.
- ^ Описание Ubuntu 10.04 «Добавление/удаление приложений» для GNOME Do
- ^ Хелфт, Мигель (12 мая 2008 г.). «Powerset дебютирует с поиском в Википедии» . Нью-Йорк Таймс .
- ^ Джонсон, Марк (1 июля 2008 г.). «Microsoft приобретает Powerset» . Блог Powerset. Архивировано из оригинала 25 февраля 2009 года.
- ^ Хамфрис, Мэтью. «Yebol.com выходит на рынок поиска». Архивировано 15 марта 2012 г. на Wayback Machine Geek.com . 31 июля 2009 г.