Jump to content

Прогнозируемый текст

Интеллектуальный текст — это технология ввода, используемая, когда одна клавиша или кнопка представляет множество букв, например, на физических цифровых клавиатурах мобильных телефонов и в технологиях специальных возможностей . Каждое нажатие клавиши приводит к предсказанию, а не к многократному повторению одной и той же группы «букв», которую она представляет, в одном и том же неизменном порядке. Интеллектуальный текст может позволить целое слово ввести одним нажатием клавиши. Функция интеллектуального ввода текста позволяет эффективно использовать меньшее количество клавиш устройства для ввода текста в текстовое сообщение , электронную почту , адресную книгу , календарь и т.п.

Наиболее широко используемые общие системы интеллектуального ввода текста — это T9 , iTap , eZiText и LetterWise /WordWise. Существует множество способов создания устройства, предсказывающего текст, но все системы предиктивного ввода текста имеют начальные лингвистические настройки, которые предлагают прогнозы, приоритеты которых перераспределяются для адаптации к каждому пользователю. Это обучение адаптируется через память устройства к устраняющей неоднозначность обратной связи пользователя, что приводит к корректирующим нажатиям клавиш, например, к нажатию клавиши «Далее», чтобы перейти к цели. Большинство систем интеллектуального ввода текста имеют базу данных пользователей, облегчающую этот процесс.

Теоретически количество нажатий клавиш, необходимое для одного нужного символа в готовом письме, в среднем сравнимо с использованием клавиатуры . Это примерно верно при условии, что все используемые слова находятся в его базе данных, пунктуация игнорируется и не допускаются ошибки при вводе или написании. [1] Теоретическое количество нажатий клавиш на символ, KSPC, на клавиатуре составляет KSPC=1,00, а при многократном нажатии - KSPC=2,03. от Eatoni LetterWise — это интеллектуальный гибрид с несколькими касаниями, который при работе на стандартной телефонной клавиатуре достигает KSPC = 1,15 для английского языка.

Выбор того, какую систему интеллектуального ввода текста лучше всего использовать, включает в себя соответствие предпочтительному стилю интерфейса пользователя , уровню его навыков работы с программным обеспечением для интеллектуального ввода текста и цели пользователя по эффективности. Существуют различные уровни риска в системах интеллектуального ввода текста по сравнению с системами с несколькими касаниями , поскольку автоматически записываемый прогнозируемый текст, обеспечивающий преимущество в скорости и механической эффективности, может, если пользователь не будет внимательно просматривать его, привести к передаче дезинформации. Системы предиктивного ввода текста требуют времени, чтобы научиться правильно их использовать, и поэтому, как правило, система устройства имеет пользовательские возможности, позволяющие настроить выбор нескольких касаний или любой из нескольких школ методов предиктивного ввода текста.

Предыстория [ править ]

Служба коротких сообщений (SMS) позволяет пользователю мобильного телефона отправлять текстовые сообщения (также называемые сообщениями, SMS-сообщениями, текстовыми сообщениями и текстовыми сообщениями) в виде коротких сообщений. Самая распространенная система ввода текста SMS называется « мультитап ». При использовании многократного нажатия клавиша нажимается несколько раз, чтобы получить доступ к списку букв на этой клавише. Например, нажатие клавиши «2» один раз отображает «а», дважды — «b» и три раза — «c». Чтобы ввести две последовательные буквы, находящиеся на одной и той же клавише, пользователь должен либо сделать паузу, либо нажать кнопку «Далее». Пользователь может печатать, нажимая буквенно-цифровую клавиатуру, не глядя на дисплей электронного оборудования. Таким образом, мультитап легко понять и его можно использовать без какой-либо визуальной обратной связи. Однако многократное нажатие не очень эффективно: для ввода одной буквы потенциально требуется много нажатий клавиш.

При идеальном интеллектуальном вводе текста все используемые слова находятся в словаре, пунктуация игнорируется, орфографические и печатные ошибки не допускаются. Идеальный словарь должен включать весь сленг, имена собственные , сокращения , URL-адреса , слова на иностранных языках и другие уникальные для пользователя слова. Это идеальное обстоятельство дает программному обеспечению для интеллектуального ввода текста сокращение количества нажатий клавиш, необходимых пользователю для ввода слова. Пользователь нажимает число, соответствующее каждой букве, и, пока слово существует в словаре предиктивного текста или правильно расшифровывается не-словарными системами, оно появляется. Например, нажатие «4663» обычно будет интерпретироваться как слово « хорошо » при условии, что в настоящее время используется лингвистическая база данных на английском языке, хотя такие альтернативы, как «дом» , «капюшон» и «копыта» , также являются допустимыми интерпретациями последовательности нажатий клавиш.

Наиболее широко используемые системы интеллектуального ввода текста — это T9 компании Tegic , iTap компании Motorola и Eatoni Ergonomics и WordWise компании системы LetterWise . T9 и iTap используют словари, но продукты Eatoni Ergonomics используют процесс устранения неоднозначности — набор статистических правил для воссоздания слов из последовательностей нажатий клавиш. Всем системам интеллектуального ввода текста требуется лингвистическая база данных для каждого поддерживаемого языка ввода.

Словарные и несловарные системы [ править ]

Традиционное устранение неоднозначности работает путем обращения к словарю часто используемых слов, хотя Eatoni предлагает систему устранения неоднозначности без словаря.

В системах на основе словаря, когда пользователь нажимает цифровые кнопки, алгоритм ищет в словаре список возможных слов, соответствующих комбинации клавиш, и предлагает наиболее вероятный выбор. Затем пользователь может подтвердить выбор и двигаться дальше или использовать клавишу для переключения возможных комбинаций.

Несловарная система строит слова и другие последовательности букв на основе статистики частей слова. Чтобы попытаться предсказать предполагаемый результат еще не введенных нажатий клавиш, устранение неоднозначности можно объединить со средством завершения слов .

Любая система (устранение неоднозначности или прогнозирующая) может включать в себя базу данных пользователей, которую можно далее классифицировать как «обучающуюся» систему, когда слова или фразы вводятся в базу данных пользователей без прямого вмешательства пользователя. База данных пользователей предназначена для хранения слов или фраз, которые не могут быть четко определены предварительно предоставленной базой данных. Некоторые системы устранения неоднозначности также пытаются исправить орфографию, форматировать текст или выполнить другие автоматические перезаписи, что приводит к риску либо улучшить, либо свести на нет усилия пользователя по вводу текста.

История [ править ]

Технология интеллектуального ввода текста и автозаполнения была изобретена китайскими учеными и лингвистами в 1950-х годах для решения проблемы неэффективности ввода китайской пишущей машинки . [2] поскольку процесс набора текста включал поиск и выбор тысяч логотипографических символов на лотке, [3] резко замедляет скорость обработки текста. [4] [5]

Активирующие клавиши китайской пишущей машинки, созданной Линь Ютаном в 1940-х годах, включали предложения для символов, следующих за выбранным. В 1951 году китайский наборщик Чжан Цзиин расположил китайские иероглифы в ассоциативные группы, что стало предшественником современного интеллектуального ввода текста, и этим побил рекорды скорости. [6] Предиктивный ввод текста с клавиатуры телефона известен по крайней мере с 1970-х годов (Смит и Гудвин, 1971). Интеллектуальный текст в основном использовался для поиска имен в каталогах по телефону, пока текстовые сообщения с мобильных телефонов не получили широкого распространения.

Пример [ править ]

Стандартная клавиатура ITU-T E.161, используемая для обмена текстовыми сообщениями.

На обычной телефонной клавиатуре, если пользователи хотят ввести код в системе ввода с несколькими касаниями, им необходимо будет:

  • Нажмите 8 (tuv) один раз, чтобы выбрать t .
  • Дважды нажмите 4 (ghi), чтобы выбрать h .
  • Нажмите 3 (def) дважды, чтобы выбрать e .

Между тем в телефоне с интеллектуальным вводом текста им нужно всего лишь:

  • Нажмите 8 один раз, чтобы выбрать группу (tuv) для первого символа.
  • Нажмите 4 один раз, чтобы выбрать группу (ghi) для второго символа.
  • Нажмите 3 один раз, чтобы выбрать группу (def) для третьего символа.

Система обновляет дисплей при каждом нажатии клавиши, чтобы показать наиболее вероятный ввод. В этом примере прогнозирование уменьшило количество нажатий кнопок с пяти до трех. Эффект еще сильнее при использовании более длинных слов и слов, состоящих из букв, расположенных позже в последовательности каждой клавиши.

Система прогнозирования на основе словаря основана на надежде, что нужное слово есть в словаре. Эта надежда может оказаться неуместной, если слово каким-либо образом отличается от общепринятого употребления, в частности, если слово написано или напечатано неправильно, является сленгом или является существительным собственным . В этих случаях для ввода слова необходимо использовать какой-то другой механизм. Более того, простой словарный подход не работает с агглютинативными языками , где одно слово не обязательно представляет собой одну семантическую единицу.

Компании и продукты [ править ]

Функция интеллектуального ввода текста разрабатывается и продается во множестве конкурирующих продуктов, таких как Nuance Communications компании T9 . Другие продукты включают Motorola от iTap ; Eatoni Ergonomic от LetterWise (предсказание на основе символов, а не слов); WordWise (предсказание на основе слов без словаря); EQ3 ( раскладка типа QWERTY , совместимая с обычными телефонными клавиатурами); Preвалентных устройств от Phraze-It ; Xrgomics ' TenGO (система клавиатуры QWERTY с шестью клавишами); Adaptxt (учитывает язык, контекст, грамматику и семантику); Lightkey (программное обеспечение для интеллектуального набора текста для Windows); Clevertexting (статистическая природа языка, отсутствие словаря, динамическое распределение ключей); и Тип Оизеа (временная неоднозначность); Tauto компании Intelab; интеллектуальная платформа ввода WordLogic™ (запатентованное расширенное прогнозирование текста на основе слоев, включает многоязычный словарь, проверку орфографии, встроенный веб-поиск); от Google Gboard .

Текстонимы [ править ]

Слова, созданные с помощью одной и той же комбинации нажатий клавиш, были названы «текстонимами»; [7] также «текстонимы»; [8] «T9onyms» (произносится как «tynonyms» / ˈ t n ə n ɪ m z / или [7] ), хотя они не специфичны для Т9. Выбор неправильного текстонима может произойти без орфографических ошибок или опечаток, если неправильный текстоним выбран по умолчанию или по ошибке пользователя. Как упоминалось выше, последовательность клавиш 4663 на телефонной клавиатуре, снабженной лингвистической базой данных на английском языке, обычно будет трактоваться как слово « хорошо» . Однако та же самая последовательность клавиш соответствует и другим словам, таким как home , away , hoof , hood и так далее. Например: «Ты дома?» можно было бы перевести как «Ты в порядке?» если пользователь пренебрегает изменением слова 4663 по умолчанию. Это может привести к недопониманию; например, последовательность 735328 может соответствовать либо select , либо его антониму ignore . Драка 2010 года, приведшая к непредумышленному убийству, была спровоцирована ошибкой в ​​текстовом названии. [9] Прогнозируемый текст, выбирающий значение по умолчанию, отличное от того, которое ожидает пользователь, имеет сходство с эффектом Купертино , при котором программное обеспечение для проверки правописания изменяет написание непредусмотренного слова.

Текстонимы использовались как миллениалов сленг ; например, использование слова book для обозначения «круто» , поскольку «book» было значением по умолчанию в системах интеллектуального ввода текста, которые предполагали, что это слово встречается чаще, чем «cool» . [10] Это связано с какографией .

Ошибка определения неоднозначности и орфографическая ошибка [ править ]

Текстонимы — не единственная проблема, ограничивающая эффективность реализации интеллектуального текста. Еще одна серьезная проблема — это слова, для которых устранение неоднозначности дает единственный неправильный ответ. Система может, например, ответить Блэрфом при вводе 252473, когда предполагаемым словом было Блейз или Клэр , оба из которых соответствуют последовательности нажатий клавиш, но в этом примере не найдены системой интеллектуального ввода текста. Когда возникают опечатки или орфографические ошибки, они вряд ли будут правильно распознаны системой устранения неоднозначности, хотя механизмы исправления ошибок могут смягчить этот эффект.

См. также [ править ]

Концепции [ править ]

Ссылки [ править ]

  1. ^ И. Скотт Маккензи (2002). «KSPC (количество нажатий клавиш на символ) как характеристика методов ввода текста» . Материалы MobileHCI 2002 . Значения [KSPC] для английского языка варьируются от примерно 10 для методов, использующих только клавиши курсора и клавишу SELECT, до примерно 0,5 для методов предсказания слов. Показано, что KSPC полезен для априорного анализа, тем самым поддерживая характеристику и сравнение методов ввода текста перед трудоемкими реализациями и оценками.
  2. ^ Макклюр, Макс (12 ноября 2012 г.). «Китайская пишущая машинка предвосхищала предсказывающий текст, находит историк» .
  3. ^ Соррел, Чарли (23 февраля 2009 г.). «Как это работает: китайская пишущая машинка» . Проводной .
  4. ^ Гринвуд, Вероника (14 декабря 2016 г.). «Почему интеллектуальный ввод текста заставляет вас забыть, как писать» . Новый учёный .
  5. ^ О'Донован, Кэролайн (16 августа 2016 г.). «Как эта десятилетняя технология привела к появлению интеллектуального текста» . Баззфид .
  6. ^ Фишер, Джейми (8 марта 2018 г.). «Ребенок-левша» . Лондонское обозрение книг . 40 (5) . Проверено 16 марта 2018 г.
  7. Перейти обратно: Перейти обратно: а б «Сленговое предупреждение: «Книга» — это новая «кошачья пижама» | Смена темы» . Блоги.chicagotribune.com. 19 января 2007 г. Проверено 8 июля 2009 г.
  8. ^ Дартмельк, еврей. «Текстонимы» (PDF) . Университетский колледж Лондона: Центр математики и физики в области наук о жизни и экспериментальной биологии . Проверено 5 апреля 2013 г.
  9. ^ «Бессрочный приговор за убийство своего друга» . Это Ланкашир . 2 апреля 2011 г. Архивировано из оригинала 4 марта 2016 г. . Проверено 5 апреля 2013 г.
  10. ^ Аллейн, Ричард (5 февраля 2008 г.). «Предсказывающий текст, создающий секретный подростковый язык» . «Дейли телеграф» . Проверено 5 апреля 2013 г.

Дальнейшее чтение [ править ]

  • Смит, Сидни Л.; Гудвин, Нэнси К. (1971). «Ввод данных в алфавитном порядке с помощью сенсорной панели: комментарий». Человеческий фактор . 13 (2): 189–190. дои : 10.1177/001872087101300212 . S2CID   61164630 .

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: f5d910946d7c64fcb18eb1434c3156a1__1702418580
URL1:https://arc.ask3.ru/arc/aa/f5/a1/f5d910946d7c64fcb18eb1434c3156a1.html
Заголовок, (Title) документа по адресу, URL1:
Predictive text - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)