Jump to content

Определение ключевых слов

Обнаружение ключевых слов (или, проще говоря, обнаружение слов ) — это проблема, которая исторически впервые была определена в контексте обработки речи . [1] [2] При обработке речи обнаружение ключевых слов занимается идентификацией ключевых слов в высказываниях .

Обнаружение ключевых слов также определяется как отдельная, но связанная проблема в контексте обработки изображений документа. [1] При обработке изображений документа обнаружение ключевых слов — это проблема поиска всех вхождений запрашиваемого слова, которые существуют в отсканированном изображении документа, без его полного распознавания.

В обработке речи

[ редактировать ]

Первые работы по определению ключевых слов появились в конце 1980-х годов. [2]

Особым случаем обнаружения ключевых слов является обнаружение пробуждающего слова (также называемого «горячим словом»), используемое персональными цифровыми помощниками, такими как Alexa или Siri, для активации бездействующего динамика, другими словами, «пробуждения», когда произносится его имя.

В Соединенных Штатах Агентство национальной безопасности использует отслеживание ключевых слов как минимум с 2006 года. [3] Эта технология позволяет аналитикам просматривать большие объемы записанных разговоров и изолировать упоминания подозрительных ключевых слов. Записи можно индексировать, а аналитики могут выполнять запросы к базе данных, чтобы найти интересующие разговоры. IARPA финансировало исследование по определению ключевых слов в программе Babel .

Некоторые алгоритмы, используемые для этой задачи:

При обработке изображений документов

[ редактировать ]

Обнаружение ключевых слов при обработке изображений документов можно рассматривать как пример более общей проблемы поиска изображений на основе контента (CBIR).Целью запроса является получение наиболее релевантных экземпляров слов в коллекции отсканированных документов. [1] Запрос может представлять собой текстовую строку (построчный поиск ключевых слов) или изображение слова (последовательный поиск ключевых слов).

  1. ^ Jump up to: а б с Гиотис, АП; Сфикас, Г.; Гатос, Б.; Нику, К. (2017). «Обзор методов определения слов в изображениях документов». Распознавание образов . 68 : 310–332. Бибкод : 2017PatRe..68..310G . дои : 10.1016/j.patcog.2017.02.023 .
  2. ^ Jump up to: а б Роличек, Дж.; Рассел, В.; Рукос, С.; Гиш, Х. (1989). «Непрерывное скрытое марковское моделирование для независимого от говорящего распознавания слов». Материалы 14-й Международной конференции IEEE по акустике, речи и обработке сигналов (ICASSP) . 1 : 627–630.
  3. ^ Фрумкин, Дэн (5 мая 2015 г.). «КОМПЬЮТЕРЫ СЛУШАЮТ» . Перехват . Проверено 20 июня 2015 г.
  4. ^ Сайнат, Тара Н ; Парада, Каролина (2015). «Сверточные нейронные сети для небольшого обнаружения ключевых слов». Шестнадцатая ежегодная конференция Международной ассоциации речевой коммуникации . arXiv : 1711.00333 .
  5. ^ Вэй, Бо; Ян, Мейронг; Чжан, Тао; Тан, Сяо; Хуан, Син; Ким, Кюхонг; Ли, Джэюн; Чо, Кихо; Пак, Сон Ын (30 августа 2021 г.). Комплексное определение ключевых слов с открытым словарем на основе трансформатора и локальное внимание с учетом местоположения (PDF) . Интерспич 2021. {{cite conference}}: CS1 maint: дата и год ( ссылка )
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 154d309b857a714b407eb38aaba2fe84__1691109180
URL1:https://arc.ask3.ru/arc/aa/15/84/154d309b857a714b407eb38aaba2fe84.html
Заголовок, (Title) документа по адресу, URL1:
Keyword spotting - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)