Определение ключевых слов

Обнаружение ключевых слов (или, проще говоря, обнаружение слов ) — это проблема, которая исторически впервые была определена в контексте обработки речи . ^[1]^[2]При обработке речи обнаружение ключевых слов занимается идентификацией ключевых слов в высказываниях .

Обнаружение ключевых слов также определяется как отдельная, но связанная проблема в контексте обработки изображений документа. ^[1]При обработке изображений документа обнаружение ключевых слов — это проблема поиска всех вхождений запрашиваемого слова, которые существуют в отсканированном изображении документа, без его полного распознавания.

В обработке речи

Первые работы по определению ключевых слов появились в конце 1980-х годов. ^[2]

Особым случаем обнаружения ключевых слов является обнаружение пробуждающего слова (также называемого «горячим словом»), используемое персональными цифровыми помощниками, такими как Alexa или Siri, для активации бездействующего динамика, другими словами, «пробуждения», когда произносится его имя.

В Соединенных Штатах Агентство национальной безопасности использует отслеживание ключевых слов как минимум с 2006 года. ^[3] Эта технология позволяет аналитикам просматривать большие объемы записанных разговоров и изолировать упоминания подозрительных ключевых слов. Записи можно индексировать, а аналитики могут выполнять запросы к базе данных, чтобы найти интересующие разговоры. IARPA финансировало исследование по определению ключевых слов в программе Babel .

Некоторые алгоритмы, используемые для этой задачи:

Модель раздвижного окна и мусора
K-лучшая гипотеза
Итеративное декодирование Витерби
Сверточная нейронная сеть на мел-частотных коэффициентах кепстра ^[4]
трансформаторов Определение ключевых слов на основе ^[5]

При обработке изображений документов

Обнаружение ключевых слов при обработке изображений документов можно рассматривать как пример более общей проблемы поиска изображений на основе контента (CBIR).Целью запроса является получение наиболее релевантных экземпляров слов в коллекции отсканированных документов. ^[1]Запрос может представлять собой текстовую строку (построчный поиск ключевых слов) или изображение слова (последовательный поиск ключевых слов).

Ссылки

^ Jump up to: ^а ^б ^с Гиотис, АП; Сфикас, Г.; Гатос, Б.; Нику, К. (2017). «Обзор методов определения слов в изображениях документов». Распознавание образов . 68 : 310–332. Бибкод : 2017PatRe..68..310G . дои : 10.1016/j.patcog.2017.02.023 .
^ Jump up to: ^а ^б Роличек, Дж.; Рассел, В.; Рукос, С.; Гиш, Х. (1989). «Непрерывное скрытое марковское моделирование для независимого от говорящего распознавания слов». Материалы 14-й Международной конференции IEEE по акустике, речи и обработке сигналов (ICASSP) . 1 : 627–630.
^ Фрумкин, Дэн (5 мая 2015 г.). «КОМПЬЮТЕРЫ СЛУШАЮТ» . Перехват . Проверено 20 июня 2015 г.
^ Сайнат, Тара Н ; Парада, Каролина (2015). «Сверточные нейронные сети для небольшого обнаружения ключевых слов». Шестнадцатая ежегодная конференция Международной ассоциации речевой коммуникации . arXiv : 1711.00333 .
^ Вэй, Бо; Ян, Мейронг; Чжан, Тао; Тан, Сяо; Хуан, Син; Ким, Кюхонг; Ли, Джэюн; Чо, Кихо; Пак, Сон Ын (30 августа 2021 г.). Комплексное определение ключевых слов с открытым словарем на основе трансформатора и локальное внимание с учетом местоположения (PDF) . Интерспич 2021. {{cite conference}}: CS1 maint: дата и год ( ссылка )

[giotis17-1] Jump up to: ^а ^б ^с Гиотис, АП; Сфикас, Г.; Гатос, Б.; Нику, К. (2017). «Обзор методов определения слов в изображениях документов». Распознавание образов . 68 : 310–332. Бибкод : 2017PatRe..68..310G . дои : 10.1016/j.patcog.2017.02.023 .

[rohlicek89-2] Jump up to: ^а ^б Роличек, Дж.; Рассел, В.; Рукос, С.; Гиш, Х. (1989). «Непрерывное скрытое марковское моделирование для независимого от говорящего распознавания слов». Материалы 14-й Международной конференции IEEE по акустике, речи и обработке сигналов (ICASSP) . 1 : 627–630.

[3] Фрумкин, Дэн (5 мая 2015 г.). «КОМПЬЮТЕРЫ СЛУШАЮТ» . Перехват . Проверено 20 июня 2015 г.

[4] Сайнат, Тара Н ; Парада, Каролина (2015). «Сверточные нейронные сети для небольшого обнаружения ключевых слов». Шестнадцатая ежегодная конференция Международной ассоциации речевой коммуникации . arXiv : 1711.00333 .

[5] Вэй, Бо; Ян, Мейронг; Чжан, Тао; Тан, Сяо; Хуан, Син; Ким, Кюхонг; Ли, Джэюн; Чо, Кихо; Пак, Сон Ын (30 августа 2021 г.). Комплексное определение ключевых слов с открытым словарем на основе трансформатора и локальное внимание с учетом местоположения (PDF) . Интерспич 2021. {{cite conference}}: CS1 maint: дата и год ( ссылка )

[1]

[2]

[3]

[4]

[5]