Jump to content

Частота ошибок в словах

Коэффициент ошибок в словах ( WER ) — это общий показатель производительности системы распознавания речи или машинного перевода .

Общая сложность измерения производительности заключается в том, что распознанная последовательность слов может иметь длину, отличную от эталонной последовательности слов (предположительно правильной). WER получен из расстояния Левенштейна и работает на уровне слов, а не на уровне фонем . WER — ценный инструмент для сравнения различных систем, а также для оценки улучшений внутри одной системы. Однако этот вид измерения не дает подробностей о природе ошибок перевода, и поэтому требуется дальнейшая работа для выявления основного источника(ов) ошибки и сосредоточения любых исследовательских усилий.

Эта проблема решается путем предварительного выравнивания распознанной последовательности слов с эталонной (произносимой) последовательностью слов с использованием динамического выравнивания строк. Исследование этой проблемы рассматривается с помощью теории, называемой степенным законом, которая утверждает корреляцию между недоумением и частотой ошибок в словах. [1]

Тогда коэффициент ошибок в словах можно рассчитать как:

где

  • S – количество замен,
  • D – количество делеций,
  • I — количество вставок,
  • C – количество правильных слов,
  • N — количество слов в ссылке (N=S+D+C)

Интуиция, лежащая в основе «удаления» и «вставки», заключается в том, как перейти от ссылки к гипотезе. Итак, если у нас есть ссылка «Это Arc.Ask3.Ru» и гипотеза «Это _ Arc.Ask3.Ru», мы называем это удалением.

При сообщении о производительности системы распознавания речи иногда точность слов (WAcc) вместо этого используется :

Обратите внимание: поскольку N — это количество слов в ссылке, коэффициент ошибок в словах может быть больше 1,0, и, следовательно, точность слова может быть меньше 0,0.

Эксперименты

[ редактировать ]

Принято считать, что более низкий уровень ошибок в словах обеспечивает более высокую точность распознавания речи по сравнению с более высоким уровнем ошибок в словах. Однако, по крайней мере, одно исследование показало, что это может быть не так. В эксперименте Microsoft Research было показано, что если бы люди обучались по программе, «которая соответствует цели оптимизации понимания» (Wang, Acero and Chelba, 2003), они продемонстрировали бы более высокую точность понимания языка, чем другие люди, продемонстрировавшие более низкий уровень ошибок в словах, что показывает, что истинное понимание разговорной речи зависит не только от высокой точности распознавания слов . [2]

Другие показатели

[ редактировать ]

Однако одна из проблем с использованием общей формулы, такой как приведенная выше, заключается в том, что не принимается во внимание влияние, которое различные типы ошибок могут оказать на вероятность успешного результата, например, некоторые ошибки могут быть более разрушительными, чем другие, а некоторые могут исправить легче, чем другие. Эти факторы, вероятно, будут специфичны для синтаксиса тестируемого . Еще одна проблема заключается в том, что даже при наилучшем выравнивании формула не может отличить ошибку замены от комбинированной ошибки удаления и вставки.

Хант (1990) предложил использовать взвешенную меру точности производительности, где ошибки замены имеют вес, равный единице, а ошибки удаления и вставки имеют вес только 0,5, таким образом:

Однако ведутся споры о том, можно ли правильно использовать формулу Ханта для оценки производительности одной системы, поскольку она была разработана как средство сравнения более справедливо конкурирующих систем-кандидатов. Еще одна сложность добавляется тем, допускает ли данный синтаксис исправление ошибок, и если да, то насколько прост этот процесс для пользователя. Таким образом, аргумент в пользу того, что показатели производительности следует разрабатывать в соответствии с конкретной измеряемой системой, имеет определенные основания.

Однако какой бы показатель ни использовался, одной из основных теоретических проблем при оценке производительности системы является решение о том, было ли слово «неправильно произнесено», т.е. лежит ли вина на пользователе или на распознавателе. Это может быть особенно актуально в системе, предназначенной для работы с людьми, для которых данный язык не является родным, или с сильным региональным акцентом.

Скорость, с которой следует произносить слова во время процесса измерения, также является источником различий между испытуемыми, как и необходимость испытуемых отдохнуть или перевести дух. Все эти факторы, возможно, необходимо каким-то образом контролировать.

Для текстовой диктовки общепринято, что точность производительности ниже 95 % неприемлема, но это опять же может зависеть от синтаксиса и/или предметной области, например, есть ли у пользователей нехватка времени для выполнения задачи, существуют ли альтернативные методы завершения и так далее.

Термин «коэффициент ошибок в одном слове» иногда называют процентом неправильных распознаваний каждого отдельного слова в системном словаре.

Изменить расстояние

[ редактировать ]

Коэффициент ошибок в словах также можно назвать нормализованным по длине расстоянием редактирования . [3] Нормализованное расстояние редактирования между X и Y, d (X,Y) определяется как минимум W(P)/L(P), где P — путь редактирования между X и Y, W(P) — сумма веса элементарных операций редактирования P, а L(P) — количество этих операций (длина P). [4]

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ Клаков, Дитрих; Йохен Петерс (сентябрь 2002 г.). «Тестирование корреляции частоты ошибок в словах и недоумения». Речевое общение . 38 (1–2): 19–28. дои : 10.1016/S0167-6393(01)00041-3 . ISSN   0167-6393 .
  2. ^ Ван, Ю.; Асеро, А.; Челба, К. (2003). Является ли процент ошибок в словах хорошим индикатором точности понимания разговорной речи ? Семинар IEEE по автоматическому распознаванию и пониманию речи. Сент-Томас, Виргинские острова США. CiteSeerX   10.1.1.89.424 .
  3. ^ Ниссен и др. (2000)
  4. ^ Вычисление нормализованного расстояния редактирования и применение: Андрес Марзал и Энрике Видаль

Другие источники

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: d043074269e8c1cae7918fa32b232159__1702639740
URL1:https://arc.ask3.ru/arc/aa/d0/59/d043074269e8c1cae7918fa32b232159.html
Заголовок, (Title) документа по адресу, URL1:
Word error rate - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)