Jump to content

Модель шумного канала

Модель шумного канала — это структура, используемая в средствах проверки правописания . ответы на вопросы , распознавание речи и машинный перевод . В этой модели цель состоит в том, чтобы найти предполагаемое слово по слову, в котором буквы каким-то образом перепутались.

В проверке орфографии

[ редактировать ]

См. главу B. [1]

Учитывая алфавит , позволять быть набором всех конечных струн над . Пусть словарь допустимых слов быть некоторым подмножеством , то есть, .

Шумный канал – это матрица

,

где это предполагаемое слово и это зашифрованное слово, которое было фактически получено.

Цель модели шумного канала — найти нужное слово с учетом зашифрованное слово, которое было получено. Функция принятия решения это функция, которая по зашифрованному слову возвращает задуманное слово.

К методам построения решающей функции относятся правило максимального правдоподобия , правило максимума апостериорного типа и правило минимального расстояния .

В некоторых случаях может быть лучше принять зашифрованное слово как задуманное. слово, а не пытаться найти нужное слово в словаре. Для Например, слова schönfinkeling может не быть в словаре, но оно может быть на самом деле быть подразумеваемым словом.

Рассмотрим английский алфавит . Некоторое подмножество составляет словарь валидного английского языка слова.

При наборе текста может возникнуть ряд ошибок, в том числе:

  1. Пропущенные буквы, например, буква вместо буквы
  2. Случайное добавление букв, например, ошибка вместо ошибки.
  3. Перестановка писем, например, получено вместо полученного
  4. Замена букв, например, фимит вместо конечного

Чтобы построить матрицу шумного канала , мы должны рассмотреть вероятность каждой ошибки, учитывая предполагаемое слово ( для всех и ). Эти вероятности могут быть собраны, поскольку например, рассмотрев расстояние Дамерау – Левенштейна между и или сравнивая черновик эссе с уже имеющимся были отредактированы вручную для проверки правописания.

В машинном переводе

[ редактировать ]

Естественно, возникает вопрос, можно ли рассматривать проблему перевода как проблему криптографии. Когда я смотрю на статью на русском языке, я говорю: «Это действительно написано по-английски, но закодировано какими-то странными символами». Теперь приступлю к расшифровке.

Уоррен Уивер , письмо Норберту Винеру , 4 марта 1947 г.

См. главу 1 и главу 25. [2]

Предположим, мы хотим перевести иностранный язык на английский, мы могли бы смоделировать напрямую: вероятность того, что у нас есть английское предложение E, учитывая иностранное предложение F, затем мы выбираем наиболее вероятное . Однако по закону Байеса мы имеем эквивалентное уравнение: Преимущество модели шумного канала заключается в данных: если сбор параллельного корпуса обходится дорого, то у нас будет только небольшой параллельный корпус, поэтому мы сможем обучить только умеренно хорошую модель перевода с английского на иностранный и умеренно хорошая модель перевода с иностранного языка на английский. Однако мы можем собрать большой корпус только по иностранному языку и большой корпус только по английскому языку, чтобы обучить две хорошие языковые модели. Объединив эти четыре модели, мы сразу получаем хорошего англо-иностранного переводчика и хорошего иностранно-английского переводчика. [3]

Цена модели с шумным каналом заключается в том, что использование байесовского вывода обходится дороже, чем непосредственное использование модели перевода. Вместо того, чтобы зачитывать наиболее вероятный перевод, , ему придется считывать прогнозы как модели перевода, так и языковой модели, умножать их и искать наибольшее число.

В распознавании речи

[ редактировать ]

Распознавание речи можно рассматривать как перевод со звукового языка на текстовый язык. Следовательно, мы имеем где - это вероятность того, что звук речи S будет воспроизведен, если говорящий намеревается произнести текст T. Интуитивно это уравнение утверждает, что наиболее вероятным текстом является текст, который одновременно является вероятным текстом на языке и с высокой вероятностью производит речевой звук .

Полезность модели с шумным каналом не в емкости. Теоретически любую модель канала с шумом можно воспроизвести прямым путем. модель. Однако модель с шумным каналом разделяет модель на две части, соответствующие ситуации, и, следовательно, она в целом более эффективна.

Когда человек говорит, он не производит звук напрямую, а сначала производит текст, который хочет произнести, в языковых центрах мозга, затем текст преобразуется в звук моторной корой, голосовыми связками и другими частями мозга. тело. Модель шумового канала соответствует этой модели человека и поэтому подходит. Это оправдано практическим успехом модели шумного канала в распознавании речи.

Рассмотрим звуковое предложение (написанное в IPA для английского языка ) S = aɪ wʊd laɪk wʌn tuː . Есть три возможных текста :

  • Я бы хотел, чтобы один.
  • Я бы тоже хотел.
  • Я бы хотел один два.

одинаково вероятны в том смысле, что . Имея хорошую модель английского языка, мы бы , так как второе предложение грамматическое, то первое не совсем, но близко к грамматическому (типа «Мне бы хотелось одного [пойти]»), а третье далеко от грамматического.

Следовательно, модель шумного канала будет выводить как лучшая транскрипция.

См. также

[ редактировать ]
  1. ^ Обработка речи и языка. Дэниел Джурафски и Джеймс Х. Мартин. © 2023. Все права защищены. Черновик от 7 января 2023 г. https://web.stanford.edu/~jurafsky/slp3/B.pdf.
  2. ^ Юрафски, Дэн (2009). Обработка речи и языка: введение в обработку естественного языка, компьютерную лингвистику и распознавание речи . Джеймс Х. Мартин (2-е изд.). Река Аппер-Седл, ISBN Нью-Джерси  978-0-13-187321-6 . OCLC   213375806 . {{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )
  3. ^ Браун, Питер Ф.; Делла Пьетра, Стивен А.; Делла Пьетра, Винсент Дж.; Мерсер, Роберт Л. (1993). Хиршберг, Джулия (ред.). «Математика статистического машинного перевода: оценка параметров» . Компьютерная лингвистика . 19 (2): 263–311.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 3cc48e99924da8db02d2205ee079623a__1699972560
URL1:https://arc.ask3.ru/arc/aa/3c/3a/3cc48e99924da8db02d2205ee079623a.html
Заголовок, (Title) документа по адресу, URL1:
Noisy channel model - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)