Jump to content

Гибридный машинный перевод

Гибридный машинный перевод — это метод машинного перевода , который характеризуется использованием нескольких подходов машинного перевода в рамках одной системы машинного перевода. Мотивация разработки гибридных систем машинного перевода проистекает из неспособности какого-либо отдельного метода достичь удовлетворительного уровня точности. Многие гибридные системы машинного перевода успешно повышают точность перевода, и существует несколько популярных систем машинного перевода, которые используют гибридные методы.

Многомоторный

[ редактировать ]

Этот подход к гибридному машинному переводу предполагает параллельную работу нескольких систем машинного перевода. Конечный результат генерируется путем объединения результатов всех подсистем. Чаще всего в этих системах используются статистические и основанные на правилах подсистемы перевода. [1] но были изучены и другие комбинации. Например, исследователи из Университета Карнеги-Меллон добились определенного успеха в объединении на основе примеров , передачи , знаний и статистического перевода в одну систему машинного перевода. подсистем перевода [2]

Генерация статистических правил

[ редактировать ]

Этот подход предполагает использование статистических данных для создания лексических и синтаксических правил. Затем входные данные обрабатываются с использованием этих правил, как если бы это был транслятор на основе правил . [1] Этот подход пытается избежать сложной и трудоемкой задачи создания набора всеобъемлющих, детализированных лингвистических правил путем извлечения этих правил из обучающего корпуса. Этот подход по-прежнему страдает от многих проблем обычного статистического машинного перевода , а именно от того, что точность перевода будет сильно зависеть от сходства входного текста с текстом обучающего корпуса. В результате этот метод имел наибольший успех в приложениях, специфичных для конкретной предметной области, и имеет те же трудности с адаптацией к предметной области, что и многие системы статистического машинного перевода . [3]

Многопроходной

[ редактировать ]

Этот подход предполагает последовательную обработку ввода несколько раз. Наиболее распространенным методом, используемым в многопроходных системах машинного перевода, является предварительная обработка входных данных с помощью системы машинного перевода , основанной на правилах . Выходные данные препроцессора на основе правил передаются в статистическую систему машинного перевода , которая выдает окончательный результат. Этот метод используется для ограничения объема информации, которую должна учитывать статистическая система, что значительно снижает требуемую вычислительную мощность. Это также устраняет необходимость в том, чтобы система, основанная на правилах, была полноценной системой перевода на язык, что значительно снижает количество человеческих усилий и труда, необходимых для создания системы. [4]

Основанный на доверии

[ редактировать ]

Этот подход отличается от других гибридных подходов тем, что в большинстве случаев используется только одна технология перевода. Для каждого переведенного предложения создается показатель достоверности, на основе которого можно принять решение, использовать ли вторичную технологию перевода или продолжить первоначальный результат перевода. SMT также используется, когда типичные шаблоны ошибок, такие как несколько повторяющихся слов, появляются последовательно, как это часто бывает с NMT, когда механизм внимания сбивается.

См. также

[ редактировать ]
  1. ^ Jump up to: а б Хатчинс, Дж. 2007. Машинный перевод: краткая история. Архивировано 28 ноября 2021 г. в Wayback Machine . Компьютерный перевод: Теория и практика.
  2. ^ Хоган, К. и Фредеркинг, Р. 1998. Оценка многомоторной архитектуры MT . Конспекты лекций по информатике, 1529, стр. 113–123.
  3. ^ Чанг, Дж. и Су, К. 1997. Исследования машинного перевода, ориентированные на корпусную статистику (CBSO), на Тайване . АМТА (1997), стр. 165–173.
  4. ^ Хови, Э. 1996. Углубление мудрости или компромиссные принципы? - гибридизация статистических и символических систем МП . Эксперт IEEE, 11 (2), стр. 16–18.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: d08818b4288f48067d94a4b0e8d4678b__1673563920
URL1:https://arc.ask3.ru/arc/aa/d0/8b/d08818b4288f48067d94a4b0e8d4678b.html
Заголовок, (Title) документа по адресу, URL1:
Hybrid machine translation - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)