Гибридный машинный перевод
Гибридный машинный перевод — это метод машинного перевода , который характеризуется использованием нескольких подходов машинного перевода в рамках одной системы машинного перевода. Мотивация разработки гибридных систем машинного перевода проистекает из неспособности какого-либо отдельного метода достичь удовлетворительного уровня точности. Многие гибридные системы машинного перевода успешно повышают точность перевода, и существует несколько популярных систем машинного перевода, которые используют гибридные методы.
Подходы
[ редактировать ]Многомоторный
[ редактировать ]Этот подход к гибридному машинному переводу предполагает параллельную работу нескольких систем машинного перевода. Конечный результат генерируется путем объединения результатов всех подсистем. Чаще всего в этих системах используются статистические и основанные на правилах подсистемы перевода. [1] но были изучены и другие комбинации. Например, исследователи из Университета Карнеги-Меллон добились определенного успеха в объединении на основе примеров , передачи , знаний и статистического перевода в одну систему машинного перевода. подсистем перевода [2]
Генерация статистических правил
[ редактировать ]Этот подход предполагает использование статистических данных для создания лексических и синтаксических правил. Затем входные данные обрабатываются с использованием этих правил, как если бы это был транслятор на основе правил . [1] Этот подход пытается избежать сложной и трудоемкой задачи создания набора всеобъемлющих, детализированных лингвистических правил путем извлечения этих правил из обучающего корпуса. Этот подход по-прежнему страдает от многих проблем обычного статистического машинного перевода , а именно от того, что точность перевода будет сильно зависеть от сходства входного текста с текстом обучающего корпуса. В результате этот метод имел наибольший успех в приложениях, специфичных для конкретной предметной области, и имеет те же трудности с адаптацией к предметной области, что и многие системы статистического машинного перевода . [3]
Многопроходной
[ редактировать ]Этот подход предполагает последовательную обработку ввода несколько раз. Наиболее распространенным методом, используемым в многопроходных системах машинного перевода, является предварительная обработка входных данных с помощью системы машинного перевода , основанной на правилах . Выходные данные препроцессора на основе правил передаются в статистическую систему машинного перевода , которая выдает окончательный результат. Этот метод используется для ограничения объема информации, которую должна учитывать статистическая система, что значительно снижает требуемую вычислительную мощность. Это также устраняет необходимость в том, чтобы система, основанная на правилах, была полноценной системой перевода на язык, что значительно снижает количество человеческих усилий и труда, необходимых для создания системы. [4]
Основанный на доверии
[ редактировать ]Этот подход отличается от других гибридных подходов тем, что в большинстве случаев используется только одна технология перевода. Для каждого переведенного предложения создается показатель достоверности, на основе которого можно принять решение, использовать ли вторичную технологию перевода или продолжить первоначальный результат перевода. SMT также используется, когда типичные шаблоны ошибок, такие как несколько повторяющихся слов, появляются последовательно, как это часто бывает с NMT, когда механизм внимания сбивается.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б Хатчинс, Дж. 2007. Машинный перевод: краткая история. Архивировано 28 ноября 2021 г. в Wayback Machine . Компьютерный перевод: Теория и практика.
- ^ Хоган, К. и Фредеркинг, Р. 1998. Оценка многомоторной архитектуры MT . Конспекты лекций по информатике, 1529, стр. 113–123.
- ^ Чанг, Дж. и Су, К. 1997. Исследования машинного перевода, ориентированные на корпусную статистику (CBSO), на Тайване . АМТА (1997), стр. 165–173.
- ^ Хови, Э. 1996. Углубление мудрости или компромиссные принципы? - гибридизация статистических и символических систем МП . Эксперт IEEE, 11 (2), стр. 16–18.