Машинный перевод на основе примеров
Эта статья нуждается в дополнительных цитатах для проверки . ( июнь 2012 г. ) |
Машинный перевод на основе примеров ( EBMT ) — это метод машинного перевода, который часто характеризуется использованием двуязычного корпуса с параллельными текстами в качестве основной базы знаний во время выполнения. По сути, это перевод по аналогии , и его можно рассматривать как реализацию на основе прецедентного рассуждения подхода к машинному обучению .
Перевод по аналогии [ править ]
В основе машинного перевода на основе примеров лежит идея перевода по аналогии. Применительно к процессу человеческого перевода идея о том, что перевод происходит по аналогии, является отказом от идеи, что люди переводят предложения, проводя глубокий лингвистический анализ. Вместо этого оно основано на убеждении, что люди переводят, сначала разлагая предложение на определенные фразы, затем переводя эти фразы и, наконец, правильно составляя эти фрагменты в одно длинное предложение. Фразовые переводы переводятся по аналогии с предыдущими переводами. Принцип перевода по аналогии закодирован в машинном переводе на основе примеров посредством переводов примеров, которые используются для обучения такой системы.
Другие подходы к машинному переводу, включая статистический машинный перевод , также используют двуязычные корпуса для изучения процесса перевода.
История [ править ]
Машинный перевод на основе примеров был впервые предложен Макото Нагао в 1984 году. [1] Он отметил, что он специально адаптирован для перевода между двумя совершенно разными языками, такими как английский и японский. , бесполезно В этом случае одно предложение можно перевести в несколько хорошо структурированных предложений на другом языке, поэтому проводить глубокий лингвистический анализ, характерный для машинного перевода на основе правил .
Пример [ править ]
Английский | японский | |
---|---|---|
Сколько стоит этот красный зонтик ? | Ано акаи каса ва икура десу ка. | |
Сколько стоит эта маленькая камера ? | Ано чиисай камера ва икура десу ка. |
Системы машинного перевода на основе примеров обучаются на двуязычных параллельных корпусах, содержащих пары предложений, как в примере, показанном в таблице выше. Пары предложений содержат предложения на одном языке с их переводом на другой. В конкретном примере показан пример минимальной пары , что означает, что предложения различаются всего на один элемент. Эти предложения упрощают изучение перевода частей предложения. Например, система машинного перевода на основе примеров изучит три единицы перевода из приведенного выше примера:
- Сколько стоит это Х ? соответствует Ано Х ва икура десу ка.
- красный зонтик соответствует акаи каса
- маленькая камера соответствует камере Тиисай
Составление этих единиц может быть использовано для создания новых переводов в будущем. Например, если нас обучали с использованием текста, содержащего предложения:
Президент Кеннеди был застрелен во время парада. и Осужденный сбежал 15 июля. , тогда мы могли бы перевести предложение . Осужденный был застрелен во время парада. заменив соответствующие части предложений.
Фразовые глаголы [ править ]
Машинный перевод на основе примеров лучше всего подходит для таких подъязыковых явлений, как фразовые глаголы . Фразовые глаголы имеют сильно зависящее от контекста значение. Они распространены в английском языке и состоят из глагола, за которым следует наречие и/или предлог , которые называются частицей глагола. Фразовые глаголы имеют специализированные, зависящие от контекста значения, которые не могут быть выведены из значения составляющих. При дословном переводе с исходного языка на целевой язык почти всегда возникает двусмысленность.
В качестве примера рассмотрим фразовый глагол «надеть» и его перевод на хиндустани . Его можно использовать любым из следующих способов:
- Рам включил свет. (Включено) (перевод на хиндустани: Джалана )
- Рам надел кепку. (Носить) (перевод на хиндустани: Пахенна )
См. также [ править ]
Ссылки [ править ]
- ^ Макото Нагао (1984). «Схема механического перевода между японским и английским языками по принципу аналогии» (PDF) . В А. Элиторн и Р. Банерджи (ред.). Искусственный и человеческий интеллект . Научное издательство «Эльзевир» . Архивировано из оригинала (PDF) 6 февраля 2012 г. Проверено 11 декабря 2006 г.
Дальнейшее чтение [ править ]
- Карл, Майкл; Путь, Энди (2003). Последние достижения в области машинного перевода на основе примеров . Нидерланды: Спрингер. дои : 10.1007/978-94-010-0181-6 . ISBN 978-1-4020-1400-0 .