Нечеткое сопоставление (компьютерный перевод)
Эта статья нуждается в дополнительных цитатах для проверки . ( апрель 2009 г. ) |
Нечеткое сопоставление — это метод, используемый в компьютерном переводе как особый случай связывания записей . Он работает с совпадениями, которые могут быть менее 100% точными при поиске соответствий между сегментами текста и записями в базе данных предыдущих переводов. Обычно он работает на сегментах уровня предложения , но некоторые технологии перевода допускают сопоставление на уровне фраз . Используется, когда переводчик работает с памятью переводов (ТМ). Он использует приблизительное сопоставление строк .
Фон
[ редактировать ]Если в базе данных TM невозможно найти точное совпадение для переводимого текста, существует возможность поиска менее точного совпадения; транслятор устанавливает порог нечеткого совпадения на процентное значение меньше 100 %, и база данных затем возвращает в свою память любые совпадения, соответствующие этому проценту. Его основная функция — помочь переводчику, ускоряя процесс перевода; нечеткое сопоставление не предназначено для замены человека-переводчика.
История
[ редактировать ]Из-за полиморфной и динамичной природы языка , особенно английского (на который приходится 90% всех исходных текстов, проходящих перевод в индустрии локализации). [ нужна ссылка ] ), постоянно ищутся методы, которые сделают процесс перевода проще и быстрее. С конца 1980-х годов были разработаны инструменты памяти переводов, позволяющие повысить производительность и ускорить весь процесс перевода для переводчика.
В 1990-е годы нечеткое сопоставление стало важной особенностью инструментов TM, и, несмотря на некоторые проблемы, связанные с дополнительной работой, связанной с редактированием «предложения» нечеткого сопоставления, оно по-прежнему остается популярным подмножеством TM. В настоящее время это функция большинства популярных инструментов ТМ.
Методология
[ редактировать ]Инструмент TM выполняет поиск в базе данных для обнаружения сегментов, которые приблизительно соответствуют сегменту нового исходного текста, подлежащего переводу. НП, по сути, «предлагает» переводчику совпадение; тогда переводчик должен принять это предложение или отредактировать это предложение, чтобы оно более полно соответствовало новому исходному тексту, который подвергается переводу. Таким образом, нечеткое сопоставление может ускорить процесс перевода и повысить производительность.
Это вызывает вопросы к качеству полученных переводов. Иногда переводчик вынужден выполнить задание вовремя и, таким образом, вынужден принять предложение с нечетким совпадением, не проверив его пригодность и контекст. Базы данных ТМ создаются на основе данных множества разных переводчиков, работающих над множеством разных текстов, с опасностью того, что предложения, извлеченные из этого слова «гобелен», станут сшитой мешаниной стилей и полной противоположностью стремящейся последовательности. – то, что некоторые критики окрестили «салатом предложений». Вопрос веры в предложения ТМ может стать проблемой при попытке найти баланс между более быстрым процессом перевода и качеством этого перевода. Тем не менее, нечеткое сопоставление по-прежнему остается важной частью инструментария переводчика.
Внешние ссылки
[ редактировать ]- Эсселинк, Б. (2000) Практическое руководство по локализации , издательство John Benjamins Publishing Company.