Jump to content

Нечеткое сопоставление (компьютерный перевод)

Нечеткое сопоставление — это метод, используемый в компьютерном переводе как особый случай связывания записей . Он работает с совпадениями, которые могут быть менее 100% точными при поиске соответствий между сегментами текста и записями в базе данных предыдущих переводов. Обычно он работает на сегментах уровня предложения , но некоторые технологии перевода допускают сопоставление на уровне фраз . Используется, когда переводчик работает с памятью переводов (ТМ). Он использует приблизительное сопоставление строк .

Если в базе данных TM невозможно найти точное совпадение для переводимого текста, существует возможность поиска менее точного совпадения; транслятор устанавливает порог нечеткого совпадения на процентное значение меньше 100 %, и база данных затем возвращает в свою память любые совпадения, соответствующие этому проценту. Его основная функция — помочь переводчику, ускоряя процесс перевода; нечеткое сопоставление не предназначено для замены человека-переводчика.

Из-за полиморфной и динамичной природы языка , особенно английского (на который приходится 90% всех исходных текстов, проходящих перевод в индустрии локализации). [ нужна ссылка ] ), постоянно ищутся методы, которые сделают процесс перевода проще и быстрее. С конца 1980-х годов были разработаны инструменты памяти переводов, позволяющие повысить производительность и ускорить весь процесс перевода для переводчика.

В 1990-е годы нечеткое сопоставление стало важной особенностью инструментов TM, и, несмотря на некоторые проблемы, связанные с дополнительной работой, связанной с редактированием «предложения» нечеткого сопоставления, оно по-прежнему остается популярным подмножеством TM. В настоящее время это функция большинства популярных инструментов ТМ.

Методология

[ редактировать ]

Инструмент TM выполняет поиск в базе данных для обнаружения сегментов, которые приблизительно соответствуют сегменту нового исходного текста, подлежащего переводу. НП, по сути, «предлагает» переводчику совпадение; тогда переводчик должен принять это предложение или отредактировать это предложение, чтобы оно более полно соответствовало новому исходному тексту, который подвергается переводу. Таким образом, нечеткое сопоставление может ускорить процесс перевода и повысить производительность.

Это вызывает вопросы к качеству полученных переводов. Иногда переводчик вынужден выполнить задание вовремя и, таким образом, вынужден принять предложение с нечетким совпадением, не проверив его пригодность и контекст. Базы данных ТМ создаются на основе данных множества разных переводчиков, работающих над множеством разных текстов, с опасностью того, что предложения, извлеченные из этого слова «гобелен», станут сшитой мешаниной стилей и полной противоположностью стремящейся последовательности. – то, что некоторые критики окрестили «салатом предложений». Вопрос веры в предложения ТМ может стать проблемой при попытке найти баланс между более быстрым процессом перевода и качеством этого перевода. Тем не менее, нечеткое сопоставление по-прежнему остается важной частью инструментария переводчика.

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 5da03496bc53e1ec6d4e187eb8a82c0a__1679060340
URL1:https://arc.ask3.ru/arc/aa/5d/0a/5da03496bc53e1ec6d4e187eb8a82c0a.html
Заголовок, (Title) документа по адресу, URL1:
Fuzzy matching (computer-assisted translation) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)