Постредактирование
Часть серии о |
Перевод |
---|
Типы |
Теория |
Технологии |
Локализация |
Институциональный |
Связанные темы |
|
Постредактирование (или постредактирование ) — это процесс, при котором люди вносят поправки в машинный перевод для получения приемлемого конечного продукта. Человека, занимающегося постредактированием, называют постредактором . Понятие постредактирования связано с понятием предварительного редактирования . В процессе перевода текста с помощью машинного перевода наилучшие результаты могут быть получены путем предварительного редактирования исходного текста – например, путем применения принципов контролируемого языка – и последующего редактирования машинного вывода. Это отличается от редактирования, которое относится к процессу улучшения текста, созданного человеком (процесс, который в области перевода часто называют редактированием). Отредактированный текст впоследствии может быть отредактирован для обеспечения качества выбранного языка и исправления простых ошибок.
Постредактирование включает в себя коррекцию результатов машинного перевода , чтобы гарантировать, что они соответствуют уровню качества, заранее согласованному между клиентом и постредактором. Легкое постредактирование направлено на то, чтобы сделать результат понятным; полный постредактирование , придающее еще и стилистический смысл. С развитием машинного перевода полное постредактирование становится альтернативой ручному переводу. Практически все инструменты компьютерного перевода (CAT) теперь поддерживают постредактирование результатов машинного перевода.
Постредактирование и машинный перевод
[ редактировать ]Машинный перевод вышел из лабораторий и начал использоваться по своему назначению в конце семидесятых годов в некоторых крупных учреждениях, таких как Европейская комиссия и Панамериканская организация здравоохранения , а затем, позже, в некоторых корпорациях, таких как Caterpillar и General Motors . Первые исследования постредактирования появились в восьмидесятых годах, связанные с этими реализациями. [1] [2] Для разработки соответствующих руководств и обучения члены Американской ассоциации машинного перевода (AMTA) и Европейской ассоциации машинного перевода (EAMT) создали в 1999 году Специальную группу по постредактированию. [3] [4]
После девяностых годов достижения в области компьютерной мощности и возможностей подключения ускорили разработку машинного перевода и позволили его развертывать через веб-браузер, в том числе в качестве бесплатного и полезного дополнения к основным поисковым системам ( Google Translate , Bing Translator , Yahoo! Babel Fish ). Более широкое признание несовершенного машинного перевода сопровождалось также более широким признанием постредактирования. Поскольку спрос на локализацию товаров и услуг растет такими темпами, которые невозможно удовлетворить с помощью человеческого перевода, даже при отсутствии памяти переводов и других технологий управления переводами, отраслевые организации, такие как Общество пользователей автоматизации перевода (TAUS), ожидают машинного перевода и постредактирование будет играть гораздо большую роль в течение следующих нескольких лет. [5]
Использование машинного перевода предполагает иногда предварительное редактирование .
Легкий и полноценный постредактирование
[ редактировать ]В течение многих лет не существовало общепринятых стандартизированных руководств по постредактированию; [6] однако в 2017 году ISO стандарт 18587:2017: Услуги перевода. Постредактирование результатов машинного перевода. Требования был опубликован . Исследования восьмидесятых годов различали степени постредактирования, которые в контексте Службы переводов Европейской комиссии сначала были определены как обычные и быстрые. [7] или полный и быстрый. [8] Легкий и полный постредактирование, кажется, наиболее используемая сегодня формулировка.
Легкое постредактирование подразумевает минимальное вмешательство постредактора с целью обеспечения «достаточно хорошего» или «понятного» качества; [6] ожидается, что клиент будет использовать его только для входящих целей, часто когда текст нужен срочно или имеет короткий промежуток времени.
Полное постредактирование предполагает более высокий уровень вмешательства для достижения определенного уровня качества, который должен быть согласован между клиентом и постредактором; ожидается, что результатом будет текст, который не только будет понятен, но и представлен каким-то стилистически подходящим образом, чтобы его можно было использовать для усвоения и даже для распространения, как для входящих, так и для исходящих целей. Ожидается, что качество будет пригодным для публикации и эквивалентным качеству человеческого перевода. [6]
Однако предполагалось, что переводчикам требуется меньше усилий для работы непосредственно с исходным текстом, чем для последующего редактирования версии, сгенерированной машиной. С развитием машинного перевода ситуация может измениться. Для некоторых языковых пар и для некоторых задач, а также с механизмами, которые были настроены с использованием данных хорошего качества для конкретной предметной области, некоторые клиенты уже просят переводчиков выполнить постредактирование вместо перевода с нуля, полагая, что они достигнут аналогичного качества за небольшие деньги. более низкая стоимость.
Легкая/полная классификация, разработанная в девяностые годы, когда машинный перевод еще существовал на компакт-дисках, также может не соответствовать достижениям в области машинного перевода на этапе облегченного постредактирования. Для некоторых языковых пар и некоторых задач, особенно если исходный код был предварительно отредактирован, необработанный машинный вывод может быть достаточно хорош для целей обобщения, не требуя последующего вмешательства человека.
Эффективность постредактирования
[ редактировать ]Постредактирование используется, когда необработанный машинный перевод недостаточно хорош и человеческий перевод не требуется. Промышленность советует использовать постредактирование, когда оно может как минимум удвоить производительность ручного перевода, а в случае легкого постредактирования — даже в четыре раза (1000 слов в час против 250 слов в час). [9] [10]
Однако эффективность постредактирования трудно предсказать. Различные исследования, проведенные как в научных кругах, так и в промышленности, утверждают, что постредактирование обычно выполняется быстрее, чем перевод с нуля, независимо от языковых пар или опыта переводчиков. [11] Однако нет единого мнения о том, сколько времени можно сэкономить на практике за счет постредактирования (если оно вообще существует): в то время как в отрасли сообщается об экономии времени около 40%, [12] некоторые академические исследования показывают, что экономия времени в реальных условиях работы, скорее всего, будет составлять от 0 до 20% или что она может зависеть от терминологической близости между исходным и целевым языками. [13] Профессионалы также сообщают об отрицательном приросте производительности, когда исправления требуют больше времени, чем перевод с нуля. [14] [15]
Постредактирование и языковая индустрия
[ редактировать ]Спустя тридцать лет постредактирование все еще остается «зарождающейся профессией». [16] Каков правильный профиль постредактора, еще до конца не изучено. Постредактирование пересекается с переводом и редактированием, но лишь частично. Большинство считает, что идеальным постредактором будет переводчик, стремящийся обучиться конкретным необходимым навыкам, но есть и те, кто считает, что билингва, не имеющего опыта перевода, легче обучить. [17] Мало что известно и о том, кто на самом деле являются постредакторами, являются ли они профессиональными переводчиками, работают ли они в основном штатными сотрудниками или самозанятыми и на каких условиях. Многие профессиональные переводчики не любят постредактирование, среди прочего, потому, что за него обычно платят меньше, чем за обычный перевод, причем Международная ассоциация профессиональных переводчиков (IAPTI). особенно активно об этом говорит [18]
Качество результатов машинного перевода для постредактирования выше и, следовательно, требует меньше усилий после редактирования, если машинный перевод обеспечивается нейронной, вертикальной или настраиваемой системой машинного перевода . Повышение эффективности перевода можно измерить, отслеживая время, необходимое лингвистам для исправления машинного перевода в той же среде перевода, например XTM Cloud, [19] Система управления переводами и инструмент компьютерного перевода , позволяющий сравнивать время постредактирования и результаты оценки лингвистического качества отредактированных текстов.
Нет четких цифр о том, насколько велик пирог постредактирования в переводческой отрасли. Недавний опрос показал, что 50% поставщиков языковых услуг предлагают его, но для 85% из них на это приходится менее 10% их пропускной способности. [20] Memsource , веб-инструмент для перевода, утверждает, что более 50 процентов переводов между английским, испанским, французским и другими языками были выполнены на его платформе, сочетающей память переводов с машинным переводом. [21] Постредактирование также осуществляется через краудсорсинговые порталы перевода, такие как Unbabel , которые к ноябрю 2014 года заявили, что отредактировали более 11 миллионов слов. [22]
Оценки производительности и объема в любом случае являются движущимися целями, поскольку достижения в области машинного перевода, в значительной степени обусловленные тем, что отредактированный текст возвращается в его механизмы, будут означать, что чем больше будет выполнено постредактирование, тем выше будет станет качество машинного перевода и более широкое распространение постредактирование. [ нужна ссылка ]
См. также
[ редактировать ]- Машинный перевод
- Контролируемый язык
- Память переводов
- Редактирование
- Корректура
- Компьютерный перевод
- Предварительное редактирование
Ссылки
[ редактировать ]- ^ Сенез, Дороти (12–13 ноября 1998 г.). «Услуга постредактирования для пользователей машинного перевода в Европейской комиссии». Перевод и компьютер 20. Материалы конференции АСЛИБ . CiteSeerX 10.1.1.477.4105 .
- ^ Васконселлос, Мюриэль; Леон, Марджори (1985). «SPANAM и ENGSPA: машинный перевод в Панамериканской организации здравоохранения». Компьютерная лингвистика . 11 : 122–136. CiteSeerX 10.1.1.14.9212 .
- ^ Аллен, Джеффри Х. (2003). «16. Постредактирование». В Сомерсе, HL (ред.). Компьютеры и перевод: Руководство переводчика . Амстердам Филадельфия: Дж. Бенджаминс. п. 312. ИСБН 978-90-272-1640-3 . OCLC 52938937 .
- ^ Сомерс, Х.Л. (январь 2003 г.). Аллен, Джеффри. «Постредактирование», Гарольд Сомерс (редактор) (2003). Компьютеры и перевод. Руководство переводчика . Бенджаминс: Амстердам/Филадельфия, с. 312 . ISBN 978-90-272-1640-3 .
- ^ «Сайт ТАУС» . Ютуб . [ мертвая ссылка на YouTube ]
- ^ Перейти обратно: а б с Ху, Кэ; Кэдвелл, Патрик (2016). «Сравнительное исследование рекомендаций по постредактированию». Балтийский журнал современных вычислений . 4 : 346–353.
- ^ ЛОФФЛЕР-ЛОРИАН, АНН-МАРИ (1986). «Быстрое постредактирование и обычное постредактирование: два способа конкретной деятельности». Multilingua – Журнал межкультурной и межъязыковой коммуникации . 5 (2). Вальтер де Грюйтер ГмбХ: 81–88. дои : 10.1515/мульт.1986.5.2.81 . ISSN 0167-8507 . S2CID 201700030 .
- ^ Вагнер, Элизабет (10–11 ноября 1983 г.). «Быстрое постредактирование Систрана». Перевод и компьютер 5. Материалы конференции ASLIB : 199–213.
- ^ Бойте, Кристиан; Бланшон, Эрве (1994). « Обещания и проблемы «ТАО для всех». После ЛИДИИ-1 появилась первая модель " " . Языки . 28 (116): 20–47. дои : 10.3406/lgge.1994.1692 .
- ^ «Профиль работы – Постредактирование | Французское общество переводчиков: профессиональный союз (SFT)» . www.sft.fr. Проверено 16 августа 2022 г.
- ^ Грин, Спенс; Джеффри Хир; Кристофер Д. Мэннинг (2013). «Эффективность человеческого постредактирования языкового перевода» (PDF) . Человеческий фактор ACM в вычислительных системах .
- ^ Плитт, Мирко и Франсуа Массело (2010). «Тест продуктивности постредактирования статистического машинного перевода в типичном контексте локализации» (PDF) . Пражский вестник математической лингвистики . 93 : 7–16. дои : 10.2478/v10108-010-0010-x .
- ^ Шах, Ритеш; Бойте, Кристиан; Бхаттачарья, Пушпак; Падмакумар, Митхун; Зилио, Леонардо; Калитвянский, Руслан; Насируддин, Мохаммед; Томокиё, Муцуко; Паес, Сандра Кастельянос (2015). «Постредактирование главы специализированного учебника на 7 языков: важность терминологической близости с английским для продуктивности» . Материалы 12-й Международной конференции по обработке естественного языка . Тривандрам, Индия: Индийская ассоциация НЛП: 325–332.
- ^ Марчелло Федерико; Алессандро Каттелан; Марко Тромбетти (2012). «Измерение производительности пользователей при машинном переводе, улучшенном с помощью компьютера» (PDF) . Материалы десятой конференции Ассоциации машинного перевода Америки (AMTA), проводимой раз в два года, Сан-Диего, Калифорния, 28 октября – 1 ноября .
- ^ Ляубли, Самуэль; Марк Фишел; Гэри Мэсси; Морин Эренсбергер-Доу; Мартин Волк (2013). «Оценка эффективности постредактирования в реалистичной среде перевода» (PDF) . Материалы 2-го семинара по технологии и практике постредактирования . стр. 83–91.
- ^ «Сайт ТАУС» .
- ^ Хатчинс, Джон (1995). «Размышления об истории и современном состоянии машинного перевода» (PDF) .
- ^ «Сайт IAPTI» .
- ^ «Официальный сайт XTM International» .
- ^ «Постредактирование на практике. Отчет TAUS» (PDF) . Март 2010. с. 13.
- ^ «Сайт Memsource» .
- ^ «Unbabel запускает службу машинного перевода, редактируемую человеком, чтобы помочь компаниям выйти на глобальный уровень и локализовать поддержку клиентов» .
Дальнейшее чтение
[ редактировать ]- ISO 18587:2017: Услуги перевода. Постредактирование результатов машинного перевода. Требования ( Предварительный просмотр + оглавление )
- Илона Уоллберг: ISO 18587 — стандарт для процесса постредактирования. В: Йорг Порсиэль (ред.): Машинный перевод: что нужно знать языковым специалистам. BDÜ Дальнейшее образование и Fachverlagsgesellschaft mbH, Берлин 2017, ISBN 978-3-938430-94-1 .
- Нитцке, Жан и Хансен-Ширра, Сильвия. 2021. Краткое руководство по постредактированию. (Перевод и многоязычная обработка естественного языка 16). Берлин: Language Science Press. DOI: 10.5281/zenodo.5646896. Открытый доступ. https://langsci-press.org/catalog/book/319