Компьютерный перевод
![]() | В данной статье поднимается несколько вопросов. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
Часть серии о |
Перевод |
---|
![]() |
Типы |
Теория |
Технологии |
Локализация |
Институциональный |
похожие темы |
|
Компьютерный перевод ( CAT ), также называемый компьютерным переводом или автоматизированным человеческим переводом ( CAHT ), представляет собой использование программного обеспечения , также известного как переводчик, для помощи переводчику-человеку в процессе перевода . Перевод создается человеком, а некоторые аспекты процесса выполняются с помощью программного обеспечения; это контрастирует с машинным переводом (МП), при котором перевод создается компьютером, возможно, с некоторым вмешательством человека (например, предварительное редактирование и последующее редактирование). [1]
Под инструментами CAT обычно понимаются программы, которые конкретно облегчают фактический процесс перевода. Большинство инструментов CAT имеют (а) возможность переводить различные форматы исходных файлов в единой среде редактирования без необходимости использования соответствующего программного обеспечения для этого формата файла для большей части или всего процесса перевода, (б) памяти переводов и (в) интеграция различных утилит или процессов, повышающих производительность и согласованность перевода.
Набор инструментов [ править ]
Компьютерный перевод – это широкий и неточный термин, охватывающий целый ряд инструментов. Они могут включать в себя:
- памяти переводов Инструменты (инструменты TM), состоящие из базы данных текстовых сегментов на исходном языке и их переводов на один или несколько целевых языков. [2]
- Средства проверки орфографии , встроенные в текстовый редактор или доступные в качестве дополнительных программ .
- Средства проверки грамматики , встроенные в текстовый редактор или доступные в качестве дополнительных программ.
- Менеджеры терминологии , позволяющие переводчикам управлять собственным банком терминологии в электронном виде. Это может варьироваться от простой таблицы, созданной в текстовом редакторе или электронной таблице переводчика, до базы данных, созданной в такой программе, как FileMaker Pro , или, для более надежных (и более дорогих) решений, специализированных программных пакетов, таких как SDL MultiTerm , LogiTerm, Termex. , ТермВеб и т. д.
- Электронные словари, одноязычные или двуязычные.
- Базы данных терминологии, находящиеся на главном компьютере или доступные через Интернет, например TERMIUM Plus или Grand Dictionnaire Terminologique от Office Québécois de la langue française.
- Инструменты полнотекстового поиска (или индексаторы), которые позволяют пользователю запрашивать уже переведенные тексты или справочные документы различного рода. Некоторые из таких индексаторов — ISYS Search Software , dtSearch Desktop и Naturel.
- Concordancers — программы, которые извлекают экземпляры слова или выражения и их соответствующий контекст в одноязычном, двуязычном или многоязычном корпусе, таком как битекст или память переводов.
- Выравниватели битекста : инструменты, которые выравнивают исходный текст и его перевод, которые затем можно проанализировать с помощью инструмента полнотекстового поиска или средства согласования. [3]
- Программное обеспечение для управления проектами , которое позволяет лингвистам структурировать сложные переводческие проекты в виде цепочки задач (часто называемой «рабочим процессом»), назначать различные задачи разным людям и отслеживать ход выполнения каждой из этих задач.
Концепции [ править ]
Программное обеспечение памяти переводов [ править ]
Программы памяти переводов сохраняют ранее переведенные исходные тексты и эквивалентные им целевые тексты в базе данных и извлекают связанные сегменты во время перевода новых текстов. [4]
Такие программы разбивают исходный текст на управляемые блоки, известные как «сегменты». Предложение исходного текста или единица, подобная предложению (заголовки, заголовки или элементы в списке), можно считать сегментом. Тексты также можно разделить на более крупные единицы, например абзацы, или на более мелкие, например статьи. По мере того, как переводчик работает с документом, программное обеспечение поочередно отображает каждый исходный сегмент и предоставляет предыдущий перевод для повторного использования, если находит соответствующий исходный сегмент в своей базе данных. Если этого не происходит, программа позволяет переводчику ввести перевод для нового сегмента. После завершения перевода сегмента программа сохраняет новый перевод и переходит к следующему сегменту. В доминирующей парадигме память переводов, в принципе, представляет собой простую базу данных полей, содержащую сегмент исходного языка, перевод сегмента и другую информацию, такую как дата создания сегмента, последний доступ, имя переводчика и так далее. Другой подход к использованию памяти переводов не предполагает создания базы данных, а опирается на согласованные справочные документы. [5]
Некоторые программы памяти переводов функционируют как автономные среды, в то время как другие функционируют как надстройка или макрос для коммерческих текстовых редакторов или других программ для бизнеса. Дополнительные программы позволяют исходные документы других форматов, например файлы настольных издательских систем, электронные таблицы или HTML- обрабатывать код, с помощью программы TM. Пример см. в MEMOrg .
Языковая поисковая система [ править ]
Новое в переводческой индустрии . Программное обеспечение лингвистической поисковой системы обычно представляет собой интернет-систему, работающую аналогично поисковым системам Интернета. Однако вместо поиска в Интернете языковая поисковая система ищет в большом хранилище памяти переводов ранее переведенные фрагменты предложений, фразы, целые предложения и даже полные абзацы, соответствующие сегментам исходного документа.
Языковые поисковые системы предназначены для использования современных поисковых технологий для проведения поиска на основе исходных слов в контексте, чтобы гарантировать, что результаты поиска соответствуют значению исходных сегментов. Как и в случае с традиционными инструментами TM, ценность языковой поисковой системы во многом зависит от репозитория Translation Memory, в котором она осуществляет поиск.
управления терминологией для обеспечение Программное
Программное обеспечение для управления терминологией предоставляет переводчику средства автоматического поиска в данной терминологической базе данных терминов, встречающихся в документе, либо путем автоматического отображения терминов в окне интерфейса программного обеспечения памяти переводов, либо с помощью горячих клавиш для просмотра записи в терминологической базе данных. Некоторые программы имеют другие комбинации горячих клавиш, позволяющие переводчику добавлять новые терминологические пары в терминологическую базу данных «на лету» во время перевода. Некоторые из более продвинутых систем позволяют переводчикам проверять в интерактивном или пакетном режиме , использовалась ли правильная комбинация исходного/целевого термина внутри и между сегментами памяти переводов в данном проекте. Также существуют независимые системы управления терминологией, которые могут обеспечивать функциональные возможности рабочего процесса, визуальную таксономию, работать как своего рода средство проверки терминов (по аналогии с проверкой орфографии, термины, которые использовались неправильно, помечаются) и могут поддерживать другие типы многоязычных классификаций аспектов терминов, такие как изображения, видео или звук. [6] [4]
Программное обеспечение для выравнивания [ править ]
Процесс привязки сегмента исходного языка к соответствующему сегменту целевого языка. Цель — создать базу данных памяти переводов или дополнить существующую.
Интерактивный машинный перевод [ править ]
Интерактивный машинный перевод — это парадигма, в которой автоматическая система пытается предсказать перевод, который собирается выполнить человек-переводчик, предлагая гипотезы перевода. Эти гипотезы могут представлять собой либо полное предложение, либо часть предложения, которую еще предстоит перевести.
Дополненный перевод [ править ]
Расширенный перевод — это форма человеческого перевода, выполняемая в интегрированной технологической среде, которая предоставляет переводчикам доступ к подсегментному адаптивному машинному переводу (MT) и памяти переводов (TM), поиску терминологии (CAT) и автоматическому обогащению контента (ACE), чтобы помочь им работу и автоматизирует управление проектами, обработку файлов и другие вспомогательные задачи. [7] [8]
Основанный на концепции дополненной реальности , дополненный перевод призван повысить продуктивность переводчиков, предоставляя им соответствующую информацию по мере необходимости. Эта информация адаптируется к привычкам и стилю отдельных переводчиков, чтобы ускорить их работу и повысить производительность. Он отличается от классического постредактирования MT , при котором лингвисты пересматривают целые тексты, переведенные машинами, тем, что он предоставляет машинный перевод и информацию в виде предложений, которые можно принять целиком, отредактировать или игнорировать, в зависимости от ситуации. [7]
Расширенный перевод расширяет принципы, впервые разработанные в 1980-х годах и вошедшие в CAT-инструменты. Однако он объединяет в одной среде несколько функций, которые ранее были дискретными. Например, исторически переводчикам приходилось покидать свою среду перевода для проведения терминологических исследований, но в расширенной среде компонент ACE автоматически предоставлял ссылки на информацию о терминах и понятиях, встречающихся в тексте, непосредственно в среде.
По состоянию на май 2017 года полных реализаций расширенной среды перевода не существует, хотя отдельные разработчики создали частичные системы.
См. также [ править ]
- Сравнение средств компьютерного перевода
- Компьютерная лингвистика
- Компьютерное рецензирование
- Нечеткое соответствие
- Перевод
Ссылки [ править ]
- ^ Боукер, Линн; Фишер, Дес (2010). «Компьютерный перевод» . В Гамбье, Ю.; ван Дорслаер, Л. (ред.). Справочник по переводоведению . Издательская компания Джона Бенджамина. п. 60. ИСБН 978-90-272-0331-1 . Проверено 4 марта 2024 г.
- ^ Кристенсен, Тина Полсен; Шёлдагер, Энн. «Исследование переводческой памяти (ТМ): что мы знаем и откуда мы это знаем?» (PDF) . Гермес . 44 .
- ^ «Выравнивание битового текста | Запрос PDF — ResearchGate» .
- ^ Перейти обратно: а б «Терминологический менеджмент и MT» (PDF) . Схема . 117 .
- ^ «CAT-инструменты против машинного перевода: какой метод лучше?» . Азиатский Абсолют. 21 декабря 2015 года . Проверено 29 января 2017 г.
- ^ «Архивная копия» (PDF) . Архивировано из оригинала (PDF) 25 апреля 2012 года . Проверено 3 октября 2011 г.
{{cite web}}
: CS1 maint: архивная копия в заголовке ( ссылка ) - ^ Перейти обратно: а б ДеПальма, Дональд А. и Арль Ломмель (15 февраля 2017 г.). «Расширенный перевод расширяет возможности лингвистических служб» . Рекомендации по здравому смыслу . Проверено 19 мая 2017 г.
- ^ Эггерс, Уильям Д., Дэвид Шацкий и доктор Питер Вехницки (26 апреля 2017 г.). «Правительство, дополненное искусственным интеллектом: использование когнитивных технологий для перепроектирования работы государственного сектора» . Издательство Делойтского университета . Проверено 19 мая 2017 г.
{{cite web}}
: CS1 maint: несколько имен: список авторов ( ссылка )
Внешние ссылки [ править ]
![](http://upload.wikimedia.org/wikipedia/commons/thumb/d/df/Wikibooks-logo-en-noslogan.svg/40px-Wikibooks-logo-en-noslogan.svg.png)
СМИ, связанные с компьютерным переводом, на Викискладе?
- Компьютерный перевод в Curlie
- Машинный перевод и компьютерный перевод: новый способ перевода?