Компьютерное рецензирование
Эта статья в значительной степени или полностью опирается на один источник . ( июнь 2024 г. ) |
Инструменты компьютерного рецензирования ( CAR ) — это программы, основанные на алгоритмах сравнения и анализа текста . [1] Эти инструменты фокусируются на различиях между двумя документами, принимая во внимание шрифт каждого документа посредством интеллектуального анализа.
Обнаружение различий [ править ]
Интеллектуальный анализ, используемый инструментами CAR, обнаруживает, что различия не имеют одинакового значения в зависимости от их типа и/или поля/темы документа. Например, разница в номере не одинакова, если этот номер является датой, ценой, номером страницы, номером рисунка, частью адреса, указанием сноски, номером позиции списка, номером заголовка и т. д. .
- разница в номере заголовка или номере позиции списка может не представлять интереса, если эти числа будут пересчитаны впоследствии перед печатью или публикацией с помощью инструмента обработки текста,
- небольшая разница в числах, например «1» и «один» или «1» и «1-й», часто представляет второстепенный интерес, в зависимости от темы и области документа.
- в то время как некоторые другие различия в числах могут нанести серьезный ущерб документу.
Эти инструменты интересны в различных приложениях:
- сравнение документа и его обновленной/модифицированной версии. Основная цель состоит в том, чтобы выделить изменения, внесенные третьим лицом или программным обеспечением для обработки текста.
- сравнение отредактированного документа двух форматов файлов: Word , TXT, PDF , HTML , XML . Основная цель — подчеркнуть различия, связанные с модификацией формата или программным обеспечением преобразования/переформатирования. Часто простые проблемы с преобразованием кодировки символов могут привести к катастрофе.
Для перевода [ править ]
Инструменты компьютерного рецензирования для перевода (CART) — это инструменты CAR, позволяющие управлять многоязычными сравнениями. Это подразумевает возможность сопоставлять каждую часть текста из одного документа с другим, учитывая специфику каждого языка: форматы даты/числа, пунктуацию (например, французские / английские кавычки ) и т. д. Лучшие инструменты CART умеют находить совпадения между существительными или глагольными группами, то есть находить терминологические и синтаксические элементы с помощью лингвистических анализаторов.
Примеры применения [ править ]
- Автор книги обновляет свой документ (часто в формате Word), одновременно получая корректуры (часто в формате PDF) или переводы на другой язык.
- Менеджер контента веб-сайта, который должен обеспечивать согласованность обновлений и версий своих HTML-страниц на разных языках.
- Типограф, который должен обеспечивать согласованность и качество своего процесса, возможно, используя собственные форматы XML/SGML, некоторые автоматические обработки, возможное ручное вмешательство, выполняемое им самим или субподрядчиком.
- Редактор, через который проходят документы от всех акторов
- «История» MediaWiki . на каждой странице — это инструмент CAR
См. также [ править ]
Ссылки [ править ]
- ^ Аарон; Сетевой словарь Javvin Technologies, стр. 116. Донг, Цзелин, Чжу , 9781602670006 .