Интернационализация и локализация
Часть серии о |
Перевод |
---|
![]() |
Типы |
Теория |
Технологии |
Локализация |
Институциональный |
похожие темы |
|
![](http://upload.wikimedia.org/wikipedia/commons/thumb/3/36/Debian72Trinity35132.png/350px-Debian72Trinity35132.png)
В вычислительной технике интернационализация и локализация ( американская ) или интернационализация и локализация ( британская ), часто обозначаемые сокращениями i18n и l10n соответственно, [1] представляют собой средства адаптации компьютерного программного обеспечения к различным языкам, региональным особенностям и техническим требованиям целевой локали . [2]
Интернационализация — это процесс разработки программного приложения , позволяющий адаптировать его к различным языкам и регионам без технических изменений. Локализация — это процесс адаптации интернационализированного программного обеспечения для определенного региона или языка путем перевода текста и добавления компонентов, специфичных для данного региона.
Локализация (которая потенциально выполняется несколько раз для разных языков) использует инфраструктуру или гибкость, обеспечиваемую интернационализацией (которая в идеале выполняется только один раз перед локализацией или как неотъемлемая часть текущей разработки). [3]
Именование [ править ]
Термины часто сокращаются до нумеронимов i18n (где 18 обозначает количество букв между первым i и последним n в слове «интернационализация» , использование которого было придумано в Digital Equipment Corporation в 1970-х или 1980-х годах). [4] [5] и l10n для локализации из-за длины слов. [1] [6] Некоторые авторы пишут последний термин с заглавной буквы ( L10n ) , чтобы облегчить различие между ними. [7]
Некоторые компании, такие как IBM и Oracle , используют термин «глобализация» , g11n , для сочетания интернационализации и локализации. [8]
Microsoft определяет интернационализацию как сочетание готовности к работе во всем мире и локализации. Готовность к работе — это задача разработчика, которая позволяет использовать продукт с несколькими сценариями и культурами (глобализация) и разделяет ресурсы пользовательского интерфейса в локализуемом формате (локализуемость, сокращенно L12y ). [9] [10]
Hewlett-Packard и HP-UX создали систему под названием «Поддержка национальных языков» или «Поддержка родного языка» (NLS) для создания локализуемого программного обеспечения. [2]
Некоторые поставщики, включая IBM [11] используйте термин « Версия на национальном языке» (NLV) для локализованных версий программных продуктов, поддерживающих только один конкретный языковой стандарт. Этот термин подразумевает существование других похожих версий программного обеспечения NLV для разных рынков; эта терминология не используется, если не проводилась интернационализация и локализация, а программный продукт поддерживает только один язык и локаль в любой версии.
Область применения [ править ]
![](http://upload.wikimedia.org/wikipedia/commons/thumb/c/ce/Globalisationchart.svg/400px-Globalisationchart.svg.png)
(на основе диаграммы с сайта LISA )
Согласно «Программному обеспечению без границ» , аспекты проектирования, которые следует учитывать при интернационализации продукта, включают «кодирование данных, данные и документацию, создание программного обеспечения, поддержку аппаратных устройств и взаимодействие с пользователем»; в то время как ключевыми областями проектирования, которые следует учитывать при создании полностью интернационализированного продукта с нуля, являются «взаимодействие с пользователем, разработка алгоритмов и форматов данных, программные услуги и документация». [2]
Перевод обычно является наиболее трудоемким компонентом языковой локализации . [2] Это может включать в себя:
- Для фильмов, видео и аудио перевод устной речи или музыкальных текстов, часто с использованием дубляжа или субтитров.
- Перевод текста для печатных материалов и цифровых носителей (возможно, включая сообщения об ошибках и документацию)
- Потенциальное изменение изображений и логотипов, содержащих текст, для включения переводов или общих значков. [2]
- Разная длина перевода и различия в размерах символов (например, между буквами латинского алфавита и китайскими иероглифами ) могут привести к тому, что макеты, которые хорошо работают на одном языке, будут плохо работать на других. [2]
- Учет различий в диалекте , регистре или разновидности [2]
- Написание соглашений типа:
- Форматирование чисел (особенно десятичный разделитель и группировка цифр )
- Формат даты и времени , возможно, включая использование различных календарей (например, исламского или японского календаря ).
Стандартные данные локали [ править ]
Компьютерное программное обеспечение может сталкиваться с различиями, выходящими за рамки простого перевода слов и фраз, поскольку компьютерные программы могут динамически генерировать контент. Эти различия, возможно, придется принять во внимание в процессе интернационализации при подготовке к переводу. Многие из этих различий настолько регулярны, что преобразование между языками можно легко автоматизировать. Общий репозиторий данных локали от Unicode предоставляет набор таких различий. Его данные используются основными операционными системами , включая Microsoft Windows , macOS и Debian , а также крупными интернет-компаниями и проектами, такими как Google и Wikimedia Foundation . Примеры таких различий включают в себя:
- Различные «сценарии» в разных системах письменности используют разные символы – разные наборы букв, силлограмм , логограмм или символов. Современные системы используют стандарт Unicode для представления множества различных языков с помощью одной кодировки символов .
- Направление письма слева направо в большинстве европейских языков, справа налево в иврите и арабском языке или и то, и другое в сценариях бустрофедонов , а также, опционально, вертикальное в некоторых азиатских языках. [2]
- Сложная компоновка текста для языков, где символы меняют форму в зависимости от контекста.
- В некоторых сценариях капитализация существует, а в других нет.
- В разных языках и системах письменности действуют разные сортировки текста. правила
- В разных языках используются разные системы счисления , которые, возможно, потребуется поддерживать, если западные арабские цифры. не используются
- В разных языках действуют разные правила множественного числа, что может усложнять программы, динамически отображающие числовой контент. [12] Другие грамматические правила также могут различаться, например, родительный падеж .
- В разных языках используется разная пунктуация (например, при цитировании текста используются двойные кавычки («»), как в английском языке, или кавычки («»), как во французском языке).
- Сочетания клавиш могут использовать только кнопки той раскладки клавиатуры , для которой выполняется локализация. Если ярлык соответствует слову на определенном языке (например, Ctrl-s означает «сохранить» на английском языке), возможно, его необходимо изменить. [13]
Национальные конвенции
В разных странах действуют разные экономические конвенции, включая вариации:
- Размеры бумаги
- Системы вещательного телевидения и популярные носители информации
- Форматы телефонных номеров
- Форматы почтовых адресов , почтовые индексы и выбор служб доставки.
- Валюта ( символы , позиции валютных маркеров и разумные суммы из-за различной истории инфляции ) — коды ISO 4217 часто используются для интернационализации.
- Система измерения
- Размеры батареи
- Стандарты напряжения и тока
В частности, в большинстве этих случаев Соединенные Штаты и Европа различаются. Другие области часто следуют одному из них.
Определенные сторонние сервисы, такие как онлайн-карты, прогнозы погоды или поставщики платежных услуг , могут быть недоступны по всему миру у одних и тех же операторов связи или вообще недоступны.
Часовые пояса различаются по всему миру, и это необходимо учитывать, если изначально продукт взаимодействовал только с людьми, находящимися в одном часовом поясе. Для интернационализации UTC часто используется внутри страны, а затем преобразуется в местный часовой пояс для отображения.
В разных странах действуют разные законодательные требования, означающие, например:
- Соответствие нормативным требованиям может потребовать настройки для конкретной юрисдикции или изменения продукта в целом, например:
- закона о конфиденциальности Соблюдение
- Дополнительные заявления об отказе от ответственности на веб-сайте или упаковке
- Различные требования к потребительской маркировке
- Соблюдение экспортных ограничений и правил шифрования.
- Соблюдение режима интернет-цензуры или вызова в суд процедуры
- Требования к доступности
- Сбор различных налогов, таких как налог с продаж , налог на добавленную стоимость или таможенные пошлины.
- Чувствительность к различным политическим вопросам, таким как споры о географических названиях и спорные границы , показанные на картах (например, Индия предложила законопроект, согласно которому отказ от показа Кашмира и других территорий, как это было задумано правительством, является преступлением. [14] [15] [16] )
- Номера, присвоенные правительством, имеют разные форматы (например, номера паспортов, номера социального страхования и другие национальные идентификационные номера ).
Локализация также может учитывать различия в культуре, такие как:
- Местные праздники
- личного имени и титула Условные обозначения
- Эстетика
- Понятность и культурная адекватность изображений и цветовой символики.
- Этническая принадлежность , одежда и социально-экономический статус людей и архитектура изображенных мест.
- Местные обычаи и условности , такие как социальные табу, популярные местные религии или суеверия, такие как группы крови в японской культуре и астрологические знаки в других культурах.
интернационализации программного обеспечения - процесс Бизнес
Чтобы вывести продукт на международный уровень , важно рассмотреть различные рынки, на которые этот продукт, как ожидается, выйдет. [2] Такие детали, как длина поля для почтовых адресов, уникальный формат адреса, возможность сделать поле почтового индекса необязательным для адреса стран, у которых нет почтовых индексов, или поле штата для стран, у которых нет штатов, а также введение новой регистрации. потоки, соответствующие местным законам, — это лишь некоторые из примеров, которые делают интернационализацию сложным проектом. [7] [17] Более широкий подход учитывает культурные факторы, например, адаптацию логики бизнес-процесса или включение отдельных культурных (поведенческих) аспектов. [2] [18]
Уже в 1990-х годах такие компании, как Bull использовали машинный перевод ( Systran , широко ) для всей своей переводческой деятельности: переводчики-люди выполняли предварительное редактирование (делание ввода машиночитаемым) и постредактирование . [2]
Инженерное дело [ править ]
Как при реинжиниринге существующего программного обеспечения, так и при разработке нового интернационализированного программного обеспечения первым шагом интернационализации является разделение каждой потенциально зависящей от локали части (будь то код, текст или данные) в отдельный модуль. [2] Затем каждый модуль может либо полагаться на стандартную библиотеку/зависимость, либо заменяться независимо по мере необходимости для каждой локали.
В настоящее время преобладающая практика заключается в том, что приложения помещают текст в файлы ресурсов, которые загружаются во время выполнения программы по мере необходимости. [2] Эти строки, хранящиеся в файлах ресурсов, относительно легко перевести. Программы часто создаются для обращения к библиотекам ресурсов в зависимости от выбранных данных локали.
Хранилище переводимых и переведенных строк иногда называют каталогом сообщений. [2] поскольку строки называются сообщениями. Каталог обычно содержит набор файлов в определенном формате локализации и стандартную библиотеку для работы с этим форматом. Одной из программных библиотек и форматов, которые помогают в этом, является gettext .
Таким образом, чтобы приложение поддерживало несколько языков, необходимо разработать приложение так, чтобы оно выбирало соответствующий файл языковых ресурсов во время выполнения. Код, необходимый для управления проверкой ввода данных и многими другими типами данных, зависящими от языкового стандарта, также должен поддерживать различные требования к языковому стандарту. Современные системы разработки и операционные системы включают сложные библиотеки для международной поддержки этих типов, см. также данные стандартной локали выше.
Многие вопросы локализации (например, направление письма, сортировка текста) требуют более глубоких изменений в программном обеспечении, чем перевод текста. Например, OpenOffice.org достигает этого с помощью переключателей компиляции.
Процесс [ править ]
Метод глобализации включает после планирования три этапа реализации: интернационализацию, локализацию и обеспечение качества. [2]
В некоторой степени (например, для обеспечения качества ) в команды разработчиков входит кто-то, кто управляет базовыми/центральными этапами процесса, а затем обеспечивает выполнение всех остальных. [2] Такие люди обычно понимают иностранные языки и культуры и имеют некоторое техническое образование. Специализированные технические писатели должны создать синтаксис, соответствующий культуре, для потенциально сложных концепций, а также инженерные ресурсы для развертывания и тестирования элементов локализации.
После правильной интернационализации программное обеспечение может полагаться на более децентрализованные модели локализации: бесплатное программное обеспечение и программное обеспечение с открытым исходным кодом обычно полагаются на самостоятельную локализацию конечных пользователей и добровольцев, иногда организованных в группы. [19] есть команды волонтеров-переводчиков более чем на 100 языков. проекте GNOME Например, в [20] MediaWiki поддерживает более 500 языков, из которых 100 в основном готовы по состоянию на сентябрь 2023 г. [update]. [21]
При переводе существующего текста на другие языки сложно поддерживать параллельные версии текстов на протяжении всего срока службы продукта. [22] Например, если сообщение, отображаемое пользователю, изменено, все переведенные версии должны быть изменены.
Коммерческие соображения [ править ]
В коммерческом контексте преимуществом локализации является доступ к большему количеству рынков. В начале 1980-х Lotus 1-2-3 потребовалось два года, чтобы разделить программный код и текст, и потеряло лидерство на рынке Европы над Microsoft Multiplan . [2] MicroPro обнаружила, что использование австрийского переводчика для рынка Западной Германии привело к тому, что ее документация WordStar , по словам одного из руководителей, «не имела того тона, который она должна была иметь». [23]
Однако это требует значительных затрат, выходящих далеко за рамки инженерных разработок. Кроме того, бизнес-операции должны адаптироваться для управления производством, хранением и распространением множества отдельных локализованных продуктов, которые часто продаются в совершенно разных валютах, нормативных условиях и налоговых режимах.
Наконец, отделы продаж, маркетинга и технической поддержки также должны облегчить свою деятельность на новых языках, чтобы поддержать клиентов в локализованной продукции. Предложение локализованного продукта может оказаться экономически невыгодным, особенно для относительно небольших языковых групп. Даже если большое количество языков может оправдать локализацию данного продукта, а внутренняя структура продукта уже допускает локализацию, данному разработчику или издателю программного обеспечения может не хватать размера и сложности для управления вспомогательными функциями, связанными с работой в нескольких регионах.
См. также [ править ]
- Подкомпоненты и стандарты:
- Связанные понятия:
- Доступность компьютера
- Русификация компьютера , локализация на русский язык.
- Разделение интересов
- Методы и примеры:
- Локализация игры
- Система управления глобализацией
- Псевдолокализация — метод тестирования программного обеспечения , предназначенный для проверки готовности программного продукта к локализации.
- Другой:
Ссылки [ править ]
- ^ Перейти обратно: а б Исида, Ричард; Миллер, Сьюзен К. (5 декабря 2005 г.). «Локализация против интернационализации» . W3C . Архивировано из оригинала 3 апреля 2016 г. Проверено 16 сентября 2023 г.
- ^ Перейти обратно: а б с д Это ж г час я дж к л м н О п д Холл, ПАВ; Хадсон, Р., ред. (1997). Программное обеспечение без границ: мультиплатформенный, мультикультурный и многонациональный подход . Чичестер: Уайли. ISBN 0-471-96974-5 .
- ^ Эсселинк, Берт (2006). «Эволюция локализации» (PDF) . В Пиме, Энтони; Перекрестенко Александр; Старинк, Брэм (ред.). Технология перевода и ее преподавание (с большим упоминанием локализации) . Таррагона: Группа межкультурных исследований – URV. стр. 21–29. ISBN 84-611-1131-1 . Архивировано из оригинала (PDF) 7 сентября 2012 года.
В двух словах, локализация вращается вокруг объединения языка и технологий для создания продукта, который может преодолевать культурные и языковые барьеры. Не больше, не меньше.
- ^ «Глоссарий жаргона W3C» . W3C . Архивировано из оригинала 2 сентября 2011 года . Проверено 16 сентября 2023 г.
- ^ «Происхождение аббревиатуры И18н» . I18nGuy . Архивировано из оригинала 27 июня 2014 года . Проверено 19 февраля 2022 г.
- ^ «Концепции (утилиты GNU gettext)» . gnu.org . Архивировано из оригинала 18 сентября 2019 года . Проверено 16 сентября 2023 г.
Многие люди, уставшие писать эти длинные слова снова и снова, взяли за привычку вместо этого писать i18n и l10n , цитируя первую и последнюю букву каждого слова и заменяя ряд промежуточных букв числом, просто указывающим, сколько таких букв. есть.
- ^ Перейти обратно: а б Алан (29 марта 2011 г.). «Что такое интернационализация (i18n), локализация (L10n) и глобализация (g11n)» . ccjk.com . Архивировано из оригинала 2 апреля 2015 года . Проверено 16 сентября 2023 г.
Заглавная буква L в L10n помогает отличить ее от строчной буквы i в i18n.
- ^ «Глобализация вашего бизнеса» . ИБМ . Архивировано из оригинала 31 марта 2016 года.
- ^ «Глобализация шаг за шагом» . Go Global Developer Center . Архивировано из оригинала 12 апреля 2015 года.
- ^ «Глобализация шаг за шагом: понимание интернационализации» . Глобальный центр разработчиков Go . Архивировано из оригинала 26 мая 2015 года.
- ^ https://www.ibm.com/docs/ssw_ibm_i_74/nls/rbagsnatlangvers.htm
- ^ «Множественное число форм (утилиты GNU gettext)» . gnu.org . Архивировано из оригинала 14 марта 2021 года . Проверено 16 сентября 2023 г.
- ^ «Нужно ли нам локализовать сочетания клавиш?» . Услуги человеческого перевода – перевод с языка на язык . 21 августа 2014 года. Архивировано из оригинала 3 апреля 2015 года . Проверено 19 февраля 2022 г.
- ^ Матин Хайдер (17 мая 2016 г.). «Пакистан выражает обеспокоенность по поводу спорного индийского «законопроекта о картах» » . Рассвет . Архивировано из оригинала 10 мая 2018 года . Проверено 9 мая 2018 г.
- ^ Ясир Латиф Хамдани (18 мая 2016 г.). «Изменение карт не будет означать, что Кашмир станет частью вас, Индия» . «Экспресс Трибьюн» . Проверено 19 февраля 2022 г.
- ^ «Обзор законопроекта о регулировании геопространственной информации» . Мадрасский курьер . 24 июля 2017 г. Архивировано из оригинала 29 октября 2020 г. . Проверено 19 февраля 2022 г.
- ^ «Приложение V Международные форматы адресов» . Документы Майкрософт . 2 июня 2008 г. Архивировано из оригинала 19 мая 2021 г. Проверено 19 февраля 2022 г.
- ^ Павловский, Ян М. Профили культуры: содействие глобальному обучению и обмену знаниями (PDF) (проектная версия). Архивировано (PDF) из оригинала 16 июля 2011 г. Проверено 1 октября 2009 г.
- ^ Рейна, Лаура Архона; Роблес, Грегорио; Гонсалес-Бараона, Хесус М. (2013). «Предварительный анализ локализации свободного программного обеспечения: как выполняются переводы». В Петринье, Этиэль; Суччи, Джанкарло; Иоини, Набиль Эль; Силлитти, Альберто (ред.). Программное обеспечение с открытым исходным кодом: проверка качества . ИФИП: Достижения в области информационных и коммуникационных технологий. Том. 404. Шпрингер Берлин Гейдельберг. стр. 153–167. дои : 10.1007/978-3-642-38928-3_11 . ISBN 978-3-642-38927-6 .
- ^ «Языки GNOME» . ГНОМ . Архивировано из оригинала 29 августа 2023 года . Проверено 16 сентября 2023 г.
- ^ «Перевод: Статистика группы» . переводвики.нет . Архивировано из оригинала 29 августа 2023 г. Проверено 16 сентября 2023 г.
- ^ «Как перевести игру на 20 языков и избежать попадания в ад: изгнание четырех дьяволов замешательства» . PocketGamer.biz . 4 апреля 2014 года. Архивировано из оригинала 7 декабря 2017 года . Проверено 19 февраля 2022 г.
- ^ Шраге, Майкл (17 февраля 1985 г.). «IBM завоевывает доминирование на европейском компьютерном рынке» . Вашингтон Пост . Архивировано из оригинала 29 августа 2018 года . Проверено 29 августа 2018 г. .
Дальнейшее чтение [ править ]
- Смит-Ферье, Гай (2006). Интернационализация .NET: Руководство разработчика по созданию глобальных приложений Windows и веб-приложений . Аппер-Сэддл-Ривер, Нью-Джерси: Эддисон Уэсли Профессионал. ISBN 0-321-34138-4 .
- Эсселинк, Берт (2000). Практическое руководство по локализации . Амстердам: Джон Бенджаминс. ISBN 1-58811-006-0 .
- Эш, Лидия (2003). The Web Testing Companion: Руководство для инсайдеров по эффективным и результативным тестам . Индианаполис, Индиана: Уайли. ISBN 0-471-43021-8 .
- ДеПальма, Дональд А. (2004). Бизнес без границ: Стратегическое руководство по глобальному маркетингу . Челмсфорд, Массачусетс: Globa Vista Press. ISBN 0-9765169-0-Х .
Внешние ссылки [ править ]
![](http://upload.wikimedia.org/wikipedia/commons/thumb/9/99/Wiktionary-logo-en-v2.svg/40px-Wiktionary-logo-en-v2.svg.png)
Локализация FOSS в Wikibooks
- Локализация против интернационализации Консорциума Всемирной паутины
СМИ, связанные с интернационализацией и локализацией, на Викискладе?