Код языка
Код языка — это код , который назначает буквы или цифры в качестве идентификаторов или классификаторов языков . Эти коды могут использоваться для организации библиотечных коллекций или представления данных , для выбора правильной локализации и перевода в вычислительной технике , а также в качестве сокращенного обозначения для более длинных форм названий языков.
Трудности классификации
[ редактировать ]Схемы языковых кодов пытаются классифицировать сложный мир человеческих языков, диалектов и вариантов . Большинство схем делают некоторый компромисс между общим характером и достаточной полнотой для поддержки конкретных диалектов.
Например, на испанском говорят более чем в 20 странах Северной Америки, Центральной Америки, Карибского бассейна и Европы. Испанский язык, на котором говорят в Мексике, будет немного отличаться от испанского языка, на котором говорят в Перу . В разных регионах Мексики будут немного различаться диалекты и акценты испанского языка. Схема языкового кода может сгруппировать их все как «испанский» для выбора раскладки клавиатуры, в большинстве случаев как «испанский» для общего использования или разделить каждый диалект, чтобы разрешить вариации в зависимости от региона.
Распространенные схемы
[ редактировать ]Схема | Примечания | Примеры для английского языка | Примеры для испанского языка |
---|---|---|---|
глоттолога Коды | Создан для языков меньшинств как научная альтернатива промышленному стандарту ISO 639‑3. Намеренно не напоминают аббревиатуры. |
|
|
Языковой тег IETF | Передовая практика IETF, указанная в BCP 47: [1] для языковых тегов, которые легко анализируются компьютером. Система тегов может быть расширена до региона, диалекта и частных обозначений. Он ссылается на ISO 639, ISO 3166 и ISO 15924. |
|
|
ИСО 639‑1 | Система двухбуквенных кодов стала официальной в 2002 году и на тот момент содержала 136 кодов. Во многих системах используются двухбуквенные коды ISO 639-1, дополненные трехбуквенными кодами ISO 639-2, когда двухбуквенный код неприменим. По состоянию на июнь 2021 года зарегистрировано 183 двухбуквенных кода.См.: Список языковых кодов ISO 639. |
|
|
ИСО 639‑2 | Трехбуквенная система из 464 кодов. |
|
|
ИСО 639‑3 | Расширение ISO 639-2 для охвата всех известных, живых или мертвых, устных и письменных языков в 7589 статьях. |
|
|
Регистра Лингосферы Кодовая система | Двузначная + от одной до шести букв кодовая система Регистра лингвистики, опубликованная в 2000 году, [3] содержащий более 32 000 кодов в 10 секторах, охватывающих языки и речевые сообщества мира. Также ознакомьтесь с иерархией кодовой системы Регистра лингвистики, опубликованной на сайте hortensj-garden.org. [4] | В иерархии кодовой системы Регистра Лингосферы:
Сравните: 52-АБА-а шотландцы + нортумбрийцы | В иерархии кодовой системы Регистра Лингосферы:
Сравните: 51-AAA-a Португальский + внешний блок Galego и 51-AAA-c Astur + внешний блок Leonés и т. д. |
Коды SIL (10–14 издания) | Коды, созданные для использования в Ethnologue , публикации SIL International , в которой приводится языковая статистика. В настоящее время в публикации используются коды ISO 639‑3. | RU | СПН |
Verbix Языковые коды | Созданы коды, начинающиеся со старых кодов SIL и добавляющие дополнительную информацию. [5] | RU | СПН |
См. также
[ редактировать ]- Accept-Язык
- Коды для искусственных языков
- Код страны
- Значки флагов для языков
- Список кодов ISO 639-1 — коды для распространенных языков
- Список кодов ISO 639-2 - расширенный список трехсимвольных кодов всех языков, кодируемых ISO.
- Локаль (компьютерное программное обеспечение)
Ссылки
[ редактировать ]- ^ «Информация о BCP 47 » Редактор RFC» .
- ^ Передовая текущая практика 47 — Теги для идентификации языков , IETF
- ^ «Реестр лингосферы в PDF» . l’Observatoire linguistique (Лингвосферная обсерватория) . Архивировано из оригинала 27 апреля 2015 года . Проверено 20 апреля 2015 г.
- ^ «Иерархия Регистра Лингвосферы» . Проверено 8 июня 2016 г.
- ^ Коды языков Verbix. Архивировано 1 апреля 2009 г. на Wayback Machine , Verbix.
Внешние ссылки
[ редактировать ]- Список обычных кодов языка и его вариантов
- Языковые теги в HTML и XML
- Идентификаторы языка в контексте разметки