ИСО 639
ISO 639 — это стандарт Международной организации по стандартизации (ISO), касающийся представления языков и языковых групп .В настоящее время он состоит из четырех наборов кода (1–3, 5), названных в честь каждой части, которая ранее описывала соответствующий набор (часть 4 представляла собой руководство без собственной системы кодирования); часть 6 была опубликована, но отозвана.Впервые он был одобрен в 1967 году как одночастная рекомендация ISO , ISO/R 639 . [1] заменен в 2002 году частью 1 новой серии ISO 639-1 , [2] Далее следуют дополнительные части. В 2023 году все существующие части серии были объединены в единый стандарт. [3] в основном основано на тексте ISO 639-4.
Использование кодов ISO 639 [ править ]
Коды языков, определенные в нескольких разделах стандарта ISO 639, используются в библиографических целях, а в вычислительной среде и в Интернете — в качестве ключевого элемента данных локали . Коды также находят применение в различных приложениях, например, в URL-адресах Википедии для разных языковых версий.
История [ править ]
Ранняя форма системы языкового кодирования ISO была отражена в стандарте ISO/R 639:1967 под названием «Символы для языков, стран и органов власти» , который был направлен главным образом на регулирование словарей, обозначающих языки, страны и агентства по стандартизации организаций-членов ISO. Его «языковые символы» состояли из одно- или двухбуквенных идентификаторов переменной длины, написанных с заглавной буквы, например: E
или En
для английского языка; S
, Sp
, или Es
для испанского языка; и In
для индонезийского. Также было разрешено использовать (версию до 1993 года) вспомогательные цифровые обозначения УДК для обозначения языков.
После выделения кода страны в ISO 3166 в 1974 году было опубликовано первое издание стандарта ISO 639:1988 «Кодекс для представления названий языков» с использованием единых двухбуквенных идентификаторов в строчных латинских алфавитах, в основном идентичных по формату и словарный запас соответствует действующему стандарту ISO 639, набор 1.
С тех пор стандарт был принят в качестве фундаментальной технологии быстро развивающейся компьютерной индустрии ( RFC 1766 ), что привело к разработке более выразительной трехбуквенной структуры, опубликованной как ISO 639-2:1998, в основном основанной на MARC кодах для языков. . Исходная двухбуквенная система была переименована в ISO 639-1 в 2001 году.
В целях более широкой поддержки языков для расширения приложений были созданы отдельные расширенные наборы пространства имен ISO 639-2, охватывающие отдельные языки и группы, как ISO 639-3 и ISO 639-5 соответственно. Была также попытка закодировать более точные варианты языка с использованием четырехбуквенных идентификаторов, таких как ISO 639-6, который позже был отозван и реорганизован в рамках другой структуры, ISO 21636 .
Относительно постоянные обновления частей ISO 639 осуществлялись каждым ответственным органом до публикации ISO 639:2023, который гармонизировал и воссоединил основной текст прежних стандартов и привел к организационным изменениям с объединенным агентством по техническому обслуживанию, контролирующим все наборы и выпуск информационных бюллетеней [1] .
стандарта и исторические части Текущие наборы
Набор (прошедшая часть) | Прежнее название ( Коды представления названий языков – ... ) | Регистрационный орган | Первое издание | Текущий | № в списке (по состоянию на 12 июля 2023 г.) [update]) |
---|---|---|---|---|---|
Набор 1 | Часть 1: Код Альфа-2 | Инфотерм | 1967 г. (исходный стандарт ISO/R 639) | 2023 | 183 |
Набор 2 | Часть 2: Код Альфа-3 | Библиотека Конгресса | 1998 | 2023 | 482 + 20 только B + 4 специальных + 520 для местного использования [4] [5] |
Набор 3 | Часть 3. Код Alpha-3 для всестороннего охвата языков. | СИЛ Интернешнл | 2007 | 2023 | 7916 + 4 специальных + 520 для местного использования [6] |
(ИСО 639-4) | Часть 4: Рекомендации по реализации и общие принципы языкового кодирования | ИСО/ТК 37 / ПК 2 | 2010-07-16 | 2023 | (не список) |
Набор 5 | Часть 5: Код Alpha-3 для языковых семей и групп. | Библиотека Конгресса | 2008-05-15 | 2023 | 115 (включая 36 остальных + 29 обычных групп по ISO 639-2) [7] |
( ИСО 639-6 ) | Часть 6: Представление Alpha-4 для полного охвата языковых вариантов (снято) | Геолонг | 2009-11-17 | отозван | 21,000+ |
Каждый набор стандартов поддерживается агентством по техническому обслуживанию, которое при необходимости добавляет коды и изменяет статус кодов. ISO 639-6 был отменен в 2014 году. [8] и не включен в ISO 639:2023.
Характеристики отдельных кодов [ править ]
Области применения:
- Отдельные языки
- Макроязыки (набор 3)
- Коллекции языков (Наборы 1, 2, 5). Некоторые коллекции уже были в наборе 2, а другие добавились только в наборе 5:
- Группы остатка: 36 коллекций как в наборе 2, так и в наборе 5 относятся к этому типу — для совместимости с набором 2, когда набор 5 еще не был опубликован, остальные группы не содержат ни одного языка и коллекций, которые уже были закодированы в наборе 2 (однако новые приложения совместимые с Набором 5, могут рассматривать эти группы включительно, если они соблюдают иерархию включения, опубликованную в Наборе 5, и используют наиболее конкретную коллекцию при группировке языков);
- Обычные группы: 29 коллекций в обоих наборах 2 и 5 именно такого типа — для совместимости с набором 2 они не могут содержать другие группы;
- Семейства: 50 новых коллекций, закодированных только в Наборе 5 (включая одну, содержащую обычную группу, уже закодированную в Наборе 2) — для совместимости с Набором 2 они могут содержать другие коллекции, кроме остальных групп.
- Диалекты : они должны были охватываться бывшим стандартом ISO 639-6 (предложенным, но сейчас отмененным).
- Особые ситуации (наборы 2, 3).
- Зарезервировано для местного использования (наборы 2, 3). Также иногда используется в приложениях, которым требуется двухбуквенный код, например стандартные коды в наборах 1 и 2 (где специальный код
mis
не подходит) или трехбуквенный код для коллекций, например стандартные коды в наборе 5.
Типы (для отдельных языков): [ нужно обновить ]
- Живые языки (наборы 2, 3) (все макроязыки являются живыми языками) [10]
- Вымершие языки (Наборы 2, 3) (599, [11] 5 из них входят в набор 2:
chb
,chg
,cop
,lui
,sam
; их нет в наборе 1) - Древние языки (Наборы 1, 2, 3) (124, [12] 19 из них входят в набор 2; и 5 из них, а именно
ave
,chu
,lat
,pli
иsan
, также есть код в наборе 1:ae
,cu
,la
,pi
,sa
) - Исторические языки (Наборы 2, 3) (89, [13] 16 из них входят в набор 2; их нет в наборе 1)
- Искусственные языки (наборы 1, 2, 3) (23, [14] 9 из них в наборе 2:
afh
,epo
,ido
,ile
,ina
,jbo
,tlh
,vol
,zbl
; 5 из них в наборе 1:eo
,ia
,ie
,io
,vo
)
Отдельные языки и макроязыки с двумя разными трехбуквенными кодами в наборе 2:
- Библиографические (некоторые из них устарели, ни один из них не был определен в наборе 3): это устаревшие коды (основанные на названиях языков на английском языке).
- Терминологические (также определены в наборе 3): это предпочтительные коды (основанные на названиях на родном языке, при необходимости латинизированные).
- Все остальные (включая наборы языков и специальные/зарезервированные коды) имеют только один трехбуквенный код для обоих вариантов использования.
Отношения между множествами [ править ]
В этом разделе есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
Различные наборы ISO 639 разработаны для совместной работы таким образом, что ни один код не означает одно в одном наборе, а другое — в другом. Однако не все языки входят во все наборы, и существует множество различных способов обработки конкретных языков и других элементов в разных наборах. Это зависит, например, от того, включен ли язык в наборы 1 или 2, имеет ли он отдельные коды B/T в наборе 2 или классифицируется как макроязык в наборе 3 и т.д.
Эти различные методы лечения подробно описаны в следующей таблице. В каждой группе строк (по одной для каждой области набора 3) последние четыре столбца содержат коды репрезентативного языка, который иллюстрирует определенный тип отношений между наборами ISO 639, второй столбец дает объяснение взаимосвязи, и первый столбец указывает количество элементов, имеющих этот тип отношений. Например, есть четыре элемента, которые имеют код в наборе 1, имеют код B/T и классифицируются как макроязыки в наборе 3. Одним из представителей этих четырех элементов является «персидский». fa
/ per
/ fas
.
Объем | Количество случаев | Описание | Пример сопоставления кодов | |||
---|---|---|---|---|---|---|
ISO 639 Набор 1 | ISO 639 Набор 2 | ISO 639 Набор 3 | ISO 639 Набор 5 | |||
Отдельные языки ("Я") | 128 | Отдельные языки, не входящие в состав макроязыка, имеют коды в каждом наборе 1, 2 и 3 (только один код в наборе 2). В Наборе 1 присвоено 184 кода для отдельных языков, макроязыков или групп; вычтите те, что посчитаны в строках ниже, получится: 184 - (2 "I (бывший B/T)") ‒ (3+11 "I") ‒ (3+2 "I (B/T)") ‒ (28 +4+1+1 «М») ‒ (1 «С») = 128 кодов. | в | а | — | |
2 | Отдельные языки с кодами в каждом наборе 1, 2 и 3, которые имели отдельные коды B/T в наборе 2, но чьи B-коды были отозваны (с 28 июня 2008 г.), сохраняя свои T-коды для любого использования. Это: hr /( scr )/ hrv , и sr /( scc )/ srp . Оба являются частью одного и того же макроязыка. hbs добавлен в Набор 3, чтобы включить также другие новые закодированные отдельные языки, но его код sh в Наборе 1 также был изъят, и у него не было кода, определенного в Наборе 2. | час | (скр)/гривны (Б/Т) | HRV | ||
3 | Отдельные языки, принадлежащие к макроязыку в Наборе 3, имеющие единый код в Наборе 2, а также имеющие код в Наборе 1. Это: bs / bos (часть макроязыка hbs ), nb / nob и nn / nno (обе части макроязыка no / nor ). | обратите внимание | ноб | |||
11 | Отдельные языки с отдельными кодами B/T в наборе 2, но не в каких-либо особых случаях в последующих строках. В Наборе 2 отдельным языкам или макроязыкам присвоено 20 пар отдельных кодов B/T; вычтем приведенные ниже особые случаи, и получится: 20 ‒ (3+2 «M») ‒ (4 «C») = 11 пар кодов. | из | гер/десять (Б/Т) | это дало | ||
3 | Отдельные языки с отдельными кодами B/T в Наборе 2, но буквы из кода Набора 1 не являются первыми двумя буквами кода Набора 2T. Это: cs / cze / ces , mi / mao / mri , и sk / slo / slk . | CS | июнь/сезон (B/T) | эти | ||
3 | Отдельные языки в наборах 2 и 3 (не относятся к макроязыкам), но в наборе 1 были охвачены кодом, эквивалентом которого в наборе 2 является коллектив. Это: bho , mai , и mag . | (бх) | от | |||
немного | Любой другой отдельный язык из наборов 2 и 3, без кода из набора 1. | — | Аст | |||
1 | Отдельные языки, добавленные в Набор 3 без кодов в Наборах 1 и 2, но охваченные макроязыком в Наборах 2 и 3, также закодированным в Наборе 1. | (с) | (Мы покупаем) | вилка | ||
1 | Отдельный язык в Наборе 3, без кода в Наборе 2, но в Наборе 1 он был охвачен кодом, эквивалентом которого в Наборе 2 является коллективная группа (см. запись об этой группе ниже). | (бх) | (Я бы) | СК | ||
> 7000 | Любой другой отдельный язык из набора 3 без какого-либо кода из наборов 1 и 2 (возможно, включенный в набор 2 коллективным кодом, например nic «Нигер-Кодофаниан (Другие)», представляющая собой остаточную группу). | — | (ничего) | ааа | ||
Макроязыки («М») | 28 | Макроязыки из набора 3, которые также имеют коды из набора 1 и 2. В наборе 3 для макроязыков присвоено 62 кода; вычтем коды с особыми случаями ниже, получится: 62 ‒ (4 «B/T») ‒ 1 ‒ (25+1+3 «нет в наборе 1») = 28 кодов. | с | Мы покупаем | ||
4 | Макроязыки в наборе 3 с отдельными кодами B/T в наборе 2. Это: fa / per / fas , ms / may / msa , sq / alb / sqi , и zh / chi / zho . | но | за/фас (Б/Т) | фас | ||
1 | Макроязыки из набора 3, содержащие языки, имеющие коды из набора 1. Только: no / nor (содержащий: nb / nob , и nn / nno ). | нет | ни | |||
25 | Макроязыки в наборах 2 и 3, но без кода в наборе 1. | — | бал | |||
1 | Макроязык в наборе 3, без кода в наборе 2, код которого в наборе 1 устарел. | (ш) | — | HBS | ||
3 | Макроязыки в наборе 3, без кодов в наборе 1 или 2. Это: bnc , kln , и luy . | — | — | БНК | ||
Семьи и группы (коллектив) («С») | 1 | Бихари помечен как коллективный и имеет код Набора 2. У него был код Set 1, но он устарел в 2021 году. [9] Причина заключалась в том, что три отдельных языка бихари (которые настолько различаются, что не могут образовать один и тот же макроязык для Набора 3) получили разные коды Набора 2 ( bho , mai , mag ), что сделало бихари остаточной группой для целей Набора 2 (содержащего языки группы, кроме этих трех). | (бх) | Я бы | — | Я бы |
35 | Остальные группы в наборе 2, т.е. тот же код, но включены разные языки. В наборе 2, afa относится к афро-азиатскому языку, который не имеет идентификатора индивидуального языка в наборе 2 и не попадает в три оставшиеся группы: ber «Бербер (Другое)», cus «Кушитский (Другой)», или sem «Семитские (Другие)», все из которых являются афро-азиатскими языковыми группами. | — | хорошо | хорошо | ||
29 | Обычная группа в наборе 2, такая же, как языковая семья в наборе 5, кода в наборе 1 нет. Среди них обычная группа ypk в Наборе 2 была единственной, которая была закодирована в Наборе 5 как часть другой новой регулярной группы в Наборе 5, которая не была закодирована в Наборе 2 (см. ниже). | из | из | |||
50 | Регулярные группы добавлены только в Набор 5 и ранее не кодировались в Наборы 1, 2 и 3. Большинство этих новых регулярных групп могли быть ранее представлены другим коллективным кодом в Наборе 2 как часть остаточной группы (например, остаточная группа ine для новой постоянной группы sqj ), кроме 7 из них: aav , esx , euq , hmx , jpx , urj , а также syd (часть новой регулярной группы urj ). Обычная группа ypk (часть новой регулярной группы esx ), однако уже был закодирован в наборе 2. См. иерархию языковых групп в списке кодов набора 5 ISO 639 . | — | площадь | |||
Специальные коды («С») | 1 | Доступен для использования в одноязычном контексте, где требуется индивидуальный код языка, но сам язык не имеет стандартного кода. Более точной альтернативой могло бы быть использование остаточной группы из набора 2 или кода языкового семейства из набора 5, если только другие языки в такой группе не должны быть исключены (поскольку они разделены собственным кодом) или если стандартный коллективный код не подходит. Некоторые приложения могут предпочесть использовать более конкретный код, зарезервированный для локального использования. | — | что | — | |
1 | Многоязычный контент (включает как минимум два языка в отдельные наборы). Используется, когда для всего контента ожидается единый языковой код. Отдельные языки или макроязыки для каждой части контента могут быть еще не закодированы (и могут быть представлены как mis или точнее с коллективным кодом). | у меня есть | ||||
1 | Неопределенный (содержание включает ноль, один или несколько языков в произвольной комбинации). | и | ||||
1 | Никакой лингвистической информации вообще (добавлено 11 января 2006 г.). Содержимое (например, графика, фотографии или аудио/видеозаписи, не включающие текст на человеческом языке, или технические метаданные и большая часть исходного кода программ) можно использовать в том виде, в каком оно есть, на любом языке и не следует переводить (за исключением его описания, которое, возможно, связано с отдельными содержания или несущественных фрагментов содержания). | зхх | ||||
Зарезервировано для локального использования («Р») | 20 | Двухбуквенные коды в наборе 1, в диапазоне qa .. qt . Эти коды не рекомендуются, но оставлены неназначенными в Наборе 1. | ка | — | ||
520 | Трехбуквенные коды в наборах 2 и 3, в диапазоне qaa ... qtz . Эти коды также могут использоваться для коллективных языков (или других особых случаев), но в Наборе 5 им не будут присвоены никакие стандартные языковые семьи и группы. | — | что |
Эти различия обусловлены следующими факторами.
В наборе 2 ISO 639 22 отдельным языкам были присвоены два отдельных кода, а именно библиографический и терминологический код (коды B/T). [15] Коды B были включены по историческим причинам, поскольку предыдущие широко используемые библиографические системы использовали языковые коды, основанные на английском названии языка. Напротив, коды Набора 1 были основаны на родном названии языка, и также существовало сильное желание иметь коды Набора 2 (T-коды) для этих языков, которые были бы похожи на соответствующий двухсимвольный код в Наборе 1.
- Например, немецкий язык (Набор 1:
de
) имеет два кода в наборе 2:ger
(код B) иdeu
(Т-код), тогда как в наборе 2 имеется только один код,eng
, для английского языка . - Два прежних кода B были отозваны, и сегодня осталось только 20 пар кодов B/T.
Отдельные языки в Наборе 2 всегда имеют код в Наборе 3 (там повторно используется только код терминологии Набора 2), но могут иметь или не иметь код в Наборе 1, как показано в следующих примерах:
- Набор 3
eng
соответствует набору 2eng
и набор 1en
- Набор 3
ast
соответствует набору 2ast
но не имеет кода в наборе 1.
Некоторые коды (62) набора 3 являются макроязыками. Это группы, содержащие несколько отдельных языков, которые хорошо понимают друг друга и обычно смешиваются или путаются. Некоторые макроязыки разработали стандартную форму по умолчанию для одного из своих отдельных языков (например, для китайского макроязыка по умолчанию подразумевается мандаринский язык, другие отдельные языки при необходимости все еще можно различать, но конкретный код cmn
поскольку китайский язык используется редко).
- Макроязык 1 имеет коды Набора 2 и Кода Набора 1, в то время как отдельные языки, входящие в его состав, также имеют коды в Наборе 1 и Наборе 2:
nor
/no
содержитnon
/nn
,nob
/nb
; или - 4 макроязыка имеют два кода Набора 2 (B/T) и код Набора 1:
per
/fas
/fa
,may
/msa
/ms
,alb
/sqi
/sq
, иchi
/zho
/zh
; - 28 макроязыков имеют код Набора 2, но не имеют кода Набора 1;
- 29 других макроязыков имеют коды только в наборе 3.
Коллективные коды в наборе 2 имеют код в наборе 5: например aus
в наборах 2 и 5, что означает австралийские языки .
- Некоторые коды были добавлены в Набор 5, но не содержали кода в Наборе 2: например
sqj
Наборы 2 и 3 также имеют зарезервированный диапазон и четыре специальных кода:
- Коды
qaa
черезqtz
зарезервированы для местного использования. - Существует четыре специальных кода:
mis
для языков, которым еще не присвоен код,mul
для «несколько языков»,und
для «неопределенного» иzxx
для «нет языкового содержания, неприменимо».
Кодовое пространство [ править ]
Двухбуквенное кодовое пространство [ править ]
Двухбуквенные (ранее «Альфа-2») идентификаторы (для кодов, состоящих из 2 букв основного латинского алфавита ISO ) используются в Наборе 1 . Когда требовались коды для более широкого диапазона языков, можно было использовать более двух буквенных комбинаций (максимум 26 2 = 676), Набор 2 был разработан с использованием трехбуквенных кодов. (Однако последняя была формально опубликована первой. [16] [17] )
Трехбуквенное кодовое пространство [ править ]
Трехбуквенные идентификаторы (ранее «Альфа-3») (для кодов, состоящих из 3 букв основного латинского алфавита ISO ) используются в Наборе 2 , Наборе 3 и Наборе 5 . Число языков и языковых групп, которые могут быть представлены таким образом, составляет 26. 3 = 17,576.
Общее использование трехбуквенных кодов тремя наборами ISO 639 требует некоторой координации в рамках более крупной системы.
Набор 2 определяет четыре специальных кода. mis
, mul
, und
, zxx
, зарезервированный диапазон qaa-qtz
(20 × 26 = 520 кодов) и имеет 20 двойных записей (коды B/T), а также 2 записи с устаревшими B-кодами. В сумме получается 520 + 22 + 4 = 546 кодов, которые нельзя использовать в Наборе 3 для обозначения языков или в Наборе 5 для обозначения языковых семей или групп. Остаток равен 17 576 – 546 = 17 030.
Сегодня на Земле существует где-то от шести до семи тысяч языков. [18] Таким образом, этих 17 030 кодов достаточно для присвоения уникального кода каждому языку, хотя некоторые языки могут иметь произвольные коды, которые совсем не похожи на традиционные названия этого языка.
Кодовое пространство Альфа-4 (отозвано) [ править ]
Коды «Альфа-4» (для кодов, состоящих из 4 букв основного латинского алфавита ISO ) было предложено использовать в ISO 639-6 , который был отозван. Верхний предел количества языков и диалектов, которые могут быть представлены, составляет 26. 4 = 456,976.
См. также [ править ]
- Языковые теги IETF (на основе ISO 639)
- ISO 3166 (коды стран)
- ISO 15924 (коды систем письма )
- Коды для искусственных языков
- Код языка
- Языковые семьи и языки
- Список языков
- Список официальных языков
- Списки кодов ISO 639
Примечания и ссылки [ править ]
- ^ «ИСО/Р 639:1967» . Международная организация по стандартизации. 01.03.1988 . Проверено 5 августа 2012 г.
- ^ «ИСО 639:1988» . Международная организация по стандартизации . Проверено 5 августа 2012 г.
- ^ «ИСО 639:2023» . Международная организация по стандартизации . Проверено 15 ноября 2023 г.
- ^ «Коды, расположенные в алфавитном порядке по коду альфа-3/ISO 639-2» . Библиотека Конгресса. 25 июля 2013 г. Проверено 10 января 2019 г.
- ^ «Коды ISO-639-2» . Библиотека Конгресса . Проверено 10 января 2019 г.
- ^ «Набор кодов ISO 639-3 (UTF-8)» . СИЛ Интернешнл . Проверено 12 июля 2023 г.
- ^ «Коды ISO 639-5, упорядоченные по идентификатору» . Офис развития сети и стандартизации MARC . Библиотека Конгресса . Проверено 12 декабря 2018 г.
- ^ ИСО 639-6:2009 , ИСО .
- ↑ Перейти обратно: Перейти обратно: а б СИЛ Интернешнл (14 июня 2021 г.). «Изменение кода языка части 1» . ИСО 639-3 .
- ^ «Кодовые таблицы ISO 639: макроязыки» . Сил.орг . Проверено 5 августа 2012 г.
- ^ «Кодовые таблицы ISO 639: вымерли» . Сил.орг . Проверено 5 августа 2012 г.
- ^ «Кодовые таблицы ISO 639: древние» . Сил.орг . Проверено 10 января 2019 г.
- ^ «Кодовые таблицы ISO 639: исторические» . Сил.орг . Проверено 5 августа 2012 г.
- ^ «Кодовые таблицы ISO 639: построены» . Сил.орг . Проверено 7 февраля 2022 г.
- ^ «ISO 639-2 – Часто задаваемые вопросы» . Библиотека Конгресса. 05 мая 2014 г. Проверено 12 декабря 2014 г.
- ^ «Коды для представления названий языков. Часть 2: Код Альфа-3» . Международная организация по стандартизации . ИСО . Проверено 10 января 2019 г.
Дата публикации: 1998-10 гг.
- ^ «Коды для представления названий языков. Часть 1: Код Альфа-2» . Международная организация по стандартизации . ИСО . Проверено 15 февраля 2018 г.
Дата публикации: 2002-07.
- ^ «Статистические сводки» . Этнолог . Проверено 5 августа 2012 г.
Внешние ссылки [ править ]
- Официальный ISO 639-1/RA (Регистрационный орган) Infoterm
- Официальный ISO 639-2/RA (Регистрационный орган) Библиотека Конгресса
- Официальный ISO 639-3/RA (Регистрационный орган) SIL International
- Официальный ISO 693-5/RA (Регистрационный орган) Библиотека Конгресса
- Общий репозиторий данных локали , который содержит переводы кодов ISO 639 на другие языки в формате XML. Инструмент опроса CLDR также содержит более читаемый формат данных.