Символ регионального индикатора
Символы региональных индикаторов представляют собой набор из 26 буквенных символов Юникода (A–Z), предназначенных для использования для кодирования ISO 3166-1 альфа-2 двухбуквенных кодов стран таким образом, чтобы обеспечить дополнительную специальную обработку.
Они были определены как часть в Юникоде 6.0 поддержки эмодзи , как альтернатива кодированию отдельных символов для каждого флага страны. Хотя они могут отображаться как латинские буквы, предполагается, что реализации могут отображать их другими способами, например, с использованием национальных флагов . [1] [2] В FAQ по Unicode указывается, что этот механизм следует использовать и что символы национальных флагов не будут кодироваться напрямую. [3]
Они закодированы в диапазоне U + 1F1E6 🇦 РЕГИОНАЛЬНЫЙ ИНДИКАТОР БУКВА от A до U+1F1FF 🇿 РЕГИОНАЛЬНЫЙ ИНДИКАТОР-СИМВОЛ БУКВА Z в закрытом блоке буквенно-цифрового дополнения в дополнительной многоязычной плоскости . [4]
Последовательности флагов эмодзи
[ редактировать ]Пара символов-индикаторов региона называется последовательностью флагов эмодзи (хотя она представляет конкретный регион, а не конкретный флаг для этого региона). [6]
Из 676 возможных пар символов региональных индикаторов (26 × 26) только 270 считаются действительными кодами регионов Unicode.Это подмножество последовательностей регионов в общем хранилище данных локали (CLDR): [6] [7] [8]
- Все 256 последовательностей регулярных областей в CLDR.
- 249 официально присвоенных кодов ISO 3166-1 альфа-2.
- 6 исключительных резерваций (остров Вознесения, остров Клиппертон, Диего-Гарсия, Сеута и Мелилья, Канарские острова и Тристан-да-Кунья)
- 1 назначаемый пользователем временный код страны (Косово)
- Две из 35 последовательностей макрорегионов в CLDR (ЕС и ООН)
- Все 12 устаревших последовательностей регионов в CLDR (настоятельно не рекомендуется — предназначены только для обратной совместимости)
А начиная с Юникод 16.0 |
устарел | замена [10] [11] | ||||
---|---|---|---|---|---|
код | область | флаг | код | область | возможный рендеринг |
АН | Нидерландские Антильские острова | 🇨🇼 | CW | Кюрасао | |
🇸🇽 | SX | Синт-Мартен | |||
🇧🇶 | БК | Карибские Нидерланды | |||
ЭТОТ | Бирма | 🇲🇲 | ММ | Мьянма (Бирма) | |
CS | Сербия и Черногория | 🇷🇸 | РС | Сербия | |
🇲🇪 | МНЕ | Черногория | |||
ДД | Германская Демократическая Республика | 🇩🇪 | ИЗ | Германия | |
Форекс | Метрополитен Франции | 🇫🇷 | фр. | Франция | |
НТ | Нейтральная зона | 🇸🇦 | на | Саудовская Аравия | |
🇮🇶 | IQ | Ирак | |||
ЧТО | Евросоюз | 🇪🇺 | Евросоюз | Евросоюз | |
Они есть | Союз Советских Социалистических Республик | 🇷🇺 | РУ | Россия | |
🇦🇲 | ЯВЛЯЮСЬ | Армения | |||
🇦🇿 | ТО | Азербайджан | |||
🇧🇾 | К | Беларусь | |||
🇪🇪 | ЭЭ | Эстония | |||
🇬🇪 | GE | Грузия | |||
🇰🇿 | КЗ | Казахстан | |||
🇰🇬 | КГ | Кыргызстан | |||
🇱🇻 | ЛВ | Латвия | |||
🇱🇹 | LT | Литва | |||
🇲🇩 | доктор медицинских наук | Молдавия | |||
🇹🇯 | Ти Джей | Таджикистан | |||
🇹🇲 | ТМ | Туркменистан | |||
🇺🇦 | UA | Украина | |||
🇺🇿 | К | Узбекистан | |||
Город | Восточный Тимор | 🇹🇱 | ТЛ | Тимор-Лешти | |
ЯД | Демократический Йемен | 🇾🇪 | ВЫ | Йемен | |
YU | Югославия | 🇷🇸 | РС | Сербия | |
🇲🇪 | МНЕ | Черногория | |||
ЗР | Заир | 🇨🇩 | компакт-диск | Конго - Киншаса |
Отдельный механизм ( последовательности тегов эмодзи ) используется для региональных флагов, таких как Англия 🏴 Football Football, Шотландия, Шотландия, Шотландия, Уэльс, Уэльс, Техас, Техас. футзалфутболфутбол или Калифорния 🏴 Football Football. [12] Он использует U+ 1F3F4 🏴 РАЗМАШИВАНИЕ ЧЕРНОГО ФЛАГА и форматирование символов тегов вместо символов региональных индикаторов. Он основан на регионах ISO 3166-2 с удаленным дефисом и строчными буквами, например GB-ENG → gbeng, оканчивающимся на U+ E007F ОТМЕНА ТЕГА . Таким образом, флаг Англии представлен последовательностью U+1F3F4 , U+E0067 , U+E0062 , U+E0065 , U+E006E , U+E0067 , U+E007F . В десятой версии консорциум Unicode рассматривал возможность U+ 1F3F3 🏳 Вместо этого МАШУ БЕЛЫМ ФЛАГОМ , [13] но с одиннадцатого числа оно становится черным. [14] Некоторые поставщики предпочитают включать пользовательские соединительные последовательности нулевой ширины , которые отображаются только на их платформе, например WhatsApp и их флаг страны-беженца 🏳️🟧⬛️🟧. [15]
блок Юникода
[ редактировать ]Подмножество региональных индикаторных символов Прилагаемого буквенно-цифрового дополнения [1] Официальная таблица кодов Консорциума Unicode (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
... | (U+1F100–U+1F1E5 опущены) | |||||||||||||||
U + 1F1Ex | 🇦 | 🇧 | 🇨 | 🇩 | 🇪 | 🇫 | 🇬 | 🇭 | 🇮 | 🇯 | ||||||
U + 1F1Fx | 🇰 | 🇱 | 🇲 | 🇳 | 🇴 | 🇵 | 🇶 | 🇷 | 🇸 | 🇹 | 🇺 | 🇻 | 🇼 | 🇽 | 🇾 | 🇿 |
Примечания
|
Фон
[ редактировать ]В 2007 году Техническому комитету Unicode был представлен проект предложения по кодированию символов эмодзи , в частности тех, которые широко используются на мобильных телефонах японскими телекоммуникационными компаниями DoCoMo , KDDI и SoftBank . [16] Предлагаемые символы включали десять национальных флагов: [17] Китай (🇨🇳), Германия (🇩🇪), Испания (🇪🇸), Франция (🇫🇷), Великобритания (🇬🇧), Италия (🇮🇹), Япония (🇯🇵), Южная Корея (🇰🇷), Россия (🇷🇺) и США (🇺🇸).Кодирование этих флагов, а не флагов других стран, некоторые считали вредным. [18] Одним из отклоненных решений было закодировать десять флагов, но назвать их «СИМВОЛ СОВМЕСТИМОСТИ EMOJI-n» и представить их визуально в Стандарте как «EC n» вместо отображения флагов, которые они представляют. [19] Другое отклоненное решение предусматривало бы выделение 676 кодовых точек (26×26) для каждой возможной двухбуквенной комбинации A–Z. Они будут представлять политические организации, основанные на ISO 3166, такие как «JP» для Японии или интернет-нДВУ ( домены верхнего уровня с кодом страны ), такие как «EU» для Европейского Союза. [20]
Принятым решением было добавить 26 символов для букв, используемых для представления региональных индикаторов, которые, используемые парами, будут обозначать десять национальных флагов и возможные будущие расширения. [2] Согласно стандарту Unicode , «основная цель таких пар [региональных индикаторных символов] — обеспечить однозначные двусторонние сопоставления с определенными символами, используемыми в основных наборах эмодзи». [21] в частности десять национальных флагов: [22] 🇨🇳, 🇩🇪, 🇪🇸, 🇫🇷, 🇬🇧, 🇮🇹, 🇯🇵, 🇰🇷, 🇷🇺 и 🇺🇸.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Эндрю Уэст . «Что нового в Unicode 6.0» . Бабельстон. Архивировано из оригинала 6 апреля 2014 г. Проверено 18 августа 2014 г.
- ^ Перейти обратно: а б Майкл Эверсон и Кен Уистлер. «N3727: Предложение по кодированию символов региональных индикаторов в UCS» (PDF) . Документ рабочей группы, ISO/IEC JTC1/SC2/WG2 и UTC . Проверено 18 августа 2014 г.
- ^ «Часто задаваемые вопросы по Unicode: эмодзи и дингбаты» . Консорциум Юникод. 28 октября 2009 г. Проверено 18 августа 2014 г.
- ^ «Прилагаемое буквенно-цифровое дополнение, диапазон 1F100–1F1FF, стандарт Unicode, версия 6.0» (PDF) . Консорциум Юникод. 2010 . Проверено 18 августа 2014 г.
- ^ «Флаги» . emojipedia.com . Проверено 4 февраля 2020 г.
- ^ Перейти обратно: а б UTR № 51: Emoji Unicode, Приложение B: Допустимые последовательности флагов Emoji , Интернет-сайт Консорциума Unicode, 05 сентября 2023 г.
- ^ «UTR № 35: язык разметки региональных данных Unicode (LDML), данные достоверности» . Консорциум Юникод.
- ^ «Данные о действительности региона CLDR v38» . Общее хранилище данных локали Unicode (CLDR) . 2020-10-28. [ постоянная мертвая ссылка ] [1]
- ^ «UCD: данные последовательности эмодзи для UTR № 51» . Консорциум Юникод. 05.06.2023.
- ^ «UTR № 35: язык разметки данных локали Unicode (LDML), дополнительные метаданные» . Консорциум Юникод.
- ^ «Дополнительные метаданные CLDR v38» . Общее хранилище данных локали Unicode (CLDR) . 2020-10-28. [ постоянная мертвая ссылка ] [2]
- ^ «UTR № 51: эмодзи Юникода» . Консорциум Юникод. 18 мая 2017 г.
- ^ «UTR № 51: эмодзи Юникода» .
- ^ «UTS № 51: Юникод-эмодзи» .
- ^ «Портал WhatsApp» . Копировать и вставить дамп . Р74н. 2020. Архивировано из оригинала 22 июня 2021 года . Проверено 23 июня 2021 г.
- ^ Момои, Кэт; Дэвис, Марк; Шерер, Маркус (3 августа 2007 г.). «L2/07-257: Рабочий проект предложения по кодированию символов эмодзи» . Проверено 18 августа 2014 г.
- ^ «Сопоставление Unicode для Emoji со ссылкой на японских операторов связи, AU/KDDI, DoCoMo и Softbank» (формат ZIP-архива) . Проверено 18 августа 2014 г.
- ^ «L2/09-114 N3607: На пути к кодированию символов, используемых в качестве эмодзи» (PDF) . 6 апреля 2009 г. Проверено 18 августа 2014 г.
- ^ «INCITS/L2/09-304: Комментарии к отрицательному голосованию США по PDAM 8 к ISO/IEC 10646:2003 (SC2 N4078)» (PDF) . 15 августа 2009 г. Проверено 18 августа 2014 г.
- ^ Пентцлин, Карл (9 августа 2008 г.). «L2/08-305: Некоторые предложения по кодировке национальных флагов в соответствии с предложением Emoji» (PDF) . Проверено 18 августа 2014 г.
- ^ Стандарт Unicode, версия 6.2, глава 15: Символы (PDF) . Unicode, Inc., сентябрь 2012 г., с. 534. ИСБН 978-1-936213-07-8 .
- ^ «Источники эмодзи» (обычный текст) . Юникод, Инк. 17 декабря 2013 г. Проверено 18 августа 2014 г.
Дальнейшее чтение
[ редактировать ]- Дженнифер Дэниел (28 марта 2022 г.). «Прошлое и будущее эмодзи флага 🏁» . Кто-то сказал эмодзи? .