Теги (блок Unicode)
Теги | |
---|---|
Диапазон | U+E0000..U+E007F (128 кодовых точек) |
Самолет | ССП |
Скрипты | Общий |
Назначенный | 97 кодовых точек |
Неиспользованный | 31 зарезервированная кодовая точка 1 устаревший |
История версий Юникода | |
3.1 (2001) | 97 (+97) |
Документация Юникод | |
Таблица кодов ∣ Веб-страница | |
Примечание : [1] [2] |
Теги — это блок Юникода, содержащий символы тегов форматирования. Блок предназначен для отражения ASCII . Первоначально он предназначался для языковых тегов, но теперь был перепрофилирован как модификаторы эмодзи, особенно для флагов регионов.
Устаревшее использование [ править ]
U+E0001, U+E0020–U+E007F изначально предназначались для невидимой маркировки текстов по языку. [3] но такое использование больше не рекомендуется. [4] Все эти символы устарели в Unicode 5.1.
С выпуском Unicode 8.0 символы U+E0020–U+E007E больше не являются устаревшими символами.Изменение было внесено, «чтобы расчистить путь для потенциального использования символов тегов в целях, отличных от представления языковых тегов». [5] В Unicode говорится, что «использование символов тегов для представления языковых тегов в простом текстовом потоке по-прежнему является устаревшим механизмом передачи языковой информации о тексте». [5]
Текущее использование [ править ]
С выпуском Unicode 9.0 U+E007F больше не является устаревшим символом. (U+E0001 LANGUAGE TAG остается устаревшим.) Выпуск Emoji 5.0 в мае 2017 г. [6] считает эти символы эмодзи для использования в качестве модификаторов в специальных последовательностях.
Единственное указанное использование - это представление флагов регионов, а также использование региональных индикаторных символов для национальных флагов. [7] Эти последовательности состоят из U+1F3F4 🏴 МАШАЕМ ЧЕРНЫМ ФЛАГОМ , за которым следует последовательность тегов, соответствующих региону, закодированному в CLDR , затем U+E007F ОТМЕНА ТЕГА . Например, при использовании тегов для «gbeng» (🏴 Football Football) некоторые системы будут отображать флаг Англии , для «gbsct» (🏴 Football Football) — флаг Шотландии и те, что обозначают «gbwls» (🏴 Football Football), флаг Уэльса . [7]
Последовательности тегов взяты из ISO 3166-2 последовательности, представляющие другие субнациональные флаги (например, штаты США , но с использованием этого механизма также возможны ). Однако, начиная с версии Unicode 12.0, только три перечисленные выше последовательности флагов «рекомендуются для общего обмена» Консорциумом Unicode, что означает, что они «скорее всего, будут широко поддерживаться на нескольких платформах». [8]
Блок Юникода [ править ]
Теги [1] [2] [3] Официальная таблица кодов Консорциума Unicode (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
U+E000x | НАЧИНАТЬ | |||||||||||||||
U + E001x | ||||||||||||||||
U + E002x | СП | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
U + E003x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
U + E004x | @ | А | Б | С | Д | И | Ф | Г | ЧАС | я | Дж | К | л | М | Н | ТО |
U + E005x | П | вопрос | Р | С | Т | В | V | В | Х | И | С | [ | \ | ] | ^ | _ |
U + E006x | ` | а | б | с | д | и | ж | г | час | я | дж | к | л | м | н | тот |
U + E007x | п | д | р | с | т | в | v | В | х | и | С | { | | | } | ~ | КОНЕЦ |
История [ править ]
В следующих документах, связанных с Unicode, записаны цель и процесс определения определенных символов в блоке «Теги»:
Версия | Окончательные кодовые точки [а] | Считать | L2 Идентификатор | рабочей группы 2 Идентификатор | Документ |
---|---|---|---|---|---|
3.1 | U + E0001 | 1 | Л2/97-203 | Уистлер, Кен; Адамс, Гленн (5 августа 1997 г.), Plane 14 символов для общих тегов | |
Л2/97-171Р2 | Уистлер, Кен (18 сентября 1997 г.), Plane 14 символов для общих тегов | ||||
Л2/97-256 | Аллуш, Мати (20 октября 1997 г.), Комментарии к позиционному документу по самолету 14 | ||||
Л2/97-255Р | Алипранд, Джоан (3 декабря 1997 г.), «3.B. Облегченная языковая маркировка», утвержденный протокол - совместное заседание UTC № 73 и L2 № 170, Пало-Альто, Калифорния – 4–5 августа 1997 г. | ||||
Л2/98-027 | N1670 | Самолет, 14 символов для языковых тегов , 12 декабря 1997 г. | |||
Л2/98-039 | Алипранд, Джоан; Винклер, Арнольд (24 февраля 1998 г.), «2.C ПЕРЕСМОТРЕННЫЕ ПРЕДЛОЖЕНИЯ», предварительные протоколы - UTC № 74 и L2 № 171, Маунтин-Вью, Калифорния - 5 декабря 1997 г. | ||||
Л2/98-286 | N1703 | Умамахесваран, В.С.; Ксар, Майк (2 июля 1998 г.), «7.4», неподтвержденный протокол заседания, заседание WG 2 № 34, Редмонд, Вашингтон, США; 1998-03-16--20 | |||
Л2/98-281Р (pdf , html ) | Алипранд, Джоан (31 июля 1998 г.), «Проблемы IETF и W3C (VI)», неподтвержденный протокол - UTC № 77 и подгруппа NCITS L2 № 174, СОВМЕСТНОЕ СОБРАНИЕ, Редмонд, Вашингтон, 29–31 июля 1998 г. | ||||
Л2/00-010 | N2103 | Умамахесваран, В.С. (05 января 2000 г.), «9.1», протокол заседания 37 РГ 2, Копенгаген, Дания: 13 сентября 1999 г. | |||
Л2/01-301 | Уистлер, Кен (01 августа 2001 г.), «Символы тегов», Анализ устаревания символов в стандарте Unicode | ||||
Л2/02-166Р2 | Мур, Лиза (09 августа 2002 г.), «Устаревание персонажа», UTC № 91 минута | ||||
U + E0020..E007F | 96 | Л2/16-042 | Шрифты, Агустин; Пурнадер, Рузбе (26 января 2015 г.), Требуются разъяснения по поводу «полных данных эмодзи» и флагов эмодзи. | ||
Л2/15-145Р | Эдберг, Питер (07 мая 2015 г.), Предложение о дополнительных символах региональных индикаторов | ||||
Л2/15-107 | Мур, Лиза (12 мая 2015 г.), «E.1.3 Предложение по дополнительным символам региональных индикаторов», протокол UTC № 143. | ||||
Л2/15-190 | Эдберг, Питер (29 июня 2015 г.), PRI № 299. Предыстория: представление дополнительных типов флагов. | ||||
Л2/15-206 | Дэвис, Марк (25 июля 2015 г.), Срок действия флагов для региона / подразделения | ||||
Л2/16-180Р | Бердж, Джереми ; Уильямс, Оуэн (07 июля 2016 г.), Предложение включить флаги-эмодзи для Англии, Шотландии и Уэльса. | ||||
Л2/17-016 | Мур, Лиза (08 февраля 2017 г.), «Пункт действия 150-A59», UTC № 150 минут . Добавьте три последовательности для флагов, задокументированных в L2/16-180R, в emoji-sequences.txt для emoji 5.0. | ||||
Л2/17-048 | Пурнадер, Рузбе (24 января 2017 г.), Отзыв о PRI 343 (Unicode Emoji 5.0) | ||||
Л2/17-086 | Бердж, Джереми; и др. (27 марта 2017 г.), Добавьте ZWJ, VS-16, колпачки клавиш и теги в Emoji_Component | ||||
Л2/17-103 | Мур, Лиза (18 мая 2017 г.), «E.1.7 Добавьте ZWJ, VS-16, колпачки клавиш и теги в Emoji_Component», UTC № 151 минута | ||||
|
Ссылки [ править ]
- ^ «База данных символов Юникода» . Стандарт Юникод . Проверено 26 июля 2023 г.
- ^ «Перечисленные версии стандарта Unicode» . Стандарт Юникод . Проверено 26 июля 2023 г.
- ^ Уистлер, К.; Адамс, Г. (январь 1999 г.). «RFC2482: Языковые теги в обычном тексте Unicode» . Сетевая рабочая группа. дои : 10.17487/RFC2482 .
{{cite journal}}
: Для цитирования журнала требуется|journal=
( помощь ) - ^ Уистлер, К.; Адамс, Г.; Дюрст, М.; Кленсин Дж.; Кленсин, Дж. (ноябрь 2010 г.). Пресун, Р. (ред.). «RFC6082: Устаревшие символы языковых тегов Юникода: RFC 2482 является историческим» . Целевая группа инженеров Интернета (IETF). дои : 10.17487/RFC6082 .
{{cite journal}}
: Для цитирования журнала требуется|journal=
( помощь ) - ^ Перейти обратно: а б «Юникод 8.0.0, последствия миграции» . Консорциум Юникод.
- ^ «Список эмодзи версии 5.0» . Эмохипедия . Проверено 24 июля 2021 г.
- ^ Перейти обратно: а б «UTR № 51: эмодзи Юникода» . Консорциум Юникод. 18 мая 2017 г.
- ^ "emoji-sequences.txt" . Консорциум Юникод . 05.06.2023 . Проверено 5 марта 2019 г.