блок Юникода

Из Википедии, бесплатной энциклопедии

Блок Unicode — это один из нескольких смежных диапазонов числовых кодов символов ( кодовых точек ) набора символов Unicode , определенных Консорциумом Unicode для административных целей и целей документации. Обычно такие предложения, как добавление новых глифов, обсуждаются и оцениваются с учетом соответствующего блока или блоков в целом.

Каждый блок обычно, но не всегда, предназначен для предоставления глифов, используемых в одном или нескольких конкретных языках или в какой-то общей области применения, такой как математика , геодезия , декоративный набор текста , социальные форумы и т. д.

Проектирование и реализация [ править ]

Блоки Юникода идентифицируются уникальными именами, которые используют только символы ASCII и обычно описывают природу символов на английском языке ; например «Тибетский» или «Дополнительные стрелки-А». (При сравнении имен блоков предполагается приравнивать прописные и строчные буквы и игнорировать любые пробелы, дефисы и подчеркивания; поэтому фамилия эквивалентна «supplemental_arrows__a» и «SUPPLEMENTALARROWSA». [1]

Блоки попарно непересекающиеся ; то есть они не перекрываются. Начальная кодовая точка и размер (количество кодовых точек) каждого блока всегда кратны 16; следовательно, в шестнадцатеричной записи начальная (самая маленькая) точка — это U+ xxx 0, а конечная (самая большая) точка — это U+ yyy F, где xxx и yyy — три или более шестнадцатеричных цифр. (Эти ограничения предназначены для упрощения отображения глифов в документах Консорциума Unicode в виде таблиц с 16 строками, помеченными последней шестнадцатеричной цифрой кодовой точки. [1] ) Размер блока может варьироваться от минимум 16 до максимум 65 536 кодовых точек.

Каждая назначенная кодовая точка имеет свойство глифа под названием «Блок», значение которого представляет собой строку символов, обозначающую уникальный блок, которому принадлежит эта точка. [2] Однако блок также может содержать неназначенные кодовые точки, обычно зарезервированные для будущих добавлений символов, которые «логически» должны принадлежать этому блоку. Кодовые точки, не принадлежащие ни одному из поименованных блоков, например, в неназначенных плоскостях 4–13, имеют значение block="No_Block". [1]

Простая принадлежность к определенному блоку Юникода не гарантирует определенных свойств символов, которые он содержит или будет содержать. Идентичность любого символа определяется его свойствами, указанными в базе данных символов Юникода. Например, непрерывный диапазон из 32 несимвольных кодовых точек U+FDD0..U+FDEF не имеет ни одного общего свойства с другими символами в блоке Arab Presentation Forms-A , поэтому они определенно не являются символами арабского алфавита или «правыми буквами». несимволы слева» и назначаются там в качестве заполнителя этого блока, при условии, что было согласовано, что дальнейшие арабские символы совместимости не будут кодироваться. [3]

Другие классификации [ править ]

Каждая точка Unicode также имеет свойство под названием « Общая категория », которое пытается описать роль соответствующего символа в языках или приложениях, ради которых он был включен в систему. Примерами общих категорий являются «Lu» (означает заглавную букву), «Nd» (десятичная цифра), «Pi» (знак препинания в открытой кавычке) и «Mn» (знак без пробелов, т. е. диакритический знак для предшествующей категории). глиф). Это разделение полностью независимо от кодовых блоков: кодовые точки с данной общей категорией обычно охватывают множество блоков и не обязательно должны быть последовательными, даже внутри каждого блока. [4]

Каждая точка кода также имеет свойство сценария , указывающее, для какой системы письма она предназначена или предназначена ли она для нескольких систем письменности. Это также не зависит от блока.

В описаниях системы Unicode блок может быть разделен на более конкретные подгруппы, например, « Шахматные символы » в блоке «Разные символы » (не путать с отдельным блоком «Шахматные символы »). Эти подгруппы не являются «блоками» в техническом смысле, используемом консорциумом Unicode, и названы только для удобства пользователей.

Список блоков [ править ]

Юникод 15.1 определяет 328 блоков: [1]

  • 164 в плоскости 0, базовой многоязычной плоскости (в таблице ниже: § BMP )
  • 151 в плоскости 1, дополнительной многоязычной плоскости ( § SMP )
  • 7 в плоскости 2, дополнительной идеографической плоскости ( § SIP )
  • 2 в плоскости 3, третичной идеографической плоскости ( § TIP )
  • 2 в плоскости 14 (E в шестнадцатеричном формате ), Дополнительная плоскость специального назначения ( § SSP )
  • По одному в плоскостях 15 (F hex ) и 16 (10 hex ), называемых дополнительной зоной частного использования-A и -B ( § PUA-A ).
Самолет Диапазон блоков Имя блока Кодовые точки [а] Назначенные персонажи Скрипты [б] [с] [д] [Это] [ф]
 0 БМП U+0000..U+007F Базовая латынь [г] 128 128 Латиница (52 символа), Общий (76 символов)
0 БМП U + 0080.. U + 00FF Дополнение Latin-1 [час] 128 128 Латиница (64 символа), Общий (64 символа)
0 БМП U+0100..U+017F Латинский расширенный-A 128 128 латинский
0 БМП U+0180..U+024F Латинский расширенный-B 208 208 латинский
0 БМП U + 0250.. U + 02AF Расширения IPA 96 96 латинский
0 БМП U + 02B0.. U + 02FF Буквы-модификаторы интервала 80 80 Бопомофо (2 символа), Латиница (14 символов), Общий (64 символа)
0 БМП U + 0300.. U + 036F Объединение диакритических знаков 112 112 Унаследовано
0 БМП U + 0370.. U + 03FF греческий и коптский 144 135 Коптский (14 символов), Греческий (117 символов), Общий (4 символа)
0 БМП U+0400..U+04FF Кириллица 256 256 Кириллица (254 символа), Наследственная (2 символа)
0 БМП U+0500..U+052F Кириллическое дополнение 48 48 Кириллица
0 БМП U + 0530.. U + 058F Армянский 96 91 Армянский
0 БМП U + 0590.. U + 05FF иврит 112 88 иврит
0 БМП U + 0600.. U + 06FF арабский 256 256 Арабский (238 символов), Общий (6 символов), Наследственный (12 символов)
0 БМП U+0700..U+074F сирийский 80 77 сирийский
0 БМП U+0750..U+077F арабское дополнение 48 48 арабский
0 БМП U+0780..U+07BF Тана 64 50 Тана
0 БМП U + 07C0.. U + 07FF Мое имя 64 62 Н'Ко
0 БМП U+0800..U+083F Самаритянин 64 61 Самаритянин
0 БМП U + 0840.. U + 085F мандайский 32 29 мандайский
0 БМП U+0860..U+086F Сирийское дополнение 16 11 сирийский
0 БМП U+0870..U+089F Арабский расширенный-B 48 41 арабский
0 БМП U + 08A0.. U + 08FF Арабский расширенный-A 96 96 Арабский (95 символов), Общий (1 символ)
0 БМП U+0900..U+097F Деванагари 128 128 Деванагари (122 символа), Обычный (2 символа), Наследственный (4 символа)
0 БМП U + 0980.. U + 09FF Бенгальский 128 96 Бенгальский
0 БМП U+0A00..U+0A7F Гурмухи 128 80 Гурмухи
0 БМП U+0A80..U+0AFF Гуджарати 128 91 Гуджарати
0 БМП U+0B00..U+0B7F Ория 128 91 Ория
0 БМП U+0B80..U+0BFF тамильский 128 72 тамильский
0 БМП U+0C00..U+0C7F телугу 128 100 телугу
0 БМП U+0C80..U+0CFF Каннада 128 91 Каннада
0 БМП U+0D00..U+0D7F малаялам 128 118 малаялам
0 БМП U+0D80..U+0DFF сингальский 128 91 сингальский
0 БМП U+0E00..U+0E7F тайский 128 87 Тайский (86 символов), Общий (1 символ)
0 БМП U+0E80..U+0EFF туберкулез 128 83 туберкулез
0 БМП U+0F00..U+0FFF тибетский 256 211 Тибетский (207 символов), Общий (4 символа)
0 БМП U+1000..U+109F Мьянма 160 160 Мьянма
0 БМП U+10A0..U+10FF грузинский 96 88 Грузинский (87 символов), Общий (1 символ)
0 БМП U+1100..U+11FF Хангыль Джамо 256 256 хангыль
0 БМП U+1200..U+137F Эфиопский 384 358 Эфиопский
0 БМП U+1380..U+139F Эфиопское дополнение 32 26 Эфиопский
0 БМП U+13A0..U+13FF Чероки 96 92 Чероки
0 БМП U+1400..U+167F Единая слоговая система канадских аборигенов 640 640 Канадский абориген
0 БМП U+1680..U+169F Огам 32 29 Огам
0 БМП U+16A0..U+16FF Рунический 96 89 Рунический (86 символов), Общий (3 символа)
0 БМП U+1700..U+171F Тагальский 32 23 Тагальский
0 БМП U+1720..U+173F Хануноо 32 23 Хануно (21 символ), Общий (2 символа)
0 БМП U+1740..U+175F Бухид 32 20 Бухид
0 БМП U+1760..U+177F Тагбанва 32 18 Тагбанва
0 БМП U+1780..U+17FF кхмерский 128 114 кхмерский
0 БМП U+1800..U+18AF Монгольский 176 158 Монгольский (155 символов), Общий (3 символа)
0 БМП U+18B0..U+18FF Расширение единого слогового письма канадских аборигенов 80 70 Канадский абориген
0 БМП U+1900..U+194F Лимбо 80 68 Лимбо
0 БМП U+1950..U+197F Ударь 48 35 Ударь
0 БМП U+1980..U+19DF Новое или прочитанное 96 83 Новое или прочитанное
0 БМП U+19E0..U+19FF Кхмерские символы 32 32 кхмерский
0 БМП U+1A00..U+1A1F Бугийский 32 30 Бугийский
0 БМП U+1A20..U+1AAF Тай Там 144 127 Тай Там
0 БМП U+1AB0..U+1AFF Расширенное объединение диакритических знаков 80 31 Унаследовано
0 БМП U+1B00..U+1B7F Балийский 128 124 Балийский
0 БМП U+1B80..U+1BBF суданский 64 64 суданский
0 БМП U+1BC0..U+1BFF Батак 64 56 Батак
0 БМП U+1C00..U+1C4F Лепча 80 74 Лепча
0 БМП U+1C50..U+1C7F Ol Chiki 48 48 Ol Chiki
0 БМП U+1C80..U+1C8F Расширенная кириллица-C 16 9 Кириллица
0 БМП U+1C90..U+1CBF Грузинский расширенный 48 46 грузинский
0 БМП U+1CC0..U+1CCF Суданская добавка 16 8 суданский
0 БМП U+1CD0..U+1CFF Ведические расширения 48 43 Общий (16 символов), Наследственный (27 символов)
0 БМП U+1D00..U+1D7F Фонетические расширения 128 128 Кириллица (2 символа), греческий (15 символов), латиница (111 символов)
0 БМП U+1D80..U+1DBF Дополнение к фонетическим расширениям 64 64 Греческий (1 символ), Латинский (63 символа)
0 БМП U+1DC0..U+1DFF Дополнение к объединению диакритических знаков 64 64 Унаследовано
0 БМП U+1E00..U+1EFF Латинский расширенный дополнительный 256 256 латинский
0 БМП U+1F00..U+1FFF Греческий расширенный 256 233 Греческий
0 БМП U+2000..U+206F Общая пунктуация 112 111 Общий (109 символов), Наследственный (2 символа)
0 БМП U+2070..U+209F Верхние и нижние индексы 48 42 Латиница (15 символов), Общий (27 символов)
0 БМП U+20A0..U+20CF Символы валют 48 33 Общий
0 БМП U+20D0..U+20FF Объединение диакритических знаков для символов 48 33 Унаследовано
0 БМП U+2100..U+214F Буквальные символы 80 80 Греческий (1 символ), Латинский (4 символа), Общий (75 символов)
0 БМП U+2150..U+218F Числовые формы 64 60 Латиница (41 символ), Общий (19 символов)
0 БМП U+2190..U+21FF Стрелки 112 112 Общий
0 БМП U+2200..U+22FF Математические операторы 256 256 Общий
0 БМП U+2300..U+23FF Разное техническое 256 256 Общий
0 БМП U+2400..U+243F Контрольные изображения 64 39 Общий
0 БМП U+2440..U+245F Оптическое распознавание символов 32 11 Общий
0 БМП U+2460..U+24FF Закрытые буквы и цифры 160 160 Общий
0 БМП U+2500..U+257F Рисунок коробки 128 128 Общий
0 БМП U+2580..U+259F Блочные элементы 32 32 Общий
0 БМП U+25A0..U+25FF Геометрические фигуры 96 96 Общий
0 БМП U+2600..U+26FF Разные символы 256 256 Общий
0 БМП U+2700..U+27BF Дингбаты 192 192 Общий
0 БМП U+27C0..U+27EF Разные математические символы-A 48 48 Общий
0 БМП U+27F0..U+27FF Дополнительные стрелки-А 16 16 Общий
0 БМП U+2800..U+28FF Узоры Брайля 256 256 Брайль
0 БМП U+2900..U+297F Дополнительные стрелки-B 128 128 Общий
0 БМП U+2980..U+29FF Разные математические символы-B 128 128 Общий
0 БМП U+2A00..U+2AFF Дополнительные математические операторы 256 256 Общий
0 БМП U+2B00..U+2BFF Разные символы и стрелки 256 253 Общий
0 БМП U+2C00..U+2C5F глаголица 96 96 глаголица
0 БМП U+2C60..U+2C7F Латинский расширенный-C 32 32 латинский
0 БМП U+2C80..U+2CFF коптский 128 123 коптский
0 БМП U+2D00..U+2D2F Грузинская добавка 48 40 грузинский
0 БМП U+2D30..U+2D7F Тифинаг 80 59 Тифинаг
0 БМП U+2D80..U+2DDF Эфиопский расширенный 96 79 Эфиопский
0 БМП U+2DE0..U+2DFF Расширенная кириллица-A 32 32 Кириллица
0 БМП U+2E00..U+2E7F Дополнительная пунктуация 128 94 Общий
0 БМП U+2E80..U+2EFF CJK Радикалы Добавка 128 115 Он
0 БМП U+2F00..U+2FDF Канси Радикалы 224 214 Он
0 БМП U+2FF0..U+2FFF Идеографическое описание персонажей 16 16 Общий
0 БМП U+3000..U+303F Символы и пунктуация CJK 64 64 Хан (15 символов), Хангыль (2 символа), Обычный (43 символа), Наследственный (4 символа)
0 БМП U+3040..U+309F Хирагана 96 93 Хирагана (89 символов), Обычный (2 символа), Наследственный (2 символа)
0 БМП U+30A0..U+30FF Катакана 96 96 Катакана (93 символа), Общая (3 символа)
0 БМП U+3100..U+312F Бопомофо 48 43 Бопомофо
0 БМП U+3130..U+318F Совместимость с хангылем Джамо 96 94 хангыль
0 БМП U+3190..U+319F Канбун 16 16 Общий
0 БМП U+31A0..U+31BF Бопомофо расширенный 32 32 Бопомофо
0 БМП U+31C0..U+31EF CJK Удары 48 37 Общий
0 БМП U+31F0..U+31FF Фонетические расширения катаканы 16 16 Катакана
0 БМП U+3200..U+32FF Прилагаемые письма и месяцы CJK 256 255 Хангыль (62 символа), Катакана (47 символов), Общий (146 символов).
0 БМП U+3300..U+33FF Совместимость с CJK 256 256 Катакана (88 символов), Общая (168 символов)
0 БМП U+3400..U+4DBF Расширение A унифицированных идеографов CJK 6,592 6,592 Он
0 БМП U+4DC0..U+4DFF Символы гексаграммы Ицзин 64 64 Общий
0 БМП U+4E00..U+9FFF Единые иероглифы CJK 20,992 20,992 Он
0 БМП U+A000..U+A48F Слоги И 1,168 1,165 Делать
0 БМП U+A490..U+A4CF Йи Радикалы 64 55 Делать
0 БМП U+A4D0..U+A4FF Гладкий 48 48 Гладкий
0 БМП U+A500..U+A63F Или 320 300 Или
0 БМП U+A640..U+A69F Расширенная кириллица-B 96 96 Кириллица
0 БМП U+A6A0..U+A6FF Бам 96 88 Бам
0 БМП U+A700..U+A71F Буквы тона модификатора 32 32 Общий
0 БМП U+A720..U+A7FF Латинский расширенный-D 224 193 Латиница (188 символов), Общий (5 символов)
0 БМП U+A800..U+A82F Силоти Нагри 48 45 Силоти Нагри
0 БМП U+A830..U+A83F Общие формы индикационных чисел 16 10 Общий
0 БМП U+A840..U+A87F Фагс-па 64 56 Фагс Па
0 БМП U+A880..U+A8DF Саураштра 96 82 Саураштра
0 БМП U+A8E0..U+A8FF Деванагари расширенный 32 32 Деванагари
0 БМП U+A900..U+A92F Кая Ли 48 48 Кая Ли (47 символов), Общий (1 символ)
0 БМП U+A930..U+A95F Реджанг 48 37 Реджанг
0 БМП U+A960..U+A97F Хангыль Джамо Расширенный-А 32 29 хангыль
0 БМП U+A980..U+A9DF яванский 96 91 Яванский (90 символов), Общий (1 символ)
0 БМП U+A9E0..U+A9FF Мьянма Расширенный-B 32 31 Мьянма
0 БМП U+AA00..U+AA5F Чам 96 83 Чам
0 БМП U+AA60..U+AA7F Мьянма Расширенный-A 32 32 Мьянма
0 БМП U+AA80..U+AADF Тай Вьет 96 72 Тай Вьет
0 БМП U+AAE0..U+AAFF Расширения встречи Meek 32 23 Знакомьтесь Майек
0 БМП U+AB00..U+AB2F Эфиопский расширенный-А 48 32 Эфиопский
0 БМП U+AB30..U+AB6F Латинский расширенный-E 64 60 Латинский (56 символов), греческий (1 символ), общий (3 символа).
0 БМП U+AB70..U+ABBF Дополнение чероки 80 80 Чероки
0 БМП U+ABC0..U+ABFF Знакомьтесь Майек 64 56 Знакомьтесь Майек
0 БМП U+AC00..U+D7AF Слоги хангыля 11,184 11,172 хангыль
0 БМП U+D7B0..U+D7FF Хангыль Джамо Расширенный-B 80 72 хангыль
0 БМП U+D800..U+DB7F Высокие суррогаты 896 0 Неизвестный
0 БМП U+DB80..U+DBFF Суррогаты с высоким уровнем частного использования 128 0 Неизвестный
0 БМП U+DC00..U+DFFF Низкие суррогаты 1,024 0 Неизвестный
0 БМП U+E000..U+F8FF Зона частного использования 6,400 6,400 Неизвестный
0 БМП U+F900..U+FAFF Иероглифы совместимости CJK 512 472 Он
0 БМП U+FB00..U+FB4F Алфавитные формы представления 80 58 Армянский (5 символов), Иврит (46 символов), Латынь (7 символов)
0 БМП U+FB50..U+FDFF Формы презентации на арабском языке-A 688 631 Арабский (629 символов), Общий (2 символа)
0 БМП U+FE00..U+FE0F Селекторы вариантов 16 16 Унаследовано
0 БМП U+FE10..U+FE1F Вертикальные формы 16 10 Общий
0 БМП U+FE20..U+FE2F Объединение половинных оценок 16 16 Кириллица (2 символа), Наследственная (14 символов)
0 БМП U+FE30..U+FE4F Формы совместимости CJK 32 32 Общий
0 БМП U+FE50..U+FE6F Варианты малых форм 32 26 Общий
0 БМП U+FE70..U+FEFF Формы презентации на арабском языке-B 144 141 Арабский (140 символов), Общий (1 символ)
0 БМП U+FF00..U+FFEF Формы половинной и полной ширины 240 225 Хангыль (52 символа), Катакана (55 символов), Латынь (52 символа), Общий (66 символов)
0 БМП U+FFF0..U+FFFF Специальные предложения 16 5 Общий
 1 средняя школа U+10000..U+1007F Слоговое письмо линейного письма B 128 88 Линейное письмо Б
1 средняя школа U+10080..U+100FF Идеограммы линейного письма B 128 123 Линейное письмо Б
1 средняя школа U+10100..U+1013F Эгейские числа 64 57 Общий
1 средняя школа U+10140..U+1018F Древнегреческие числа 80 79 Греческий
1 средняя школа U+10190..U+101CF Древние символы 64 14 Греческий (1 символ), Общий (13 символов)
1 средняя школа U+101D0..U+101FF Фестский диск 48 46 Общий (45 символов), Наследственный (1 символ)
1 средняя школа U+10280..U+1029F Ликийский 32 29 Ликийский
1 средняя школа U + 102A0.. U + 102DF Поиск 64 49 Поиск
1 средняя школа U+102E0..U+102FF Номера коптского договора 32 28 Общий (27 символов), Наследственный (1 символ)
1 средняя школа U+10300..U+1032F Старый курсив 48 39 Старый курсив
1 средняя школа U+10330..U+1034F Готика 32 27 Готика
1 средняя школа U+10350..U+1037F Старый Пермик 48 43 Старый Пермик
1 средняя школа U+10380..U+1039F Угаритовый 32 31 Угаритовый
1 средняя школа U + 103A0.. U + 103DF Старый персидский 64 50 Старый персидский
1 средняя школа U+10400..U+1044F Дезерет 80 80 Дезерет
1 средняя школа U+10450..U+1047F Шавиан 48 48 Шавиан
1 средняя школа U + 10480.. U + 104AF Османия 48 40 Османия
1 средняя школа U+104B0..U+104FF Осейдж 80 72 Осейдж
1 средняя школа U+10500..U+1052F Эльбасан 48 40 Эльбасан
1 средняя школа U+10530..U+1056F Кавказский албанец 64 53 Кавказский албанец
1 средняя школа U+10570..U+105BF Виткук 80 70 Виткук
1 средняя школа U+10600..U+1077F Линейное письмо А 384 341 Линейное письмо А
1 средняя школа U+10780..U+107BF Латинский расширенный-F 64 57 латинский
1 средняя школа U+10800..U+1083F Кипрское слоговое письмо 64 55 Киприот
1 средняя школа U+10840..U+1085F Имперский арамейский 32 31 Имперский арамейский
1 средняя школа U+10860..U+1087F Пальмирена 32 32 Пальмирена
1 средняя школа U+10880..U+108AF Набатейский 48 40 Набатейский
1 средняя школа U+108E0..U+108FF Хатран 32 26 Хатран
1 средняя школа U+10900..U+1091F финикийский 32 29 финикийский
1 средняя школа U+10920..U+1093F лидийский 32 27 лидийский
1 средняя школа U+10980..U+1099F Мероитские иероглифы 32 32 Мероитские иероглифы
1 средняя школа U+109A0..U+109FF Мероитский курсив 96 90 Мероитский курсив
1 средняя школа U+10A00..U+10A5F Харости 96 68 Харости
1 средняя школа U+10A60..U+10A7F Старый южноаравийский 32 32 Старый южноаравийский
1 средняя школа U + 10A80.. U + 10A9F Старый Североаравийский 32 32 Старый Североаравийский
1 средняя школа U+10AC0..U+10AFF манихейский 64 51 манихейский
1 средняя школа U+10B00..U+10B3F Авестийский 64 61 Авестийский
1 средняя школа U+10B40..U+10B5F Надписной парфянский 32 30 Надписной парфянский
1 средняя школа U+10B60..U+10B7F Надпись Пехлеви 32 27 Надпись Пехлеви
1 средняя школа U+10B80..U+10BAF Псалтирь Пехлеви 48 29 Псалтирь Пехлеви
1 средняя школа U+10C00..U+10C4F Древнетюркский 80 73 Древнетюркский
1 средняя школа U+10C80..U+10CFF Старый венгерский 128 108 Старый венгерский
1 средняя школа U+10D00..U+10D3F Ханифи Рохинджа 64 50 Ханифи Рохинджа
1 средняя школа U+10E60..U+10E7F Цифровые символы Руми 32 31 арабский
1 средняя школа U+10E80..U+10EBF езид 64 47 езид
1 средняя школа U+10EC0..U+10EFF Арабский расширенный-C 64 3 арабский
1 средняя школа U+10F00..U+10F2F Старый Согдийский 48 40 Старый Согдийский
1 средняя школа U+10F30..U+10F6F согдийский 64 42 согдийский
1 средняя школа U+10F70..U+10FAF Старый уйгур 64 26 Старый уйгур
1 средняя школа U+10FB0..U+10FDF Хорезмический 48 28 Хорезмический
1 средняя школа U+10FE0..U+10FFF Элимейский 32 23 Элимейский
1 средняя школа U+11000..U+1107F Брахми 128 115 Брахми
1 средняя школа U+11080..U+110CF Кайти 80 68 Кайти
1 средняя школа U+110D0..U+110FF Сора Сомпенг 48 35 Сора Сомпенг
1 средняя школа U+11100..U+1114F Чакма 80 71 Чакма
1 средняя школа U+11150..U+1117F Махаджани 48 39 Махаджани
1 средняя школа U+11180..U+111DF Шарада 96 96 Шарада
1 средняя школа U+111E0..U+111FF Сингальские архаичные цифры 32 20 сингальский
1 средняя школа U+11200..U+1124F Хойки 80 65 Хойки
1 средняя школа U + 11280.. U + 112AF Оружие 48 38 Оружие
1 средняя школа U+112B0..U+112FF Худавади 80 69 Худавади
1 средняя школа U+11300..U+1137F Грантха 128 86 Грантха (85 символов), Наследство (1 символ)
1 средняя школа U+11400..U+1147F Ньюа 128 97 Ньюа
1 средняя школа U+11480..U+114DF Тирхута 96 82 Тирхута
1 средняя школа U+11580..U+115FF Сиддхам 128 92 Сиддхам
1 средняя школа U+11600..U+1165F Моди 96 79 Моди
1 средняя школа U+11660..U+1167F Монгольское дополнение 32 13 Монгольский
1 средняя школа U+11680..U+116CF Такри 80 68 Такри
1 средняя школа U+11700..U+1174F Ахом 80 65 Ахом
1 средняя школа U+11800..U+1184F Догра 80 60 Догра
1 средняя школа U+118A0..U+118FF Тысяча Сити 96 84 Тысяча Сити
1 средняя школа U+11900..U+1195F Погружения в Акуру 96 72 Погружения в Акуру
1 средняя школа U+119A0..U+119FF Нандинагари 96 65 Нандинагари
1 средняя школа U + 11A00.. U + 11A4F Площадь Занабазара 80 72 Площадь Занабазара
1 средняя школа U + 11A50.. U + 11AAF Сойомбо 96 83 Сойомбо
1 средняя школа U+11AB0..U+11ABF Унифицированное слоговое письмо канадских аборигенов, расширенное-A 16 16 Канадский абориген
1 средняя школа U+11AC0..U+11AFF Пау Син Хау 64 57 Пау Син Хау
1 средняя школа U+11B00..U+11B5F Деванагари Расширенный-А 96 10 Деванагари
1 средняя школа U + 11C00.. U + 11C6F Бхайксуки 112 97 Бхайксуки
1 средняя школа U+11C70..U+11CBF Марш 80 68 Марш
1 средняя школа U+11D00..U+11D5F Масарам Гонди 96 75 Масарам Гонди
1 средняя школа U+11D60..U+11DAF Гунджала Гонди 80 63 Гунджала Гонди
1 средняя школа U+11EE0..U+11EFF Макассар 32 25 Макассар
1 средняя школа U+11F00..U+11F5F Кави 96 86 Кави
1 средняя школа U+11FB0..U+11FBF Дополнение Лису 16 1 Гладкий
1 средняя школа U+11FC0..U+11FFF Тамильское дополнение 64 51 тамильский
1 средняя школа U+12000..U+123FF клинопись 1,024 922 клинопись
1 средняя школа U+12400..U+1247F Клинописные цифры и пунктуация 128 116 клинопись
1 средняя школа U+12480..U+1254F Ранняя династическая клинопись 208 196 клинопись
1 средняя школа U+12F90..U+12FFF Кипро-минойский 112 99 Кипро-минойский
1 средняя школа U+13000..U+1342F Египетские иероглифы 1,072 1,072 Египетские иероглифы
1 средняя школа U+13430..U+1345F Элементы управления форматом египетских иероглифов 48 38 Египетские иероглифы
1 средняя школа U+14400..U+1467F Анатолийские иероглифы 640 583 Анатолийские иероглифы
1 средняя школа U+16800..U+16A3F Бамум Добавка 576 569 Бам
1 средняя школа U+16A40..U+16A6F Мро 48 43 Мро
1 средняя школа U+16A70..U+16ACF нация 96 89 нация
1 средняя школа U+16AD0..U+16AFF Бас Вах 48 36 Бас Вах
1 средняя школа U+16B00..U+16B8F Пахау Хмонг 144 127 Пахау Хмонг
1 средняя школа U+16E40..U+16E9F Медефаидрин 96 91 Медефаидрин
1 средняя школа U+16F00..U+16F9F Мяо 160 149 Мяо
1 средняя школа U+16FE0..U+16FFF Идеографические символы и пунктуация 32 7 Хань (4 символа), Киданьская малая письменность (1 символ), Нушу (1 символ), Тангут (1 символ)
1 средняя школа U+17000..U+187FF Тангутский 6,144 6,136 Тангутский
1 средняя школа U+18800..U+18AFF Тангутские компоненты 768 768 Тангутский
1 средняя школа U+18B00..U+18CFF Киданьское маленькое письмо 512 470 Киданьское маленькое письмо
1 средняя школа U+18D00..U+18D7F Тангутская добавка 128 9 Тангутский
1 средняя школа U+1AFF0..U+1AFFF Или расширенный-B 16 13 Катакана
1 средняя школа U+1B000..U+1B0FF Кана Дополнение 256 256 Хирагана (255 символов), Катакана (1 символ)
1 средняя школа U+1B100..U+1B12F Кана Расширенный-А 48 35 Хирагана (32 символа), Катакана (3 символа)
1 средняя школа U+1B130..U+1B16F Маленькое расширение Кана 64 9 Хирагана (4 символа), Катакана (5 символов)
1 средняя школа U+1B170..U+1B2FF Нушу 400 396 Нюшу
1 средняя школа U+1BC00..U+1BC9F Дуплоян 160 143 Дуплоян
1 средняя школа U+1BCA0..U+1BCAF Элементы управления сокращенным форматом 16 4 Общий
1 средняя школа U+1CF00..U+1CFCF Знаменная нотная грамота 208 185 Общий (116 символов), Наследственный (69 символов)
1 средняя школа U+1D000..U+1D0FF Византийские музыкальные символы 256 246 Общий
1 средняя школа U+1D100..U+1D1FF Музыкальные символы 256 233 Общий (211 символов), Наследственный (22 символа)
1 средняя школа U+1D200..U+1D24F Древнегреческая нотная грамота 80 70 Греческий
1 средняя школа U+1D2C0..U+1D2DF Кактовик Цифры 32 20 Общий
1 средняя школа U+1D2E0..U+1D2FF Цифры Майя 32 20 Общий
1 средняя школа U+1D300..U+1D35F Символы Тай Сюань Цзин 96 87 Общий
1 средняя школа U+1D360..U+1D37F Подсчет стержневых цифр 32 25 Общий
1 средняя школа U+1D400..U+1D7FF Математические буквенно-цифровые символы 1,024 996 Общий
1 средняя школа U+1D800..U+1DAAF Знак СаттонаНаписание 688 672 ВойтиНаписание
1 средняя школа U+1DF00..U+1DFFF Латинский расширенный-G 256 37 латинский
1 средняя школа U+1E000..U+1E02F Глаголица дополнение 48 38 глаголица
1 средняя школа U+1E030..U+1E08F Кириллица расширенная-D 96 63 Кириллица
1 средняя школа U+1E100..U+1E14F Ньиакенг Пуачуэ Хмонг 80 71 Ньиакенг Пуачуэ Хмонг
1 средняя школа U+1E290..U+1E2BF Этот 48 31 Этот
1 средняя школа U+1E2C0..U+1E2FF Ванчо 64 59 Ванчо
1 средняя школа U+1E4D0..U+1E4FF Наг Мундари 48 42 Мундари
1 средняя школа U+1E7E0..U+1E7FF Эфиопский расширенный-B 32 28 Эфиопский
1 средняя школа U+1E800..U+1E8DF Менде Кикакуи 224 213 Менде Кикакуи
1 средняя школа U+1E900..U+1E95F Отскок 96 88 Отскок
1 средняя школа U+1EC70..U+1ECBF Индийские числа Сияка 80 68 Общий
1 средняя школа U+1ED00..U+1ED4F Османские сиякские числа 80 61 Общий
1 средняя школа U+1EE00..U+1EEFF Арабские математические алфавитные символы 256 143 арабский
1 средняя школа U+1F000..U+1F02F Плитки Маджонга 48 44 Общий
1 средняя школа U + 1F030.. U + 1F09F Домино плитки 112 100 Общий
1 средняя школа U+1F0A0..U+1F0FF Игральные карты 96 82 Общий
1 средняя школа U+1F100..U+1F1FF Прилагаемое буквенно-цифровое дополнение 256 200 Общий
1 средняя школа U+1F200..U+1F2FF Прилагаемое идеографическое дополнение 256 64 Хирагана (1 символ), Общий (63 символа)
1 средняя школа U+1F300..U+1F5FF Разные символы и пиктограммы 768 768 Общий
1 средняя школа U+1F600..U+1F64F Смайлики 80 80 Общий
1 средняя школа U+1F650..U+1F67F Декоративные дингбаты 48 48 Общий
1 средняя школа U+1F680..U+1F6FF Символы транспорта и карты 128 118 Общий
1 средняя школа U+1F700..U+1F77F Алхимические символы 128 124 Общий
1 средняя школа U+1F780..U+1F7FF Расширенные геометрические фигуры 128 103 Общий
1 средняя школа U+1F800..U+1F8FF Дополнительные стрелки-C 256 150 Общий
1 средняя школа U+1F900..U+1F9FF Дополнительные символы и пиктограммы 256 256 Общий
1 средняя школа U+1FA00..U+1FA6F Шахматные символы 112 98 Общий
1 средняя школа U+1FA70..U+1FAFF Расширенные символы и пиктограммы-A 144 107 Общий
1 средняя школа U+1FB00..U+1FBFF Символы устаревших вычислений 256 212 Общий
 2 СИП U+20000..U+2A6DF Расширение B унифицированных иероглифов CJK 42,720 42,720 Он
2 СИП U+2A700..U+2B73F Расширение CJK для унифицированных идеографов C 4,160 4,154 Он
2 СИП U+2B740..U+2B81F Расширение D унифицированных иероглифов CJK 224 222 Он
2 СИП U+2B820..U+2CEAF Расширение E унифицированных иероглифов CJK 5,776 5,762 Он
2 СИП U+2CEB0..U+2EBEF Расширение унифицированных идеографов CJK F 7,488 7,473 Он
2 СИП U+2EBF0..U+2EE5F Расширение унифицированных идеографов CJK I 624 622 Он
2 СИП U+2F800..U+2FA1F Дополнение к идеограммам совместимости CJK 544 542 Он
 3 СОВЕТ U+30000..U+3134F Расширение унифицированных иероглифов CJK G 4,944 4,939 Он
3 СОВЕТ U + 31350.. U + 323AF Расширение унифицированных иероглифов CJK H 4,192 4,192 Он
14 ССП U+E0000..U+E007F Теги 128 97 Общий
14 ССП U+E0100..U+E01EF Дополнение к селекторам вариантов 240 240 Унаследовано
15 ЦВЕТОК-А U+F0000..U+FFFFF Дополнительная зона частного использования-А 65,536 65,534 Неизвестный
16 ПУА-Б U+100000..U+10FFFF Дополнительная зона частного использования-B 65,536 65,534 Неизвестный
  1. ^ Количество кодовых точек включает в себя неназначенные кодовые точки: несимвольные , зарезервированные и т. д.
  2. ^ Скрипт содержит один или несколько символов в блоке, как определено свойством Script. Это не зависит от имени блока
  3. ^ «Общий», «Неизвестный» (Zyyy) и «Наследованный» (Zinh или Qaai) относятся к сценариям в ISO 15924.
  4. ^ Файл данных блоков Unicode . Начиная с версии Юникод 15.1.
  5. ^ UAX 24: Свойство сценария Unicode (4-буквенный код)
  6. ^ UAX 24: Файл данных сценария.
  7. ^ называется «Элементы управления C0 и базовая латиница». В стандарте ISO/IEC 10646
  8. ^ называется «Элементы управления C1 и дополнение Latin-1». В стандарте ISO/IEC 10646

Перемещенные блоки [ править ]

Политика стабильности Unicode требует, чтобы назначенный символ нельзя было перемещать или удалять, хотя он может быть признан устаревшим. Это относится к Unicode 2.0 и всем последующим версиям.

До этого были перенесены следующие бывшие блоки:

Former Unicode blocks from before Unicode 2.0
Block range Historical
block name
Version when added Version when removed Range now occupied by Superseded by block Code points Assigned characters Scripts
U+1000..U+105F Tibetan[5] 1.0.0 1.0.1 Myanmar Tibetan 96 71 Tibetan
U+3400..U+3D2D Hangul[6] 1.0.0 2.0 CJK Unified Ideographs Extension A Hangul Syllables 2350 2350 Hangul
U+3D2E..U+44B7 Hangul Supplementary-A[6] 1.1 2.0 1930 1930
U+44B8..U+4DFF Hangul Supplementary-B[6] CJK Unified Ideographs Extension A and Yijing Hexagram Symbols 2376 2376

References[edit]

  1. ^ Jump up to: a b c d "Unicode Blocks data file, Unicode version 15.1". Unicode Consortium. Retrieved 2023-09-12.
  2. ^ "Glossary". www.unicode.org. Retrieved 2022-08-07.
  3. ^ "Private-Use Characters, Noncharacters & Sentinels FAQ". www.unicode.org. Retrieved 2023-07-24.
  4. ^ "Unicode Core Specification, Chapter 4: Character Properties" (PDF). Retrieved 2021-09-15.
  5. ^ "3.8: Block-by-Block Charts" (PDF). The Unicode Standard. Version 1.0. Unicode Consortium.
  6. ^ Jump up to: a b c "Appendix E: Block Names" (PDF). The Unicode Standard. Version 1.1. Unicode Consortium.

External links[edit]