блок Юникода
Блок Unicode — это один из нескольких смежных диапазонов числовых кодов символов ( кодовых точек ) набора символов Unicode , определенных Консорциумом Unicode для административных целей и целей документации. Обычно такие предложения, как добавление новых глифов, обсуждаются и оцениваются с учетом соответствующего блока или блоков в целом.
Каждый блок обычно, но не всегда, предназначен для предоставления глифов, используемых в одном или нескольких конкретных языках или в какой-то общей области применения, такой как математика , геодезия , декоративный набор , социальные форумы и т. д.
Проектирование и реализация [ править ]
Блоки Юникода идентифицируются уникальными именами, которые используют только символы ASCII и обычно описывают природу символов на английском языке ; например «Тибетский» или «Дополнительные стрелки-А». (При сравнении имен блоков предполагается приравнивать прописные и строчные буквы и игнорировать любые пробелы, дефисы и подчеркивания; поэтому фамилия эквивалентна «supplemental_arrows__a» и «SUPPLEMENTALARROWSA». [1]
Блоки попарно непересекающиеся ; то есть они не перекрываются. Начальная кодовая точка и размер (количество кодовых точек) каждого блока всегда кратны 16; следовательно, в шестнадцатеричной записи начальная (самая маленькая) точка — это U+ xxx 0, а конечная (самая большая) точка — это U+ yyy F, где xxx и yyy — три или более шестнадцатеричных цифр. (Эти ограничения предназначены для упрощения отображения глифов в документах Консорциума Unicode в виде таблиц с 16 строками, помеченными последней шестнадцатеричной цифрой кодовой точки. [1] ) Размер блока может варьироваться от минимум 16 до максимум 65 536 кодовых точек.
Каждая назначенная кодовая точка имеет свойство глифа под названием «Блок», значение которого представляет собой строку символов, обозначающую уникальный блок, которому принадлежит эта точка. [2] Однако блок может также содержать неназначенные кодовые точки, обычно зарезервированные для будущих добавлений символов, которые «логически» должны принадлежать этому блоку. Кодовые точки, не принадлежащие ни одному из поименованных блоков, например, в неназначенных плоскостях 4–13, имеют значение block="No_Block". [1]
Простая принадлежность к определенному блоку Юникода не гарантирует определенных свойств символов, которые он содержит или будет содержать. Идентичность любого символа определяется его свойствами, указанными в базе данных символов Юникода. Например, непрерывный диапазон из 32 несимвольных кодовых точек U+FDD0..U+FDEF не обладает ни одним из свойств, общих с другими символами в блоке Arab Presentation Forms-A , поэтому они определенно не являются символами арабского алфавита или «правыми буквами». несимволы слева» и назначаются там в качестве заполнителя этого блока, при условии, что было согласовано, что никакие дальнейшие арабские символы совместимости не будут кодироваться. [3]
Другие классификации [ править ]
Каждая точка Unicode также имеет свойство под названием « Общая категория », которое пытается описать роль соответствующего символа в языках или приложениях, ради которых он был включен в систему. Примерами общих категорий являются «Lu» (означает прописную букву), «Nd» (десятичная цифра), «Pi» (знаки препинания в открытой кавычке) и «Mn» (знак без пробелов, т. е. диакритический знак для предшествующей категории). глиф). Это разделение полностью независимо от кодовых блоков: кодовые точки с данной общей категорией обычно охватывают множество блоков и не обязательно должны быть последовательными, даже внутри каждого блока. [4]
Каждая точка кода также имеет свойство сценария , указывающее, для какой системы письма она предназначена или предназначена ли она для нескольких систем письменности. Это также не зависит от блока.
В описаниях системы Unicode блок может быть разделен на более конкретные подгруппы, например, « Шахматные символы » в блоке «Разные символы» (не путать с отдельным блоком «Шахматные символы» ). Эти подгруппы не являются «блоками» в техническом смысле, используемом консорциумом Unicode, и названы только для удобства пользователей.
Список блоков [ править ]
Юникод 15.1 определяет 328 блоков: [1]
- 164 в плоскости 0, базовой многоязычной плоскости (в таблице ниже: § BMP )
- 151 в плоскости 1, дополнительной многоязычной плоскости ( § SMP )
- 7 в плоскости 2, дополнительной идеографической плоскости ( § SIP )
- 2 в плоскости 3, третичной идеографической плоскости ( § TIP )
- 2 в плоскости 14 (E в шестнадцатеричном формате ), Дополнительная плоскость специального назначения ( § SSP )
- По одному в плоскостях 15 (F hex ) и 16 (10 hex ), называемых дополнительной зоной частного использования-A и -B ( § PUA-A ).
Самолет | Диапазон блоков | Имя блока | Кодовые точки [а] | Назначенные персонажи | Скрипты [б] [с] [д] [и] [ф] |
---|---|---|---|---|---|
0 БМП | U+0000..U+007F | Базовая латынь [г] | 128 | 128 | Латиница (52 символа), Общий (76 символов) |
0 БМП | U + 0080.. U + 00FF | Дополнение Latin-1 [час] | 128 | 128 | Латиница (64 символа), Общий (64 символа) |
0 БМП | U+0100..U+017F | Латинский расширенный-A | 128 | 128 | латинский |
0 БМП | U+0180..U+024F | Латинский расширенный-B | 208 | 208 | латинский |
0 БМП | U + 0250.. U + 02AF | Расширения IPA | 96 | 96 | латинский |
0 БМП | U + 02B0.. U + 02FF | Буквы-модификаторы интервала | 80 | 80 | Бопомофо (2 символа), Латиница (14 символов), Общий (64 символа) |
0 БМП | U + 0300.. U + 036F | Объединение диакритических знаков | 112 | 112 | Унаследовано |
0 БМП | U + 0370.. U + 03FF | греческий и коптский | 144 | 135 | Коптский (14 символов), Греческий (117 символов), Общий (4 символа) |
0 БМП | U + 0400.. U + 04FF | Кириллица | 256 | 256 | Кириллица (254 символа), Наследственная (2 символа) |
0 БМП | U+0500..U+052F | Кириллическое дополнение | 48 | 48 | Кириллица |
0 БМП | U + 0530.. U + 058F | Армянский | 96 | 91 | Армянский |
0 БМП | U + 0590.. U + 05FF | иврит | 112 | 88 | иврит |
0 БМП | U + 0600.. U + 06FF | арабский | 256 | 256 | Арабский (238 символов), Общий (6 символов), Наследственный (12 символов) |
0 БМП | U+0700..U+074F | сирийский | 80 | 77 | сирийский |
0 БМП | U+0750..U+077F | арабское дополнение | 48 | 48 | арабский |
0 БМП | U+0780..U+07BF | Тана | 64 | 50 | Тана |
0 БМП | U + 07C0.. U + 07FF | Мое имя | 64 | 62 | Н'Ко |
0 БМП | U+0800..U+083F | Самаритянин | 64 | 61 | Самаритянин |
0 БМП | U + 0840.. U + 085F | мандайский | 32 | 29 | мандайский |
0 БМП | U+0860..U+086F | Сирийское дополнение | 16 | 11 | сирийский |
0 БМП | U+0870..U+089F | Арабский расширенный-B | 48 | 41 | арабский |
0 БМП | U + 08A0.. U + 08FF | Арабский расширенный-A | 96 | 96 | Арабский (95 символов), Общий (1 символ) |
0 БМП | U+0900..U+097F | Деванагари | 128 | 128 | Деванагари (122 символа), Обычный (2 символа), Наследственный (4 символа) |
0 БМП | U + 0980.. U + 09FF | Бенгальский | 128 | 96 | Бенгальский |
0 БМП | U+0A00..U+0A7F | Гурмухи | 128 | 80 | Гурмухи |
0 БМП | U+0A80..U+0AFF | Гуджарати | 128 | 91 | Гуджарати |
0 БМП | U+0B00..U+0B7F | Ория | 128 | 91 | Ория |
0 БМП | U+0B80..U+0BFF | тамильский | 128 | 72 | тамильский |
0 БМП | U+0C00..U+0C7F | телугу | 128 | 100 | телугу |
0 БМП | U+0C80..U+0CFF | Каннада | 128 | 91 | Каннада |
0 БМП | U+0D00..U+0D7F | малаялам | 128 | 118 | малаялам |
0 БМП | U+0D80..U+0DFF | сингальский | 128 | 91 | сингальский |
0 БМП | U+0E00..U+0E7F | тайский | 128 | 87 | Тайский (86 символов), Общий (1 символ) |
0 БМП | U+0E80..U+0EFF | туберкулез | 128 | 83 | туберкулез |
0 БМП | U+0F00..U+0FFF | тибетский | 256 | 211 | Тибетский (207 символов), Общий (4 символа) |
0 БМП | U+1000..U+109F | Мьянма | 160 | 160 | Мьянма |
0 БМП | U+10A0..U+10FF | грузинский | 96 | 88 | Грузинский (87 символов), Общий (1 символ) |
0 БМП | U+1100..U+11FF | Хангыль Джамо | 256 | 256 | хангыль |
0 БМП | U+1200..U+137F | Эфиопский | 384 | 358 | Эфиопский |
0 БМП | U+1380..U+139F | Эфиопское дополнение | 32 | 26 | Эфиопский |
0 БМП | U+13A0..U+13FF | Чероки | 96 | 92 | Чероки |
0 БМП | U+1400..U+167F | Единая слоговая система канадских аборигенов | 640 | 640 | Канадский абориген |
0 БМП | U+1680..U+169F | Огам | 32 | 29 | Огам |
0 БМП | U+16A0..U+16FF | Рунический | 96 | 89 | Рунический (86 символов), Общий (3 символа) |
0 БМП | U+1700..U+171F | Тагальский | 32 | 23 | Тагальский |
0 БМП | U+1720..U+173F | Хануноо | 32 | 23 | Хануно (21 символ), Общий (2 символа) |
0 БМП | U+1740..U+175F | Бухид | 32 | 20 | Бухид |
0 БМП | U+1760..U+177F | Тагбанва | 32 | 18 | Тагбанва |
0 БМП | U+1780..U+17FF | кхмерский | 128 | 114 | кхмерский |
0 БМП | U+1800..U+18AF | Монгольский | 176 | 158 | Монгольский (155 символов), Общий (3 символа) |
0 БМП | U+18B0..U+18FF | Расширенное единое слоговое письмо канадских аборигенов | 80 | 70 | Канадский абориген |
0 БМП | U+1900..U+194F | Лимбо | 80 | 68 | Лимбо |
0 БМП | U+1950..U+197F | Хит | 48 | 35 | Хит |
0 БМП | U+1980..U+19DF | Новое или прочитанное | 96 | 83 | Новое или прочитанное |
0 БМП | U+19E0..U+19FF | Кхмерские символы | 32 | 32 | кхмерский |
0 БМП | U+1A00..U+1A1F | Бугийский | 32 | 30 | Бугийский |
0 БМП | U+1A20..U+1AAF | Тай Там | 144 | 127 | Тай Там |
0 БМП | U+1AB0..U+1AFF | Расширенное объединение диакритических знаков | 80 | 31 | Унаследовано |
0 БМП | U+1B00..U+1B7F | Балийский | 128 | 124 | Балийский |
0 БМП | U+1B80..U+1BBF | суданский | 64 | 64 | суданский |
0 БМП | U+1BC0..U+1BFF | Батак | 64 | 56 | Батак |
0 БМП | U+1C00..U+1C4F | Лепча | 80 | 74 | Лепча |
0 БМП | U+1C50..U+1C7F | Ol Chiki | 48 | 48 | Ol Chiki |
0 БМП | U+1C80..U+1C8F | Расширенная кириллица-C | 16 | 9 | Кириллица |
0 БМП | U+1C90..U+1CBF | Грузинский расширенный | 48 | 46 | грузинский |
0 БМП | U+1CC0..U+1CCF | Суданская добавка | 16 | 8 | суданский |
0 БМП | U+1CD0..U+1CFF | Ведические расширения | 48 | 43 | Общий (16 символов), Наследственный (27 символов) |
0 БМП | U+1D00..U+1D7F | Фонетические расширения | 128 | 128 | Кириллица (2 символа), греческий (15 символов), латиница (111 символов) |
0 БМП | U+1D80..U+1DBF | Дополнение к фонетическим расширениям | 64 | 64 | Греческий (1 символ), Латинский (63 символа) |
0 БМП | U+1DC0..U+1DFF | Дополнение к объединению диакритических знаков | 64 | 64 | Унаследовано |
0 БМП | U+1E00..U+1EFF | Латинский расширенный дополнительный | 256 | 256 | латинский |
0 БМП | U+1F00..U+1FFF | Греческий расширенный | 256 | 233 | Греческий |
0 БМП | U+2000..U+206F | Общая пунктуация | 112 | 111 | Общий (109 символов), Наследственный (2 символа) |
0 БМП | U+2070..U+209F | Верхние и нижние индексы | 48 | 42 | Латиница (15 символов), Общий (27 символов) |
0 БМП | U+20A0..U+20CF | Символы валют | 48 | 33 | Общий |
0 БМП | U+20D0..U+20FF | Объединение диакритических знаков для символов | 48 | 33 | Унаследовано |
0 БМП | U+2100..U+214F | Буквальные символы | 80 | 80 | Греческий (1 символ), Латинский (4 символа), Общий (75 символов) |
0 БМП | U+2150..U+218F | Числовые формы | 64 | 60 | Латиница (41 символ), Общий (19 символов) |
0 БМП | U+2190..U+21FF | Стрелки | 112 | 112 | Общий |
0 БМП | U+2200..U+22FF | Математические операторы | 256 | 256 | Общий |
0 БМП | U+2300..U+23FF | Разное техническое | 256 | 256 | Общий |
0 БМП | U+2400..U+243F | Контрольные изображения | 64 | 39 | Общий |
0 БМП | U+2440..U+245F | Оптическое распознавание символов | 32 | 11 | Общий |
0 БМП | U+2460..U+24FF | Закрытые буквы и цифры | 160 | 160 | Общий |
0 БМП | U+2500..U+257F | Рисунок коробки | 128 | 128 | Общий |
0 БМП | U+2580..U+259F | Блочные элементы | 32 | 32 | Общий |
0 БМП | U+25A0..U+25FF | Геометрические фигуры | 96 | 96 | Общий |
0 БМП | U+2600..U+26FF | Разные символы | 256 | 256 | Общий |
0 БМП | U+2700..U+27BF | Дингбаты | 192 | 192 | Общий |
0 БМП | U+27C0..U+27EF | Разные математические символы-A | 48 | 48 | Общий |
0 БМП | U+27F0..U+27FF | Дополнительные стрелки-А | 16 | 16 | Общий |
0 БМП | U+2800..U+28FF | Узоры Брайля | 256 | 256 | Брайль |
0 БМП | U+2900..U+297F | Дополнительные стрелки-B | 128 | 128 | Общий |
0 БМП | U+2980..U+29FF | Разные математические символы-B | 128 | 128 | Общий |
0 БМП | U+2A00..U+2AFF | Дополнительные математические операторы | 256 | 256 | Общий |
0 БМП | U+2B00..U+2BFF | Разные символы и стрелки | 256 | 253 | Общий |
0 БМП | U+2C00..U+2C5F | глаголица | 96 | 96 | глаголица |
0 БМП | U+2C60..U+2C7F | Латинский расширенный-C | 32 | 32 | латинский |
0 БМП | U+2C80..U+2CFF | коптский | 128 | 123 | коптский |
0 БМП | U+2D00..U+2D2F | Грузинская добавка | 48 | 40 | грузинский |
0 БМП | U+2D30..U+2D7F | Тифинаг | 80 | 59 | Тифинаг |
0 БМП | U+2D80..U+2DDF | Эфиопский расширенный | 96 | 79 | Эфиопский |
0 БМП | U+2DE0..U+2DFF | Расширенная кириллица-A | 32 | 32 | Кириллица |
0 БМП | U+2E00..U+2E7F | Дополнительная пунктуация | 128 | 94 | Общий |
0 БМП | U+2E80..U+2EFF | CJK Радикалы Добавка | 128 | 115 | Он |
0 БМП | U+2F00..U+2FDF | Канси Радикалы | 224 | 214 | Он |
0 БМП | U+2FF0..U+2FFF | Идеографическое описание персонажей | 16 | 16 | Общий |
0 БМП | U+3000..U+303F | Символы и пунктуация CJK | 64 | 64 | Хан (15 символов), Хангыль (2 символа), Обычный (43 символа), Наследственный (4 символа) |
0 БМП | U+3040..U+309F | Хирагана | 96 | 93 | Хирагана (89 символов), Обычный (2 символа), Наследственный (2 символа) |
0 БМП | U+30A0..U+30FF | Катакана | 96 | 96 | Катакана (93 символа), Общая (3 символа) |
0 БМП | U+3100..U+312F | Бопомофо | 48 | 43 | Бопомофо |
0 БМП | U+3130..U+318F | Совместимость с хангылем Джамо | 96 | 94 | хангыль |
0 БМП | U+3190..U+319F | Канбун | 16 | 16 | Общий |
0 БМП | U+31A0..U+31BF | Бопомофо расширенный | 32 | 32 | Бопомофо |
0 БМП | U+31C0..U+31EF | CJK Удары | 48 | 37 | Общий |
0 БМП | U+31F0..U+31FF | Фонетические расширения катаканы | 16 | 16 | Катакана |
0 БМП | U+3200..U+32FF | Прилагаемые письма и месяцы CJK | 256 | 255 | Хангыль (62 символа), Катакана (47 символов), Общий (146 символов). |
0 БМП | U+3300..U+33FF | Совместимость с CJK | 256 | 256 | Катакана (88 символов), Общая (168 символов) |
0 БМП | U+3400..U+4DBF | Расширение A унифицированных идеографов CJK | 6,592 | 6,592 | Он |
0 БМП | U+4DC0..U+4DFF | Символы гексаграммы Ицзин | 64 | 64 | Общий |
0 БМП | U+4E00..U+9FFF | Единые иероглифы CJK | 20,992 | 20,992 | Он |
0 БМП | U+A000..U+A48F | Слоги И | 1,168 | 1,165 | Делать |
0 БМП | U+A490..U+A4CF | Йи Радикалы | 64 | 55 | Делать |
0 БМП | U+A4D0..U+A4FF | Гладкий | 48 | 48 | Гладкий |
0 БМП | U+A500..U+A63F | Или | 320 | 300 | Или |
0 БМП | U+A640..U+A69F | Расширенная кириллица-B | 96 | 96 | Кириллица |
0 БМП | U+A6A0..U+A6FF | Бамум | 96 | 88 | Бамум |
0 БМП | U+A700..U+A71F | Буквы тона модификатора | 32 | 32 | Общий |
0 БМП | U+A720..U+A7FF | Латинский расширенный-D | 224 | 193 | Латиница (188 символов), Общий (5 символов) |
0 БМП | U+A800..U+A82F | Силоти Нагри | 48 | 45 | Силоти Нагри |
0 БМП | U+A830..U+A83F | Общие формы индикационных чисел | 16 | 10 | Общий |
0 БМП | U+A840..U+A87F | Фагс-па | 64 | 56 | Фагс Па |
0 БМП | U+A880..U+A8DF | Саураштра | 96 | 82 | Саураштра |
0 БМП | U+A8E0..U+A8FF | Деванагари расширенный | 32 | 32 | Деванагари |
0 БМП | U+A900..U+A92F | Кая Ли | 48 | 48 | Кая Ли (47 символов), Общий (1 символ) |
0 БМП | U+A930..U+A95F | Реджанг | 48 | 37 | Реджанг |
0 БМП | U+A960..U+A97F | Хангыль Джамо Расширенный-А | 32 | 29 | хангыль |
0 БМП | U+A980..U+A9DF | яванский | 96 | 91 | Яванский (90 символов), Общий (1 символ) |
0 БМП | U+A9E0..U+A9FF | Мьянма Расширенный-B | 32 | 31 | Мьянма |
0 БМП | U+AA00..U+AA5F | Чам | 96 | 83 | Чам |
0 БМП | U+AA60..U+AA7F | Мьянма Расширенный-A | 32 | 32 | Мьянма |
0 БМП | U+AA80..U+AADF | Тай Вьет | 96 | 72 | Тай Вьет |
0 БМП | U+AAE0..U+AAFF | Расширения Meetei Mayek | 32 | 23 | Знакомьтесь Майек |
0 БМП | U+AB00..U+AB2F | Эфиопский расширенный-A | 48 | 32 | Эфиопский |
0 БМП | U+AB30..U+AB6F | Латинский расширенный-E | 64 | 60 | Латинский (56 символов), греческий (1 символ), общий (3 символа) |
0 БМП | U+AB70..U+ABBF | Дополнение чероки | 80 | 80 | Чероки |
0 БМП | АВС0..АБФФ | Знакомьтесь Майек | 64 | 56 | Знакомьтесь Майек |
0 БМП | U+AC00..U+D7AF | Слоги хангыля | 11,184 | 11,172 | хангыль |
0 БМП | U+D7B0..U+D7FF | Хангыль Джамо Расширенный-B | 80 | 72 | хангыль |
0 БМП | U+D800..U+DB7F | Высокие суррогаты | 896 | 0 | Неизвестный |
0 БМП | U+DB80..U+DBFF | Суррогаты с высоким уровнем частного использования | 128 | 0 | Неизвестный |
0 БМП | U+DC00..U+DFFF | Низкие суррогаты | 1,024 | 0 | Неизвестный |
0 БМП | U+E000..U+F8FF | Зона частного использования | 6,400 | 6,400 | Неизвестный |
0 БМП | U+F900..U+FAFF | Иероглифы совместимости CJK | 512 | 472 | Он |
0 БМП | U+FB00..U+FB4F | Алфавитные формы представления | 80 | 58 | Армянский (5 символов), Иврит (46 символов), Латынь (7 символов) |
0 БМП | U+FB50..U+FDFF | Формы презентации на арабском языке-A | 688 | 631 | Арабский (629 символов), Общий (2 символа) |
0 БМП | U+FE00..U+FE0F | Селекторы вариантов | 16 | 16 | Унаследовано |
0 БМП | U+FE10..U+FE1F | Вертикальные формы | 16 | 10 | Общий |
0 БМП | U+FE20..U+FE2F | Объединение половинных оценок | 16 | 16 | Кириллица (2 символа), Наследственная (14 символов) |
0 БМП | U+FE30..U+FE4F | Формы совместимости CJK | 32 | 32 | Общий |
0 БМП | U+FE50..U+FE6F | Варианты малых форм | 32 | 26 | Общий |
0 БМП | U+FE70..U+FEFF | Формы презентации на арабском языке-B | 144 | 141 | Арабский (140 символов), Общий (1 символ) |
0 БМП | U+FF00..U+FFEF | Формы половинной и полной ширины | 240 | 225 | Хангыль (52 символа), Катакана (55 символов), Латынь (52 символа), Общий (66 символов) |
0 БМП | U+FFF0..U+FFFF | Специальные предложения | 16 | 5 | Общий |
1 средняя школа | U+10000..U+1007F | Слоговое письмо линейного письма B | 128 | 88 | Линейное письмо Б |
1 средняя школа | U+10080..U+100FF | Идеограммы линейного письма B | 128 | 123 | Линейное письмо Б |
1 средняя школа | U+10100..U+1013F | Эгейские числа | 64 | 57 | Общий |
1 средняя школа | U+10140..U+1018F | Древнегреческие числа | 80 | 79 | Греческий |
1 средняя школа | U+10190..U+101CF | Древние символы | 64 | 14 | Греческий (1 символ), Общий (13 символов) |
1 средняя школа | U+101D0..U+101FF | Фестский диск | 48 | 46 | Общий (45 символов), Наследственный (1 символ) |
1 средняя школа | U+10280..U+1029F | Ликийский | 32 | 29 | Ликийский |
1 средняя школа | U + 102A0.. U + 102DF | Поиск | 64 | 49 | Поиск |
1 средняя школа | U+102E0..U+102FF | Номера коптского договора | 32 | 28 | Общий (27 символов), Наследственный (1 символ) |
1 средняя школа | U+10300..U+1032F | Старый курсив | 48 | 39 | Старый курсив |
1 средняя школа | U+10330..U+1034F | Готика | 32 | 27 | Готика |
1 средняя школа | U+10350..U+1037F | Старый Пермик | 48 | 43 | Старый Пермик |
1 средняя школа | U+10380..U+1039F | Угаритовый | 32 | 31 | Угаритовый |
1 средняя школа | U + 103A0.. U + 103DF | Старый персидский | 64 | 50 | Старый персидский |
1 средняя школа | U+10400..U+1044F | Дезерет | 80 | 80 | Дезерет |
1 средняя школа | U+10450..U+1047F | Шавиан | 48 | 48 | Шавиан |
1 средняя школа | U + 10480.. U + 104AF | Османия | 48 | 40 | Османия |
1 средняя школа | U+104B0..U+104FF | Осейдж | 80 | 72 | Осейдж |
1 средняя школа | U+10500..U+1052F | Эльбасан | 48 | 40 | Эльбасан |
1 средняя школа | U+10530..U+1056F | Кавказский албанец | 64 | 53 | Кавказский албанец |
1 средняя школа | U+10570..U+105BF | Виткук | 80 | 70 | Виткук |
1 средняя школа | U+10600..U+1077F | Линейное письмо А | 384 | 341 | Линейное письмо А |
1 средняя школа | U+10780..U+107BF | Латинский расширенный-F | 64 | 57 | латинский |
1 средняя школа | U+10800..U+1083F | Кипрское слоговое письмо | 64 | 55 | Киприот |
1 средняя школа | U+10840..U+1085F | Имперский арамейский | 32 | 31 | Имперский арамейский |
1 средняя школа | U+10860..U+1087F | Пальмирена | 32 | 32 | Пальмирена |
1 средняя школа | U+10880..U+108AF | Набатейский | 48 | 40 | Набатейский |
1 средняя школа | U+108E0..U+108FF | Хатран | 32 | 26 | Хатран |
1 средняя школа | U+10900..U+1091F | финикийский | 32 | 29 | финикийский |
1 средняя школа | U+10920..U+1093F | лидийский | 32 | 27 | лидийский |
1 средняя школа | U+10980..U+1099F | Мероитские иероглифы | 32 | 32 | Мероитские иероглифы |
1 средняя школа | U+109A0..U+109FF | Меройский курсив | 96 | 90 | Меройский курсив |
1 средняя школа | U+10A00..U+10A5F | Харости | 96 | 68 | Харости |
1 средняя школа | U+10A60..U+10A7F | Старый южноаравийский | 32 | 32 | Старый южноаравийский |
1 средняя школа | U+10A80..U+10A9F | Старый Североаравийский | 32 | 32 | Старый Североаравийский |
1 средняя школа | U+10AC0..U+10AFF | манихейский | 64 | 51 | манихейский |
1 средняя школа | U+10B00..U+10B3F | Авестийский | 64 | 61 | Авестийский |
1 средняя школа | U+10B40..U+10B5F | Надписной парфянский | 32 | 30 | Надписной парфянский |
1 средняя школа | U+10B60..U+10B7F | Надпись Пехлеви | 32 | 27 | Надпись Пехлеви |
1 средняя школа | U+10B80..U+10BAF | Псалтирь Пехлеви | 48 | 29 | Псалтирь Пехлеви |
1 средняя школа | U+10C00..U+10C4F | Древнетюркский | 80 | 73 | Древнетюркский |
1 средняя школа | U+10C80..U+10CFF | Старый венгерский | 128 | 108 | Старый венгерский |
1 средняя школа | U+10D00..U+10D3F | Ханифи Рохинджа | 64 | 50 | Ханифи Рохинджа |
1 средняя школа | U+10E60..U+10E7F | Цифровые символы Руми | 32 | 31 | арабский |
1 средняя школа | U+10E80..U+10EBF | езид | 64 | 47 | езид |
1 средняя школа | U+10EC0..U+10EFF | Арабский расширенный-C | 64 | 3 | арабский |
1 средняя школа | U+10F00..U+10F2F | Старый Согдийский | 48 | 40 | Старый Согдийский |
1 средняя школа | U+10F30..U+10F6F | согдийский | 64 | 42 | согдийский |
1 средняя школа | U+10F70..U+10FAF | Старый уйгур | 64 | 26 | Старый уйгур |
1 средняя школа | U+10FB0..U+10FDF | Хорезмический | 48 | 28 | Хорезмический |
1 средняя школа | U+10FE0..U+10FFF | Элимейский | 32 | 23 | Элимейский |
1 средняя школа | U+11000..U+1107F | Брахми | 128 | 115 | Брахми |
1 средняя школа | U+11080..U+110CF | Кайти | 80 | 68 | Кайти |
1 средняя школа | U+110D0..U+110FF | Сора Сомпенг | 48 | 35 | Сора Сомпенг |
1 средняя школа | U+11100..U+1114F | Чакма | 80 | 71 | Чакма |
1 средняя школа | U+11150..U+1117F | Махаджани | 48 | 39 | Махаджани |
1 средняя школа | U+11180..U+111DF | Шарада | 96 | 96 | Шарада |
1 средняя школа | U+111E0..U+111FF | Сингальские архаичные цифры | 32 | 20 | сингальский |
1 средняя школа | U+11200..U+1124F | Хойки | 80 | 65 | Хойки |
1 средняя школа | U + 11280.. U + 112AF | Оружие | 48 | 38 | Оружие |
1 средняя школа | U+112B0..U+112FF | Худавади | 80 | 69 | Худавади |
1 средняя школа | U+11300..U+1137F | Грантха | 128 | 86 | Грантха (85 символов), Наследство (1 символ) |
1 средняя школа | U+11400..U+1147F | Ньюа | 128 | 97 | Ньюа |
1 средняя школа | U+11480..U+114DF | Тирхута | 96 | 82 | Тирхута |
1 средняя школа | U+11580..U+115FF | Сиддхам | 128 | 92 | Сиддхам |
1 средняя школа | U+11600..U+1165F | Моди | 96 | 79 | Моди |
1 средняя школа | U+11660..U+1167F | Монгольское дополнение | 32 | 13 | Монгольский |
1 средняя школа | U+11680..U+116CF | Такри | 80 | 68 | Такри |
1 средняя школа | U+11700..U+1174F | Ахом | 80 | 65 | Ахом |
1 средняя школа | U+11800..U+1184F | Догра | 80 | 60 | Догра |
1 средняя школа | U+118A0..U+118FF | Варанг Сити | 96 | 84 | Варанг Сити |
1 средняя школа | U+11900..U+1195F | Погружения в Акуру | 96 | 72 | Погружения в Акуру |
1 средняя школа | U+119A0..U+119FF | Нандинагари | 96 | 65 | Нандинагари |
1 средняя школа | U + 11A00.. U + 11A4F | Площадь Занабазара | 80 | 72 | Площадь Занабазара |
1 средняя школа | U + 11A50.. U + 11AAF | Сойомбо | 96 | 83 | Сойомбо |
1 средняя школа | U+11AB0..U+11ABF | Унифицированное слоговое письмо канадских аборигенов, расширенное-A | 16 | 16 | Канадский абориген |
1 средняя школа | U+11AC0..U+11AFF | Олл Син Сноу | 64 | 57 | Олл Син Сноу |
1 средняя школа | U+11B00..U+11B5F | Деванагари Расширенный-А | 96 | 10 | Деванагари |
1 средняя школа | U + 11C00.. U + 11C6F | Бхайксуки | 112 | 97 | Бхайксуки |
1 средняя школа | U+11C70..U+11CBF | Марш | 80 | 68 | Марш |
1 средняя школа | U+11D00..U+11D5F | Масарам Гонди | 96 | 75 | Масарам Гонди |
1 средняя школа | U+11D60..U+11DAF | Гунджала Гонди | 80 | 63 | Гунджала Гонди |
1 средняя школа | U+11EE0..U+11EFF | Макассар | 32 | 25 | Макассар |
1 средняя школа | U+11F00..U+11F5F | Кави | 96 | 86 | Кави |
1 средняя школа | U+11FB0..U+11FBF | Дополнение Лису | 16 | 1 | Гладкий |
1 средняя школа | U+11FC0..U+11FFF | Тамильское дополнение | 64 | 51 | тамильский |
1 средняя школа | U+12000..U+123FF | клинопись | 1,024 | 922 | клинопись |
1 средняя школа | U+12400..U+1247F | Клинописные цифры и пунктуация | 128 | 116 | клинопись |
1 средняя школа | U+12480..U+1254F | Ранняя династическая клинопись | 208 | 196 | клинопись |
1 средняя школа | U+12F90..U+12FFF | Кипро-минойский | 112 | 99 | Кипро-минойский |
1 средняя школа | U+13000..U+1342F | Египетские иероглифы | 1,072 | 1,072 | Египетские иероглифы |
1 средняя школа | U+13430..U+1345F | Элементы управления форматом египетских иероглифов | 48 | 38 | Египетские иероглифы |
1 средняя школа | U+14400..U+1467F | Анатолийские иероглифы | 640 | 583 | Анатолийские иероглифы |
1 средняя школа | U+16800..U+16A3F | Бамум Добавка | 576 | 569 | Бамум |
1 средняя школа | U+16A40..U+16A6F | Мро | 48 | 43 | Мро |
1 средняя школа | U+16A70..U+16ACF | Танса | 96 | 89 | Танса |
1 средняя школа | U+16AD0..U+16AFF | Бас Вах | 48 | 36 | Бас Вах |
1 средняя школа | U+16B00..U+16B8F | Пахау Хмонг | 144 | 127 | Пахау Хмонг |
1 средняя школа | U+16E40..U+16E9F | медефаидрин | 96 | 91 | медефаидрин |
1 средняя школа | U+16F00..U+16F9F | Мяо | 160 | 149 | Мяо |
1 средняя школа | U+16FE0..U+16FFF | Идеографические символы и пунктуация | 32 | 7 | Хань (4 символа), Киданьская малая письменность (1 символ), Нушу (1 символ), Тангут (1 символ) |
1 средняя школа | U+17000..U+187FF | Тангутский | 6,144 | 6,136 | Тангутский |
1 средняя школа | U+18800..U+18AFF | Тангутские компоненты | 768 | 768 | Тангутский |
1 средняя школа | U+18B00..U+18CFF | Обрезание мелким шрифтом | 512 | 470 | Обрезание мелким шрифтом |
1 средняя школа | U+18D00..U+18D7F | Тангутская добавка | 128 | 9 | Тангутский |
1 средняя школа | U+1AFF0..U+1AFFF | Кана Расширенная-B | 16 | 13 | Катакана |
1 средняя школа | U+1B000..U+1B0FF | Кана Дополнение | 256 | 256 | Хирагана (255 символов), Катакана (1 символ) |
1 средняя школа | U+1B100..U+1B12F | Кана Расширенный-А | 48 | 35 | Хирагана (32 символа), Катакана (3 символа) |
1 средняя школа | U+1B130..U+1B16F | Маленькое расширение Кана | 64 | 9 | Хирагана (4 символа), Катакана (5 символов) |
1 средняя школа | U+1B170..U+1B2FF | Нушу | 400 | 396 | Нюшу |
1 средняя школа | U+1BC00..U+1BC9F | Дуплоян | 160 | 143 | Дуплоян |
1 средняя школа | U+1BCA0..U+1BCAF | Элементы управления сокращенным форматом | 16 | 4 | Общий |
1 средняя школа | U+1CF00..U+1CFCF | Знаменная нотная грамота | 208 | 185 | Общий (116 символов), Наследственный (69 символов) |
1 средняя школа | U+1D000..U+1D0FF | Византийские музыкальные символы | 256 | 246 | Общий |
1 средняя школа | U+1D100..U+1D1FF | Музыкальные символы | 256 | 233 | Общий (211 символов), Наследственный (22 символа) |
1 средняя школа | U+1D200..U+1D24F | Древнегреческая нотная грамота | 80 | 70 | Греческий |
1 средняя школа | U+1D2C0..U+1D2DF | Кактовик Цифры | 32 | 20 | Общий |
1 средняя школа | U+1D2E0..U+1D2FF | Цифры Майя | 32 | 20 | Общий |
1 средняя школа | U+1D300..U+1D35F | Символы Тай Сюань Цзин | 96 | 87 | Общий |
1 средняя школа | U+1D360..U+1D37F | Подсчет стержневых цифр | 32 | 25 | Общий |
1 средняя школа | U+1D400..U+1D7FF | Математические буквенно-цифровые символы | 1,024 | 996 | Общий |
1 средняя школа | U+1D800..U+1DAAF | Знак СаттонаНаписание | 688 | 672 | ВойтиНаписание |
1 средняя школа | U+1DF00..U+1DFFF | Латинский расширенный-G | 256 | 37 | латинский |
1 средняя школа | U+1E000..U+1E02F | Глаголица дополнение | 48 | 38 | глаголица |
1 средняя школа | U+1E030..U+1E08F | Кириллица расширенная-D | 96 | 63 | Кириллица |
1 средняя школа | U+1E100..U+1E14F | Ньиакенг Пуачуэ Хмонг | 80 | 71 | Ньиакенг Пуачуэ Хмонг |
1 средняя школа | U+1E290..U+1E2BF | Этот | 48 | 31 | Этот |
1 средняя школа | U+1E2C0..U+1E2FF | Ванчо | 64 | 59 | Ванчо |
1 средняя школа | U+1E4D0..U+1E4FF | Наг Мундари | 48 | 42 | Мундари |
1 средняя школа | U+1E7E0..U+1E7FF | Эфиопский расширенный-B | 32 | 28 | Эфиопский |
1 средняя школа | U+1E800..U+1E8DF | Менде Кикакуи | 224 | 213 | Менде Кикакуи |
1 средняя школа | U+1E900..U+1E95F | Отскок | 96 | 88 | Отскок |
1 средняя школа | U+1EC70..U+1ECBF | Индийские числа Сияка | 80 | 68 | Общий |
1 средняя школа | U+1ED00..U+1ED4F | Османские сиякские числа | 80 | 61 | Общий |
1 средняя школа | U+1EE00..U+1EEFF | Арабские математические алфавитные символы | 256 | 143 | арабский |
1 средняя школа | U+1F000..U+1F02F | Плитки Маджонга | 48 | 44 | Общий |
1 средняя школа | U + 1F030.. U + 1F09F | Домино плитки | 112 | 100 | Общий |
1 средняя школа | U+1F0A0..U+1F0FF | Игральные карты | 96 | 82 | Общий |
1 средняя школа | U+1F100..U+1F1FF | Прилагаемое буквенно-цифровое дополнение | 256 | 200 | Общий |
1 средняя школа | U+1F200..U+1F2FF | Прилагаемое идеографическое дополнение | 256 | 64 | Хирагана (1 символ), Общий (63 символа) |
1 средняя школа | U+1F300..U+1F5FF | Разные символы и пиктограммы | 768 | 768 | Общий |
1 средняя школа | U+1F600..U+1F64F | Смайлики | 80 | 80 | Общий |
1 средняя школа | U+1F650..U+1F67F | Декоративные дингбаты | 48 | 48 | Общий |
1 средняя школа | U+1F680..U+1F6FF | Символы транспорта и карты | 128 | 118 | Общий |
1 средняя школа | U+1F700..U+1F77F | Алхимические символы | 128 | 124 | Общий |
1 средняя школа | U+1F780..U+1F7FF | Расширенные геометрические фигуры | 128 | 103 | Общий |
1 средняя школа | U+1F800..U+1F8FF | Дополнительные стрелки-C | 256 | 150 | Общий |
1 средняя школа | U+1F900..U+1F9FF | Дополнительные символы и пиктограммы | 256 | 256 | Общий |
1 средняя школа | U+1FA00..U+1FA6F | Шахматные символы | 112 | 98 | Общий |
1 средняя школа | U+1FA70..U+1FAFF | Расширенные символы и пиктограммы-A | 144 | 107 | Общий |
1 средняя школа | U+1FB00..U+1FBFF | Символы устаревших вычислений | 256 | 212 | Общий |
2 СИП | U+20000..U+2A6DF | Расширение B унифицированных иероглифов CJK | 42,720 | 42,720 | Он |
2 СИП | U+2A700..U+2B73F | Расширение CJK для унифицированных идеографов C | 4,160 | 4,154 | Он |
2 СИП | U+2B740..U+2B81F | Расширение D унифицированных иероглифов CJK | 224 | 222 | Он |
2 СИП | U+2B820..U+2CEAF | Расширение E унифицированных иероглифов CJK | 5,776 | 5,762 | Он |
2 СИП | U+2CEB0..U+2EBEF | Расширение унифицированных идеографов CJK F | 7,488 | 7,473 | Он |
2 СИП | U+2EBF0..U+2EE5F | Расширение унифицированных идеографов CJK I | 624 | 622 | Он |
2 СИП | U+2F800..U+2FA1F | Дополнение к идеограммам совместимости CJK | 544 | 542 | Он |
3 СОВЕТ | U+30000..U+3134F | Расширение унифицированных иероглифов CJK G | 4,944 | 4,939 | Он |
3 СОВЕТ | U + 31350.. U + 323AF | Расширение унифицированных иероглифов CJK H | 4,192 | 4,192 | Он |
14 ССП | U+E0000..U+E007F | Теги | 128 | 97 | Общий |
14 ССП | U+E0100..U+E01EF | Дополнение к селекторам вариантов | 240 | 240 | Унаследовано |
15 ЦВЕТОК-А | U+F0000..U+FFFFF | Дополнительная зона частного использования-А | 65,536 | 65,534 | Неизвестный |
16 ПУА-Б | U+100000..U+10FFFF | Дополнительная зона частного использования-B | 65,536 | 65,534 | Неизвестный |
|
Перемещенные блоки [ править ]
Политика стабильности Unicode требует, чтобы назначенный символ нельзя было перемещать или удалять, хотя он может быть признан устаревшим. Это относится к Unicode 2.0 и всем последующим версиям.
До этого были перенесены следующие бывшие блоки:
Диапазон блоков | Исторический имя блока | Версия при добавлении | Версия после удаления | Диапазон сейчас занят | Заменено блоком | Кодовые точки | Назначенные персонажи | Скрипты |
---|---|---|---|---|---|---|---|---|
U+1000..U+105F | тибетский [5] | 1.0.0 | 1.0.1 | Мьянма | тибетский | 96 | 71 | тибетский |
U+3400..U+3D2D | хангыль [6] | 1.0.0 | 2.0 | Расширение A унифицированных идеографов CJK | Слоги хангыля | 2350 | 2350 | хангыль |
U+3D2E..U+44B7 | Дополнительный курс хангыль-A [6] | 1.1 | 2.0 | 1930 | 1930 | |||
U+44B8..U+4DFF | Дополнительный курс хангыль-B [6] | Расширение A унифицированных иероглифов CJK и символы гексаграммы Ицзин | 2376 | 2376 |
Ссылки [ править ]
- ↑ Перейти обратно: Перейти обратно: а б с д «Файл данных блоков Unicode, версия Unicode 15.1» . Консорциум Юникод . Проверено 12 сентября 2023 г.
- ^ «Глоссарий» . www.unicode.org . Проверено 7 августа 2022 г.
- ^ «Часто задаваемые вопросы о персонажах, неперсонажах и стражах для частного использования» . www.unicode.org . Проверено 24 июля 2023 г.
- ^ «Основная спецификация Unicode, глава 4: Свойства символов» (PDF) . Проверено 15 сентября 2021 г.
- ^ «3.8: Поблочные диаграммы» (PDF) . Стандарт Юникод . Версия 1.0. Консорциум Юникод .
- ↑ Перейти обратно: Перейти обратно: а б с «Приложение E: Имена блоков» (PDF) . Стандарт Юникод . Версия 1.1. Консорциум Юникод .
Внешние ссылки [ править ]
- Официальный сайт Консорциума Unicode (на английском языке)