Jump to content

Базовая латиница (блок Unicode)

Послушайте эту статью
Базовая латынь
или
Элементы управления C0 и базовая латиница
Диапазон U+0000..U+007F
(128 кодовых точек)
Самолет БМП
Скрипты Латиница (52 символа)
Общий (76 символов)
Основные алфавиты Английский
Французский
немецкий
испанский
вьетнамский
Наборы символов арабские цифры
Пунктуация
Назначенный 128 кодовых точек
33 Управление или форматирование
Неиспользованный 0 зарезервированных кодовых точек
Исходные стандарты ИСО/МЭК 8859 , ИСО 646
История версий Юникода
1.0.0 (1991) 128 (+128)
Документация Юникод
Таблица кодов Веб-страница
Примечание : [1] [2]

Блок Basic Latin Unicode , [3] иногда неофициально называемые C0 Controls и Basic Latin , [4] — это первый блок стандарта Unicode и единственный блок, который закодирован в один байт в UTF-8 . Блок содержит все буквы и управляющие коды кодировки ASCII. Он варьируется от U+0000 до U+007F, содержит 128 символов и включает элементы управления C0 , знаки препинания и символы ASCII , ASCII цифры , как прописные , так и строчные буквы английского алфавита , а также управляющий символ .

Блок базовой латиницы был включен в его нынешней форме из версии 1.0.0 стандарта Unicode без добавления или изменения набора символов. [5] Имя его блока в Unicode 1.0 было ASCII . [6]

Таблица персонажей

[ редактировать ]
Код Результат Описание Акроним
Управление C0
U+0000 Нулевой символ НУЛЕВОЙ
U + 0001 Начало заголовка СОХ
U + 0002 Начало текста СТХ
U + 0003 Символ конца текста И Т. Д
U + 0004 Символ окончания передачи EOT
U + 0005 Характер запроса ENQ
U + 0006 Признать характер ПОДТВЕРЖДЕНИЕ
U + 0007 Белл персонаж БЕЛ
U + 0008 Backspace БС
U + 0009 Горизонтальная вкладка ХТ
U + 000A Перевод строки НЧ
U + 000B Вертикальная вкладка ВТ
U+000C Подача формы ФФ
U + 000D Возврат каретки ЧР
U + 000E Сдвиг ТАК
U + 000F Сдвиг И
U + 0010 Выход из канала передачи данных В СООТВЕТСТВИИ С
U + 0011 Управление устройством 1 DC1
U + 0012 Контроль устройств 2 DC2
U + 0013 Контроль устройств 3 DC3
U + 0014 Контроль устройств 4 DC4
U + 0015 Символ отрицательного подтверждения ХОТЕТЬ
U + 0016 Синхронный холостой ход СИН
U + 0017 Конец блока передачи ЭТБ
U + 0018 Отменить символ МОЖЕТ
U + 0019 Конец среды В
U + 001A Заменить символ СУБ
U + 001B Побег персонаж ЭКУ
U + 001C Разделитель файлов ФС
U + 001D Разделитель групп GS
U + 001E Разделитель записей РС
U + 001F Разделитель единиц измерения НАС
Знаки препинания и символы ASCII
U + 0020  Космос СП
U + 0021 ! Восклицательный знак ОТЛИЧНО
U + 0022 " Кавычка КВО
U + 0023 # Знак номера
U + 0024 $ Знак доллара
U + 0025 % Знак процента
U + 0026 & Амперсанд
U + 0027 ' Апостроф
U + 0028 ( Левая скобка
U + 0029 ) Правая скобка
U + 002A * Звездочка
U + 002B + Знак плюс
U + 002C , Запятая
U + 002D - Дефис-минус
U + 002E . Точка или точка
U + 002F / Солидус или Слэш
цифры ASCII
U + 0030 0 цифра ноль
U + 0031 1 цифра один
U + 0032 2 цифра два
U + 0033 3 цифра три
U + 0034 4 цифра четыре
U + 0035 5 цифра пять
U + 0036 6 цифра шесть
U + 0037 7 цифра семь
U + 0038 8 Цифра восемь
U + 0039 9 цифра девять
Знаки препинания и символы ASCII
U + 003A : Колон
U + 003B ; Точка с запятой
U + 003C < Знак меньше чем
U + 003D = Знак равенства
U + 003E > Знак «больше»
U + 003F ? Знак вопроса
U + 0040 @ На вывеске или в рекламе на
Прописная латиница
U + 0041 А Латинская заглавная буква А
U + 0042 Б Латинская заглавная буква Б
U + 0043 С Латинская заглавная буква С
U + 0044 Д Латинская заглавная буква D
U + 0045 И Латинская заглавная буква Е
U + 0046 Ф Латинская заглавная буква F
U + 0047 Г Латинская заглавная буква G
U + 0048 ЧАС Латинская заглавная буква H
U + 0049 я Латинская заглавная буква I
U + 004A Дж Латинская заглавная буква J
U + 004B К Латинская заглавная буква К
U + 004C л Латинская заглавная буква L
U + 004D М Латинская заглавная буква М
U + 004E Н Латинская заглавная буква N
U + 004F ТО Латинская заглавная буква О
U + 0050 П Латинская заглавная буква P
U + 0051 вопрос Латинская заглавная буква Q
U + 0052 Р Латинская заглавная буква R
U + 0053 С Латинская заглавная буква S
U + 0054 Т Латинская заглавная буква Т
U + 0055 В Латинская заглавная буква U
U + 0056 V Латинская заглавная буква V
U + 0057 В Латинская заглавная буква W
U + 0058 Х Латинская заглавная буква X
U + 0059 И Латинская заглавная буква Y
U + 005A С Латинская заглавная буква Z
Знаки препинания и символы ASCII
U + 005B [ Левая квадратная скобка
U + 005C \ обратная косая черта [А]
U + 005D ] Правая квадратная скобка
U + 005E ^ Циркумфлексный акцент
U + 005F _ Низкая линия
U + 0060 ` Могильный акцент
Строчный латинский алфавит
U + 0061 а Латинская строчная буква А
U + 0062 б Латинская строчная буква B
U + 0063 с Латинская строчная буква C
U + 0064 д Латинская строчная буква D
U + 0065 и Латинская строчная буква Е
U + 0066 ж Латинская строчная буква F
U + 0067 г Латинская строчная буква G
U + 0068 час Латинская строчная буква H
U + 0069 я Латинская строчная буква I
U + 006A дж Латинская строчная буква J
U + 006B к Латинская строчная буква К
U + 006C л Латинская строчная буква L
U + 006D м Латинская строчная буква М
U + 006E н Латинская строчная буква N
U + 006F тот Латинская строчная буква О
U + 0070 п Латинская строчная буква P
U + 0071 д Латинская строчная буква Q
U + 0072 р Латинская строчная буква R
U + 0073 с Латинская строчная буква S
U + 0074 т Латинская строчная буква Т
U + 0075 в Латинская строчная буква U
U + 0076 v Латинская строчная буква V
U + 0077 В Латинская строчная буква W
U + 0078 х Латинская строчная буква X
U + 0079 и Латинская строчная буква Y
U + 007A С Латинская строчная буква Z
Знаки препинания и символы ASCII
U + 007B { Левая фигурная скобка
U + 007C | Вертикальная полоса
U + 007D } Правая фигурная скобка
U + 007E ~ Тильда
Управляющий персонаж
U + 007F Удалить ПРИНАДЛЕЖАЩИЙ
А Буква U+005C (\) может отображаться как знак иены (¥) или воны (₩) в японских/корейских шрифтах, принимая Unicode (особенно UTF-8 ) за устаревший набор символов, который заменил обратную косую черту этими знаками. [7]

Подзаголовки

[ редактировать ]

Блок C0 Controls and Basic Latin содержит шесть подзаголовков. [8]

Управление C0

[ редактировать ]

Элементы управления C0 , называемые в версии 1.0 управляющими кодами C0 ASCII, унаследованы от ASCII и других 7-битных и 8-битных схем кодирования. Псевдонимы элементов управления C0 взяты из стандарта ISO/IEC 6429:1992 . [8]

Знаки препинания и символы ASCII

[ редактировать ]

В этом подзаголовке упоминаются стандартные знаки пунктуации, простые математические операторы и такие символы, как знак доллара, процент, амперсанд, подчеркивание и трубка. [8]

цифры ASCII

[ редактировать ]

Подзаголовок ASCII Digits содержит стандартные европейские числовые символы 1–9 и 0. [8]

Прописная латиница

[ редактировать ]

Подзаголовок «Прописной латинский алфавит» содержит стандартный 26-буквенный латинский алфавит без ударения в маюскуле . [8]

Строчный латинский алфавит

[ редактировать ]

Подзаголовок «Латинский алфавит в нижнем регистре» содержит стандартный 26-буквенный латинский алфавит без ударения в минускулах . [8]

Управляющий персонаж

[ редактировать ]

Подзаголовок «Управляющий символ» содержит символ «Удалить» . [8]

Количество символов, букв и кодов управления

[ редактировать ]

В таблице ниже указано количество букв , символов и управляющих кодов в каждом из подзаголовков блока C0 Controls и Basic Latin.

Подзаголовок Количество символов Диапазон символов
Управление C0 32 кода управления От U+0000 до U+001F
Знаки препинания и символы ASCII 33 знака препинания и символов От U+0020 до U+002F, от U+003A до U+0040, от U+005B до U+0060 и от U+007B до U+007E
цифры ASCII 10 цифр От U+0030 до U+0039
Прописные буквы латинского алфавита 26 безударных латинских букв в маюскуле. От U+0041 до U+005A
Строчный латинский алфавит 26 безударных латинских букв в мизере. От U+0061 до U+007A
Управляющий персонаж 1 управляющий код, содержащий символ «Удалить». U + 007F

Диаграмма

[ редактировать ]
Элементы управления C0 и базовая латиница [а]
Официальная таблица кодов Консорциума Unicode (PDF)
 0 1 2 3 4 5 6 7 8 9 А Б С Д И Ф
U+000x НУЛЕВОЙ СОХ СТХ И Т. Д EOT ENQ ПОДТВЕРЖДЕНИЕ БЕЛ БС ХТ НЧ ВТ ФФ ЧР ТАК И
U + 001x В СООТВЕТСТВИИ С DC1 DC2 DC3 DC4 ХОТЕТЬ СИН ЭТБ МОЖЕТ В СУБ ЭКУ ФС GS РС НАС
U + 002x СП ! " # $ % & ' ( ) * + , - . /
U + 003x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
U + 004x @ А Б С Д И Ф Г ЧАС я Дж К л М Н ТО
U + 005x П вопрос Р С Т В V В Х И С [ \ ] ^ _
U + 006x ` а б с д и ж г час я дж к л м н тот
U + 007x п д р с т в v В х и С { | } ~ ПРИНАДЛЕЖАЩИЙ
  1. ^ Начиная с версии Unicode 15.1.

Варианты

[ редактировать ]

Некоторые символы определены для отображения как стандартизированный вариант, если за ним следуют индикаторы варианта.

Вариант определен для нуля с короткой диагональной чертой: U+0030 ЦИФРА НОЛЬ, U+FE00 VS1 (0︀). [9] [10]

За двенадцатью символами (#, * и цифры) могут следовать U+FE0E VS15 или U+FE0F VS16 для создания вариантов эмодзи . [11] [12] [13] [14] Это базовые символы клавиатуры , например #️⃣ (U+0023 ЗНАК ЦИФРЫ U+FE0F VS16 U+20E3 КОМБИНИРОВАНИЕ КЛАВИАТУРЫ). Версия VS15 представляет собой «текстовое представление», а версия VS16 — «стиль эмодзи». [10]

Последовательности вариаций эмодзи
У+ 0023 002А 0030 0031 0032 0033 0034 0035 0036 0037 0038 0039
база # * 0 1 2 3 4 5 6 7 8 9
база+VS15+клавиша #︎⃣ *︎⃣ 0︎⃣ 1︎⃣ 2︎⃣ 3︎⃣ 4︎⃣ 5︎⃣ 6︎⃣ 7︎⃣ 8︎⃣ 9︎⃣
база+VS16+клавиша #️⃣ *️⃣ 0️⃣ 1️⃣ 2️⃣ 3️⃣ 4️⃣ 5️⃣ 6️⃣ 7️⃣ 8️⃣ 9️⃣

В следующих документах, связанных с Unicode, записаны цель и процесс определения определенных символов в блоке базовой латиницы:

См. также

[ редактировать ]
  1. ^ «База данных символов Юникода» . Стандарт Юникод . Проверено 26 июля 2023 г.
  2. ^ «Перечисленные версии стандарта Unicode» . Стандарт Юникод . Проверено 26 июля 2023 г.
  3. ^ "блок.txt" . Консорциум Юникод . Проверено 23 марта 2023 г.
  4. ^ «Элементы управления C0 и базовая латиница» (PDF) . Стандарт Юникод, версия 15.0 . Юникод, Инк. 2022 . Проверено 22 марта 2023 г.
  5. ^ Стандарт Unicode, версия 1.0, том 1 . Addison-Wesley Publishing Company, Inc., 1990. ISBN.  0-201-56788-1 .
  6. ^ «3.8: Поблочные диаграммы» (PDF) . Стандарт Юникод . версия 1.0. Консорциум Юникод .
  7. ^ Майкл С. Каплан (17 сентября 2005 г.). «Когда обратная косая черта не является обратной косой чертой?» . Разбираем все это . Майкрософт. Архивировано из оригинала 12 июня 2010 г. Также доступно по адресу: http://archives.miloush.net/michkap/archive/2005/09/17/469941.html.
  8. ^ Перейти обратно: а б с д и ж г «Таблицы кодов Unicode 6.2» (PDF) . Стандарт Юникод . Проверено 1 апреля 2013 г.
  9. ^ Битон, Барбара; Фрейтаг, Асмус; Янку, Лаурентиу; Сарджент, Мюррей (30 октября 2015 г.). «L2 / 15-268: Предложение представить вариант пустого набора с перечеркнутым нулем» (PDF) .
  10. ^ Перейти обратно: а б «Последовательности вариаций эмодзи UTS № 51» . Консорциум Юникод.
  11. ^ Эдберг, Питер (22 декабря 2011 г.). «L2/11-438: Последовательности вариаций эмодзи (редакция L2/11-429)» (PDF) .
  12. ^ Пурнадер, Рузбе (01 ноября 2015 г.). «L2/15-301: Предложение по 278 стандартизированным вариационным последовательностям для эмодзи» (PDF) .
  13. ^ «UTR № 51: эмодзи Юникода» . Консорциум Юникод. 05.09.2023.
  14. ^ «UCD: данные Emoji для UTR #51» . Консорциум Юникод. 01.02.2023.
[ редактировать ]
Послушайте эту статью ( 5 минут )
Продолжительность: 5 минут 18 секунд.
Разговорная иконка Википедии
Этот аудиофайл был создан на основе редакции этой статьи от 8 ноября 2023 г. ( 2023-11-08 ) и не отражает последующие изменения.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: ba92cce956e116f5b9fc924d465eff3a__1721948520
URL1:https://arc.ask3.ru/arc/aa/ba/3a/ba92cce956e116f5b9fc924d465eff3a.html
Заголовок, (Title) документа по адресу, URL1:
Basic Latin (Unicode block) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)