Jump to content

Кодовая точка

(Перенаправлено из Кодовых точек )

Кодовая точка , кодовая точка или позиция кода — это определенная позиция в таблице, где этой позиции присвоено значение. Таблица может быть одномерной (столбец), двухмерной (например, ячейки в электронной таблице), трехмерной (листы в книге) и т. д. в любом количестве измерений.

Технически кодовая точка — это уникальная позиция в квантованном n-мерном пространстве, где этой позиции присвоено семантическое значение. В таблице есть дискретные (целые) и положительные позиции (1, 2, 3, 4, но не дроби).

Кодовые точки используются во множестве формальных стандартов обработки информации и телекоммуникаций. [1] [2] Например, Рекомендация ITU-T T.35. [3] содержит набор кодов стран для телекоммуникационного оборудования (первоначально факсов), которые позволяют оборудованию указывать страну его производства или эксплуатации. В T.35 Аргентина представлена ​​кодовой точкой 0x07, Канада — 0x20, Гамбия — 0x41 и т. д.

В кодировке символов

[ редактировать ]

Кодовые точки обычно используются при кодировании символов , где кодовая точка — это числовое значение, которое соответствует определенному символу . При кодировании символов кодовые точки обычно представляют одну графему — обычно букву, цифру, знак препинания или пробел — но иногда представляют собой символы, управляющие символы или форматирование. [4] Набор всех возможных кодовых точек в данной кодировке/наборе символов составляет кодовое пространство этой кодировки . [5] [6]

Например, схема кодирования символов ASCII содержит 128 кодовых точек в диапазоне от 0 до 7F hex , расширенная ASCII содержит 256 кодовых точек в диапазоне от 0 до FF hex , а Unicode содержит 1 114 112 кодовых точек в диапазоне от 0 до 10FFFF hex. . Кодовое пространство Юникода разделено на семнадцать плоскостей (основная многоязычная плоскость и 16 дополнительных плоскостей), каждая из которых содержит 65 536 (= 2 16 ) кодовые точки. Таким образом, общий размер кодового пространства Юникода составляет 17 × 65 536 = 1 114 112.

В Юникоде

[ редактировать ]

В Unicode определенная последовательность битов называется кодовой единицей — для кодировки UCS-4 любая кодовая точка кодируется как 4- байтовые ( октетные ) двоичные числа , тогда как в кодировке UTF-8 различные кодовые точки кодируются как последовательности длиной от одного до четырех байтов, образующие самосинхронизирующийся код . см . в сравнении кодировок Unicode Подробности .Кодовые точки обычно присваиваются абстрактным символам . Абстрактный символ — это не графический глиф , а единица текстовых данных. Однако кодовые точки также можно оставить зарезервированными для будущего назначения (большая часть кодового пространства Юникода не назначена) или предоставить другие назначенные функции. [ нужна ссылка ]

Различие между кодовой точкой и соответствующим абстрактным символом не выражено в Юникоде, но очевидно для многих других схем кодирования, где множество кодовых страниц . для одного кодового пространства может существовать [ нужна ссылка ]

Концепция кодовой точки восходит к самым ранним стандартам цифровой обработки информации и цифровых телекоммуникаций.

В Unicode кодовые точки являются частью решения Unicode сложной проблемы, с которой столкнулись разработчики кодировок символов в 1980-х годах. [7] Если бы они добавили больше битов на символ для размещения более крупных наборов символов, это проектное решение также стало бы неприемлемой тратой тогда скудных вычислительных ресурсов для пользователей латинского алфавита (которые в то время составляли подавляющее большинство пользователей компьютеров), поскольку эти дополнительные биты для таких пользователей всегда будет обнуляться. [8] Кодовая точка позволяет избежать этой проблемы, разрушая старую идею прямого однозначного соответствия между символами и конкретными последовательностями битов.

См. также

[ редактировать ]
  1. ^ ETSI TS 101 773 (раздел 4), https://www.etsi.org/deliver/etsi_ts/101700_101799/101773/01.02.01_60/ts_101773v010201p.pdf
  2. ^ RFC4190 (раздел 1), https://datatracker.ietf.org/doc/html/rfc4190.
  3. ^ «T.35: Процедура присвоения кодов, определенных МСЭ-Т, для нестандартных объектов» .
  4. ^ «Стандарт Unicode® версии 11.0 – Основная спецификация» (PDF) . Консорциум Юникод . 30 июня 2018 г. с. 23. Архивировано из оригинала (PDF) 19 сентября 2018 года . Проверено 25 декабря 2018 г. Формат: Невидимый, но влияет на соседних символов; включает разделители строк и абзацев
  5. ^ Юникод. «Глоссарий терминов Юникода» . unicode.org . Проверено 20 марта 2023 г.
  6. ^ «Стандарт Unicode® версии 11.0 – Основная спецификация» (PDF) . Консорциум Юникод . 30 июня 2018 г. с. 22. Архивировано из оригинала (PDF) 19 сентября 2018 года . Проверено 25 декабря 2018 г. На компьютере абстрактные символы внутренне кодируются как числа. Чтобы создать полную кодировку символов, необходимо определить список всех символов, подлежащих кодированию, и установить систематические правила того, как числа представляют символы. Диапазон целых чисел, используемых для кодирования абстрактных символов, называется кодовым пространством. Определенное целое число в этом наборе называется кодовой точкой. Когда абстрактный символ отображается или назначается определенной кодовой точке в кодовом пространстве, он тогда называется кодированным символом.
  7. ^ Констебль, Питер (13 июня 2001 г.). «Понимание Unicode™ — I» . NRSI: Компьютеры и системы письма . Архивировано из оригинала (html) 16 сентября 2010 года . Проверено 25 декабря 2018 г. К началу 1980-х годов индустрия программного обеспечения начала осознавать необходимость решения проблем, связанных с использованием нескольких стандартов кодирования символов. Некоторые особенно новаторские работы были начаты в Xerox. Рабочая станция Xerox Star использовала многобайтовую кодировку, которая позволяла ей поддерживать один набор символов, потенциально содержащий миллионы символов.
  8. ^ Марк Дэвис; Кен Уистлер (23 марта 2001 г.). «Технический стандарт Unicode № 10, АЛГОРИТМ СОСТАВЛЕНИЯ ЮНИКОДА» . Консорциум Юникод . Архивировано из оригинала (html) 25 августа 2001 года . Проверено 25 декабря 2018 г. 6.2 Большие значения веса
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: c8bb6d63f6c8d882af10da39dfda5c92__1718675280
URL1:https://arc.ask3.ru/arc/aa/c8/92/c8bb6d63f6c8d882af10da39dfda5c92.html
Заголовок, (Title) документа по адресу, URL1:
Code point - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)