Jump to content

Специальные предложения (блок Unicode)

(Перенаправлено с глифа замены )
Специальные предложения
Диапазон U+FFF0..U+FFFF
(16 кодовых точек)
Самолет БМП
Скрипты Общий
Назначенный 5 кодовых точек
Неиспользованный 9 зарезервированных кодовых точек
2 не персонажа
История версий Юникода
1.0.0 (1991) 1 (+1)
2.1 (1998) 2 (+1)
3.0 (1999) 5 (+3)
Документация Юникод
Таблица кодов Веб-страница
Примечание : [1] [2]

Специальные символы — это короткий блок символов Юникода , расположенный в самом конце базовой многоязычной плоскости , по адресам U+FFF0–FFFF. Из этих 16 кодовых точек пять были присвоены начиная с Unicode 3.0:

  • U+FFF9 ЯКОРЬ МЕЖЛИНЕЙНОЙ АННОТАЦИИ , отмечает начало аннотированного текста.
  • U+FFFA РАЗДЕЛИТЕЛЬ МЕЖЛИНЕЙНЫХ АННОТАНЦИЙ , отмечает начало символа(ов) аннотации.
  • U+FFFB TERMINATOR INTERLINEAR ANNOTATION TERMINATOR , отмечает конец блока аннотаций.
  • U+FFFC СИМВОЛ ЗАМЕНЫ ОБЪЕКТА , заполнитель в тексте для другого неопределенного объекта, например в составном документе .
  • U+FFFD — СИМВОЛ ЗАМЕНЫ , используемый для замены неизвестного, нераспознанного или непредставимого символа.
  • U+FFFE <noncharacter-FFFE> не является символом.
  • U+FFFF <noncharacter-FFFF> не является символом.

U+FFFE <несимвольный-FFFE> и U+FFFF <noncharacter-FFFF> — это несимволы , то есть они зарезервированы, но не приводят к неправильному форматированию текста в Юникоде. В версиях стандарта Unicode с 3.1.0 по 6.3.0 утверждалось, что эти символы никогда не следует менять местами, в результате чего некоторые приложения использовали их для угадывания кодировки текста, интерпретируя присутствие любого из них как признак того, что текст не является Unicode. Однако позже в Исправлении № 9 было указано, что несимвольные символы не являются незаконными, и поэтому этот метод проверки кодировки текста неверен. [3]

Юникод Символ U+FEFF ZERO WIDTH NO-BREAK SPACE может быть вставлен в начало текста Unicode, чтобы указать на его порядковый номер : программа, читающая такой текст и встречающая 0xFFFE, будет знать, что ей следует изменить порядок байтов для всех следующих символов.

Имя его блока в Юникоде 1.0 было Special . [4]

Заменяющий символ

[ редактировать ]
Заменяющий символ

Символ замены � (часто отображается в виде черного ромба с белым вопросительным знаком) — это символ, встречающийся в стандарте Unicode в кодовой точке U+FFFD в таблице Specials . Он используется для обозначения проблем, когда система не может преобразовать поток данных для исправления символов. [5]

Например, текстовый файл, закодированный в ISO 8859-1, содержащий немецкое слово für, содержит байты 0x66 0xFC 0x72. Если этот файл открыт в текстовом редакторе, который предполагает, что входные данные имеют формат UTF-8 , первый и третий байты являются допустимыми кодировками ASCII UTF-8 , а второй байт ( 0xFC) недействителен в UTF-8. Текстовый редактор может заменить этот байт символом замены, чтобы создать действительную строку кодовых точек Юникода для отображения, чтобы пользователь видел «f’r».

Плохо реализованный текстовый редактор может записать символ замены, когда пользователь сохраняет файл; данные в файле станут 0x66 0xEF 0xBF 0xBD 0x72. Если файл повторно открыт с использованием ISO 8859-1, он отобразит «f�r» (это называется mojibake ). Поскольку замена одинакова для всех ошибок, восстановить исходный символ невозможно. Лучшее решение (но более сложное в реализации) — сохранить исходные байты, включая любые ошибки, и преобразовать их в замену только при отображении текста. Это позволит текстовому редактору сохранить исходную последовательность байтов, при этом показывая пользователю сообщение об ошибке.

Одно время символ замены часто использовался, когда в шрифте не было глифа для этого символа, как при замене шрифта . Однако большинство современных систем рендеринга текста вместо этого используют шрифт. Символ .notdef , который в большинстве случаев представляет собой пустое поле или "?" или «X» в квадрате, [6] (этот браузер отображает �), иногда называемый « тофу ». Для этого символа не существует кодовой точки Unicode.

Таким образом, символ замены теперь виден только при ошибках кодирования. Некоторые программы преобразуют недопустимые байты UTF-8 в соответствующие символы в Windows-1252 (поскольку это наиболее распространенный источник этих ошибок), так что символ замены никогда не виден.

Диаграмма Юникод

[ редактировать ]
Специальные предложения [1] [2] [3]
Официальная таблица кодов Консорциума Unicode (PDF)
 0 1 2 3 4 5 6 7 8 9 А Б С Д И Ф
U+FFFx ИАА МСФО ИАТ
Примечания
1. ^ Начиная с версии Unicode 15.1.
2. ^ Серые области обозначают неназначенные кодовые точки.
3. ^ Черные области обозначают несимволы (кодовые точки, которые гарантированно никогда не будут назначены как закодированные символы в стандарте Unicode).

Следующие документы, связанные с Unicode, описывают цель и процесс определения определенных символов в блоке Specials:

См. также

[ редактировать ]
  1. ^ «База данных символов Юникода» . Стандарт Юникод . Проверено 26 июля 2023 г.
  2. ^ «Перечисленные версии стандарта Unicode» . Стандарт Юникод . Проверено 26 июля 2023 г.
  3. ^ «Исправление № 9: Разъяснение относительно неперсонажей» . Стандарт Юникод . Архивировано из оригинала 10 июня 2023 г. Проверено 7 июня 2023 г.
  4. ^ «3.8: Поблочные диаграммы» (PDF) . Стандарт Юникод . Версия 1.0. Консорциум Юникод . Архивировано (PDF) из оригинала 11 февраля 2021 г. Проверено 30 сентября 2020 г.
  5. ^ Вичари, Марцин (29 сентября 2020 г.). «Когда падают шрифты» . Фигма. Архивировано из оригинала 13 июня 2021 года . Проверено 6 июня 2021 г.
  6. ^ «Рекомендации по шрифтам OpenType (OpenType 1.7) — Типографика» . Microsoft Learn . Архивировано из оригинала 19 октября 2020 года . Проверено 18 октября 2020 г.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 937882ce953775a4da7738a65bfb09d6__1722003480
URL1:https://arc.ask3.ru/arc/aa/93/d6/937882ce953775a4da7738a65bfb09d6.html
Заголовок, (Title) документа по адресу, URL1:
Specials (Unicode block) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)