~~~~~~~~~~~~~~~~~~~~ Arc.Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~ 
Номер скриншота №:
✰ C2DDF22C6139B993429693246864E7A4__1709260260 ✰
Заголовок документа оригинал.:
✰ HZ (character encoding) - Wikipedia ✰
Заголовок документа перевод.:
✰ HZ (кодировка символов) — Википедия ✰
Снимок документа находящегося по адресу (URL):
✰ https://en.wikipedia.org/wiki/HZ_(character_encoding) ✰
Адрес хранения снимка оригинал (URL):
✰ https://arc.ask3.ru/arc/aa/c2/a4/c2ddf22c6139b993429693246864e7a4.html ✰
Адрес хранения снимка перевод (URL):
✰ https://arc.ask3.ru/arc/aa/c2/a4/c2ddf22c6139b993429693246864e7a4__translat.html ✰
Дата и время сохранения документа:
✰ 15.06.2024 22:22:11 (GMT+3, MSK) ✰
Дата и время изменения документа (по данным источника):
✰ 1 March 2024, at 05:31 (UTC). ✰ 

~~~~~~~~~~~~~~~~~~~~~~ Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~~ 
Сервисы Ask3.ru: 
 Архив документов (Снимки документов, в формате HTML, PDF, PNG - подписанные ЭЦП, доказывающие существование документа в момент подписи. Перевод сохраненных документов на русский язык.)https://arc.ask3.ruОтветы на вопросы (Сервис ответов на вопросы, в основном, научной направленности)https://ask3.ru/answer2questionТоварный сопоставитель (Сервис сравнения и выбора товаров) ✰✰
✰ https://ask3.ru/product2collationПартнерыhttps://comrades.ask3.ru


Совет. Чтобы искать на странице, нажмите Ctrl+F или ⌘-F (для MacOS) и введите запрос в поле поиска.
Arc.Ask3.ru: далее начало оригинального документа

HZ (кодировка символов) — Википедия Jump to content

HZ (кодировка символов)

Из Википедии, бесплатной энциклопедии
кодировка Гц
МИМ / IANA ХЗ-ГБ-2312
Язык(и) Упрощенный китайский , английский , русский
Сделано Фунг Фунг Ли
Стандартный РФК   1843
Классификация Кодировка CJK , броня ASCII , кодирование переменной ширины , кодирование с отслеживанием состояния
Преобразует/кодирует ГБ 2312
Предшествует zW
Преемник Цитируется-печать , UTF-7 , 8BITMIME

HZ Кодировка символов [1] — это кодировка GB 2312 , которая ранее широко использовалась в сообщениях электронной почты и USENET . Он был разработан в 1989 году Фунг Фунг Ли ( китайский : 李楓峰 ) из Стэнфордского университета и впоследствии кодифицирован в 1995 году в RFC 1843. [2]

HZ, сокращение от Hanzi ( упрощенный китайский : 汉字 ; традиционный китайский : 漢字 ; букв. «Китайские иероглифы»), кодировка была изобретена для облегчения использования китайских иероглифов в электронной почте, которая в то время допускала только 7-битные символы. . Таким образом, вместо стандартных escape-последовательностей ISO 2022 (как в случае с ISO-2022-JP ) или 8-битных символов (как в случае EUC ), код HZ использует только печатные 7-битные символы для представления китайского языка. персонажи.

Он также был популярен в сетях USENET, которые в конце 1980-х и начале 1990-х годов обычно не позволяли передавать 8-битные символы или escape-символы.

История [ править ]

HZ заменил более раннюю кодировку «zW», которая помечала целые строки как текст GB 2312, начиная их с символов zW. [3]

Структура и использование [ править ]

В системе кодирования HZ последовательности символов «~{» и «~}» действуют как escape-последовательности; все, что находится между ними, интерпретируется как китайское, закодированное в GB 2312 (старшие биты игнорируются). За пределами escape-последовательностей предполагается, что символы ASCII .

Пример поможет проиллюстрировать связь между GB 2312 , EUC-CN и кодом HZ:

Различные формы кода GB 2312 (0xD2BB) для символа «一» (один)
Форма Код С escape-последовательностями Примечания
Кутен / Кувэй / локации форма 5027 зон/отделов/рядов (ку/цю/ 50 очков (десять/вэй/位 ) , 27 ).
Форма ISO 2022 52 16 16 16 52 16 16 0F 16 50 + 32 = 82 = 52 16
Форма EUC-CN Д2 16 ББ 16 Д2 16 ББ 16 52 16 ∨ 80 16 = D2 16
Форма ХЗ (стандартная) 52 16 16 16 16 52 16 16 16 16 Появляется как ~{R;~} без декодера HZ
Форма ГЦ (альтернативный) Д2 16 ББ 16 16 16 Д2 16 ББ 16 16 16 Форма EUC приемлема по крайней мере для некоторых декодеров

HZ изначально разрабатывался для использования исключительно как 7-битный код. Однако, когда позволяют ситуации, escape-последовательности «~{» и «~}» иногда окружают символы, представленные в EUC-CN; это альтернативное использование позволяет читать китайский язык либо с помощью программного обеспечения декодера HZ, либо с помощью системы, которая понимает EUC-CN.

Кроме того, спецификация определяет, что:

  • последовательность «~~» следует рассматривать как кодировку одного ASCII «~» и,
  • символ «~», за которым следует новая строка, должен быть отброшен.

Однако не все декодеры HZ следуют этим двум правилам.

Кодеры и декодеры HZ [ править ]

Первые кодер и декодер HZ были написаны в 1989 году изобретателем кода для операционной системы Unix . [4]

The Программа hztty , также для операционной системы Unix , также была одной из первых и одной из самых популярных декодеров HZ. Он отличается от спецификации тем, что отображает escape-последовательности (т. е. «~{» и «~}») и не обрабатывает специально «~~» и «~», за которыми следует символ новой строки. Вероятно, это было сделано для того, чтобы позволить программному обеспечению, которое предполагает, что один символ занимает одну позицию экрана (на текстовом экране), работать правильно без изменений.

Поддержка в Microsoft Windows появилась позже, а ряд сторонних «китайских систем» поддерживают HZ. Эти системы могут предоставлять возможность скрыть escape-последовательности.

Недостатки [ править ]

Благодаря escape-последовательностям и, кроме того, поскольку его escape-разделители представляют собой печатные символы в ASCII, довольно легко создавать последовательности атакующих байтов, которые переходят из HZ в Unicode и обратно. Таким образом, использование кодировки HZ рассматривается пакетами защиты от вредоносных программ как подозрительное. [5] [ нужен лучший источник ]

Ссылки [ править ]

Arc.Ask3.Ru: конец оригинального документа.
Arc.Ask3.Ru
Номер скриншота №: C2DDF22C6139B993429693246864E7A4__1709260260
URL1:https://en.wikipedia.org/wiki/HZ_(character_encoding)
Заголовок, (Title) документа по адресу, URL1:
HZ (character encoding) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть, любые претензии не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, денежную единицу можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)