ISO-8859-8- Я

Из Википедии, бесплатной энциклопедии

ISO-8859-8- I — это IANA имя набора символов для кодировки символов ISO/IEC 8859-8, используемой вместе с управляющими кодами из ISO/IEC 6429 для частей C0 (00–1F hex ) и C1 (80–9F). . Персонажи расположены в логическом порядке.

Escape-последовательности (из ISO/IEC 6429 или ISO/IEC 2022 ) не подлежат интерпретации. Большинство приложений интерпретируют только управляющие коды для LF , CR и HT . Некоторые приложения также интерпретируют VT , FF и NEL (в C1). Очень немногие приложения интерпретируют другие управляющие коды C0 и C1 .

ISO-8859-8 иногда располагается в логическом порядке ( HTML , XML ), а иногда в визуальном (слева направо) порядке (обычный текст без какой-либо разметки). Стандарт кодирования WHATWG , используемый HTML5, рассматривает ISO-8859-8 и ISO-8859-8- I как отдельные кодировки с одинаковым сопоставлением из-за влияния на направление макета, но отмечает, что это больше не относится к ISO-8859-6 ( арабский), только в соответствии с ISO-8859-8. [1]

Логический порядок для этого набора символов требует обработки двунаправленного текста для отображения.

Кодовая страница Microsoft Windows для иврита, Windows-1255 , использует логический порядок и добавляет поддержку гласных в качестве комбинируемых символов, а также некоторые дополнительные знаки препинания. В основном это расширение ISO-8859-8- I без элементов управления C1, за исключением отсутствия двойного подчеркивания и замены универсального знака валюты ( ¤ ) знаком шекеля (₪).

Ссылки [ править ]

  1. ^ ван Кестерен, Энн . «9. Устаревшие однобайтовые кодировки» . Стандарт кодирования . ЧТОРГ . Примечание. ISO-8859-8 и ISO-8859-8- I — разные имена кодировок, поскольку ISO-8859-8 влияет на направление макета. И хотя исторически это могло быть справедливо и для ISO-8859-6 и «ISO-8859-6- I », это уже не так.