ИСО/МЭК 8859-8

ISO-8859-8: латынь/иврит
МИМ / IANA ИСО-8859-8
Псевдоним(а) iso-ir-138, иврит, csISOLatinHebrew [1]
Язык(и) иврит , английский
Стандартный ИСО/МЭК 8859-8, ЕСМА-121, СИ 1311
Классификация расширенный ASCII , ISO 8859
На основе DEC Иврит (8 бит) , ISO/IEC 8859-1
Другая связанная кодировка(и) Windows-1255

ISO/IEC 8859-8 , Информационные технологии. 8-битные однобайтовые наборы графических символов. Часть 8. Латинский/ивритский алфавит , является частью серии ISO/IEC 8859 на основе ASCII стандартных кодировок символов . ISO/IEC 8859-8:1999 от 1999 года представляет собой вторую и текущую редакцию, которой предшествовало первое издание ISO/IEC 8859-8:1988 в 1988 году. Его неофициально называют латинским/ивритским . ISO/IEC 8859-8 охватывает все буквы иврита , но не содержит знаков гласных иврита . IBM присвоила кодовую страницу 916 ( CCSID 916 и 5012). ему [2] [3] [4] Этот набор символов также был принят израильским стандартом SI1311:2002 с некоторыми расширениями.

ISO-8859-8 — это предпочтительное имя кодировки IANA для этого стандарта, дополненное управляющими кодами C0 и C1 из ISO/IEC 6429 . Текст (обычно) расположен в логическом порядке, поэтому двунаправленного текста для отображения требуется обработка . Номинально ISO-8859-8 ( кодовая страница 28598 ) предназначен для «визуального порядка», а ISO-8859-8- I ( кодовая страница 38598 ) — для логического порядка. Но обычно на практике и требуется для XML-документов, [ нужна ссылка ] ISO-8859-8 также означает текст логического порядка. Стандарт кодирования WHATWG , используемый HTML5 , рассматривает ISO-8859-8 и ISO-8859-8- I как отдельные кодировки с одинаковым сопоставлением из-за влияния на направление макета, но отмечает, что это больше не относится к ISO-8859-6 ( арабский), только в соответствии с ISO-8859-8. [5]

Существует также ISO-8859-8-E , который предположительно требует явного указания направления с помощью специальных управляющих символов; этот последний вариант на практике не используется.

Кодовая страница Microsoft Windows для иврита, Windows-1255 , в основном является расширением ISO/IEC 8859-8 без элементов управления C1, за исключением отсутствия двойного подчеркивания и замены общего знака валюты ( ¤ ) на знак шекеля . (₪). Он добавляет поддержку гласных в качестве комбинированных символов и некоторых дополнительных знаков препинания.

Спустя более десяти лет после публикации этого стандарта предпочтение отдается Unicode , по крайней мере, для Интернета. [6] (имеется в виду UTF-8 , доминирующая кодировка веб-страниц). ISO-8859-8 используется менее чем на 0,1% веб-сайтов. [7]

Макет кодовой страницы [ править ]

ИСО/МЭК 8859-8 [8] [9] [10] [11]
0 1 2 3 4 5 6 7 8 9 А Б С Д И Ф
0x
1x
2x  СП  ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ А Б С Д И Ф Г ЧАС я Дж К л М Н ТО
5x П вопрос Р С Т В V В Х И С [ \ ] ^ _
6x ` а б с д и ж г час я дж к л м н тот
7x п д р с т в v В х и С { | } ~
8x
9x
Топор НБСП ¢ £ ¤ ¥ ¦ § ¨ © × « ¬ ЗАСТЕНЧИВЫЙ ® ¯
Бх ° ± ² ³ ´ м · ¸ ¹ ÷ » ¼ ½ ¾
Сх
Дх
Бывший А на третий д тот и Г ЧАС девятый Дж с о к М от Н
Форекс Н С П ж П С С К Р что А ЛРМ РЛМ
  Отличается как от DEC иврита (8-бит), так и от ISO-8859-1 .

FD — это знак слева направо (U+200E), а FE — знак справа налево (U+200F), как указано в новой поправке ISO/IEC 8859-8:1999.

израильского стандарта Расширения 2002 г.

Израильский стандарт SI1311:2002 соответствует ISO/IEC 8859-8:1999, за исключением ряда дополнительных символов для знака евро , нового знака шекеля и более совершенного явного двунаправленного форматирования . [12]

СИ1311:2002 [12]
0 1 2 3 4 5 6 7 8 9 А Б С Д И Ф
Дх МРО РЛО PDF
Бывший А на третий д тот и Г ЧАС девятый Дж с о к М от Н
Форекс Н С П ж П С С К Р что А ЖРД РЛЭ ЛРМ РЛМ
  Отсутствует в ISO/IEC 8859-8:1999, добавлен в SI1311:2002.

См. также [ править ]

Ссылки [ править ]

  1. ^ Наборы символов , Управление по присвоению номеров в Интернете (IANA), 12 декабря 2018 г.
  2. ^ «Информационный документ с кодовой страницей 916» . Архивировано из оригинала 16 февраля 2017 г.
  3. ^ «Информационный документ CCSID 916» . Архивировано из оригинала 29 ноября 2014 г.
  4. ^ «Информационный документ CCSID 5012» . Архивировано из оригинала 27 марта 2016 г.
  5. ^ ван Кестерен, Энн . «9. Устаревшие однобайтовые кодировки» . Стандарт кодирования . ЧТОРГ . Примечание. ISO-8859-8 и ISO-8859-8- I — разные имена кодировок, поскольку ISO-8859-8 влияет на направление макета. И хотя исторически это могло быть справедливо и для ISO-8859-6 и «ISO-8859-6 -I », это уже не так.
  6. ^ Джон, Николас А. (2013). «Строительство многоязычного Интернета: Юникод, иврит и глобализация» . Журнал компьютерной коммуникации . 18 (3): 321–338. дои : 10.1111/jcc4.12015 . ISSN   1083-6101 . Предыстория: проблема иврита и Интернета
  7. ^ «Статистика использования ISO-8859-8 для веб-сайтов, январь 2019 г.» . w3techs.com . Проверено 17 января 2019 г.
  8. ^ Кодовая страница CPGID 00916 (pdf) (PDF) , IBM
  9. ^ Кодовая страница CPGID 00916 (txt) , IBM
  10. ^ Международные компоненты для Unicode (ICU), ibm-916_P100-1995.ucm , 3 декабря 2002 г.
  11. ^ Международные компоненты для Unicode (ICU), ibm-5012_P100-1999.ucm , 3 декабря 2002 г.
  12. ^ Jump up to: Перейти обратно: а б Институт стандартов Израиля . ISO-IR-234: Набор символов латиницы и иврита для 8-битных кодов (PDF) . ITSCJ/ IPSJ .

Внешние ссылки [ править ]