ИСО/МЭК 8859-8
МИМ / IANA | ИСО-8859-8 |
---|---|
Псевдоним(а) | iso-ir-138, иврит, csISOLatinHebrew [1] |
Язык(и) | иврит , английский |
Стандартный | ИСО/МЭК 8859-8, ЕСМА-121, СИ 1311 |
Классификация | расширенный ASCII , ISO 8859 |
На основе | DEC Иврит (8 бит) , ISO/IEC 8859-1 |
Другая связанная кодировка(и) | Windows-1255 |
ISO/IEC 8859-8 , Информационные технологии. 8-битные однобайтовые наборы графических символов. Часть 8. Латинский/ивритский алфавит , является частью серии ISO/IEC 8859 на основе ASCII стандартных кодировок символов . ISO/IEC 8859-8:1999 от 1999 года представляет собой вторую и текущую редакцию, которой предшествовало первое издание ISO/IEC 8859-8:1988 в 1988 году. Его неофициально называют латинским/ивритским . ISO/IEC 8859-8 охватывает все буквы иврита , но не содержит знаков гласных иврита . IBM присвоила кодовую страницу 916 ( CCSID 916 и 5012). ему [2] [3] [4] Этот набор символов также был принят израильским стандартом SI1311:2002 с некоторыми расширениями.
ISO-8859-8 — это предпочтительное имя кодировки IANA для этого стандарта, дополненное управляющими кодами C0 и C1 из ISO/IEC 6429 . Текст (обычно) расположен в логическом порядке, поэтому двунаправленного текста для отображения требуется обработка . Номинально ISO-8859-8 ( кодовая страница 28598 ) предназначен для «визуального порядка», а ISO-8859-8- I ( кодовая страница 38598 ) — для логического порядка. Но обычно на практике, что требуется для XML-документов, [ нужна ссылка ] ISO-8859-8 также означает текст логического порядка. Стандарт кодирования WHATWG , используемый HTML5 , рассматривает ISO-8859-8 и ISO-8859-8- I как отдельные кодировки с одинаковым сопоставлением из-за влияния на направление макета, но отмечает, что это больше не относится к ISO-8859-6 ( арабский), только в соответствии с ISO-8859-8. [5]
Существует также ISO-8859-8-E , который предположительно требует явного указания направления с помощью специальных управляющих символов; этот последний вариант на практике не используется.
Кодовая страница Microsoft Windows для иврита, Windows-1255 , в основном является расширением ISO/IEC 8859-8 без элементов управления C1, за исключением отсутствия двойного подчеркивания и замены общего знака валюты ( ¤ ) на знак шекеля . (₪). Он добавляет поддержку гласных в качестве комбинированных символов и некоторых дополнительных знаков препинания.
Спустя более десяти лет после публикации этого стандарта предпочтение отдается Unicode , по крайней мере, для Интернета. [6] (имеется в виду UTF-8 , доминирующая кодировка веб-страниц). ISO-8859-8 используется менее чем на 0,1% веб-сайтов. [7]
Макет кодовой страницы
[ редактировать ]0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
0x | ||||||||||||||||
1x | ||||||||||||||||
2x | СП | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | А | Б | С | Д | И | Ф | Г | ЧАС | я | Дж | К | л | М | Н | ТО |
5x | П | вопрос | Р | С | Т | В | V | В | Х | И | С | [ | \ | ] | ^ | _ |
6x | ` | а | б | с | д | и | ж | г | час | я | дж | к | л | м | н | тот |
7x | п | д | р | с | т | в | v | В | х | и | С | { | | | } | ~ | |
8x | ||||||||||||||||
9x | ||||||||||||||||
Топор | НБСП | ¢ | £ | ¤ | ¥ | ¦ | § | ¨ | © | × | « | ¬ | ЗАСТЕНЧИВЫЙ | ® | ¯ | |
Бх | ° | ± | ² | ³ | ´ | м | ¶ | · | ¸ | ¹ | ÷ | » | ¼ | ½ | ¾ | |
Сх | ||||||||||||||||
Дх | ‗ | |||||||||||||||
Бывший | А | на | третий | д | тот | и | Г | ЧАС | девятый | Дж | с | о | к | М | от | Н |
Форекс | Н | С | П | ж | П | С | С | К | Р | что | А | ЛРМ | РЛМ |
FD — это знак слева направо (U+200E), а FE — знак справа налево (U+200F), как указано в новой поправке ISO/IEC 8859-8:1999.
Расширения израильского стандарта 2002 г.
[ редактировать ]Израильский стандарт SI1311:2002 соответствует ISO/IEC 8859-8:1999, за исключением ряда дополнительных символов для знака евро , нового знака шекеля и более совершенного явного двунаправленного форматирования . [12]
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
Дх | € | ₪ | МРО | РЛО | ‗ | |||||||||||
Бывший | А | на | третий | д | тот | и | Г | ЧАС | девятый | Дж | с | о | к | М | от | Н |
Форекс | Н | С | П | ж | П | С | С | К | Р | что | А | ЖРД | РЛЭ | ЛРМ | РЛМ |
См. также
[ редактировать ]- 8-битный иврит DEC (аналогичная кодовая страница DEC)
- Кодовая страница 1255 (аналогичная кодовая страница Windows)
- СИ 960
- 7-битный иврит DEC
Ссылки
[ редактировать ]- ^ Наборы символов , Управление по присвоению номеров в Интернете (IANA), 12 декабря 2018 г.
- ^ «Информационный документ с кодовой страницей 916» . Архивировано из оригинала 16 февраля 2017 г.
- ^ «Информационный документ CCSID 916» . Архивировано из оригинала 29 ноября 2014 г.
- ^ «Информационный документ CCSID 5012» . Архивировано из оригинала 27 марта 2016 г.
- ^ ван Кестерен, Энн . «9. Устаревшие однобайтовые кодировки» . Стандарт кодирования . ЧТОРГ .
Примечание. ISO-8859-8 и ISO-8859-8- I — разные имена кодировок, поскольку ISO-8859-8 влияет на направление макета. И хотя исторически это могло быть справедливо и для ISO-8859-6 и «ISO-8859-6 -I », это уже не так.
- ^ Джон, Николас А. (2013). «Строительство многоязычного Интернета: Юникод, иврит и глобализация» . Журнал компьютерной коммуникации . 18 (3): 321–338. дои : 10.1111/jcc4.12015 . ISSN 1083-6101 .
Предыстория: проблема иврита и Интернета
- ^ «Статистика использования ISO-8859-8 для веб-сайтов, январь 2019 г.» . w3techs.com . Проверено 17 января 2019 г.
- ^ Кодовая страница CPGID 00916 (pdf) (PDF) , IBM
- ^ Кодовая страница CPGID 00916 (txt) , IBM
- ^ Международные компоненты для Unicode (ICU), ibm-916_P100-1995.ucm , 3 декабря 2002 г.
- ^ Международные компоненты для Unicode (ICU), ibm-5012_P100-1999.ucm , 3 декабря 2002 г.
- ^ Перейти обратно: а б Институт стандартов Израиля . ISO-IR-234: Набор символов латинского/иврита для 8-битных кодов (PDF) . ITSCJ/ IPSJ .
Внешние ссылки
[ редактировать ]- ИСО/МЭК 8859-8:1999
- Стандарт ECMA-121 — наборы 8-битных однобайтовых графических символов — латинский/еврейский алфавит
- Израильский стандарт SI1311:2002. Архивировано 24 ноября 2005 г. в Wayback Machine (иврит).
- Регистрации ISO-IR:
- Из ECMA-121:1987 и следующего ISO/IEC 8859-8:1988: Европейская ассоциация производителей компьютеров (31 июля 1987 г.). ISO-IR-138: Латинский/еврейский алфавит (PDF) . ITSCJ/ IPSJ .
- В соответствии с ISO/IEC 8859-8:1999 и ECMA-121:2000: Израильский институт стандартов (1 мая 1998 г.). ISO-IR-198: Латинский/еврейский алфавит (PDF) . ITSCJ/ IPSJ .
- Из SI 1311:2002: Израильский институт стандартов (20 июля 2004 г.). ISO-IR-234: Набор символов латинского/иврита для 8-битных кодов (PDF) . ITSCJ/ IPSJ .