ИСО/МЭК 8859-6
МИМ / IANA | ИСО-8859-6 |
---|---|
Псевдоним(а) | iso-ir-127, ECMA-114, ASMO-708, арабский, csISOLatinArabic [1] |
Стандартный | ASMO 708, ECMA-114, ISO/IEC 8859-6. |
Классификация | расширенный ASCII , ISO 8859 |
Расширения | OEM-708 , Mac OS арабский (почти) |
Предшественник | ЦЕЛЬ 449 |
Другая связанная кодировка(и) | Windows-1256 (несовместимо, перемещает несколько букв) |
ISO/IEC 8859-6:1999 , Информационные технологии. 8-битные однобайтовые наборы графических символов. Часть 6. Латинский/арабский алфавит , является частью серии ISO/IEC 8859 на основе ASCII стандартных кодировок символов , первое издание опубликован в 1987 году. Неофициально его называют латинским/арабским . Он был разработан для покрытия арабского языка . Кодируются только именные буквы, а не заранее сформированные формы букв, поэтому для отображения требуется обработка формирования. Он не включает дополнительные буквы, необходимые для написания большинства языков с арабской графикой, кроме самого арабского языка (таких как персидский, урду и т. д.).
ISO-8859-6 — это предпочтительное имя кодировки IANA для этого стандарта, дополненное управляющими кодами C0 и C1 из ISO/IEC 6429 . Текст расположен в логическом порядке, поэтому двунаправленного текста для отображения требуется обработка . Номинально ISO-8859-6 ( кодовая страница 28596 ) предназначен для «визуального порядка», а ISO-8859-6-I ( кодовая страница 38596 ) — для логического порядка. Но на практике ISO-8859-6 , необходимый для документов HTML и XML, также обозначает текст в логическом порядке. Существует также ISO-8859-6-E , который предположительно требует явного указания направления с помощью специальных управляющих символов; этот последний вариант на практике не используется. IBM присвоила кодовую страницу/ CCSID 1089 ISO 8859-6. [2] [3] Это эмуляция их операционной системы AIX .
ISO-8859-6 технологически устарел , [4] и Unicode предпочтителен в современных приложениях, особенно в Интернете; означает доминирующую кодировку UTF-8 для веб-страниц (см. также арабский алфавит в Unicode для полного описания, в отличие, например, от ISO-8859-6 или Windows 1256, которые не охватывают дополнительные возможности). Менее 0,0002% всех веб-страниц используют ISO-8859-6. [5] [6] и это даже не третий по популярности вариант кодировки арабского языка в Интернете.
История
[ редактировать ]ASMO 708 был разработан ныне несуществующей Арабской организацией по стандартизации и метрологии. [7] в 1986 году стал 8-битным стандартом, который будет использоваться в арабоязычных странах. Дизайн этого набора символов был вдохновлен предыдущим 7-битным стандартом — ASMO 449 — но это не просто 7-битный набор символов, перенесенный в верхнюю часть; есть некоторые различия.
ASMO 708 — это двунаправленный набор символов. Нижняя часть набора символов отличается от стандарта ISO 646 цифрами и некоторыми знаками препинания. В зависимости от контекста (независимо от того, написаны ли числа латинским или арабским шрифтом), цифры отображаются либо как латинские цифры, либо как арабские цифры. Кроме того, в зависимости от контекста симметричные знаки препинания меняются местами, т. е. всякий раз, когда есть открывающий знак препинания, форма отображается по-разному в зависимости от направления текста.
Верхняя часть набора символов содержит только арабские буквы, арабскую пунктуацию, отличную от латинской, а также несколько других символов.
ASMO 708 был разработан в тесном сотрудничестве [8] с ECMA , которая приняла его в качестве собственного стандарта ECMA-114 в 1986 году. Он также был утвержден в качестве стандарта ISO как ISO 8859-6 . [9] Он также был зарегистрирован в Международном реестре наборов кодированных символов как IR 127. [10] в 1986 году.
Связь с другими наборами символов
[ редактировать ]Некоторые другие наборы символов связаны с ASMO 708:
- ASMO 708/Французский 1 [11] добавляет французские строчные буквы;
- Французский 1/АСМО 708 [11] добавляет французские строчные буквы в их кодовые точки ISO 8859-1 и перемещает арабские символы;
- ИСО/ИК 167 [12] добавляет французские и немецкие символы;
- Microsoft Кодовая страница 708 для MS-DOS добавляет французские символы в их типичные кодовые точки из кодовой страницы 437 и добавляет символы рисования прямоугольников;
- И кодовая страница Microsoft 710 (прозрачный арабский язык), и кодовая страница Microsoft 720 (прозрачный ASMO) для MS-DOS добавляют французские символы в их типичные кодовые точки из кодовой страницы 437, но перемещают арабские символы, чтобы разрешить символы рисования прямоугольников из кода. страница 437 должна иметь исходные кодовые точки;
- Microsoft Windows 1256 добавляет французские строчные буквы в Windows 1252 кодовые точки и удаляет арабские символы;
Таблица кодов
[ редактировать ]0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
0x | ||||||||||||||||
1x | ||||||||||||||||
2x | СП | ! | " | # | $ | % / ٪ | & | ' | ( | ) | * / ٭ | + | , | - | . | / |
3x | 0/٠ | 1/١ | 2/٢ | 3/٣ | 4/٤ | 5/٥ | 6/٦ | 7/٧ | 8/٨ | 9/٩ | : | ; | < | = | > | ? |
4x | @ | А | Б | С | Д | И | Ф | Г | ЧАС | я | Дж | К | л | М | Н | ТО |
5x | П | вопрос | Р | С | Т | В | V | В | Х | И | С | [ | \ | ] | ^ | _ |
6x | ` | а | б | с | д | и | ж | г | час | я | дж | к | л | м | н | тот |
7x | п | д | р | с | т | в | v | В | х | и | С | { | | | } | ~ | |
8x | ||||||||||||||||
9x | ||||||||||||||||
Топор | НБСП | ¤ | ، | ЗАСТЕНЧИВЫЙ | ||||||||||||
Бх | ؛ | ؟ | ||||||||||||||
Сх | А | ну давай же | А | был | Э | Э | А | для | Ой | Т | че | С | ЧАС | Х | принадлежащий | |
Дх | З | Р | З | вопрос | Ш | п | З | я | З | А | г | |||||
Бывший | ـ | Ф | вопрос | твой | к | М | Н | е | и | ى | Да | ◌ً | ◌ٌ | ◌ٍ | ◌َ | ◌ُ |
Форекс | ◌ِ | ◌ّ | ◌ْ |
Кодовые значения 0xEB–0xF2 присваиваются комбинированным символам .
См. также
[ редактировать ]- ЦЕЛЬ 449
- ИСО 8859
- Windows-1256 (кодовая страница Windows на арабском языке)
Ссылки
[ редактировать ]- ^ Наборы символов , Управление по присвоению номеров в Интернете (IANA), 12 декабря 2018 г.
- ^ «Информационный документ с кодовой страницей 1089» . Архивировано из оригинала 17 марта 2016 г.
- ^ «Информационный документ CCSID 1089» . Архивировано из оригинала 27 марта 2016 г.
- ^ Вычисления и Коран - Некоторые предостережения, 2007, Томас Майло
- ^ «Статистика использования ISO-8859-6 для веб-сайтов, октябрь 2022 г.» . w3techs.com . Проверено 25 октября 2022 г.
- ^ «Часто задаваемые вопросы» .
- ^ Компьютерное кодирование арабского письма: от ASMO 449 до Unicode и ISO/IEC 10646.
- ^ Стандарт ECMA-114
- ^ ИСО/МЭК 8859-6:1999.
- ^ Европейская ассоциация производителей компьютеров , Арабская организация по стандартизации и метрологии (30 ноября 1986 г.). Правая часть латинского/арабского алфавита (PDF) . ITSCJ/ IPSJ . ИСО-ИК -127.
- ^ Перейти обратно: а б Справочное руководство программиста эмуляции Printronix ACA
- ^ Европейская ассоциация производителей компьютеров (12 июля 1992 г.). Набор на арабском, французском и немецком языках (PDF) . ITSCJ/ IPSJ . ИСО-ИК -167.
- ^ «ISO 8859-6:1999 в Юникод» . 27 июля 1999 г.
- ^ Кодовая страница CPGID 01089 (pdf) (PDF) , IBM
- ^ Кодовая страница CPGID 01089 (txt) , IBM
- ^ Международные компоненты для Unicode (ICU), ibm-1089_P100-1995.ucm , 3 декабря 2002 г.
Внешние ссылки
[ редактировать ]- ИСО/МЭК 8859-6:1999
- Стандарт ECMA-114 : наборы 8-битных однобайтовых графических символов - латинский/арабский алфавит, 2-е издание (декабрь 2000 г.)
- ISO-IR 127 Правая часть латинского/арабского алфавита (30 ноября 1986 г.)