Jump to content

ИСО/МЭК 8859-6

ИСО-8859-6 (АСМО 708)
МИМ / IANA ИСО-8859-6
Псевдоним(а) iso-ir-127, ECMA-114, ASMO-708, арабский, csISOLatinArabic [1]
Стандартный ASMO 708, ECMA-114, ISO/IEC 8859-6.
Классификация расширенный ASCII , ISO 8859
Расширения OEM-708 , Mac OS арабский (почти)
Предшественник ЦЕЛЬ 449
Другая связанная кодировка(и) Windows-1256 (несовместимо, перемещает несколько букв)

ISO/IEC 8859-6:1999 , Информационные технологии. 8-битные однобайтовые наборы графических символов. Часть 6. Латинский/арабский алфавит , является частью серии ISO/IEC 8859 на основе ASCII стандартных кодировок символов , первое издание опубликован в 1987 году. Неофициально его называют латинским/арабским . Он был разработан для покрытия арабского языка . Кодируются только именные буквы, а не заранее сформированные формы букв, поэтому для отображения требуется обработка формирования. Он не включает дополнительные буквы, необходимые для написания большинства языков с арабской графикой, кроме самого арабского языка (таких как персидский, урду и т. д.).

ISO-8859-6 — это предпочтительное имя кодировки IANA для этого стандарта, дополненное управляющими кодами C0 и C1 из ISO/IEC 6429 . Текст расположен в логическом порядке, поэтому двунаправленного текста для отображения требуется обработка . Номинально ISO-8859-6 ( кодовая страница 28596 ) предназначен для «визуального порядка», а ISO-8859-6-I ( кодовая страница 38596 ) — для логического порядка. Но на практике ISO-8859-6 , необходимый для документов HTML и XML, также обозначает текст в логическом порядке. Существует также ISO-8859-6-E , который предположительно требует явного указания направления с помощью специальных управляющих символов; этот последний вариант на практике не используется. IBM присвоила кодовую страницу/ CCSID 1089 ISO 8859-6. [2] [3] Это эмуляция их операционной системы AIX .

ISO-8859-6 технологически устарел , [4] и Unicode предпочтителен в современных приложениях, особенно в Интернете; означает доминирующую кодировку UTF-8 для веб-страниц (см. также арабский алфавит в Unicode для полного описания, в отличие, например, от ISO-8859-6 или Windows 1256, которые не охватывают дополнительные возможности). Менее 0,0002% всех веб-страниц используют ISO-8859-6. [5] [6] и это даже не третий по популярности вариант кодировки арабского языка в Интернете.

История [ править ]

ASMO 708 был разработан ныне несуществующей Арабской организацией по стандартизации и метрологии. [7] в 1986 году стал 8-битным стандартом, который будет использоваться в арабоязычных странах. Дизайн этого набора символов был вдохновлен предыдущим 7-битным стандартом — ASMO 449 — но это не просто 7-битный набор символов, перенесенный в верхнюю часть; есть некоторые различия.

ASMO 708 — это двунаправленный набор символов. Нижняя часть набора символов отличается от стандарта ISO 646 цифрами и некоторыми знаками препинания. В зависимости от контекста (независимо от того, написаны ли числа латинским или арабским шрифтом), цифры отображаются либо как латинские цифры, либо как арабские цифры. Кроме того, в зависимости от контекста симметричные знаки препинания меняются местами, т. е. всякий раз, когда есть открывающий знак препинания, форма отображается по-разному в зависимости от направления текста.

Верхняя часть набора символов содержит только арабские буквы, арабскую пунктуацию, отличную от латинской, а также несколько других символов.

ASMO 708 был разработан в тесном сотрудничестве [8] с ECMA , которая приняла его в качестве собственного стандарта ECMA-114 в 1986 году. Он также был утвержден в качестве стандарта ISO как ISO 8859-6 . [9] Он также был зарегистрирован в Международном реестре наборов кодированных символов как IR 127. [10] в 1986 году.

Связь с другими наборами символов [ править ]

Некоторые другие наборы символов связаны с ASMO 708:

  • ASMO 708/Французский 1 [11] добавляет французские строчные буквы;
  • Французский 1/АСМО 708 [11] добавляет французские строчные буквы в их кодовые точки ISO 8859-1 и перемещает арабские символы;
  • ИСО/ИК 167 [12] добавляет французские и немецкие символы;
  • Microsoft Кодовая страница 708 для MS-DOS добавляет французские символы в их типичные кодовые точки из кодовой страницы 437 и добавляет символы рисования прямоугольников;
  • И кодовая страница Microsoft 710 (прозрачный арабский язык), и кодовая страница Microsoft 720 (прозрачный ASMO) для MS-DOS добавляют французские символы в их типичные кодовые точки из кодовой страницы 437, но перемещают арабские символы, чтобы разрешить символы рисования прямоугольников из кода. страница 437 должна иметь исходные кодовые точки;
  • Microsoft Windows 1256 добавляет французские строчные буквы в Windows 1252 кодовые точки и удаляет арабские символы;

Таблица кодов [ править ]

ИСО/МЭК 8859-6 [13] [14] [15] [16]
0 1 2 3 4 5 6 7 8 9 А Б С Д И Ф
0x
1x
2x  СП  ! " # $ % / ٪ & ' ( ) * / ٭ + , - . /
3x 0/٠ 1/١ 2/٢ 3/٣ 4/٤ 5/٥ 6/٦ 7/٧ 8/٨ 9/٩ : ; < = > ?
4x @ А Б С Д И Ф Г ЧАС я Дж К л М Н ТО
5x П вопрос Р С Т В V В Х И С [ \ ] ^ _
6x ` а б с д и ж г час я дж к л м н тот
7x п д р с т в v В х и С { | } ~
8x
9x
Топор НБСП ¤ ، ЗАСТЕНЧИВЫЙ
Бх ؛ ؟
Сх А ну давай же А был Э Э А для Э Т че С ЧАС Х принадлежащий
Дх З Р З вопрос Ш п З я З А г
Бывший ـ Ф вопрос твой к М Н е и ى Да ◌ً ◌ٌ ◌ٍ ◌َ ◌ُ
Форекс ◌ِ ◌ّ ◌ْ

Кодовые значения 0xEB–0xF2 присваиваются комбинированным символам .

См. также [ править ]

Ссылки [ править ]

  1. ^ Наборы символов , Управление по присвоению номеров в Интернете (IANA), 12 декабря 2018 г.
  2. ^ «Информационный документ с кодовой страницей 1089» . Архивировано из оригинала 17 марта 2016 г.
  3. ^ «Информационный документ CCSID 1089» . Архивировано из оригинала 27 марта 2016 г.
  4. ^ Вычисления и Коран - Некоторые предостережения, 2007, Томас Майло
  5. ^ «Статистика использования ISO-8859-6 для веб-сайтов, октябрь 2022 г.» . w3techs.com . Проверено 25 октября 2022 г.
  6. ^ «Часто задаваемые вопросы» .
  7. ^ Компьютерное кодирование арабского письма: от ASMO 449 до Unicode и ISO/IEC 10646.
  8. ^ Стандарт ECMA-114
  9. ^ ИСО/МЭК 8859-6:1999.
  10. ^ Европейская ассоциация производителей компьютеров , Арабская организация по стандартизации и метрологии (30 ноября 1986 г.). Правая часть латинского/арабского алфавита (PDF) . ITSCJ/ IPSJ . ИСО-ИК -127.
  11. ^ Jump up to: Перейти обратно: а б Справочное руководство программиста эмуляции Printronix ACA
  12. ^ Европейская ассоциация производителей компьютеров (12 июля 1992 г.). Набор на арабском, французском и немецком языках (PDF) . ITSCJ/ IPSJ . ИСО-ИК -167.
  13. ^ «ISO 8859-6:1999 в Юникод» . 27 июля 1999 г.
  14. ^ Кодовая страница CPGID 01089 (pdf) (PDF) , IBM
  15. ^ Кодовая страница CPGID 01089 (txt) , IBM
  16. ^ Международные компоненты для Unicode (ICU), ibm-1089_P100-1995.ucm , 3 декабря 2002 г.

Внешние ссылки [ править ]

  • ИСО/МЭК 8859-6:1999
  • Стандарт ECMA-114 : наборы 8-битных однобайтовых графических символов - латинский/арабский алфавит, 2-е издание (декабрь 2000 г.)
  • ISO-IR 127 Правая часть латинского/арабского алфавита (30 ноября 1986 г.)
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 07a7ad73e6607a80fea6e3c3e3f353d0__1716487260
URL1:https://arc.ask3.ru/arc/aa/07/d0/07a7ad73e6607a80fea6e3c3e3f353d0.html
Заголовок, (Title) документа по адресу, URL1:
ISO/IEC 8859-6 - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)