ИСО/МЭК 8859-9

Из Википедии, бесплатной энциклопедии
ИСО/МЭК 8859-9
МИМ / IANA ИСО-8859-9
Псевдоним(а) iso-ir-148, latin5, l5, csISOLatin5 [1]
Стандартный ТС 5881, ECMA-128, ISO/IEC 8859
Классификация ISO 8859 ( расширенный ASCII , ISO 4873 уровень 1)
Расширяет США-ASCII
На основе ИСО/МЭК 8859-1
Предшествует ИСО/МЭК 8859-3
Другая связанная кодировка(и) Windows-1254

ISO/IEC 8859-9:1999 , Информационные технологии. 8-битные однобайтовые наборы графических символов. Часть 9. Латинский алфавит № 5 , является частью серии ISO/IEC 8859 на основе ASCII стандартных кодировок символов , сначала издание, опубликованное в 1989 году. Оно обозначено ECMA-128 от Ecma International и TS 5881 как турецкий стандарт. [2] Его неофициально называют Latin-5 или турецким . Он был разработан для турецкого языка (и подавляющее большинство пользователей используют его для этого языка, хотя он также может использоваться для некоторых других языков) и был разработан как более полезный, чем кодировка ISO/IEC 8859-3 . Он идентичен ISO/IEC 8859-1, за исключением замены шести исландских символов ( Ð ð, Ý ý, Þ þ) символами, уникальными для турецкого алфавита ( Ğ ğ, İ , ı , Ş ş). И заглавная буква i İ ; строчная буква I ı .

ISO-8859-9 — это предпочтительное имя кодировки IANA для этого стандарта, дополненное управляющими кодами C0 и C1 из ISO/IEC 6429 . В современных приложениях Unicode и UTF-8 предпочтение отдается ; авторам новых веб-страниц и разработчикам новых протоколов рекомендуется использовать вместо этого UTF-8 . [3] С 2023 года менее 0,05% всех веб-страниц используют ISO-8859-9. [4] [5] в то время как 2,1% веб-страниц, расположенных в Турции, заявляют об использовании ISO-8859-9. [6] Однако стандарт кодирования WHATWG , определяющий кодировки символов, разрешенные в HTML5 и которые должны поддерживать совместимые браузеры, [7] требует, чтобы веб-страницы, отмеченные как ISO-8859-9, обрабатывались как Windows-1254 , [3] который отличается от ISO-8859-9 тем, что вместо него используется диапазон CR , который ISO-8859-9 резервирует для управляющих кодов C1 для дополнительных графических символов (аналогично взаимосвязи между ISO-8859-1 и Windows-1252 ).

Microsoft присвоила кодовую страницу 28599, также известную как Windows-28599, коду ISO-8859-9 в Windows. IBM присвоила кодовую страницу 920 ( CCSID 920) ISO-8859-9. [8] [9] Он опубликован Ecma International как ECMA-128 . [10]

Макет кодовой страницы [ править ]

В отличие от ISO-8859-1 номер кодовой точки Юникода находится под символом.

ИСО/МЭК 8859-9 [11] [12] [13]
0 1 2 3 4 5 6 7 8 9 А Б С Д И Ф
0x
1x
2x  СП   ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ А Б С Д И Ф г ЧАС я Дж К л М Н О
5x п вопрос р С Т В V В Икс И С [ \ ] ^ _
6x ` а б с д Это ж г час я дж к л м н О
7x п д р с т в v В Икс и С { | } ~
8x
9x
Топор НБСП ¡ ¢ £ ¤ ¥ ¦ § ¨ © й « ¬ ЗАСТЕНЧИВЫЙ ® ¯
Бх ° ± ² ³ ´ м · ¸ ¹ й » ¼ ½ ¾ ¿
Сх ИМЕЕТ На Â Ã Ä Ой Ой Что И И Э Э Я В вопрос Я
Дх Г
011E
С Ò Ой ЗОНТИК ОН ОН × Ø Ù О И О Я
0130
С
015E
SS
Бывший имеет на â ã ä к ой Что И Это ага е я в вопрос я
Форекс г
011F
н ò от Зонтик Он он ÷ ø ты ты и ты я
0131
с
015F
ÿ

См. также [ править ]

Ссылки [ править ]

  1. ^ Наборы символов , Управление по присвоению номеров в Интернете (IANA), 12 декабря 2018 г.
  2. ^ «Latin-5: список CCSID клиентов и серверов Latin-5, включая Турцию» . ИБМ . Архивировано из оригинала 13 февраля 2022 г.
  3. ^ Перейти обратно: а б ван Кестерен, Энн . «Имена и ярлыки» . Стандарт кодирования . ЧТОРГ .
  4. ^ «Исторические тенденции использования кодировок символов для веб-сайтов» . w3techs.com .
  5. ^ "Часто задаваемые вопросы" . w3techs.com .
  6. ^ «Распространение кодировок символов среди веб-сайтов, использующих Турцию» . w3techs.com .
  7. ^ «8.2.2.3. Кодировки символов» . HTML 5.1, 2-е издание . W3C . Пользовательские агенты должны поддерживать кодировки, определенные в стандарте кодирования WHATWG, включая, помимо прочего, […]
  8. ^ «Информационный документ с кодовой страницей 920» . Архивировано из оригинала 16 января 2017 г.
  9. ^ «Информационный документ CCSID 920» . Архивировано из оригинала 27 марта 2016 г.
  10. ^ Стандарт ECMA-128: наборы 8-битных однобайтовых графических символов - латинский алфавит № 5 (2-е изд.). 1999. Эта публикация Ecma также одобрена как ISO 8859-9.
  11. ^ Кодовая страница CPGID 00920 (pdf) (PDF) , IBM
  12. ^ Кодовая страница CPGID 00920 (txt) , IBM
  13. ^ Международные компоненты для Unicode (ICU), ibm-920_P100-1995.ucm , 3 декабря 2002 г.

Внешние ссылки [ править ]

  • ИСО/МЭК 8859-9:1999
  • Стандарт ECMA-128 : наборы 8-битных однобайтовых графических символов - латинский алфавит № 5, 2-е издание (декабрь 1999 г.)
  • ISO-IR 148 Правая часть латинского алфавита № 5 (1 октября 1988 г.)