ИСО/МЭК 8859-9
МИМ / IANA | ИСО-8859-9 |
---|---|
Псевдоним(а) | iso-ir-148, latin5, l5, csISOLatin5 [1] |
Стандартный | ТС 5881, ECMA-128, ISO/IEC 8859 |
Классификация | ISO 8859 ( расширенный ASCII , ISO 4873 уровень 1) |
Расширяет | США-ASCII |
На основе | ИСО/МЭК 8859-1 |
Предшественник | ИСО/МЭК 8859-3 |
Другая связанная кодировка(и) | Windows-1254 |
ISO/IEC 8859-9:1999 , Информационные технологии. 8-битные однобайтовые наборы графических символов. Часть 9. Латинский алфавит № 5 , является частью серии ISO/IEC 8859 на основе ASCII стандартных кодировок символов , сначала издание, опубликованное в 1989 году. Оно имеет обозначение ECMA-128 от Ecma International и TS 5881 в качестве турецкого стандарта. [2] Его неофициально называют Latin-5 или турецким . Он был разработан для турецкого языка (и подавляющее большинство пользователей используют его для этого языка, хотя он также может использоваться для некоторых других языков) и был разработан как более полезный, чем кодировка ISO/IEC 8859-3 . Он идентичен ISO/IEC 8859-1, за исключением замены шести исландских символов ( Ð ð, Ý ý, Þ þ) символами, уникальными для турецкого алфавита ( Ğ ğ, İ , ı , Ş ş). И заглавная буква i — İ ; строчная буква I — ı .
ISO-8859-9 — это предпочтительное имя кодировки IANA для этого стандарта, дополненное управляющими кодами C0 и C1 из ISO/IEC 6429 . В современных приложениях Unicode и UTF-8 предпочтение отдается ; авторам новых веб-страниц и разработчикам новых протоколов рекомендуется использовать вместо этого UTF-8 . [3] С 2023 года менее 0,05% всех веб-страниц используют ISO-8859-9. [4] [5] в то время как 2,1% веб-страниц, расположенных в Турции, заявляют об использовании ISO-8859-9. [6] Однако стандарт кодирования WHATWG , определяющий кодировки символов, разрешенные в HTML5 и которые должны поддерживать совместимые браузеры, [7] требует, чтобы веб-страницы, отмеченные как ISO-8859-9, обрабатывались как Windows-1254 , [3] который отличается от ISO-8859-9 тем, что вместо него используется диапазон CR , который ISO-8859-9 резервирует для управляющих кодов C1 для дополнительных графических символов (аналогично взаимосвязи между ISO-8859-1 и Windows-1252 ).
Microsoft присвоила кодовую страницу 28599, также известную как Windows-28599, коду ISO-8859-9 в Windows. IBM присвоила кодовую страницу 920 ( CCSID 920) ISO-8859-9. [8] [9] Он опубликован Ecma International как ECMA-128 . [10]
Макет кодовой страницы
[ редактировать ]В отличие от ISO-8859-1 номер кодовой точки Юникода находится под символом.
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
0x | ||||||||||||||||
1x | ||||||||||||||||
2x | СП | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | А | Б | С | Д | И | Ф | Г | ЧАС | я | Дж | К | л | М | Н | ТО |
5x | П | вопрос | Р | С | Т | В | V | В | Х | И | С | [ | \ | ] | ^ | _ |
6x | ` | а | б | с | д | и | ж | г | час | я | дж | к | л | м | н | тот |
7x | п | д | р | с | т | в | v | В | х | и | С | { | | | } | ~ | |
8x | ||||||||||||||||
9x | ||||||||||||||||
Топор | НБСП | ¡ | ¢ | £ | ¤ | ¥ | ¦ | § | ¨ | © | й | « | ¬ | ЗАСТЕНЧИВЫЙ | ® | ¯ |
Бх | ° | ± | ² | ³ | ´ | м | ¶ | · | ¸ | ¹ | й | » | ¼ | ½ | ¾ | ¿ |
Сх | ИМЕЕТ | На | Â | Ã | Ä | Ой | Ой | Что | И | И | Э | Э | Я | В | вопрос | Я |
Дх | Ğ 011E | С | Ò | Ой | ЗОНТИК | ОН | ОН | × | Ø | Ù | О | И | О | Я 0130 | Ш 015E | SS |
Бывший | имеет | на | â | ã | ä | к | ой | Что | И | и | ага | ага | я | в | вопрос | я |
Форекс | г 011F | н | ò | от | Зонтик | он | он | ÷ | ø | ты | ты | и | ты | я 0131 | ш 015F | ÿ |
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Наборы символов , Управление по присвоению номеров в Интернете (IANA), 12 декабря 2018 г.
- ^ «Latin-5: список CCSID клиентов и серверов Latin-5, включая Турцию» . ИБМ . Архивировано из оригинала 13 февраля 2022 г.
- ^ Jump up to: а б ван Кестерен, Энн . «Имена и ярлыки» . Стандарт кодирования . ЧТОРГ .
- ^ «Исторические тенденции использования кодировок символов для веб-сайтов» . w3techs.com .
- ^ «Часто задаваемые вопросы» . w3techs.com .
- ^ «Распространение кодировок символов среди веб-сайтов, использующих Турцию» . w3techs.com .
- ^ «8.2.2.3. Кодировки символов» . HTML 5.1, 2-е издание . W3C .
Пользовательские агенты должны поддерживать кодировки, определенные в стандарте кодирования WHATWG, включая, помимо прочего, […]
- ^ «Информационный документ с кодовой страницей 920» . Архивировано из оригинала 16 января 2017 г.
- ^ «Информационный документ CCSID 920» . Архивировано из оригинала 27 марта 2016 г.
- ^ Стандарт ECMA-128: наборы 8-битных однобайтовых графических символов - латинский алфавит № 5 (2-е изд.). 1999.
Эта публикация Ecma также одобрена как ISO 8859-9.
- ^ Кодовая страница CPGID 00920 (pdf) (PDF) , IBM
- ^ Кодовая страница CPGID 00920 (txt) , IBM
- ^ Международные компоненты для Unicode (ICU), ibm-920_P100-1995.ucm , 3 декабря 2002 г.
Внешние ссылки
[ редактировать ]- ИСО/МЭК 8859-9:1999
- Стандарт ECMA-128 : наборы 8-битных однобайтовых графических символов - латинский алфавит № 5, 2-е издание (декабрь 1999 г.)
- ISO-IR 148 Правая часть латинского алфавита № 5 (1 октября 1988 г.)