Windows-1254
МИМ / IANA | окна-1254 |
---|---|
Псевдоним(а) | cp1254 ( Кодовая страница 1254) |
Язык(и) | турецкий |
Создано | Майкрософт |
Стандартный | WHATWG Стандарт кодирования |
Классификация | расширенный ASCII , Windows-125x |
Расширяет | ISO 8859-9 (без однобайтовых элементов управления C1) |
Windows-1254 — это кодовая страница , используемая в Microsoft Windows (и в Интернете) для написания турецкого языка , для которого она была разработана (и подавляющее большинство пользователей используют ее для этого языка, хотя ее также можно использовать для некоторых других языков). ). Символы с кодовыми точками от A0 до FF совместимы с ISO 8859-9 , но диапазон CR , который зарезервирован для управляющих кодов C1 в ISO 8859, вместо этого используется для дополнительных символов (аналогично взаимосвязи между ISO-8859-1 и Windows- 1252 ). Он соответствует Windows-1252, за исключением замены шести исландских символов ( Ð ð, Ý ý, Þ þ) на символы, уникальные для турецкого алфавита ( Ğ ğ, İ , ı , Ş ş).
Стандарт кодирования WHATWG , определяющий кодировки символов, разрешенные в HTML5 и которые должны поддерживать совместимые браузеры. [1] включает Windows-1254, которая используется как для этикеток Windows-1254, так и для этикеток ISO-8859-9. [2] [3] Юникод предпочтителен для современных приложений; авторам новых страниц и разработчикам новых протоколов рекомендуется использовать вместо этого UTF-8 . [2] По состоянию на 2023 год [update], менее 0,05% всех веб-страниц используют Windows-1254 и менее 0,05% используют ISO-8859-9, [4] [5] который WHATWG также требует, чтобы веб-браузеры обрабатывали его как Windows-1254. [2] Поскольку 2,2% всех веб-сайтов, расположенных в Турции, используют ISO-8859-9 плюс 1,3%, которые фактически заявляют об использовании Windows-1254, по сути, 3,5% веб-сайтов там используют Windows-1254. [6]
IBM использует кодовую страницу 1254 ( CCSID 1254 и расширенный CCSID 5350 со знаком евро ) для Windows-1254. [7] [8] [9]
Набор символов
[ редактировать ]В следующей таблице показана Windows-1254. Каждый символ отображается с его эквивалентом в Юникоде .
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
0x | НУЛЕВОЙ | СОХ | СТХ | И Т. Д | EOT | ENQ | ПОДТВЕРЖДЕНИЕ | БЕЛ | БС | ХТ | НЧ | ВТ | ФФ | ЧР | ТАК | И |
1x | В СООТВЕТСТВИИ С | DC1 | DC2 | DC3 | DC4 | ХОТЕТЬ | СИН | ЭТБ | МОЖЕТ | В | СУБ | ЭКУ | ФС | GS | РС | НАС |
2x | СП | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | А | Б | С | Д | И | Ф | Г | ЧАС | я | Дж | К | л | М | Н | ТО |
5x | П | вопрос | Р | С | Т | В | V | В | Х | И | С | [ | \ | ] | ^ | _ |
6x | ` | а | б | с | д | и | ж | г | час | я | дж | к | л | м | н | тот |
7x | п | д | р | с | т | в | v | В | х | и | С | { | | | } | ~ | ПРИНАДЛЕЖАЩИЙ |
8x | € | ‚ | ƒ | „ | … | † | ‡ | ˆ | ‰ | С | ‹ | О | ||||
9x | ‘ | ’ | “ | ” | • | – | — | ˜ | ™ | с | › | œ | Ÿ | |||
Топор | НБСП | ¡ | ¢ | £ | ¤ | ¥ | ¦ | § | ¨ | © | й | « | ¬ | ЗАСТЕНЧИВЫЙ | ® | ¯ |
Бх | ° | ± | ² | ³ | ´ | м | ¶ | · | ¸ | ¹ | й | » | ¼ | ½ | ¾ | ¿ |
Сх | ИМЕЕТ | На | Â | Ã | Ä | Ой | Ой | Что | И | И | Э | Э | Я | В | вопрос | Я |
Дх | Ğ | С | Ò | Ой | ЗОНТИК | ОН | ОН | × | Ø | Ù | О | И | О | Я | Ш | SS |
Бывший | имеет | на | â | ã | ä | к | ой | Что | И | и | ага | ага | я | в | вопрос | я |
Форекс | г | н | ò | от | Зонтик | он | он | ÷ | ø | ты | ты | и | ты | я | ш | ÿ |
См. также
[ редактировать ]- Латиница в Юникоде
- ЛМБКС-8
- Юникод
- Универсальный набор символов
- UTF-8
- Наборы символов западной латиницы (вычисления)
- Windows-1250
- Кодовые страницы Windows
- ИСО/МЭК ОТК 1/ПК 2
Ссылки
[ редактировать ]- ^ «8.2.2.3. Кодировки символов» . HTML 5.1, 2-е издание . W3C .
Пользовательские агенты должны поддерживать кодировки, определенные в стандарте кодирования WHATWG, включая, помимо прочего, […]
- ^ Jump up to: а б с ван Кестерен, Энн . «Имена и ярлыки» . Стандарт кодирования . ЧТОРГ .
- ^ ван Кестерен, Энн . «Устаревшие однобайтовые кодировки» . Стандарт кодирования . ЧТОРГ .
- ^ «Исторические тенденции использования кодировок символов для веб-сайтов» . w3techs.com .
- ^ «Часто задаваемые вопросы» . w3techs.com .
- ^ «Распространение кодировок символов среди веб-сайтов, использующих Турцию» . w3techs.com . Проверено 23 февраля 2023 г.
- ^ «Информационный документ с кодовой страницей 1254» . Архивировано из оригинала 3 марта 2016 г.
- ^ «Информационный документ CCSID 1254» . Архивировано из оригинала 26 марта 2016 г.
- ^ «Информационный документ CCSID 5350» . Архивировано из оригинала 29 ноября 2014 г.
- ^ Таблица сопоставления Юникода для Windows 1254
- ^ Сопоставления Unicode для Windows 1254 с «наилучшим соответствием»
- ^ Кодовая страница CPGID 01254 (pdf) (PDF) , IBM
- ^ Кодовая страница CPGID 01254 (txt) , IBM
- ^ Международные компоненты для Unicode (ICU), ibm-1254_P100-1995.ucm , 3 декабря 2002 г.
- ^ Международные компоненты для Unicode (ICU), ibm-5350_P100-1998.ucm , 3 декабря 2002 г.