Windows-1251
МИМ / IANA | окна-1251 |
---|---|
Псевдоним(а) | cp1251 ( Кодовая страница 1251) |
Язык(и) | Русский , украинский , белорусский , болгарский , сербская кириллица , боснийская кириллица , македонский , ротокас , русинский , английский |
Создано | Майкрософт |
Стандартный | WHATWG Стандарт кодирования |
Классификация | расширенный ASCII , Windows-125x |
Другая связанная кодировка(и) | Амига-1251 , КЗ-1048 , RFC 1345 "ECMA-кириллица" |
Windows-1251 — это 8-битная кодировка символов , предназначенная для языков, использующих кириллицу , таких как русский , украинский , белорусский , болгарский , сербская кириллица , македонский и другие языки.
В Интернете это вторая по популярности однобайтовая кодировка символов (или третья по популярности кодировка символов в целом) и наиболее часто используемая из однобайтовых кодировок, поддерживающих кириллицу. По состоянию на январь 2024 г. [update]0,3% всех веб-сайтов используют Windows-1251. [1] [2] В основном он используется для русского языка, хотя его использует небольшое количество русских веб-сайтов: 94,6% русских (.ru) веб-сайтов используют UTF-8 . [3] [4] [5] а устаревшая 8-битная кодировка занимает второе место. В Linux кодировка известна как cp1251. [6] IBM использует кодовую страницу 1251 ( CCSID 1251 и расширенный CCSID 5347 со знаком евро ) для Windows-1251. [7] [8] [9] [10] [11] [12] [13]
Windows-1251 и KOI8-R (или его украинский вариант KOI8-U ) используются гораздо чаще, чем ISO 8859-5 (который используется менее чем на 0,0004% веб-сайтов). [14] В отличие от Windows-1252 и ISO 8859-1 , Windows-1251 не имеет тесного отношения к ISO 8859-5.
Юникод (например, UTF-8) предпочтительнее Windows-1251 или других кодировок кириллицы в современных приложениях, особенно в Интернете, что делает UTF-8 доминирующей кодировкой для веб-страниц. (Для дальнейшего обсуждения полного покрытия Unicode, 436 кириллических букв/кодовых точек, включая старую кириллицу , и того, как однобайтовые кодировки символов, такие как Windows-1251 и KOI8-R , не могут этого обеспечить, см. раздел «Кириллица в Unicode» . )
Набор символов
[ редактировать ]В следующей таблице показана Windows-1251. Каждый символ отображается со своим эквивалентом в Юникоде и альтернативным кодом .
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
0x | НУЛЕВОЙ | СОХ | СТХ | И Т. Д | EOT | ENQ | ПОДТВЕРЖДЕНИЕ | БЕЛ | БС | ХТ | НЧ | ВТ | ФФ | ЧР | ТАК | И |
1x | ДЛЕ | DC1 | DC2 | DC3 | DC4 | ХОТЕТЬ | СИН | ЭТБ | МОЖЕТ | В | СУБ | ЭКУ | ФС | GS | РС | НАС |
2x | СП | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | А | Б | С | Д | И | Ф | Г | ЧАС | я | Дж | К | л | М | Н | ТО |
5x | П | вопрос | Р | С | Т | В | V | В | Х | И | С | [ | \ | ] | ^ | _ |
6x | ` | а | б | с | д | и | ж | г | час | я | дж | к | л | м | н | тот |
7x | п | д | р | с | т | в | v | В | х | и | С | { | | | } | ~ | ПРИНАДЛЕЖАЩИЙ |
8x | Đ | Ф | ‚ | ж | „ | … | † | ‡ | € | ‰ | ЖЖ | ‹ | Нью-Джерси | К | Ć | Дж |
9x | д | ‘ | ’ | “ | ” | • | – | — | ™ | жж | › | Нью-Джерси | д | час | дж | |
Топор | НБСП | В | в | Дж | ¤ | Г | ¦ | § | Или | © | Есть | « | ¬ | ЗАСТЕНЧИВЫЙ | ® | Ей |
Бх | ° | ± | я | и | ґ | м | ¶ | · | или | № | есть | » | дж | С | дж | е |
Сх | А | Б | В | Г | Д | Хорошо | Же | С | И | И | К | л | М | Н | О | П |
Дх | Р | С | Т | У | Ф | Х | Ц | Ч | Ш | Щ | Ъ | Да | Ь | Э | Ю | Я |
Бывший | а | б | в | г | д | является | же | с | и | и | к | л | м | н | о | п |
Форекс | р | с | т | у | ф | х | час | час | ш | щ | ъ | й | ь | э | ю | я |
Kazakh variants
[ редактировать ]Измененная версия Windows-1251 была стандартизирована в Казахстане как казахский стандарт STRK1048 и известна под лейблом KZ-1048
. Он отличается строками, показанными ниже:
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
8x | Đ | Ф | ‚ | ж | „ | … | † | ‡ | € | ‰ | ЖЖ | ‹ | Нью-Джерси | К | ЧАС | Дж |
9x | д | ‘ | ’ | “ | ” | • | – | — | ™ | жж | › | Нью-Джерси | к | и т. д. | дж | |
Топор | НБСП | Н | ты | А | ¤ | О | ¦ | § | Или | © | Г | « | ¬ | ЗАСТЕНЧИВЫЙ | ® | Да |
Бх | ° | ± | я | и | о | м | ¶ | · | или | № | час | » | но | Н | из | й |
Кодовая страница 1174 — это еще один вариант, созданный для казахского языка , который соответствует Windows-1251 для русского подмножества кириллических букв. Отличается от КЗ-1048 перемещением кириллической буквы Шха с 8Е/9Е на 8А/9А.
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
8x | Đ | Ф | ‚ | ж | „ | … | † | ‡ | € | ‰ | ЧАС | ‹ | Нью-Джерси | К | Ć | Дж |
9x | д | ‘ | ’ | “ | ” | • | – | — | ™ | и т. д. | › | Нью-Джерси | к | час | дж | |
Топор | НБСП | Н | ты | А | ¤ | О | ¦ | § | Или | © | Г | « | ¬ | ЗАСТЕНЧИВЫЙ | ® | Да |
Бх | ° | ± | я | и | о | м | ¶ | · | или | № | час | » | но | Н | из | й |
Амига вариант
[ редактировать ]МИМ / IANA | Амига-1251 |
---|---|
Псевдоним(а) | Ами1251 |
Язык(и) | английский , русский |
Классификация | расширенный ASCII |
На основе | Windows-1251, ISO-8859-1 , ISO-8859-15 |
В российских системах ОС Amiga использовалась версия кодовой страницы 1251, которая соответствует Windows-1251 для русского подмножества кириллических букв, но в остальном в основном соответствует ISO-8859-1 . Эта версия известна как Amiga-1251 . [18] под каким именем он зарегистрирован в IANA . [19]
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
8x | ХХХ | ХХХ | ДГПЖ | НБХ | В | В | ССА | ЧТО | ХТС | ХТДЖ | СУДС | ПЛД | БОЛЕЕ | РИ | СС2 | СС3 |
9x | DCS | ПУ1 | ПУ2 | СТС | КСН | МВт | СПА | Агентство по охране окружающей среды | SOS | ХХХ | SCI | CSI | СТ | ОСК | ПМ | БТР |
Топор | НБСП | ¡ | ¢ | £ | € [а] | ¥ | ¦ | § | Или | © | № [б] | « | ¬ | ЗАСТЕНЧИВЫЙ | ® | ¯ |
Бх | ° | ± | ² | ³ | ´ | м | ¶ | · | или | ¹ | й | » | ¼ | ½ | ¾ | ¿ |
- ^ Соответствует ISO-8859-15 ; в другом месте, чем в Windows-1251
- ^ Присутствует в Windows-1251, но в другом месте (отсутствует в ISO-8859-1/15).
Ссылки
[ редактировать ]См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ «Исторические тенденции использования кодировок символов, январь 2024 года» . Проверено 1 января 2024 г.
- ^ «Часто задаваемые вопросы» .
- ^ «Распространение кодировок символов среди сайтов, использующих домен .ru» . w3techs.com . Проверено 1 января 2024 г.
- ^ «Распространение кодировок символов среди сайтов, использующих русский язык» . w3techs.com . Проверено 16 января 2023 г.
- ^ «Распространение кодировок символов среди сайтов, использующих Российскую Федерацию» . w3techs.com . Проверено 5 ноября 2021 г.
- ^ «cp1251(7) — страница руководства Linux» . man7.org . Проверено 1 июля 2018 г.
- ^ «Информационный документ с кодовой страницей 1251» . Архивировано из оригинала 3 марта 2016 г.
- ^ «Информационный документ CCSID 1251» . Архивировано из оригинала 29 ноября 2014 г.
- ^ «Информационный документ CCSID 5347» . Архивировано из оригинала 29 ноября 2014 г.
- ^ Кодовая страница CPGID 01251 (pdf) (PDF) , IBM
- ^ Кодовая страница CPGID 01251 (txt) , IBM
- ^ Международные компоненты для Unicode (ICU), ibm-1251_P100-1995.ucm , 3 декабря 2002 г.
- ^ Международные компоненты для Unicode (ICU), ibm-5347_P100-1998.ucm , 3 декабря 2002 г.
- ^ «Статистика использования кодировок символов на веб-сайтах» . w3techs.com . Архивировано из оригинала 30 мая 2012 г.
- ^ Стил, Шон (1998). CP1251 в таблицу Юникода . Консорциум Юникод . CP1251.TXT.
- ^ Уистлер, Кен (2007). KZ-1048 в Юникод . Консорциум Юникод . KZ1048.TXT.
- ^ IBM-1174_X100-2007.ucm , IBM
- ^ Перейти обратно: а б Малышев, Михаил (2003). «Таблица Amiga-1251 в Unicode». Регистрация новой кодировки [Amiga-1251] . ИАНА.
- ^ «Наборы символов» . ИАНА.
Дальнейшее чтение
[ редактировать ]- Корнаи, Андрас; Бирнбаум, Дэвид Дж.; да Круз, Фрэнк; Дэвис, Бер; Фаулер, Джордж; Пейн, Ричард Б.; Паперно, Слава; Симонсен, Келд Дж.; Тобе, Гленн Э.; Вулис, Дмитрий; ван Винген, Йохан В. (13 марта 1993 г.). «Часто задаваемые вопросы по КИРИЛЛИЧЕСКОЙ КОДИРОВКЕ Версия 1.3» . Проверено 24 июня 2020 г.
Внешние ссылки
[ редактировать ]- Справочная таблица Windows 1251
- Регистрация имени кодировки IANA
- Сопоставления Unicode для Windows 1251 с «наилучшим соответствием»
- Универсальный декодер кириллицы — онлайн-программа, которая может помочь восстановить нечитаемые кириллические тексты с неработающими кодировками Windows-1251 или другими символами .