Jump to content

Windows-1251

(Перенаправлено с CP1251 )
Windows-1251
МИМ / IANA окна-1251
Псевдоним(а) cp1251 ( Кодовая страница 1251)
Язык(и) Русский , украинский , белорусский , болгарский , сербская кириллица , боснийская кириллица , македонский , ротокас , русинский , английский
Создано Майкрософт
Стандартный WHATWG Стандарт кодирования
Классификация расширенный ASCII , Windows-125x
Другая связанная кодировка(и) Амига-1251 , КЗ-1048 ,
RFC 1345 "ECMA-кириллица"

Windows-1251 — это 8-битная кодировка символов , предназначенная для языков, использующих кириллицу , таких как русский , украинский , белорусский , болгарский , сербская кириллица , македонский и другие языки.

В Интернете это вторая по популярности однобайтовая кодировка символов (или третья по популярности кодировка символов в целом) и наиболее часто используемая из однобайтовых кодировок, поддерживающих кириллицу. По состоянию на январь 2024 г. 0,3% всех веб-сайтов используют Windows-1251. [1] [2] В основном он используется для русского языка, хотя его использует небольшое меньшинство русских веб-сайтов: 94,6% русских (.ru) веб-сайтов используют UTF-8 . [3] [4] [5] а устаревшая 8-битная кодировка занимает второе место. В Linux кодировка известна как cp1251. [6] IBM использует кодовую страницу 1251 ( CCSID 1251 и расширенный CCSID 5347 со знаком евро ) для Windows-1251. [7] [8] [9] [10] [11] [12] [13]

Windows-1251 и KOI8-R (или его украинский вариант KOI8-U ) используются гораздо чаще, чем ISO 8859-5 (который используется менее чем на 0,0004% веб-сайтов). [14] В отличие от Windows-1252 и ISO 8859-1 , Windows-1251 не имеет тесного отношения к ISO 8859-5.

Юникод (например, UTF-8) предпочтительнее Windows-1251 или других кодировок кириллицы в современных приложениях, особенно в Интернете, что делает UTF-8 доминирующей кодировкой для веб-страниц. (Для дальнейшего обсуждения полного покрытия Unicode, 436 кириллических букв/кодовых точек, включая старую кириллицу , и того, как однобайтовые кодировки символов, такие как Windows-1251 и KOI8-R , не могут этого обеспечить, см. Кириллическое письмо в Unicode . )

Набор символов

[ редактировать ]

В следующей таблице показана Windows-1251. Каждый символ отображается со своим эквивалентом в Юникоде и альтернативным кодом .

Windows-1251 [15]
0 1 2 3 4 5 6 7 8 9 А Б С Д И Ф
0x НУЛЕВОЙ СОХ СТХ И Т. Д EOT ENQ ПОДТВЕРЖДЕНИЕ БЕЛ БС ХТ НЧ ВТ ФФ ЧР ТАК И
1x ДЛЕ DC1 DC2 DC3 DC4 ХОТЕТЬ СИН ЭТБ МОЖЕТ В СУБ ЭКУ ФС GS РС НАС
2x  СП  ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ А Б С Д И Ф Г ЧАС я Дж К л М Н ТО
5x П вопрос Р С Т В V В Х И С [ \ ] ^ _
6x ` а б с д и ж г час я дж к л м н тот
7x п д р с т в v В х и С { | } ~ ПРИНАДЛЕЖАЩИЙ
8x Đ Ф ж ЖЖ Нью-Джерси К Ć Дж
9x д жж Нью-Джерси д час дж
Топор НБСП В в Дж ¤ Г ¦ § Или © Есть « ¬ ЗАСТЕНЧИВЫЙ ® Ей
Бх ° ± я и ґ м · или есть » дж С дж е
Сх А Б В Г Д Хорошо Же С И И К л М Н О П
Дх Р С Т У Ф Х Ц Ч Ш Щ Ъ Да Ь Э Ю Я
Бывший а б в г д является же с и и к л м н о п
Форекс р с т у ф х час час ш щ ъ й ь э ю я
  Отличия от Windows-1252

Kazakh variants

[ редактировать ]

Измененная версия Windows-1251 была стандартизирована в Казахстане как казахский стандарт STRK1048 и известна под лейблом KZ-1048. Он отличается строками, показанными ниже:

КЗ-1048 (СТРК1048-2002) [16]
0 1 2 3 4 5 6 7 8 9 А Б С Д И Ф
8x Đ Ф ж ЖЖ Нью-Джерси К ЧАС Дж
9x д жж Нью-Джерси к и т. д. дж
Топор НБСП Н ты А ¤ О ¦ § Или © Г « ¬ ЗАСТЕНЧИВЫЙ ® Да
Бх ° ± я и о м · или час » но Н из й
  Отличия от Windows-1251

Кодовая страница 1174 — это еще один вариант, созданный для казахского языка , который соответствует Windows-1251 для русского подмножества кириллических букв. Отличается от КЗ-1048 перемещением кириллической буквы Шха с 8Е/9Е на 8А/9А.

Кодовая страница 1174 [17]
0 1 2 3 4 5 6 7 8 9 А Б С Д И Ф
8x Đ Ф ж ЧАС Нью-Джерси К Ć Дж
9x д и т. д. Нью-Джерси к час дж
Топор НБСП Н ты А ¤ О ¦ § Или © Г « ¬ ЗАСТЕНЧИВЫЙ ® Да
Бх ° ± я и о м · или час » но Н из й
  Отличие от Windows-1251

Амига вариант

[ редактировать ]
Амига-1251
МИМ / IANA Амига-1251
Псевдоним(а) Ами1251
Язык(и) английский , русский
Классификация расширенный ASCII
На основе Windows-1251, ISO-8859-1 , ISO-8859-15

В российских системах ОС Amiga использовалась версия кодовой страницы 1251, которая соответствует Windows-1251 для русского подмножества кириллических букв, но в остальном в основном соответствует ISO-8859-1 . Эта версия известна как Amiga-1251 . [18] под каким именем он зарегистрирован в IANA . [19]

Амига-1251 [18]
0 1 2 3 4 5 6 7 8 9 А Б С Д И Ф
8x ХХХ ХХХ ДГПЖ НБХ В В ССА ЧТО ХТС ХТДЖ СУДС ПЛД БОЛЕЕ РИ СС2 СС3
9x DCS ПУ1 ПУ2 СТС КСН МВт СПА Агентство по охране окружающей среды SOS ХХХ SCI CSI СТ ОСК ПМ БТР
Топор НБСП ¡ ¢ £ [а] ¥ ¦ § Или © [б] « ¬ ЗАСТЕНЧИВЫЙ ® ¯
Бх ° ± ² ³ ´ м · или ¹ й » ¼ ½ ¾ ¿
  Отличается от Windows-1251 и соответствует ISO-8859-1.
  Отличается как от Windows-1251, так и от ISO-8859-1.
  1. ^ Соответствует ISO-8859-15 ; в другом месте, чем в Windows-1251
  2. ^ Присутствует в Windows-1251, но в другом месте (отсутствует в ISO-8859-1/15).

См. также

[ редактировать ]
  1. ^ «Исторические тенденции использования кодировок символов, январь 2024 года» . Проверено 1 января 2024 г.
  2. ^ «Часто задаваемые вопросы» .
  3. ^ «Распространение кодировок символов среди сайтов, использующих домен .ru» . w3techs.com . Проверено 1 января 2024 г.
  4. ^ «Распространение кодировок символов среди сайтов, использующих русский язык» . w3techs.com . Проверено 16 января 2023 г.
  5. ^ «Распространение кодировок символов среди сайтов, использующих Российскую Федерацию» . w3techs.com . Проверено 5 ноября 2021 г.
  6. ^ «cp1251(7) — страница руководства Linux» . man7.org . Проверено 1 июля 2018 г.
  7. ^ «Информационный документ с кодовой страницей 1251» . Архивировано из оригинала 3 марта 2016 г.
  8. ^ «Информационный документ CCSID 1251» . Архивировано из оригинала 29 ноября 2014 г.
  9. ^ «Информационный документ CCSID 5347» . Архивировано из оригинала 29 ноября 2014 г.
  10. ^ Кодовая страница CPGID 01251 (pdf) (PDF) , IBM
  11. ^ Кодовая страница CPGID 01251 (txt) , IBM
  12. ^ Международные компоненты для Unicode (ICU), ibm-1251_P100-1995.ucm , 3 декабря 2002 г.
  13. ^ Международные компоненты для Unicode (ICU), ibm-5347_P100-1998.ucm , 3 декабря 2002 г.
  14. ^ «Статистика использования кодировок символов на веб-сайтах» . w3techs.com . Архивировано из оригинала 30 мая 2012 г.
  15. ^ Стил, Шон (1998). CP1251 в таблицу Юникода . Консорциум Юникод . CP1251.TXT.
  16. ^ Уистлер, Кен (2007). KZ-1048 в Юникод . Консорциум Юникод . KZ1048.TXT.
  17. ^ IBM-1174_X100-2007.ucm , IBM
  18. ^ Перейти обратно: а б Малышев, Михаил (2003). «Таблица Amiga-1251 в Unicode». Регистрация новой кодировки [Amiga-1251] . ИАНА.
  19. ^ «Наборы символов» . ИАНА.

Дальнейшее чтение

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: b7ee9ee6a97737b65a0844a89828ae5c__1714583340
URL1:https://arc.ask3.ru/arc/aa/b7/5c/b7ee9ee6a97737b65a0844a89828ae5c.html
Заголовок, (Title) документа по адресу, URL1:
Windows-1251 - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)