Кодовая страница Windows
Кодовые страницы Windows — это наборы символов или кодовых страниц (известные как кодировки символов в других операционных системах), используемые в Microsoft Windows с 1980-х и 1990-х годов. Кодовые страницы Windows постепенно вытеснялись, когда в Windows был реализован Unicode . [ нужна ссылка ] хотя они по-прежнему поддерживаются как в Windows, так и на других платформах и по-прежнему применяются при альтернативного кода использовании сочетаний клавиш .
Текущие версии Windows поддерживают Unicode , новые приложения Windows должны использовать Unicode, а не 8-битные кодировки символов. [1]
В системах Windows существует две группы системных кодовых страниц: OEM и собственные кодовые страницы Windows («ANSI»).(ANSI — Американский национальный институт стандартов .) Кодовые страницы в обеих этих группах представляют собой ASCII расширенные кодовые страницы . Дополнительные кодовые страницы поддерживаются стандартными процедурами преобразования Windows, но не используются ни в одном из типов системных кодовых страниц.
Кодовая страница ANSI
[ редактировать ]Псевдоним(а) | ANSI (неправильное название) |
---|---|
Стандартный | Стандарт кодирования WHATWG |
Расширяет | ASCII |
Предшественник | ИСО 8859 |
Преемник | Юникод UTF-16 (в Win32 API) UTF-8 (для файлов) |
Кодовые страницы ANSI (официально называемые «кодовыми страницами Windows»). [2] после того, как Microsoft признала, что прежний термин является неправильным [3] ) используются для собственных приложений, не поддерживающих Юникод (скажем, байтово-ориентированных ), использующих графический интерфейс пользователя в системах Windows. Термин «ANSI» является неправильным, поскольку эти кодовые страницы Windows не соответствуют ни одному стандарту ANSI (Американского национального института стандартов) ; кодовая страница 1252 была основана на раннем проекте ANSI, который стал международным стандартом ISO 8859-1 . [3] что добавляет еще 32 управляющих кода и место для 96 печатных символов. Помимо других отличий, кодовые страницы Windows помещают печатные символы в дополнительное управляющее кодовое пространство, что делает их в лучшем случае неразборчивыми для операционных систем, соответствующих стандартам.)
Большинство устаревших кодовых страниц «ANSI» имеют номера кодовых страниц в формате 125x. Однако 874 (тайский) и восточноазиатские многобайтовые кодовые страницы «ANSI» ( 932 , 936 , 949 , 950 ), все из которых также используются в качестве кодовых страниц OEM, пронумерованы в соответствии с кодировками IBM, ни одна из которых не является идентичны кодировкам Windows (хотя большинство из них похожи). Хотя кодовая страница 1258 также используется в качестве кодовой страницы OEM, она является оригинальной кодировкой Microsoft, а не расширением существующей кодировки. IBM присвоила своим вариантам Microsoft свои собственные номера, они приведены для справки в списках ниже, где это применимо.
Все кодовые страницы Windows 125x, а также 874 и 936 помечены Управлением по присвоению номеров Интернета Windows (IANA) как « номер », хотя «Windows-936» рассматривается как синоним « GBK ». Кодовая страница Windows 932 вместо этого помечается как «Windows-31J». [4]
Кодовые страницы ANSI Windows, и особенно кодовая страница 1252 , были названы так, поскольку они якобы были основаны на проектах, представленных или предназначенных для ANSI. Однако ANSI и ISO не стандартизировали ни одну из этих кодовых страниц. Вместо этого они либо: [3]
- Расширенные наборы стандартных наборов, таких как ISO 8859 и различные национальные стандарты (например, Windows-1252 против ISO-8859-1 ),
- Их основные модификации (делающие их в различной степени несовместимыми, например, Windows-1250 и ISO-8859-2 ).
- Отсутствие параллельного кодирования (например, Windows-1257 против ISO-8859-4 ; ISO-8859-13 был представлен намного позже). Кроме того, Windows-1251 не соответствует ни стандартизированному ISO -8859-5 , ни преобладавшему на тот момент KOI-8 .
Microsoft присвоила около двенадцати типографских и деловых символов (включая, в частности, знак евро , €) в CP1252 кодовым точкам 0x80–0x9F, которые в ISO 8859 присвоены контрольным кодам C1 . Эти присвоения также присутствуют во многих других кодовых страницах ANSI/Windows в тех же кодовых точках. Windows не использовала управляющие коды C1, поэтому это решение не имело прямого влияния на пользователей Windows. Однако, если информация была включена в файл, передаваемый на платформу, соответствующую стандартам, например Unix или MacOS, она была невидимой и потенциально могла нанести ущерб. [ нужна ссылка ]
Кодовая страница OEM
[ редактировать ]Кодовые страницы OEM ( производитель оригинального оборудования ) используются консольными приложениями Win32 и виртуальной DOS и могут считаться пережитком DOS и исходной архитектуры IBM PC . Отдельный набор кодовых страниц был реализован не только из-за совместимости, но и потому, что шрифты оборудования VGA (и его потомков) предполагают кодирование символов рисования линий , совместимых с кодовой страницей 437 . Большинство кодовых страниц OEM имеют много общих кодовых точек, особенно для небуквенных символов, со второй (не ASCII) половиной CP437.
Типичная кодовая страница OEM во второй половине даже приблизительно не похожа ни на одну кодовую страницу ANSI/Windows. Тем не менее, две однобайтовые кодовые страницы фиксированной ширины (874 для тайского языка и 1258 для вьетнамского языка ) и четыре многобайтовые кодовые страницы CJK ( 932 , 936 , 949 , 950 ) используются как кодовые страницы OEM и ANSI. Кодовая страница 1258 использует сочетание диакритических знаков , поскольку вьетнамский язык требует более 128 комбинаций букв и диакритических знаков. В этом отличие от VISCII , который заменяет некоторые управляющие коды C0 (т. е. ASCII).
История
[ редактировать ]Первоначально компьютерные системы и языки системного программирования не делали различия между символами и байтами : для сегментных сценариев, используемых в большинстве стран Африки, Америки, Южной и Юго-Восточной Азии, Ближнего Востока и Европы, символу нужен всего один байт. необходимы два или более байта , но для идеографических наборов, используемых в остальном мире, . Впоследствии это привело к большой путанице. Программное обеспечение и системы Microsoft до линейки Windows NT являются примерами этого, поскольку они используют кодовые страницы OEM и ANSI, которые не делают различий.
С конца 1990-х годов программное обеспечение и системы приняли Юникод в качестве предпочтительного формата хранения; эта тенденция была улучшена благодаря широкому распространению XML , который по умолчанию использует UTF-8 , но также обеспечивает механизм маркировки используемой кодировки. [5] Все текущие продукты Microsoft и интерфейсы прикладных программ внутренне используют Юникод. [ нужна ссылка ] но некоторые приложения продолжают использовать кодировку «локали» компьютера по умолчанию при чтении и записи текстовых данных в файлы или стандартный вывод. [ нужна ссылка ] Таким образом, по-прежнему могут встречаться файлы, которые разборчивы и понятны в одной части мира, но непонятны моджибаке в другой.
UTF-8, UTF-16
[ редактировать ]Microsoft приняла кодировку Unicode (сначала устаревшую UCS-2 , которая тогда была единственной кодировкой Unicode), то есть UTF-16 для всех своих операционных систем, начиная с Windows NT, но дополнительно поддерживает UTF-8 (также известный как CP_UTF8
), начиная с Windows 10 версии 1803 . [6] UTF-16 уникальным образом кодирует все символы Юникода в базовой многоязычной плоскости (BMP) с использованием 16 бит, но остальная часть Юникода (например, смайлы ) кодируется с помощью 32-битного (четырехбайтового) кода, в то время как остальная часть отрасли ( Unix-подобная системах и Интернете), и теперь Microsoft выбрала UTF-8 (который использует один байт для 7-битного набора символов ASCII , два или три байта для других символов в BMP и четыре байта для оставшейся части).
Список
[ редактировать ]Существуют следующие кодовые страницы Windows:
Серия Windows-125x
[ редактировать ]Все эти девять кодовых страниц представляют собой кодировки ASCII расширенные 8-битные SBCS и были разработаны Microsoft для использования в качестве кодовых страниц ANSI в Windows. Они широко известны по зарегистрированным в IANA [7] имена как windows-<number>
, но иногда их называют cp<number>
, «cp» для «кодовой страницы». Все они используются как кодовые страницы ANSI; Windows-1258 также используется в качестве кодовой страницы OEM.
Серия Windows-125x включает девять кодовых страниц ANSI и в основном охватывает сценарии Европы и Западной Азии с добавлением Вьетнама . Системные кодировки для тайского и восточноазиатского языков были пронумерованы, чтобы соответствовать аналогичным кодовым страницам IBM, и используются как кодовые страницы ANSI, так и OEM; они описаны в следующих разделах.
ИДЕНТИФИКАТОР | Описание | Связь с ISO 8859 или другими установленными кодировками. |
---|---|---|
1250 [8] [9] | Латинский 2 / Центральноевропейский | Похож на ISO-8859-2 , но перемещает несколько символов, включая несколько букв. |
1251 [10] [11] | Кириллица | Несовместим как с ISO-8859-5 , так и с KOI-8 . |
1252 [12] [13] | Латинский 1 / Западноевропейский | Расширенный набор ISO-8859-1 (без элементов управления C1). Репертуар букв соответственно аналогичен CP850 . |
1253 [14] [15] | Греческий | Аналогично ISO 8859-7 , но перемещает несколько символов, включая букву. |
1254 [16] [17] | турецкий | Расширенный набор ISO 8859-9 (без элементов управления C1). |
1255 [18] [19] | иврит | Почти расширенный набор ISO 8859-8 , но с двумя несовместимыми изменениями пунктуации. |
1256 [20] [21] | арабский | Несовместимо с ISO 8859-6 ; OEM скорее, кодовая страница 708 представляет собой расширенный набор ISO 8859-6 (ASMO 708). |
1257 [22] [23] | Балтика | Не ISO 8859-4 ; более поздний стандарт ISO 8859-13 тесно связан, но с некоторыми различиями в пунктуации. |
1258 [24] [25] | Вьетнамский (также OEM) | Не связан с VSCII или VISCII , использует меньше базовых символов с комбинированием диакритических знаков. |
Кодовые страницы DOS
[ редактировать ]Они также основаны на ASCII. Большинство из них включены для использования в качестве кодовых страниц OEM; Кодовая страница 874 также используется как кодовая страница ANSI.
- 437 — IBM PC в США, 8-битный SBCS, расширенный ASCII . [26] Известная как OEM-US, кодировка основного встроенного шрифта видеокарт VGA.
- 708 – арабский, расширенный ISO 8859-6 (ASMO 708)
- 720 - арабский язык, сохраняя символы рисунка рамки на своих обычных местах.
- 737 – «MS-DOS Греческий». Сохраняет все символы рисования прямоугольников. Более популярен, чем 869.
- 775 – «MS-DOS Балтийский рубеж»
- 850 – «MS-DOS Latin 1». Полный (переработанный) набор стандартов ISO 8859-1 .
- 852 – «MS-DOS Латиница 2»
- 855 – «MS-DOS Кириллица». В основном используется для южнославянских языков . Включает (переработанный) репертуар ISO-8859-5 . Не путать с cp866.
- 857 – «MS-DOS турецкий»
- 858 - Западноевропейский со знаком евро.
- 860 – «MS-DOS Португальский»
- 861 – «MS-DOS исландский»
- 862 – «MS-DOS Иврит»
- 863 – «MS-DOS Французская Канада»
- 864 – арабский
- 865 – «MS-DOS Северная Европа»
- 866 – «MS-DOS Русская кириллица», cp866. Единственная кодовая страница OEM (а не ANSI или оба), включенная в качестве устаревшей кодировки в стандарт кодирования WHATWG для HTML5 .
- 869 – «MS-DOS Греческий 2», IBM869. Полный (переработанный) набор стандартов ISO 8859-7 .
- 874 — тайский язык , также используемый в качестве кодовой страницы ANSI, расширяет ISO 8859-11 (и, следовательно, TIS-620 ) несколькими дополнительными символами из Windows-1252. Соответствует кодовой странице IBM 1162 (IBM-874 аналогичен, но имеет другие расширения).
Многобайтовые кодовые страницы Восточной Азии
[ редактировать ]Они часто отличаются от кодовых страниц IBM с тем же номером: кодовые страницы 932, 949 и 950 лишь частично соответствуют кодовым страницам IBM с тем же номером, тогда как номер 936 использовался IBM для другой кодировки упрощенного китайского языка, которая сейчас устарела и Windows-951, как часть кладджа , не связана с IBM-951. Эквивалентные кодовые страницы IBM приведены во втором столбце. Кодовые страницы 932, 936, 949 и 950/951 используются как кодовые страницы ANSI и OEM в рассматриваемых локалях.
ИДЕНТИФИКАТОР | Язык | Кодирование | IBM-эквивалент | Отличие от IBM CCSID того же номера | Использовать |
---|---|---|---|---|---|
932 | японский | Shift JIS (вариант Microsoft) | 943 [27] | IBM-932 также является Shift JIS, имеет меньше расширений (но эти расширения у него общие) и заменяет некоторые варианты китайских символов ( itaiji ) для совместимости с более ранними выпусками JIS C 6226 . | ANSI/OEM (Япония) |
936 | Китайский (упрощенный) | ГБК | 1386 | IBM-936 — это другая кодировка упрощенного китайского языка с другим методом кодирования, который устарел с 1993 года. | ANSI/OEM (КНР, Сингапур) |
949 | корейский | Единый кодекс хангыль | 1363 | IBM-949 также является надмножеством EUC-KR , но с другими (конфликтующими) расширениями. | ANSI/OEM (Республика Корея) |
950 | Китайский (традиционный) | Big5 (вариант Microsoft) | 1373 [28] | IBM-950 также является Big5, но включает другое подмножество расширений ETEN, добавляет дополнительные расширения с расширенным диапазоном конечных байтов и не имеет евро. | ANSI/OEM (Тайвань, Гонконг) |
951 | Китайский (традиционный), включая кантонский диалект | Big5-HKSCS (изд. 2001 г.) | 5471 [29] | IBM-951 — это двухбайтовая плоскость от IBM-949 (см. выше), не связанная с внутренним использованием Microsoft числа 951. | ANSI/OEM (Гонконг, 98/NT4/2000/XP с патчем HKSCS) |
Несколько дополнительных многобайтовых кодовых страниц поддерживаются для декодирования или кодирования с использованием библиотек операционной системы, но не используются ни в каком виде системного кодирования ни в одной локали.
ИДЕНТИФИКАТОР | IBM-эквивалент | Язык | Кодирование | Использовать |
---|---|---|---|---|
1361 | - | корейский | Иохав (KS C 5601-1992, приложение 3) | Конверсия |
20000 | - | Китайский (традиционный) | Кодировка CNS 11643. | Конверсия |
20001 | - | Китайский (традиционный) | ТСА | Конверсия |
20002 | - | Китайский (традиционный) | Big5 (вариант ЕДА) | Конверсия |
20003 | 938 | Китайский (традиционный) | ИБМ 5550 | Конверсия |
20004 | - | Китайский (традиционный) | Телетекст | Конверсия |
20005 | - | Китайский (традиционный) | Ван | Конверсия |
20932 | 954 (примерно) | японский | EUC-JP | Конверсия |
20936 | 5479 | Китайский (упрощенный) | ГБ 2312 | Конверсия |
20949 , 51949 | 970 | корейский | Wansung (8-битный с ASCII, т. е. EUC-KR ) [30] | Конверсия |
Кодовые страницы EBCDIC
[ редактировать ]ИДЕНТИФИКАТОР | IBM-эквивалент | Описание |
---|---|---|
37 | Расширенная кодовая страница страны для США, Канады, Нидерландов, Португалии, Бразилии, Австралии, Новой Зеландии. [31] | |
500 | Расширенная кодовая страница страны для Бельгии, Канады и Швейцарии. | |
870 | EBCDIC Латиница-2 | |
875 | EBCDIC греческий | |
1026 | EBCDIC Latin-5 (турецкий) | |
1047 | Расширенная кодовая страница страны для открытых систем ( POSIX ) | |
1140 | Расширенная кодовая страница страны со знаком евро для США, Канады, Нидерландов, Португалии, Бразилии, Австралии, Новой Зеландии. | |
1141 | Расширенная кодовая страница страны с евро-знаком для Австрии и Германии | |
1142 | Расширенная кодовая страница страны с евро-знаком для Дании и Норвегии | |
1143 | Расширенная кодовая страница страны с евро-знаком для Финляндии и Швеции | |
1144 | Расширенная кодовая страница страны со знаком евро для Италии | |
1145 | Расширенная кодовая страница страны с евро-знаком для Испании и Латинской Америки | |
1146 | Расширенная кодовая страница страны со знаком евро для Великобритании | |
1147 | Расширенная кодовая страница страны со знаком евро для Франции | |
1148 | Расширенная кодовая страница страны с евро-знаком для Бельгии, Канады и Швейцарии. | |
1149 | Расширенная кодовая страница страны со знаком евро для Исландии | |
20273 | 273 | Расширенная кодовая страница страны для Германии |
20277 | 277 | Расширенная кодовая страница страны для Дании/Норвегия |
20278 | 278 | Расширенная кодовая страница страны для Финляндии/Швеции |
20280 | 280 | Расширенная кодовая страница страны для Италии |
20284 | 284 | Расширенная кодовая страница страны для Латинской Америки/Испании |
20285 | 285 | Расширенная кодовая страница страны для Великобритании |
20290 | 290 | Японская катакана EBCDIC |
20297 | 297 | Расширенная кодовая страница страны для Франции |
20420 | 420 | EBCDIC арабский |
20423 | 423 | EBCDIC греческий с расширенной латиницей |
20424 | - | x-EBCDIC-КорейскийРасширенный |
20833 | 833 | Корейский EBCDIC для N-байтового хангыля |
20838 | 838 | EBCDIC Тайский |
20871 | 871 | Расширенная кодовая страница страны для Исландии |
20880 | 880 | EBCDIC кириллица ( DKOI ) |
20905 | 905 | EBCDIC Latin-3 (мальтийский, эсперанто и турецкий) |
20924 | 924 | EBCDIC Latin-9 (включая знак евро) для открытых систем ( POSIX ) |
21025 | 1025 | EBCDIC кириллица (DKOI) со знаком раздела |
21027 | (1027) | Японский EBCDIC (неполная реализация кодовой страницы IBM 1027, [32] сейчас устарел) [33] |
Кодовые страницы, связанные с Unicode
[ редактировать ]ИДЕНТИФИКАТОР | IBM-эквивалент | Описание |
---|---|---|
1200 | 1202, 1203 | Юникод (BMP ISO 10646, UTF-16LE ). Доступно только для управляемых приложений . [33] |
1201 | 1200, 1201 | Юникод ( UTF-16BE ). Доступно только для управляемых приложений. [33] |
12000 | 1234, 1235 | UTF-32 . Доступно только для управляемых приложений. [33] |
12001 | 1232, 1233 | UTF-32 . Биг-эндиан. Доступно только для управляемых приложений. [33] |
65000 | - | Юникод ( UTF-7 ) |
65001 | 1208, 1209 | Юникод ( UTF-8 ) |
Кодовые страницы совместимости с Macintosh
[ редактировать ]ИДЕНТИФИКАТОР | IBM-эквивалент | Описание |
---|---|---|
10000 | 1275 | Apple Macintosh Роман |
10001 | - | Apple Macintosh японский |
10002 | - | Apple Macintosh китайский (традиционный) (BIG-5) |
10003 | - | Apple Macintosh Корейский |
10004 | - | Apple Macintosh арабский |
10005 | - | Apple Macintosh Иврит |
10006 | 1280 | Apple Macintosh Греческий |
10007 | 1283 | Apple Macintosh кириллица |
10008 | - | Apple Macintosh китайский (упрощенный) (GB 2312) |
10010 | 1285 | Apple Macintosh Румынский |
10017 | - | Apple Macintosh Украинский |
10021 | - | Apple Macintosh Тайский |
10029 | 1282 | Apple Macintosh Roman II / Центральная Европа |
10079 | 1286 | Apple Macintosh Исландский |
10081 | 1281 | Apple Macintosh турецкий |
10082 | 1284 | Apple Macintosh Хорватский |
Кодовые страницы ISO 8859
[ редактировать ]ИДЕНТИФИКАТОР | IBM-эквивалент | Описание |
---|---|---|
28591 | 819, 5100 | ISO-8859-1 – Латиница-1 |
28592 | 912 | ISO-8859-2 – Латиница-2 |
28593 | 913 | ISO-8859-3 – Latin-3 или южноевропейский |
28594 | 914 | ISO-8859-4 – Latin-4 или Североевропейский |
28595 | 915 | ISO-8859-5 – латиница/кириллица |
28596 | - | ISO-8859-6 – Латинский/арабский язык |
28597 | 813, 4909, 9005 | ISO-8859-7 – латинский/греческий (издание 1987 года, т.е. без знака евро , знака драхмы или нижнего индекса йоты ) [34] |
28598 | - | ISO-8859-8 – латынь/иврит (визуальный порядок; издание 1988 г., т.е. без ЛРМ и РЛМ ) [34] |
28599 | 920 | ISO-8859-9 – латиница-5 или турецкий |
28600 | 919 | ISO-8859-10 – Latin-6 или Nordic |
28601 | - | ISO-8859-11 – латынь/тайский |
28602 | - | ISO-8859-12 – зарезервировано для латыни/деванагари, но заброшено (не поддерживается). |
28603 | 921 | ISO-8859-13 – Латинский-7 или Балтийский регион |
28604 | - | ISO-8859-14 – Латиница-8 или кельтская |
28605 | 923 | ISO-8859-15 – Латиница-9 |
28606 | - | ISO-8859-16 – Latin-10 или Юго-Восточная Европа |
38596 | 1089 | ISO-8859-6- I – латынь/арабский (логический двунаправленный порядок) |
38598 | 916, 5012 | ISO-8859-8- I – латынь/иврит (логический двунаправленный порядок; издание 1988 г., т.е. без ЛРМ и РЛМ ) [34] |
Кодовые страницы МСЭ-Т
[ редактировать ]ИДЕНТИФИКАТОР | IBM-эквивалент | Описание |
---|---|---|
20105 | 1009 | 7-битный IA5 IRV (Западноевропейский) [35] [36] [37] |
20106 | 1011 | 7-битный IA5 немецкий (DIN 66003) [35] [36] [38] |
20107 | 1018 | 7-битный IA5 шведский (SEN 850200 C) [35] [36] [39] |
20108 | 1016 | 7-битный IA5 , норвежский (NS 4551-2) [35] [36] [40] |
20127 | 367 | 7-битный ASCII [35] [36] [41] |
20261 | 1036 | Т.61 (Т.61-8бит) |
20269 | ? | ISO-6937 |
Кодовые страницы КОИ8
[ редактировать ]ИДЕНТИФИКАТОР | IBM-эквивалент | Описание |
---|---|---|
20866 | 878 | Русский — КОИ8-Р |
21866 | 1167, 1168 | Украинский — КОИ8-У (или КОИ8-РУ в некоторых версиях) [42] |
Проблемы, возникающие при использовании кодовых страниц
[ редактировать ]Microsoft настоятельно рекомендует использовать Unicode в современных приложениях, но многие приложения или файлы данных по-прежнему зависят от устаревших кодовых страниц.
- Программам необходимо знать, какую кодовую страницу использовать, чтобы правильно отображать содержимое файлов (до Unicode). Если программа использует неправильную кодовую страницу, она может отображать текст как mojibake .
- Используемая кодовая страница может различаться на разных машинах, поэтому файлы (до Unicode), созданные на одной машине, могут быть нечитаемыми на другой.
- Данные часто неправильно помечены кодовой страницей или не помечены вообще, что затрудняет определение правильной кодовой страницы для чтения данных.
- Эти кодовые страницы Microsoft в разной степени отличаются от некоторых стандартов и реализаций других поставщиков. Это не проблема Microsoft как таковая , как это случается со всеми поставщиками, но отсутствие согласованности в некоторых случаях делает взаимодействие с другими системами ненадежным.
- Использование кодовых страниц ограничивает набор символов, которые можно использовать.
- Символы, выраженные в неподдерживаемой кодовой странице, могут быть преобразованы в вопросительные знаки (?) или другие символы замены или в более простую версию (например, удаление диакритических знаков из буквы). В любом случае исходный персонаж может быть утерян.
См. также
[ редактировать ]- AppLocale — утилита для запуска приложений, не поддерживающих Юникод (на основе кодовых страниц), в языковом стандарте по выбору пользователя.
Ссылки
[ редактировать ]- ^ «Юникод и наборы символов» . Майкрософт. 13 июня 2023 г. Проверено 27 мая 2024 г.
- ^ «Кодовые страницы» . 07.03.2016. Архивировано из оригинала 07 марта 2016 г. Проверено 26 мая 2021 г.
- ^ Перейти обратно: а б с «Словарь терминов, используемых на этом сайте» . 8 декабря 2018 г. Архивировано из оригинала 8 декабря 2018 г.
Термин «ANSI», используемый для обозначения кодовых страниц Windows, является исторической справкой, но в настоящее время это неправильное употребление, которое продолжает сохраняться в сообществе Windows. Причиной этого является тот факт, что кодовая страница Windows 1252 изначально была основана на проекте ANSI, который стал стандартом Международной организации по стандартизации (ISO) 8859-1. «Приложения ANSI» обычно относятся к приложениям, не поддерживающим Юникод или использующим кодовую страницу.
- ^ «Наборы символов» . www.iana.org . Архивировано из оригинала 25 мая 2021 г. Проверено 26 мая 2021 г.
- ^ «Расширяемый язык разметки (XML) 1.1 (второе издание): кодировки символов» . W3C . 29 сентября 2006 г. Архивировано из оригинала 19 апреля 2021 г. Проверено 5 октября 2020 г.
- ^ hylom (14 ноября 2017 г.). «Возможность сделать UTF-8 системной локалью, добавленной в Windows 10 Insider Preview» . Slad (на японском языке). Архивировано из оригинала 11 мая 2018 г. Проверено 05 мая 2018 г. 10 .
- ^ «Наборы символов» . ИАНА. Архивировано из оригинала 3 декабря 2016 г. Проверено 7 апреля 2019 г.
- ^ Майкрософт. «Виндовс 1250» . Архивировано из оригинала 14 июля 2014 г. Проверено 6 июля 2014 г.
- ^ ИБМ. «Информационный документ кодовой страницы SBCS CPGID 01250» . Архивировано из оригинала 14 июля 2014 г. Проверено 6 июля 2014 г.
- ^ Майкрософт. «Виндовс 1251» . Архивировано из оригинала 14 июля 2014 г. Проверено 6 июля 2014 г.
- ^ ИБМ. «Информационный документ кодовой страницы SBCS CPGID 01251» . Архивировано из оригинала 14 июля 2014 г. Проверено 6 июля 2014 г.
- ^ Майкрософт. «Винда 1252» . Архивировано из оригинала 4 мая 2013 г. Проверено 6 июля 2014 г.
- ^ ИБМ. «Информационный документ кодовой страницы SBCS CPGID 01252» . Архивировано из оригинала 14 июля 2014 г. Проверено 6 июля 2014 г.
- ^ Майкрософт. «Виндовс 1253» . Архивировано из оригинала 14 июля 2014 г. Проверено 6 июля 2014 г.
- ^ ИБМ. «Информационный документ кодовой страницы SBCS CPGID 01253» . Архивировано из оригинала 14 июля 2014 г. Проверено 6 июля 2014 г.
- ^ Майкрософт. «Винда 1254» . Архивировано из оригинала 14 июля 2014 г. Проверено 6 июля 2014 г.
- ^ ИБМ. «Информационный документ кодовой страницы SBCS CPGID 01254» . Архивировано из оригинала 14 июля 2014 г. Проверено 6 июля 2014 г.
- ^ Майкрософт. «Виндовс 1255» . Архивировано из оригинала 14 июля 2014 г. Проверено 6 июля 2014 г.
- ^ ИБМ. «Информационный документ о кодовой странице SBCS CPGID 01255» . Архивировано из оригинала 14 июля 2014 г. Проверено 6 июля 2014 г.
- ^ Майкрософт. «Виндовс 1256» . Архивировано из оригинала 14 июля 2014 г. Проверено 6 июля 2014 г.
- ^ ИБМ. «Информационный документ кодовой страницы SBCS CPGID 01256» . Архивировано из оригинала 14 июля 2014 г. Проверено 6 июля 2014 г.
- ^ Майкрософт. «Винда 1257» . Архивировано из оригинала 16 марта 2013 г. Проверено 6 июля 2014 г.
- ^ ИБМ. «Информационный документ кодовой страницы SBCS CPGID 01257» . Архивировано из оригинала 14 июля 2014 г. Проверено 6 июля 2014 г.
- ^ Майкрософт. «Виндовс 1258» . Архивировано из оригинала 25 октября 2013 г. Проверено 6 июля 2014 г.
- ^ ИБМ. «Информационный документ кодовой страницы SBCS CPGID 01258» . Архивировано из оригинала 14 июля 2014 г. Проверено 6 июля 2014 г.
- ^ ИБМ. «Информационный документ о кодовой странице SBCS — CPGID 00437» . Архивировано из оригинала 9 июня 2016 г. Проверено 4 июля 2014 г.
- ^ «ИБМ-943 и IBM-932» . Центр знаний IBM . ИБМ. Архивировано из оригинала 18 августа 2018 г. Проверено 8 июля 2020 г.
- ^ «Проводник конвертеров: IBM-1373_P100-2002» . Демонстрация отделения интенсивной терапии . Международные компоненты для Unicode . Архивировано из оригинала 26 мая 2021 г. Проверено 27 июня 2020 г.
- ^ «Идентификаторы кодированных наборов символов – CCSID 5471» . IBM Глобализация . ИБМ . Архивировано из оригинала 29 ноября 2014 г.
- ^ Джульярд, Александр. «dump_krwansung_codepage: построить корейскую таблицу Wansung из файла KSX1001» . make_unicode: Генерировать файлы кодовой страницы .c из описаний ftp.unicode.org . Винный проект . Архивировано из оригинала 26 мая 2021 г. Проверено 14 марта 2021 г.
- ^ ИБМ. «Информационный документ о кодовой странице SBCS — CPGID 00037» . Архивировано из оригинала 14 июля 2014 г. Проверено 4 июля 2014 г.
- ^ Стил, Шон (12 сентября 2005 г.). «Кодовая страница 21027 «Расширенный/расширенный строчный буквенный регистр» » . MSDN . Архивировано из оригинала 06 апреля 2019 г. Проверено 6 апреля 2019 г.
- ^ Перейти обратно: а б с д и «Идентификаторы кодовых страниц» . docs.microsoft.com . Архивировано из оригинала 07 апреля 2019 г. Проверено 7 апреля 2019 г.
- ^ Перейти обратно: а б с Фонд Мозилла . «Взаимодействие с кодовыми страницами Windows» . Создайте файлcoding_rs . Документы.рс.
- ^ Перейти обратно: а б с д и «Идентификаторы кодовых страниц» . Сеть разработчиков Microsoft . Майкрософт . 2014. Архивировано из оригинала 19 июня 2016 г. Проверено 19 июня 2016 г.
- ^ Перейти обратно: а б с д и «Веб-кодировки — Internet Explorer — Кодировки» . WHATWG Wiki . 2012-10-23. Архивировано из оригинала 20 июня 2016 г. Проверено 20 июня 2016 г.
- ^ Фоллер, Антонин (2014) [2011]. «Западноевропейская (IA5) кодировка — кодировки Windows» . WUtils.com — Интернет-утилита и справка . Программное обеспечение Мотобит. Архивировано из оригинала 20 июня 2016 г. Проверено 20 июня 2016 г.
- ^ Фоллер, Антонин (2014) [2011]. «Немецкая кодировка (IA5) – кодировки Windows» . WUtils.com – Интернет-утилита и справка . Программное обеспечение Мотобит. Архивировано из оригинала 20 июня 2016 г. Проверено 20 июня 2016 г.
- ^ Фоллер, Антонин (2014) [2011]. «Шведская (IA5) кодировка — кодировки Windows» . WUtils.com — Интернет-утилита и справка . Программное обеспечение Мотобит. Архивировано из оригинала 20 июня 2016 г. Проверено 20 июня 2016 г.
- ^ Фоллер, Антонин (2014) [2011]. «Норвежская (IA5) кодировка — кодировки Windows» . WUtils.com — Интернет-утилита и справка . Программное обеспечение Мотобит. Архивировано из оригинала 20 июня 2016 г. Проверено 20 июня 2016 г.
- ^ Фоллер, Антонин (2014) [2011]. «Кодировка US-ASCII — кодировки Windows» . WUtils.com — Интернет-утилита и справка . Программное обеспечение Мотобит. Архивировано из оригинала 20 июня 2016 г. Проверено 20 июня 2016 г.
- ^ Нечаев, Валентин (2013) [2001]. "Обзор вселенной 8-битных кодировок кириллицы" . Архивировано из оригинала 5 декабря 2016 г. Проверено 5 декабря 2016 г.
Внешние ссылки
[ редактировать ]- Справочник по API поддержки национальных языков (NLS) . Таблица, показывающая кодовые страницы ANSI и OEM для каждого языка (из веб-архива, поскольку Microsoft удалила исходную страницу)
- Регистрация имен кодировок IANA
- Таблица сопоставления Юникода для кодовых страниц Windows
- Сопоставления кодовых страниц Windows в Юникоде с «наилучшим соответствием»