Кодовая страница 949 (IBM)

Кодовые страницы IBM 934 и 944
Язык(и)	корейский
Расширяет	N-байтовый код хангыля
Преобразует/кодирует	Кодовая страница 933
Преемник	Кодовая страница IBM 949
	v ; т ; и ;

Кодовая страница IBM 949
	Макет кодовой страницы IBM-949
Псевдоним(а)	IBM-949, х-IBM949 ; На основе ASCII : IBM-949C, x-IBM949C, cp949c. ; Неоднозначно с UHC : 949, cp949. ;
Язык(и)	корейский
Создано	ИБМ
Классификация	Расширенный ISO 646 , кодировка переменной ширины , кодировка CJK
Расширяет	EUC-КР
Предшественник	Кодовая страница 944
	v ; т ; и ;

Кодовая страница IBM 949 (IBM-949) — это кодировка символов , которая использовалась IBM для представления текста на корейском языке на компьютерах. Это кодировка переменной ширины , которая представляет символы из кода Wansung, определенного южнокорейским стандартом KS X 1001, в формате, совместимом с EUC-KR , но добавляет расширения IBM для дополнительных ханджа , дополнительных заранее составленных слогов хангыль и пользовательских символов. персонажи .

При предоставлении значений в шестнадцатеричном формате байты от 0x00 до 0x7F используются для однобайтовых символов KS X 1003 ( ISO 646 :KR), аналогичного набору ASCII, но со знаком выигрыша , а не обратной косой чертой. Байты с 0x80 по 0x84 используются для однобайтовых символов расширения IBM. Ведущие байты от 0x8F до 0xA0 используются для символов двухбайтового расширения IBM. Ведущие байты от 0xA1 до 0xFE используются для кода Wansung ( символы KS X 1001 в форме EUC-KR, двухбайтовые), но с некоторым неиспользуемым пространством, открытым для использования, определяемого пользователем.

Хотя оба иногда называются «cp949», IBM-949 отличается от кодовой страницы Windows 949 (IBM-1363), которая представляет собой унифицированный код хангыля Microsoft, другое расширение EUC-KR. Его также не следует путать с реализацией обычного EUC-KR ( IBM-970 ) от IBM. Кодовая страница 949 в OS/2 — это кодовая страница IBM; однако существует сторонний патч, позволяющий изменить это. ^[1]

Терминология и маркировка кодировок [ править ]

И IBM-949, и Unified Hangul Code (Windows-949) известны как «кодовая страница 949» (или «cp949»), хотя общим для них является только подмножество EUC-KR. Ни у одного из них нет стандартизированного зарегистрированного в IANA ярлыка для его идентификации. Хотя UHC включен в стандарт кодирования WHATWG , ^[2] с ярлыками, включая «windows-949», ^[3] IBM-949 нет. Поэтому IBM-949 не разрешен в HTML5 .

Хотя значение метки «ibm-949» (и наоборот «windows-949» и «ms949») однозначно там, где эти метки поддерживаются, интерпретация меток кодировки «949» и «cp949», следовательно, различается в зависимости от реализации. Например, в International Components for Unicode для обозначения IBM-949 используются «cp949», «949», «ibm-949» и «x-IBM949». ^[4] и, кроме того, метки «cp949c», «ibm-949c» и «x-IBM949C» обозначают вариант, в котором используются немодифицированные сопоставления ASCII для 0x20–7E (что приводит к дублированию сопоставлений для обратной косой черты), ^[5] в то время как (из меток, включающих номер кодовой страницы 949) только «ms949» и «windows-949» назначены UHC. ^[6] В этом отличие от Python , который распознает как «cp949», так и «949» (в дополнение к более явным «ms949» и «uhc», но не «windows-949») как метки для UHC и не включает Кодек IBM-949. ^[7] Кодовая страница 949, используемая версиями OS/2 на корейском языке , является кодовой страницей IBM; Чтобы добавить поддержку всего набора корейских слогов Unicode, существует сторонний патч, заменяющий его кодовой страницей Microsoft. ^[1]

IBM-949 — это кодировка переменной ширины, определяемая как комбинация двух кодовых страниц фиксированной ширины : однобайтовой кодовой страницы 1088 и двухбайтовой кодовой страницы 951 . ^[8]^[9]^[10]

История [ править ]

Версия кодовой страницы 951 (DBCS-PC, т.е. двухбайтовый код, не относящийся к EUC и не EBCDIC ), двухбайтовый компонент для IBM-949, определен в редакции IBM Corporate Specification CH 3-, выпущенной в сентябре 1992 года. 3220-125 вместе с кодовой страницей 834 (DBCS-Host, т. е. двухбайтовым кодом EBCDIC), которая является двухбайтовым компонентом кодовой страницы 933 . ^[11] В этой версии кодовой страницы 949/951 весь диапазон ведущих байтов 0x8F – A0 рассматривался как определяемая пользователем область и включал только стандартные назначения Wansung и определяемые пользователем области, таким образом не включая некоторые символы, включенные в кодовую страницу 933/834. ^[11] Некоторые более поздние версии, например, реализованные International Components for Unicode (ICU), сжимают определяемую пользователем область, чтобы включить эти символы в качестве расширений. ^[12]

В более ранней версии CH 3-3220-125, выпущенной в октябре 1989 года, вместо этого кодовая страница 926 определялась как код DBCS-PC, который кодировал те же символы, что и IBM-834, в макете, отличающемся как от IBM-951, так и от IBM-834, которые имели другой диапазон ведущих байтов и не был расширением EUC-KR. ^[11] IBM-926 был объединен с кодовой страницей 891 или кодовой страницей 1040 (соответственно 8-битный N-байтовый код хангыля и его расширение; сравните, как Shift JIS расширяет 8-битный JIS X 0201 ), чтобы сформировать IBM-934 или IBM-944 соответственно. . ^[13]^[14]

Кодовая страница 944/926 теперь устарела в пользу IBM-949. В версии 1992 года кодовая страница 926 обозначена как «ограниченная» («ограниченная конкретной средой, для которой [она] зарегистрирована») и не приводится ее диаграмма или сопоставления с другими кодовыми страницами. ^[11] а CCSID 944 относится к категории «сосуществование и миграция». ^[14] (в отличие от CCSID 949, «совместимый»). ^[8] Международные компоненты для Unicode включают сопоставления Unicode для IBM-949. ^[4]^[12] и IBM-933, но его отображение IBM-944 было удалено в 2001 году. ^[15]

Однобайтовые коды [ править ]

Кодовая страница IBM 949 (однобайтовый компонент: 1088) ^[16]^[17]^[4]^[5]^[12]
	0	1	2	3	4	5	6	7	8	9	А	Б	С	Д	И	Ф
0x	НУЛЕВОЙ	┌	┐	└	┘	│	─	•	◘	○	◙	♂	♀	♪	♫	☼
1x	┼	◄	↕	‼	¶	┴	┬	┤	↑	├	→	←	∟	↔	▲	▼
2x	СП	!	"	#	$	%	&	'	(	)	*	+	,	-	.	/
3x	0	1	2	3	4	5	6	7	8	9	:	;	<	=	>	?
4x	@	А	Б	С	Д	И	Ф	Г	ЧАС	я	Дж	К	л	М	Н	ТО
5x	П	вопрос	Р	С	Т	В	V	В	Х	И	С	[	₩	]	^	_
6x	`	а	б	с	д	и	ж	г	час	я	дж	к	л	м	н	тот
7x	п	д	р	с	т	в	v	В	х	и	С	{	\|	}	~	⌂
8x	¢	¬	\	‾	¦											8F
9x	90	91	92	93	94	95	96	97	98	99	9А	9Б	9С	9Д	9Е	9F
Топор	А0	1-_	2-_	3-_	4-_	5-_	6-_	7-_	8-_	9-_	10-_	11-_	12-_	13-_	14-_	15-_
Бх	16-_	17-_	18-_	19-_	20-_	21-_	22-_	23-_	24-_	25-_	26-_	27-_	28-_	29-_	30-_	31-_
Сх	32-_	33-_	34-_	35-_	36-_	37-_	38-_	39-_	40-_	41-_	42-_	43-_	44-_	45-_	46-_	47-_
Дх	48-_	49-_	50-_	51-_	52-_	53-_	54-_	55-_	56-_	57-_	58-_	59-_	60-_	61-_	62-_	63-_
Бывший	64-_	65-_	66-_	67-_	68-_	69-_	70-_	71-_	72-_	73-_	74-_	75-_	76-_	77-_	78-_	79-_
Форекс	80-_	81-_	82-_	83-_	84-_	85-_	86-_	87-_	88-_	89-_	90-_	91-_	92-_	93-_	94-_

Отличия от кодовой страницы 437 (для 0x00–7F) или EUC-KR (для 0x80–FF)

Двухбайтовые коды [ править ]

Ведущие байты 0x8F–99, 0xC9, 0xFE (диапазоны, определяемые пользователем) [ править ]

IBM-949 предназначен для поддержки максимум 1880 UDC (определяемых пользователем символов), ^[8] включая определяемые пользователем строки (ведущие байты 0xC9 и 0xFE) плоскости Wansung и диапазоны за пределами плоскости Wansung. В этой версии ведущие байты 0x8F–A0 содержат максимум 1692 UDC, а ведущие байты 0xC9 и 0xFE содержат максимум 94 каждый (т. е. вместе с завершающими байтами 0xA1–FE). ^[11] расширения для поддержки всего двухбайтового репертуара IBM-933 , они используют ведущие байты 0x9A–A0, в результате чего для определения пользователя остается меньшее максимальное количество символов. Однако когда реализованы ^[4]^[12]

При сопоставлении с Unicode 0xC9A1–C9FE (между диапазонами слогов и ханджа) сопоставляются с кодовыми точками области частного использования Unicode U+E000–E05D, а 0xFEA1–FEFE (между концом диапазона ханджа и концом плоскости). ) отображаются в U+E05E–E0BB. За пределами плоскости Wansung 0x8FA0–9AA5 (где второй байт находится в диапазоне 0xA1–FE) сопоставляются с кодовыми точками зоны частного использования U+E0BC–E4CA. ^[4] Последний из этих диапазонов врезается в начало строки 0x9A (показано ниже).

В совокупности эти диапазоны частного использования охватывают кодовые точки U + E000 – E4CA, что позволяет отображать 1227 UDC из IBM-949 в Unicode. ^[12] Отдельный диапазон областей частного использования U+F843–F86E используется IBM для сопоставления некоторых символов в расширенном диапазоне ханджа. ^[12] Это соответствует ранним рекомендациям Консорциума Unicode о том, что корпоративные символы должны располагаться начиная с U+F8FF, а определяемые пользователем символы — начиная с U+E000 и выше. ^[18] и является частью более крупной схемы корпоративных зон частного использования, которая определена внутри IBM и использует диапазон U + F83D – F8FF. ^[19]^[20]

символы и Ведущие байты 0x9A–9D ( расширенные ханджа )

Согласно спецификации 1992 года, весь этот диапазон определяется пользователем. ^[11] Однако, как это реализовано в кодеке, предоставленном IBM для ICU, от 0x9AA1 до 0x9AA5 являются концом определяемого пользователем диапазона. Оставшаяся часть этого диапазона включает некоторые символы, не относящиеся к хангылю, включенные в кодовую страницу 933 , но не в код Wansung. Номера от 0x9AA6 до 0x9AAB содержат разные технические или математические символы. Остальная часть содержит ханджа, дополнительные к тем, которые включены в KS X 1001 , хотя некоторые из них сопоставлены IBM с областью частного использования. ^[12]

Кодовая страница IBM 949 (расширенные символы и ханджа) ^[12]^[22]
	0	1	2	3	4	5	6	7	8	9	А	Б	С	Д	И	Ф
9ААкс							ς ^[а]	≦	≧	К	￤	ʺ	ка	помещать	Цзе	опьяненный
9ABx	赵	скелет	蒹	удушье	закрыть	подсвечник	粲	борозда	秧	курица	Гао	слепой	Исполнение	栱	бар	Конг
9ACx	головастик	Хо	ванна	аист	петля	рахит	сутулиться	жениться	женщина	солнечные часы	Оу	вот	颶	掬	встать на колени	巹
9ADx	漌	опасный	кодзи	Завоевание	плавник	唜	Нуо	ропот	в прошлом	Ней	красноречивый	свирепый	потомство	шумный	выделанная кожа	Дао
9АЕх	闼	татарский	вечеринка	蟷	пестик	повилика	песня	дон	Живот	головастик	Тэн	лампа	стремя	Нао	山	哓
9AFx	ладонь	холодный	спрайт	Катастрофа	позвоночник	кальян	полировальный инструмент	дуб	грива	昤	Линг	Линг	крикет	затоплен	нос корабля
9BAx		колесо	влажный	Лу	катушка	Лай	бутон	клевета	очень мало	горбун	череп	дыра	Рин	Лин	нести	Ли
9BBx	Оставлять	Чи	горный эльф	несчастье	Да	мама	жаба	詩	Мастерок	парик	эльф	ненаблюдательный	клубника	пульс	увещевать	старый
9BCx	Хоко	Монгольский	Монгольский	Ми	Ми	Фуцзянь	По	欂	甔	толстый	Волосы	лещ	Кастрюля	повернуть	Пират	Биан
9BDx	коса	повсюду	параллельный	Не	взорваться	Дрофа	вышивка	летучая мышь	богатый	репа	слуга	фу	Фу	Клевер	наклониться вперед	карась
9BEx	стон	衡	город	Сидзуока	вышивка	покойная мать	песок	沘	смотреть косо	решетка	Филип	уздечка	бедро	изгонять	яблоко	Юн
9BFx	сдвиньте брови	храмы	Си	кабарга	китайская айва	Ча	ствол	копье	таять	напиток	плуг	Немедленно	траур	жабры	кусать
9CAx		зять	нерегулярный	стрелять	один	Плотина	Испуганный	стирать	пожар	град	偰	поступок	вытащить	корабль	Сяо	крикет
9CBx	мелкий	старик	гостиница	晬	мочиться	проклинать	Джу	перепелка	вошь	啻	храм	тонкое белье	более того	Се	чашечка	фальшивый
9CCx	дикий гусь	戞	останавливаться	камень	знаком с	темный	мартингейл	Ага	морщины	мешать	円	дверь	стрелять	篛	Ты	羘
9CDx	Тяо	Ненавидеть	стрелять	завидовать	румяна	черви	讌	соль	удовлетворен	младенец	смотреть косо	оттенок	сладкий картофель	экскурсия	старуха	薀
9CEx	дельфин	трава	фунт	куколка	обращаться	железо	летать	занавес	сторожить	ограничивать	вуаль	Руи	черный	продавать	檼	珢
9CFx	десна	налить	栠	飠	Рен	кантус	碢	耔	рот	охра	Японский кипарис	скрытый	тутовый шелкопряд	пик	малярия
9DAx		Пакет	талант	сова	личинка	свинья	клейкий рис	трель	巓	кирпич	ножницы	воровать	椤	клуб	晢	瑅
9DBx	пинать	вешать	шум	мыло	печь	сито	粜	створка	морской лещ	Фонг	след	гнездо	локоть	Хаябуса	но	доказательство
9DCx	крот	挌	стыдящийся	豱 ^[б]	отчаяние	плащ	箦	ящерица	误	всплеск	карнизы	Стрекоза	строить	醆	отвесный	шелк
9DDx	банкнота	оболочка	число	бродить	череп	怱	лук	разрушать	молоток	甃	метла	Осень	遁	толстый	наручники	поклон
9DEx	торопиться	сани	излишний	巵	Знаки	锄	Искренность	демонтировать	мешок	Ничего хорошего	рамка	Лягушка	кухня	пистолет	магазин	самолет
9DFx	сумка	точка	решетка	спотыкаясь	малярия	Хан	ястреб	Кан	кокетливый	довольный	Хикари	陜	Хао	醐	Кран

Ведущие байты 0x9E–A0 (расширенные слоги ханджа и хангыль) [ править ]

Согласно спецификации 1992 года, весь этот диапазон определяется пользователем. ^[11] Как реализовано в кодеке, предоставленном IBM для ICU, номера от 0x9EA1 до 0x9EAC содержат оставшуюся часть расширенного ханджи. Остальная часть диапазона содержит несколько дополнительных слогов хангыля , которые недоступны в предварительно составленной форме в чистом EUC-KR . В отличие от Единого кода хангыля, этого недостаточно для поддержки всех нечастных слогов Иохаб, отсутствующих в коде Вансунг. ^[12]

Среди них значимыми являются 뢔 (0x9EFC), 쌰 (0x9FE6), 쎼 (0x9FED), 쓔 (0x9FF3) и 쬬 (0xA0C1), которые соответствуют началу стандартных символов Wansung 뢨, 썅, 쏀, 쓩 и 쭁 соответственно. , при частичном вводе в редактор метода ввода .

Кодовая страница IBM 949 (расширенные слоги ханджа и хангыль) ^[12]
	0	1	2	3	4	5	6	7	8	9	А	Б	С	Д	И	Ф
9EAx		вок	Ван	радостный	служанка	哓	нечеткий	шуметь	обезьяна	музыкальный инструмент	Синь	До	Цзе	К	갰	Вот и все
9EBx	Ух ты	Ух ты	сено	хорошо	Нарезать	Гуань	Ух ты	Хорошо	Ух ты	Хорошо	Пока	Ух ты	Хорошо	Ух ты	Длинный	Ух ты
9ECx	Хорошо	Ух ты	Ух ты	ㅋ	Хорошо	Ух ты	Хорошо	Ух ты	Ух ты	Ух ты	Обманывать	Ух ты	Ух ты	Ух ты	뀍	뀡
9EDx	Ух ты	Извини	зерно	Ням	Нет	Да	Да	년	Нёнг	Да	Ага	Нет	Нет	Ух ты	Ух ты	Ага
9EEx	Ух ты	Ух ты	ура	Ух ты	Ух ты	Ух ты	Ух ты	Точка	뀄	Ух ты	Хорошо	ттеот	뽕	Ух ты	да	Ух ты
9EFx	Глубокий	Вещь	Что	Где	Ух ты	Когда	группа	Ух ты	повернуться	Ух ты	Ух ты	Ух ты	Ух ты	ржу не могу	Ух ты
9Факс		Ух ты	Ух ты	Да	Мия	Ух ты	Ух ты	Мой	вместе	Ух ты	Мео	М-м-м	Ух ты	М-м-м	М-м-м	.
9FBx	Ух ты	Ага	Пока	Пока	Бем	Бем	Бев	Пока	ББ	Пока	Пока	Пока	Бу	Пока	Ух ты	Ух ты
9FCx	Ух ты	Ух ты	Вычтено	Пока	Пффф	ручка	Ручка	Ух ты	Пока	Ух ты	Ух ты	Пока	Поп	Ух ты	Пока	Ух ты
9FDx	Ух ты	Сладкий	Ух ты	Сладкий	Вздох	Приколоть	Ух ты	Суббота	Выстрелил	Шань	ша	Набор	Лист	Овца	притворство	Избегайте
9ФЭкс	Закрыть	쀀	Новый	Ссссс	SS	Дерьмо	Ся	Ух ты	Ссам	Цк	ссссссссссссссссссссссссссссс	сентябрь	젠	쎼	Выстрелил	Ух ты
9FFx	콷	Ух ты	Пффф	Ух ты	Ух ты	Ух ты	Ух ты	Ух ты	Ух ты	Ять	Ух ты	Ага	Да	да	Хорошо
A0Ax		Ага	Ют	Ух ты	Ют	Ага	Ух ты	Ух ты	Хорошо	Джем	Джем	реактивный самолет	Чон	Молодой	Ух ты	Ух ты
A0Bx	Ух ты	Ух ты	Джун	Ух ты	Ух ты	Джон	Да	윅	Ух ты	Ух ты	Ух ты	Ух ты	Цк	Джджом	Ух ты	Джим
A0Cx	гнаться	Хорошо	Ух ты	Цк	Цк	Ух ты	Нарезать	Много	Находить	ча	Дешевый	чан	Дешевый	Чеонг	Ух ты	Ух ты
A0Dx	숣	Перец	Ух ты	Ух ты	Ух ты	Фу	Кепп	Ух ты	Ух ты	Ух ты	Ух ты	шарлатан	Твитнуть	Ух ты	Тэн	Тэн
A0Ex	Хе-хе	Цк	Ух ты	Гудок	Твитнуть	Ух ты	Пффф	Ух ты	Пеп	Пеп	Ух ты	Хе-хе	Ух ты	Пфунг	Пффф	ударять
A0Fx	Пинг	Ух ты	Хе-хе	Хе-хе	Ух ты	Хе-хе	Хе-хе	Хе-хе	Хе-хе	Хе-хе	Ух ты	хм	Упс	Ух ты	Уф

Ведущие байты 0xA1–C8, 0xCA–FD (стандарт Wansung) [ править ]

См. также [ править ]

Сноски [ править ]

^ Это не включено в поддержку IPA. Скорее, на кодовой странице 933 SO 0x4160 — это знак равенства, отображаемый с косой чертой, а SO 0x418D IBM-933 — с обратной косой чертой (т. е. =⃥). ^[11] Хотя это IBM-933 SO 0x4160, который сопоставлен с обычным идентификатором, не равным GCGID SA540080 ( полная ширина SA540000), это IBM-933 SO 0x418D, который сопоставлен с EUC-KR и IBM-949 0xA1C1, ^[11] из-за того, что в KS C 5601-1987 ссылочный символ для знака не равно также показан с обратной косой чертой. ^[23] Следовательно, U+2260, который отображается в EUC-KR и, следовательно, в IBM-949 0xA1C1, отображается в IBM-933 SO 0x418D, в результате чего IBM-933 SO 0x4160 (и, следовательно, IBM-949 0x9AA6) отображается в визуально аналогичный символ U+01C2. ^[24]
^ Соответствие IBM — U+5231刱, но глиф в документе IBM CH 3-3220-125 1992-09 ближе к U+5259 剙 (код хоста 62D5). ^[11]

Ссылки [ править ]

↑ Перейти обратно: Перейти обратно: ^а ^б Боргендейл, Кен. «Кодовая страница OS/2 и инструменты отображения клавиатуры» .
^ ван Кестерен, Энн , «5. Индексы (§ индекс EUC-KR)» , Стандарт кодирования , WHATWG. Это соответствует стандарту KS X 1001 и унифицированному коду хангыля, более известному вместе как кодовая страница Windows 949.
^ ван Кестерен, Энн . «4.2. Названия и метки» . Стандарт кодирования . ЧТОРГ.
↑ Перейти обратно: Перейти обратно: ^а ^б ^с ^д ^и «Converter Explorer: ibm-949_P110-1999 (псевдоним x-IBM949)» , Международные компоненты для Unicode , Консорциум Unicode
↑ Перейти обратно: Перейти обратно: ^а ^б «Converter Explorer: ibm-949_P11A-1999 (псевдоним x-IBM949C)» , Международные компоненты для Unicode , Консорциум Unicode . Это версия IBM-949 на основе ASCII.
^ "windows-949-2000" , Converter Explorer , Международные компоненты для Unicode
^ «кодеки — реестр кодеков и базовые классы § Стандартные кодировки» . Документация Python 3.7.2 . Фонд программного обеспечения Python.
↑ Перейти обратно: Перейти обратно: ^а ^б ^с «Идентификаторы кодированных наборов символов: CCSID 949» . IBM Глобализация . ИБМ . Архивировано из оригинала 29 ноября 2014 г.
^ «Информационный документ CCSID 1088» . Архивировано из оригинала 26 марта 2016 г.
^ «Информационный документ с кодовой страницей 951» . Архивировано из оригинала 16 января 2017 г.
↑ Перейти обратно: Перейти обратно: ^а ^б ^с ^д ^и ^ж ^г ^час ^я ^дж ^к «Набор корейских графических символов IBM: DBCS-Host и DBCS-PC» (PDF) . ИБМ . 2001 [1992]. СН 3-3220-125 1992-09.
↑ Перейти обратно: Перейти обратно: ^а ^б ^с ^д ^и ^ж ^г ^час ^я ^дж Международные компоненты для Unicode (ICU), ibm-949_P110-1999.ucm , 3 декабря 2002 г.
^ «Идентификаторы кодированных наборов символов: CCSID 934» . IBM Глобализация . ИБМ . Архивировано из оригинала 2 декабря 2014 г.
↑ Перейти обратно: Перейти обратно: ^а ^б «Идентификаторы кодированных наборов символов: CCSID 944» . IBM Глобализация . ИБМ . Архивировано из оригинала 1 декабря 2014 г.
^ Вишванадха, Рам (1 ноября 2001 г.). «ICU-1281 Удалить ненужные файлы ucm» . Международные компоненты для Unicode .
^ Кодовая страница CPGID 01088 (pdf) (PDF) , IBM
^ Кодовая страница CPGID 01088 (txt) , IBM
^ «2.0: Изменения в Юникоде 1.0» (PDF) . Стандарт Юникод, версия 1.1 . Консорциум Юникод . стр. 3–4. УТР №4.
↑ Перейти обратно: Перейти обратно: ^а ^б «CPGID 01449: PUA IBM по умолчанию» . Глобализация IBM: идентификаторы кодовых страниц . ИБМ . Архивировано из оригинала 16 сентября 2015 г. IBM определила 195 должностей от U+F83D до U+F8FF для использования в качестве корпоративной зоны IBM и намерена последовательно использовать их внутри IBM всякий раз, когда возникает необходимость поддерживать целостность символов IBM.
^ ИБМ (1997). unicode.nam: позволяет указывать символы Юникода, используя имена, подобные IBM или PostScript . (Входит в комплект Боргендейл, Кен, Инструменты кодовой страницы OS/2 и отображения клавиатуры )
^ "ibm-933_P110-1995.ucm" . Международные компоненты для Unicode .
^ Ханджа, отображенные на карте зоны частного использования, идентифицируются по таблицам кодов. В документе IBM CH 3-3220-125 1992-09 приведены кодовые таблицы для кодовых страниц, используемых в качестве двухбайтовых компонентов для кодовой страницы 933 и более старой версии кодовой страницы 949 без этих расширений; однако ханджа в этом разделе соответствуют (и находятся в том же порядке) подмножеству таблицы 7, для которого «код ПК» не указан. ^[11] Отображения корпоративных областей частного использования также координируются с другими кодовыми страницами. ^[19] включая кодовую страницу 933, ^[21] который можно использовать для получения «кода хоста» для данного сопоставления области корпоративного частного использования.
^ Корейское бюро стандартов (1 октября 1988 г.). Корейский набор графических символов для обмена информацией (PDF) . ITSCJ/ IPSJ . ИСО-ИК -149.
^ "ibm-933_P110-1995 (ведущие байты 0E41)" . Конвертер Проводник . Международные компоненты для Unicode .

[25] Это не включено в поддержку IPA. Скорее, на кодовой странице 933 SO 0x4160 — это знак равенства, отображаемый с косой чертой, а SO 0x418D IBM-933 — с обратной косой чертой (т. е. =⃥). ^[11] Хотя это IBM-933 SO 0x4160, который сопоставлен с обычным идентификатором, не равным GCGID SA540080 ( полная ширина SA540000), это IBM-933 SO 0x418D, который сопоставлен с EUC-KR и IBM-949 0xA1C1, ^[11] из-за того, что в KS C 5601-1987 ссылочный символ для знака не равно также показан с обратной косой чертой. ^[23] Следовательно, U+2260, который отображается в EUC-KR и, следовательно, в IBM-949 0xA1C1, отображается в IBM-933 SO 0x418D, в результате чего IBM-933 SO 0x4160 (и, следовательно, IBM-949 0x9AA6) отображается в визуально аналогичный символ U+01C2. ^[24]

[26] Соответствие IBM — U+5231刱, но глиф в документе IBM CH 3-3220-125 1992-09 ближе к U+5259 剙 (код хоста 62D5). ^[11]

[borgendale949-1] Перейти обратно: Перейти обратно: ^а ^б Боргендейл, Кен. «Кодовая страница OS/2 и инструменты отображения клавиатуры» .

[2] ван Кестерен, Энн , «5. Индексы (§ индекс EUC-KR)» , Стандарт кодирования , WHATWG. Это соответствует стандарту KS X 1001 и унифицированному коду хангыля, более известному вместе как кодовая страница Windows 949.

[3] ван Кестерен, Энн . «4.2. Названия и метки» . Стандарт кодирования . ЧТОРГ.

[icu-4] Перейти обратно: Перейти обратно: ^а ^б ^с ^д ^и «Converter Explorer: ibm-949_P110-1999 (псевдоним x-IBM949)» , Международные компоненты для Unicode , Консорциум Unicode

[icuc-5] Перейти обратно: Перейти обратно: ^а ^б «Converter Explorer: ibm-949_P11A-1999 (псевдоним x-IBM949C)» , Международные компоненты для Unicode , Консорциум Unicode . Это версия IBM-949 на основе ASCII.

[icums949-6] "windows-949-2000" , Converter Explorer , Международные компоненты для Unicode

[7] «кодеки — реестр кодеков и базовые классы § Стандартные кодировки» . Документация Python 3.7.2 . Фонд программного обеспечения Python.

[ccsid949-8] Перейти обратно: Перейти обратно: ^а ^б ^с «Идентификаторы кодированных наборов символов: CCSID 949» . IBM Глобализация . ИБМ . Архивировано из оригинала 29 ноября 2014 г.

[9] «Информационный документ CCSID 1088» . Архивировано из оригинала 26 марта 2016 г.

[10] «Информационный документ с кодовой страницей 951» . Архивировано из оригинала 16 января 2017 г.

[ch3320125-1992-11] Перейти обратно: Перейти обратно: ^а ^б ^с ^д ^и ^ж ^г ^час ^я ^дж ^к «Набор корейских графических символов IBM: DBCS-Host и DBCS-PC» (PDF) . ИБМ . 2001 [1992]. СН 3-3220-125 1992-09.

[ucm-12] Перейти обратно: Перейти обратно: ^а ^б ^с ^д ^и ^ж ^г ^час ^я ^дж Международные компоненты для Unicode (ICU), ibm-949_P110-1999.ucm , 3 декабря 2002 г.

[ccsid934-13] «Идентификаторы кодированных наборов символов: CCSID 934» . IBM Глобализация . ИБМ . Архивировано из оригинала 2 декабря 2014 г.

[ccsid944-14] Перейти обратно: Перейти обратно: ^а ^б «Идентификаторы кодированных наборов символов: CCSID 944» . IBM Глобализация . ИБМ . Архивировано из оригинала 1 декабря 2014 г.

[15] Вишванадха, Рам (1 ноября 2001 г.). «ICU-1281 Удалить ненужные файлы ucm» . Международные компоненты для Unicode .

[16] Кодовая страница CPGID 01088 (pdf) (PDF) , IBM

[17] Кодовая страница CPGID 01088 (txt) , IBM

[18] «2.0: Изменения в Юникоде 1.0» (PDF) . Стандарт Юникод, версия 1.1 . Консорциум Юникод . стр. 3–4. УТР №4.

[ibmpua-19] Перейти обратно: Перейти обратно: ^а ^б «CPGID 01449: PUA IBM по умолчанию» . Глобализация IBM: идентификаторы кодовых страниц . ИБМ . Архивировано из оригинала 16 сентября 2015 г. IBM определила 195 должностей от U+F83D до U+F8FF для использования в качестве корпоративной зоны IBM и намерена последовательно использовать их внутри IBM всякий раз, когда возникает необходимость поддерживать целостность символов IBM.

[20] ИБМ (1997). unicode.nam: позволяет указывать символы Юникода, используя имена, подобные IBM или PostScript . (Входит в комплект Боргендейл, Кен, Инструменты кодовой страницы OS/2 и отображения клавиатуры )

[21] "ibm-933_P110-1995.ucm" . Международные компоненты для Unicode .

[puaid-22] Ханджа, отображенные на карте зоны частного использования, идентифицируются по таблицам кодов. В документе IBM CH 3-3220-125 1992-09 приведены кодовые таблицы для кодовых страниц, используемых в качестве двухбайтовых компонентов для кодовой страницы 933 и более старой версии кодовой страницы 949 без этих расширений; однако ханджа в этом разделе соответствуют (и находятся в том же порядке) подмножеству таблицы 7, для которого «код ПК» не указан. ^[11] Отображения корпоративных областей частного использования также координируются с другими кодовыми страницами. ^[19] включая кодовую страницу 933, ^[21] который можно использовать для получения «кода хоста» для данного сопоставления области корпоративного частного использования.

[23] Корейское бюро стандартов (1 октября 1988 г.). Корейский набор графических символов для обмена информацией (PDF) . ITSCJ/ IPSJ . ИСО-ИК -149.

[24] "ibm-933_P110-1995 (ведущие байты 0E41)" . Конвертер Проводник . Международные компоненты для Unicode .

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[22]

[а]

[б]

[23]

[24]

[21]

v т и Кодировки символов
Ранние телекоммуникации	Телеграфный код Иголка Морс Нелатинский Вабун/Кана китайский Кириллица корейский Бодо и Мюррей Полевые данные ASCII ИСО/МЭК 646 BCDIC-код Телетекс и Видеотекс / Телетекст Т.51/ИСО/МЭК 6937 ИТ Т.61 ИТ Т.101 Мировая система телетекста фон наборы Перекодировать
ИСО/МЭК 8859	Утвержденные детали -1 (Западная Европа) -2 (Центральная Европа) -3 (мальтийский/эсперанто) -4 (Северная Европа) -5 (кириллица) -6 (арабский) -7 (греческий) -8 (иврит) -9 (турецкий) -10 (Скандинавия) -11 (тайский) -13 (Балтика) -14 (Селтик) -15 (Новая Западная Европа) -16 (румынский) Заброшенные части -12 (Деванагари) Предложено, но не одобрено КОИ-8 кириллица Саамы Адаптации валлийский Баренцева кириллица эстонский Украинская кириллица
Библиографическое использование	МАРК-8 АНСЕЛЬ CCII/EACC ИСО 5426 5426-2 5427 5428 6438 6862
Национальные стандарты	АрмSCII Большой5 БраSCII ЦНС 11643 DIN 66003 ЭЛОТ 927 ГОСТЬ 10859 ГБ 2312 ГБ 12345 ГБ 12052 ГБ 18030 HKSCS ИЩИС ДЖИС Х 0201 ДЖИС Х 0208 ДЖИС Х 0212 ДЖИС Х 0213 ТРЕБОВАНИЕ-7 КПС 9566 КС Х 1001 КС Х 1002 ЛСТ 1564 ЛСТ 1590-4 ПАСХА Сдвиг HE СИ 960 ТИС-620 ТСКИИ ВИСКИ VSCII ДЖОЗЕФ
ИСО/МЭК 2022	ИСО/МЭК 8859 ИСО/МЭК 10367 Расширенный код Unix/EUC
Mac OS Кодовые страницы («сценарии»)	Армянский арабский Баренцева кириллица Селтик Центральноевропейский хорватский Кириллица Деванагари Фарси (персидский) Шрифт X (Кермит) гэльский грузинский Греческий Гуджарати Гурмухи иврит Исландия Инуиты Клавиатура Латынь (Кермит) Мальтийский/Эсперанто Огам Роман румынский Саамы турецкий Тюркская кириллица Украинский ВТ100
Кодовые страницы DOS	437 668 708 720 737 770 773 775 776 777 778 850 851 852 853 855 856 857 858 859 860 861 862 863 864 865 866 867 868 869 897 899 903 904 932 936 942 949 950 951 1034 1040 1042 1043 1044 1098 1115 1116 1117 1118 1127 3846 АБИКОМП CS Индик CSX Индик CSX+ Индикация КРИ-2 Иранская система Каменицкий Мазовия ЧТО
Кодовые страницы IBM AIX	895 896 912 915 921 922 1006 1008 1009 1010 1012 1013 1014 1015 1016 1017 1018 1019 1046 1124 1133
Кодовые страницы Windows	ССЭР-ГС 932 936 ( ГБК ) 950 1169 Расширенная латиница-8 1250 1251 1252 1253 1254 1255 1256 1257 1258 1270 Кириллица + финский Кириллица + французский Кириллица + немецкий Политонический греческий
EBCDIC Кодовые страницы	Японский язык в EBCDIC ДКОИ
DEC Терминалы ( VTx )	Многонациональный (MCS) Национальная замена (NRCS) Французский канадец швейцарский испанский Великобритания Голландский финский Французский норвежский и датский Шведский Норвежский и датский (альтернативный вариант) 8-битный греческий 8-битный турецкий СИ 960 иврит Специальная графика Технический (ТКС)
Зависит от платформы	1052 1053 1054 1055 1056 1057 1058 ОС Acorn RISC Амстрад КТК Яблоко II ПРИЛОЖЕНИЯ Атари СТ БИКС Калькуляторы Касио CDC Компюколор 8001 Компюколор II КП/М+ ОСНОВАНИЕ ДЕКАБРЯ 50 ДЭК МКС / НРКС Генеральный директор по международным делам Галактика драгоценный камень GSM 03.38 HP Роман HP ФОКАЛ ХП РПЛ Сжать ЛИКС ЛМБКС MSX НЭК БТР Следующий ПЕТСКИИ Стандарт PostScript Постскриптум латиница 1 СЭМ Купе Сега СК-3000 Калькуляторы Sharp Шарп МЗ Синклер, QL Телетекст Калькуляторы TI ТРС-80 Вентура Интернэшнл ВИСЦИИ XCCS ZX80 ZX81 ZX Спектр
Юникод / ИСО/МЭК 10646	UTF-1 UTF-7 UTF-8 UTF-16 UTF-32 UTF-EBCDIC ГБ 18030 ОТ 91379 БУТЫЛКА-1 ЦЭСУ-8 ЮКГУ ТАСЕ16 Сравнение кодировок Unicode
TeX Система набора текста	Корк LY1 ОМЛ ОМС OT1
Разные кодовые страницы	АБИКОМП ЦЕЛЬ 449 Цифровое кодирование символов APL ИСО-ИР-68 АРИБ СТД-B24 Полевые данные ХЗ МЭК-П27-1 РАЗДРАЖЕННЫЙ 7-битный 8-битный ИСО-ИР-169 ИСО 2033 НЕОБХОДИМЫЙ КОИ8-Р КОИ8-RU КОИ8-У Модзикё СЕЗОНЫ Стэнфорд/ИТС Символ ТРОН Единый кодекс хангыль
Управляющий персонаж	Азбука Морзе Коды управления C0 и C1 ИСО/МЭК 6429 ДЖИС Х 0211 Управляющие символы Юникода, формат и символы-разделители Пробельные символы
Связанные темы	CCSID Кодировки символов в HTML Обнаружение кодировки Ханьское объединение Кодовая страница оборудования MICR-код Моджибаке Кодирование переменной длины
Наборы символов