Японский язык в EBCDIC
Несколько взаимонесовместимых версий расширенного двоично-десятичного кода обмена ( EBCDIC ) использовались для представления японского языка на компьютерах, включая варианты, определенные Hitachi , Fujitsu , IBM и другими. Некоторые из них представляют собой кодировки переменной ширины , в которых используются блокирующие коды сдвига для переключения между однобайтовым и двухбайтовым режимами. [1] В отличие от других локалей EBCDIC, строчные латинские буквы часто не сохраняются на своих обычных местах. [2]
Символы, которые встречаются в двухбайтовом японском коде, используемом с EBCDIC компанией IBM, но не встречаются в первом издании JIS X 0208 , также повлияли на расширения поставщиков, обнаруженные в некоторых кодировках, отличных от EBCDIC, таких как кодовая страница IBM 932 (" DBCS-PC") и кодовая страница Windows 932 . [3]
Однобайтовые коды
[ редактировать ]Подобно JIS X 0201 (который сам включен в Shift JIS ), японские кодировки EBCDIC часто включают набор однобайтовых катакан . В японском языке разные производители используют несколько различных вариантов однобайтового кода EBCDIC; Данный поставщик может также определить два разных однобайтовых кода: один для катаканы половинной ширины , а другой для латинского алфавита . Варианты EBCDIC, предпочитаемые данным поставщиком для использования с катаканой, иногда называются EBCDIK , что означает расширенный двоично-десятичный код обмена кана . [1] [4]
Кодовые страницы, включающие кану половинной ширины, являются исключением из инвариантного набора символов EBCDIC IBM, который определяет набор символов, которые обычно кодируются одинаково на всех кодовых страницах EBCDIC. В частности, они иногда включают символы катаканы в кодовых точках, которые используются для строчных букв основного латинского алфавита в инвариантном наборе. [2] Кодировка строчных букв, когда символы катаканы включены в эти места, и кодировка символов катаканы, когда строчные буквы сохраняются в их обычных местах, могут различаться у разных поставщиков, как показано ниже.
Microsoft Windows реализует два японских однобайтовых варианта EBCDIC с номерами кодовых страниц на 20000 выше, чем номера кодовых страниц IBM для его вариантов, как кодовые страницы 20290 (задокументированные как IBM290
, «IBM EBCDIC, расширенная японская катакана») [5] и 21027 («Расширенный/расширенный альфа-строчный регистр»). Кодовая страница 21027, реализованная в Windows, является неполной реализацией, в ней отсутствуют двусторонние сопоставления для нескольких букв и каны. [6] и в настоящее время устарел. [5]
Кодовые страницы IBM были позже обновлены, чтобы включить знак евро в 0xE1, сохранив исходные номера CPGID, но получив новые номера CCSID. Следовательно, CCSID 290 относится к исходной версии кодовой страницы 290, а версия кодовой страницы 290 со знаком евро также известна как CCSID 8482. [7] Аналогично, CCSID 1027 относится к исходной версии кодовой страницы 1027, а версия CPGID 1027 со знаком евро получает CCSID 5123. [8]
Наряду с версиями двухбайтовой японской кодовой страницы DBCS-Host IBM (CPGID 300, CCSID 300 или 16684) как двухбайтового компонента, кодовая страница IBM 290 используется как однобайтовый компонент многобайтовой кодовой страницы IBM- 930 [9] [10] и (как обновленный в Европе CCSID 8482) обновленная версия IBM-1390. [11] [12] Кодовая страница IBM 1027 используется как однобайтовый компонент многобайтовой кодовой страницы IBM-939. [13] [14] и (как обновленный в Европе CCSID 5123) обновленная версия IBM-1399. [15] [16]
В следующей таблице соответствие инвариантному набору отмечено зеленым цветом; столкновение с инвариантным множеством отмечено красным.
Шестнадцатеричный | Строчные буквы в неизменных местах, кана отсутствует или смещена. | Строчная буква отсутствует или заменена каной. | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
Fujitsu EBCDIC [17] | Хитачи EBCDIC [18] | HP EBCDIK [19] | ИБМ 298 [20] | ИБМ 1027 [13] [15] [21] [22] |
ИБМ 1031 [23] | Fujitsu EBCDIK [17] | Хитачи EBCDIK [18] ИБМ 1136 [24] |
НЭК EBCDIC [25] [26] | ИБМ 290 [9] [11] [27] [28] |
ИБМ 887 [29] | ИБМ 1030 [30] | |
0x40 | СП | СП | СП | СП | СП | СП | СП | СП | СП | СП | СП | СП |
0x41 | 。 | 。 | 。 | 。 | 。 | 。 | ||||||
0x42 | 。 | 。 | 。 | 。 | 。 | 「 | 「 | 「 | 「 | 「 | 「 | |
0x43 | 「 | 「 | 「 | 「 | 「 | 」 | 」 | 」 | 」 | 」 | 」 | |
0x44 | 」 | 」 | 」 | 」 | 」 | 、 | 、 | 、 | 、 | 、 | 、 | |
0x45 | 、 | 、 | 、 | 、 | 、 | ・ | ・ | ・ | ・ | ・ | ・ | |
0x46 | ・ | ・ | ・ | ・ | ・ | ヲ | ヲ | ヲ | ヲ | ヲ | ヲ | |
0x47 | ヲ | ヲ | ヲ | ヲ | ヲ | ァ | ァ | ァ | ァ | ァ | ァ | |
0x48 | ァ | ァ | ァ | ァ | ァ | ィ | ィ | ィ | ィ | ィ | ィ | |
0x49 | ィ | ィ | ィ | ィ | ィ | ゥ | ゥ | ゥ | ゥ | ゥ | ゥ | |
0x4A | £ | [ | ¢ | ¢ | ¢ | £ | [ | [ | £ | £ | £ | |
0x4B | . | . | . | . | . | . | . | . | . | . | . | . |
0x4C | < | < | ) | < | < | < | < | < | < | < | < | < |
0x4D | ( | ( | [ | ( | ( | ( | ( | ( | ( | ( | ( | ( |
0x4E | + | + | < | + | + | + | + | + | + | + | + | + |
0x4F | | | ! | | | | | | | | | ! | ! | | | | | | | |
0x50 | & | & | + | & | & | & | & | & | & | & | & | & |
0x51 | ゥ | ゥ | ゥ | ゥ | ゥ | ェ | ェ | ェ | ェ | ェ | ェ | |
0x52 | ェ | ェ | ェ | ェ | ェ | ォ | ォ | ォ | ォ | ォ | ォ | |
0x53 | ォ | ォ | ォ | ォ | ォ | | | | | | | | | | | | | |
0x54 | | | | | | | | | | | ュ | ュ | ュ | ュ | ュ | ュ | |
0x55 | ュ | ュ | ュ | ュ | ュ | ョ | ョ | ョ | ョ | ョ | ョ | |
0x56 | ョ | ョ | ョ | ョ | ョ | ッ | ッ | ッ | ッ | ッ | ッ | |
0x57 | ッ | ッ | ッ | ッ | ッ | а | ||||||
0x58 | с | с | с | с | с | с | с | с | с | с | с | |
0x59 | А | А | А | А | А | а | б | |||||
0x5A | ! | ] | ! | ! | ! | ! | ] | ] | ! | ! | ! | |
0x5B | \ | ¥ | $ | $ | $ | $ | \ | ¥ | \ | ¥ | ¥ | ¥ |
0x5C | * | * | * | * | * | * | * | * | * | * | * | * |
0x5D | ) | ) | ] | ) | ) | ) | ) | ) | ) | ) | ) | ) |
0x5E | ; | ; | ; | ; | ; | ; | ; | ; | ; | ; | ; | ; |
0x5F | ¬ | ^ | ¬ | ¬ | ¬ | ¬ | ^ | ^ | ¬ | ¬ | ¬ | |
0x60 | - | - | - | - | - | - | - | - | - | - | - | - |
0x61 | / | / | / | / | / | / | / | / | / | / | / | / |
0x62 | Хороший | Хороший | Хороший | Хороший | Хороший | б | с | а | а | |||
0x63 | ウ | ウ | ウ | ウ | ウ | с | д | б | б | |||
0x64 | Э | Э | Э | Э | Э | д | и | с | с | |||
0x65 | Ой | Ой | Ой | Ой | Ой | и | ж | д | д | |||
0x66 | Ка | Ка | Ка | Ка | Ка | ж | г | и | и | |||
0x67 | キ | キ | キ | キ | キ | г | час | ж | ж | |||
0x68 | | | | | | | | | | | час | я | г | г | |||
0x69 | ケ | ケ | ケ | ケ | ケ | я | дж | час | час | |||
0x6A | ¦ | | | | | ¦ | | | | | ||||||
0x6B | , | , | , | , | , | , | , | , | , | , | , | , |
0x6C | % | % | ( | % | % | % | % | % | % | % | % | % |
0x6D | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ |
0x6E | > | > | ¥ | > | > | > | > | > | > | > | > | > |
0x6F | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | |
0x70 | ко | ко | ко | ко | ко | дж | к | [ | [ | |||
0x71 | | | | | | | | | | | к | л | я | я | |||
0x72 | シ | シ | シ | シ | シ | л | м | дж | дж | |||
0x73 | | | | | | | | | | | м | н | к | к | |||
0x74 | Се | Се | Се | Се | Се | н | тот | л | л | |||
0x75 | | | | | | | | | | | тот | п | м | м | |||
0x76 | Та | Та | Та | Та | Та | п | д | н | н | |||
0x77 | Чи | Чи | Чи | Чи | Чи | д | р | тот | тот | |||
0x78 | ツ | ツ | ツ | ツ | ツ | р | с | п | п | |||
0x79 | ` | ` | ` | ` | ` | ` | ` | ` | ` | ` | ` | |
0x7A | : | : | : | : | : | : | : | : | : | : | : | |
0x7B | # | # | = | # | # | # | # | # | # | # | # | # |
0x7C | @ | @ | ' | @ | @ | @ | @ | @ | @ | @ | @ | @ |
0x7D | ' | ' | : | ' | ' | ' | ' | ' | ' | ' | ' | ' |
0x7E | = | = | > | = | = | = | = | = | = | = | = | = |
0x7F | " | " | " | " | " | " | " | " | " | " | " | " |
0x80 | Те | Те | Те | с | т | ] | ] | |||||
0x81 | а | а | а | а | а | а | А | А | А | А | А | А |
0x82 | б | б | б | б | б | б | Хороший | Хороший | Хороший | Хороший | Хороший | Хороший |
0x83 | с | с | с | с | с | с | ウ | ウ | ウ | ウ | ウ | ウ |
0x84 | д | д | д | д | д | д | Э | Э | Э | Э | Э | Э |
0x85 | и | и | и | и | и | и | Ой | Ой | Ой | Ой | Ой | Ой |
0x86 | ж | ж | ж | ж | ж | ж | Ка | Ка | Ка | Ка | Ка | Ка |
0x87 | г | г | г | г | г | г | キ | キ | キ | キ | キ | キ |
0x88 | час | час | час | час | час | час | | | | | | | | | | | | |
0x89 | я | я | я | я | я | я | ケ | ケ | ケ | ケ | ケ | ケ |
0x8A | К | К | К | Те | Те | ко | ко | ко | ко | ко | ко | |
0x8B | На | На | На | К | К | т | в | д | д | |||
0x8C | Н | Н | Н | На | На | | | | | | | | | | | | | |
0x8D | Нет | Нет | Нет | Н | Н | シ | シ | シ | シ | シ | シ | |
0x8E | Не | Не | Не | Нет | Нет | | | | | | | | | | | | | |
0x8F | Нет | Нет | Нет | Не | Не | Се | Се | Се | Се | Се | Се | |
0x90 | Ха | Ха | Ха | | | | | | | | | | | | | |||
0x91 | дж | дж | дж | дж | дж | дж | Та | Та | Та | Та | Та | Та |
0x92 | к | к | к | к | к | к | Чи | Чи | Чи | Чи | Чи | Чи |
0x93 | л | л | л | л | л | л | ツ | ツ | ツ | ツ | ツ | ツ |
0x94 | м | м | м | м | м | м | Те | Те | Те | Те | Те | Те |
0x95 | н | н | н | н | н | н | К | К | К | К | К | К |
0x96 | тот | тот | тот | тот | тот | тот | На | На | На | На | На | На |
0x97 | п | п | п | п | п | п | Н | Н | Н | Н | Н | Н |
0x98 | д | д | д | д | д | д | Нет | Нет | Нет | Нет | Нет | Нет |
0x99 | р | р | р | р | р | р | Не | Не | Не | Не | Не | Не |
0x9A | Привет | Привет | Привет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | |
0x9B | Фу | Фу | Фу | Ха | Ха | в | v | р | р | |||
0x9C | Он | Он | Он | Привет | Привет | v | В | |||||
0x9D | Хо | Хо | Хо | Фу | Фу | Ха | Ха | Ха | Ха | Ха | Ха | |
0x9E | Ма | Ма | Ма | Он | Он | Привет | Привет | Привет | Привет | Привет | Привет | |
0x9F | Ми | Ми | Ми | Хо | Хо | Фу | Фу | Фу | Фу | Фу | Фу | |
0xA0 | М | М | М | ¯ | ¯ | В | х | ~ | ~ | |||
0xA1 | ~ | ~ | ¯ | ~ | ~ | ~ | ~ | ~ | ~ | ¯ | ¯ | ¯ |
0xA2 | с | с | с | с | с | с | Он | Он | Он | Он | Он | Он |
0xA3 | т | т | т | т | т | т | Хо | Хо | Хо | Хо | Хо | Хо |
0xA4 | в | в | в | в | в | в | Ма | Ма | Ма | Ма | Ма | Ма |
0xA5 | v | v | v | v | v | v | Ми | Ми | Ми | Ми | Ми | Ми |
0xA6 | В | В | В | В | В | В | М | М | М | М | М | М |
0xA7 | х | х | х | х | х | х | Мне | Мне | Мне | Мне | Мне | Мне |
0xA8 | и | и | и | и | и | и | Мо | Мо | Мо | Мо | Мо | Мо |
0xA9 | С | С | С | С | С | С | Да | Да | Да | Да | Да | Да |
0xAA | Мне | Мне | Мне | Ма | Ма | ワ | ワ | ワ | ワ | ワ | ワ | |
0xAB | Мо | Мо | Мо | Ми | Ми | х | и | с | с | |||
0xAC | Да | Да | Да | М | М | ヨ | ヨ | ヨ | ヨ | ヨ | ヨ | |
0xAD | ワ | ワ | ワ | [ | [ | Ра | Ра | Ра | Ра | Ра | Ра | |
0xAE | ヨ | ヨ | ヨ | Мне | Мне | Ри | Ри | Ри | Ри | Ри | Ри | |
0xAF | Ра | Ра | Ра | Мо | Мо | Ле | Ле | Ле | Ле | Ле | Ле | |
0xB0 | Ри | Ри | Ри | ^ | ^ | и | С | ^ | ^ | |||
0xB1 | Ле | Ле | Ле | £ | £ | С | ¢ | ¢ | ||||
0xB2 | Лес | Лес | Лес | ¥ | ¥ | \ | \ | |||||
0xB3 | Ро | Ро | Ро | Да | Да | т | т | |||||
0xB4 | Ух ты | Ух ты | Ух ты | ワ | ワ | в | в | |||||
0xB5 | Н | Н | Н | ヨ | ヨ | v | v | |||||
0xB6 | ゙ | ゙ | ゙ | Ра | Ра | В | В | |||||
0xB7 | ゚ | ゚ | ゚ | Ри | Ри | х | х | |||||
0xB8 | Ле | Ле | и | и | ||||||||
0xB9 | Лес | Лес | С | С | ||||||||
0xBA | Ро | Ро | Лес | Лес | Лес | Лес | Лес | Лес | ||||
0xBB | Ух ты | Ух ты | Ро | Ро | Ро | Ро | Ро | Ро | ||||
0xBC | Н | Н | Ух ты | Ух ты | Ух ты | Ух ты | Ух ты | Ух ты | ||||
0xBD | ] | ] | Н | Н | Н | Н | Н | Н | ||||
0xBE | ゙ | ゙ | ゙ | ゙ | ゙ | ゙ | ゙ | ゙ | ||||
0xBF | ゚ | ゚ | ゚ | ゚ | ゚ | ゚ | ゚ | ゚ | ||||
0xC0 | { | { | ? | { | { | { | { | { | { | { | { | |
0xC1 | А | А | А | А | А | А | А | А | А | А | А | А |
0xC2 | Б | Б | Б | Б | Б | Б | Б | Б | Б | Б | Б | Б |
0xC3 | С | С | С | С | С | С | С | С | С | С | С | С |
0xC4 | Д | Д | Д | Д | Д | Д | Д | Д | Д | Д | Д | Д |
0xC5 | И | И | И | И | И | И | И | И | И | И | И | И |
0xC6 | Ф | Ф | Ф | Ф | Ф | Ф | Ф | Ф | Ф | Ф | Ф | Ф |
0xC7 | Г | Г | Г | Г | Г | Г | Г | Г | Г | Г | Г | Г |
0xC8 | ЧАС | ЧАС | ЧАС | ЧАС | ЧАС | ЧАС | ЧАС | ЧАС | ЧАС | ЧАС | ЧАС | ЧАС |
0xC9 | я | я | я | я | я | я | я | я | я | я | я | я |
0xCA | ┼ | ┼ | ||||||||||
0xCB | ┴ | ┴ | ||||||||||
0xCC | ┬ | ┬ | ||||||||||
0xCD | └ | ℄ | └ | |||||||||
0xCE | ┌ | ┌ | ||||||||||
0xCF | ┘ | ┘ | ||||||||||
0xD0 | } | } | ! | } | } | } | } | } | } | } | } | |
0xD1 | Дж | Дж | Дж | Дж | Дж | Дж | Дж | Дж | Дж | Дж | Дж | Дж |
0xD2 | К | К | К | К | К | К | К | К | К | К | К | К |
0xD3 | л | л | л | л | л | л | л | л | л | л | л | л |
0xD4 | М | М | М | М | М | М | М | М | М | М | М | М |
0xD5 | Н | Н | Н | Н | Н | Н | Н | Н | Н | Н | Н | Н |
0xD6 | ТО | ТО | ТО | ТО | ТО | ТО | ТО | ТО | ТО | ТО | ТО | ТО |
0xD7 | П | П | П | П | П | П | П | П | П | П | П | П |
0xD8 | вопрос | вопрос | вопрос | вопрос | вопрос | вопрос | вопрос | вопрос | вопрос | вопрос | вопрос | вопрос |
0xD9 | Р | Р | Р | Р | Р | Р | Р | Р | Р | Р | Р | Р |
0xDA | ┐ | ┐ | ||||||||||
0xDB | ─ | ° | ─ | |||||||||
0xDC | ± | |||||||||||
0xDD | ||||||||||||
0xDE | ⌴ | |||||||||||
0xDF | ↧ | |||||||||||
0xE0 | $ | $ | ¥ | \ | \ | $ | $ | $ | $ | $ | $ | |
0xE1 | € | € | ||||||||||
0xE2 | С | С | С | С | С | С | С | С | С | С | С | С |
0xE3 | Т | Т | Т | Т | Т | Т | Т | Т | Т | Т | Т | Т |
0xE4 | В | В | В | В | В | В | В | В | В | В | В | В |
0xE5 | V | V | V | V | V | V | V | V | V | V | V | V |
0xE6 | В | В | В | В | В | В | В | В | В | В | В | В |
0xE7 | Х | Х | Х | Х | Х | Х | Х | Х | Х | Х | Х | Х |
0xE8 | И | И | И | И | И | И | И | И | И | И | И | И |
0xE9 | С | С | С | С | С | С | С | С | С | С | С | С |
0xEA | ||||||||||||
0xEB | ├ | ⌀ | ├ | |||||||||
0xEC | ┤ | ┤ | ||||||||||
0xED | ≤ | |||||||||||
0xEE | ≥ | |||||||||||
0xEF | Ой | |||||||||||
0xF0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
0xF1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
0xF2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 |
0xF3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 |
0xF4 | 4 | 4 | 4 | 4 | 4 | 4 | 4 | 4 | 4 | 4 | 4 | 4 |
0xF5 | 5 | 5 | 5 | 5 | 5 | 5 | 5 | 5 | 5 | 5 | 5 | 5 |
0xF6 | 6 | 6 | 6 | 6 | 6 | 6 | 6 | 6 | 6 | 6 | 6 | 6 |
0xF7 | 7 | 7 | 7 | 7 | 7 | 7 | 7 | 7 | 7 | 7 | 7 | 7 |
0xF8 | 8 | 8 | 8 | 8 | 8 | 8 | 8 | 8 | 8 | 8 | 8 | 8 |
0xF9 | 9 | 9 | 9 | 9 | 9 | 9 | 9 | 9 | 9 | 9 | 9 | 9 |
0xFA | │ | │ | ||||||||||
0xFB | ||||||||||||
0xFC | ⌵ | |||||||||||
0xFD | м | |||||||||||
0xFE | ⋅ |
Двухбайтовые коды
[ редактировать ]Для японского языка с EBCDIC используются три двухбайтовых кода символов: [31] [32] [3] Кодовая страница IBM 300 (также называемая IBM Kanji или IBM Japan DBCS-Host) от IBM , [33] КЕЙС от Хитачи , [31] и JEF от Fujitsu . [17] Это кодировки DBCS-Host, использующие различные коды сдвига для переключения между однобайтовым и двухбайтовым режимами EBCDIC. [1] Коды от 0x41 до 0xFE (те, которые используются для графических символов в EBCDIC) используются парами для представления символов из сетки 190×190; код 0x40 ( пробел в EBCDIC) используется как идеографическое пространство , но не как часть какого-либо другого двухбайтового кода. [1] [33]
В версии кода DBCS-Host от IBM код 0x0F
переключается в однобайтовый режим и код 0x0E
переключается в двухбайтовый режим, [1] [9] [13] [11] [15] как и двухбайтовые коды EBCDIC IBM для других CJK , языков [1] например, версия Johab EBCDIC для корейского языка . [34] В отличие от KEIS и JEF, макет кодовой страницы 300 IBM не связан с JIS X 0208 , и преобразование между ними должно выполняться через таблицу; [31] тем не менее, его репертуар персонажей обновлялся с помощью последующих версий JIS X 0208, чтобы оставаться расширенным набором репертуара JIS X 0208. [3] Ведущие байты с 0x41 по 0x44 используются для символов, отличных от кандзи, ведущие байты с 0x45 по 0x68 используются для символов кандзи, а ведущие байты с 0x69 по 0x89 используются для UDC ( определяемых пользователем символов ). [33]
Существование японского кода DBCS-Host компании IBM оказало влияние не только на системы EBCDIC, поскольку IBM также определила варианты Shift JIS («DBCS-PC», определенного в чистой двухбайтовой кодовой странице 301 и используемого в кодовой странице переменной ширины 932 и Кодовая страница 942 ) и EUC-JP , которые кодируют весь репертуар кодовой страницы IBM 300, включая 28 кандзи, не написанных на кандзи, и 360 кандзи, дополнительных к тем, которые изначально были включены в JIS X 0208 (хотя они не являются кандзи, потому что знак ∵, а не знак ¬ были позже добавлены в JIS X 0208 в 1983 году). Они называются символами, «выбранными IBM» и включаются как расширения, например, в кодовую страницу Windows 932 . [3]
В некоторых новых версиях кодовой страницы IBM-300 добавляются дополнительные кандзи с ведущими байтами от 0xB8 до 0xD5 и дополнительные не-кандзи с ведущими байтами от 0xD6 до 0xE9. [33] В этой версии обновлен набор для JIS X 0213 , включая знак евро , и, сохранив CPGID 300, ему был присвоен новый CCSID 16684. [35] Кодовые страницы IBM-930 (с кодовой страницей 290 в виде однобайтового набора), [9] IBM-931 (с кодовой страницей 37 в качестве однобайтового набора) и IBM-939 (с кодовой страницей 1027 в качестве однобайтового набора) [13] исключить эти дополнения, в то время как IBM-1390 (с версией кодовой страницы 290 под знаком евро / CCSID 8482) [11] и IBM-1399 (с версией кодовой страницы 1027 для знака евро / CCSID 5123) [15] включите их.
В Хитачи КЕЙС [31] (Расширенная информационная система обработки кандзи), последовательность 0x0A 0x41
переключается в однобайтовый режим и последовательность 0x0A 0x42
переключается в двухбайтовый режим. [а] Символы JIS X 0208 кодируются с использованием тех же последовательностей байтов, которые используются для их кодирования в EUC-JP , т.е. оба байта находятся в диапазоне от 0xA1 до 0xFE включительно. Это приводит к дублированию кодировок для идеографическое пространство — 0x4040 согласно структуре кода DBCS-Host и 0xA1A1, как в EUC-JP. Однако диапазон ведущих байтов расширен обратно до 0x59, из которых ведущие байты 0x81–A0 предназначены для символов, определяемых пользователем. [1] а остальные используются для корпоративных символов, включая как кандзи, так и не-кандзи. [3]
В Фуджицу Джеф [17] (расширенная функция обработки на японском языке), 0x29
переключается в однобайтовый режим и 0x28
переключается в двухбайтовый режим. Как и в случае с KEIS, коды JIS X 0208 представлены так же, как и в EUC-JP. [1] В отличие от KEIS, версия JIS X 0208, используемая в этой зоне JEF, представляет собой оригинальный стандарт JIS C 6226:1978. [31] [17] Диапазон ведущих байтов снова расширен до 0x41, при этом 0x80–A0 предназначен для определения пользователя; ведущим байтам 0x41–7F присвоены номера строк от 101 до 163 для целей кутен , хотя строка 162 (ведущий байт 0x7E) не используется. [1] [3] Строки с 101 по 148 используются для расширенных кандзи, а строки с 149 по 163 используются для расширенных не-кандзи. [3]
Сноски
[ редактировать ]Ссылки
[ редактировать ]- ^ Перейти обратно: а б с д и ж г час я дж Лунде, Кен (2009). «Приложение F: Методы кодирования поставщиков» (PDF) . Обработка информации CJKV: китайские, японские, корейские и вьетнамские вычисления (2-е изд.). Севастополь, Калифорния : О'Рейли . ISBN 978-0-596-51447-1 .
- ^ Перейти обратно: а б «Инвариантный набор символов» . Документация IBM i 7.1 . ИБМ . 14 августа 2018 г.
- ^ Перейти обратно: а б с д и ж г Лунде, Кен (2009). «Приложение E: Стандарты набора символов поставщика» (PDF) . Обработка информации CJKV: китайские, японские, корейские и вьетнамские вычисления (2-е изд.). Севастополь, Калифорния : О'Рейли . ISBN 978-0-596-51447-1 .
- ^ «EBCDIK: Расширенный двоично-десятичный код обмена Кана» . Базовые знания коммуникационной терминологии .
- ^ Перейти обратно: а б «Идентификаторы кодовых страниц» . Центр разработки Windows . Майкрософт.
- ^ Стил, Шон. «Кодовая страница 21027 «Расширенный/расширенный альфа-строчный регистр» » . Майкрософт .
- ^ «CCSID 8482» . Идентификаторы кодированных наборов символов . ИБМ . Архивировано из оригинала 29 ноября 2014 г.
- ^ «CCSID 5123» . Идентификаторы кодированных наборов символов . ИБМ . Архивировано из оригинала 29 ноября 2014 г.
- ^ Перейти обратно: а б с д "ibm-930_P120-1999" . Международные компоненты для Unicode . Консорциум Юникод .
- ^ «CCSID 930» . Идентификаторы кодированных наборов символов . ИБМ . Архивировано из оригинала 1 декабря 2014 г.
- ^ Перейти обратно: а б с д "ibm-1390_P110-2003" . Международные компоненты для Unicode . Консорциум Юникод .
- ^ «CCSID 1390» . Идентификаторы кодированных наборов символов . ИБМ . Архивировано из оригинала 29 ноября 2014 г.
- ^ Перейти обратно: а б с д "ibm-939_P120-1999" . Международные компоненты для Unicode . Консорциум Юникод .
- ^ «CCSID 939» . Идентификаторы кодированных наборов символов . ИБМ . Архивировано из оригинала 1 декабря 2014 г.
- ^ Перейти обратно: а б с д "ibm-1399_P110-2003" . Международные компоненты для Unicode . Консорциум Юникод .
- ^ «CCSID 1399» . Идентификаторы кодированных наборов символов . ИБМ . Архивировано из оригинала 29 ноября 2014 г.
- ^ Перейти обратно: а б с д и Идзуно, Хидекацу (20 октября 2021 г.). "jef4j: поддержка кодировки JEF для Java " Гитхаб .
- ^ Перейти обратно: а б «EBCDIC/EBCDIKのコード表» . Хитачи . Архивировано из оригинала 3 июня 2021 г. Проверено 29 мая 2021 г.
- ^ «Таблица преобразования JIS/EBCDIK» . Справочное руководство FCOPY . Хьюлетт-Паккард . [1] Примечание: таблица в исходном коде сопоставляет все входные байты, иногда с кодами, которые фактически не определены в JIS X 0201 , но является асимметричной и не всегда выполняет двусторонний обмен. Показанные здесь символы — это те символы, символы которых в таблицах исходного кода туда и обратно сопоставляются с кодами, фактически определенными в JIS X 0201.
- ^ «Кодовая страница 00298» (PDF) . ИБМ . Архивировано из оригинала (PDF) 8 июля 2015 г.
- ^ «Кодовая страница 01027» (PDF) . РЕЕСТР: наборы графических символов и кодовые страницы . ИБМ . 1999.
- ^ «Кодовая страница 01027» (PDF) . ИБМ . Архивировано из оригинала (PDF) 8 июля 2015 г.
- ^ «Кодовая страница 01031» (PDF) . ИБМ . Архивировано из оригинала (PDF) 8 июля 2015 г.
- ^ «Кодовая страница 01136» (PDF) . ИБМ . Архивировано из оригинала (PDF) 8 июля 2015 г.
- ^ «Преобразование символов кана EBCDIC» Руководство по преобразованию кода - Введение (HULFT8) (на японском языке).
- ^ Коидзуми, Мориёси. «Только EBCDIC» .
- ^ «Кодовая страница 00290» (PDF) . РЕЕСТР: наборы графических символов и кодовые страницы . ИБМ . 1999.
- ^ «Кодовая страница 00290» (PDF) . ИБМ . Архивировано из оригинала (PDF) 8 июля 2015 г.
- ^ «Кодовая страница 00887» (PDF) . ИБМ . Архивировано из оригинала (PDF) 8 июля 2015 г.
- ^ «Кодовая страница 01030» (PDF) . ИБМ . Архивировано из оригинала (PDF) 8 июля 2015 г.
- ^ Перейти обратно: а б с д и кодов символов . «Приложение К.3 Преобразование »
- ^ «2 кодовых набора и преобразование кодовых наборов» . Технический справочник DIGITAL UNIX по использованию японских функций . Компак .
- ^ Перейти обратно: а б с д «Набор японских графических символов IBM, кандзи» (PDF) . ИБМ . 1999. Корпоративная спецификация IBM CH 3-3220-024.
- ^ "ibm-1364_P110-2007" . Международные компоненты для Unicode . Консорциум Юникод .
- ^ «CCSID 16684» . Идентификаторы кодированных наборов символов . ИБМ . Архивировано из оригинала 29 ноября 2014 г.