EBCDIC
Эта статья нуждается в дополнительных цитатах для проверки . ( январь 2019 г. ) |
Классификация | 8-битная базовая кодировка латиницей (не ASCII) |
---|---|
Предшественник | двоично-десятичный код |
Расширенный двоично-десятичный код обмена [1] [2] ( EBCDIC ; [1] / ˈ ɛ b s ɪ d ɪ k / ) — восьмибитная кодировка символов, используемая в основном в мэйнфреймах IBM и IBM операционных системах компьютеров среднего уровня . Он произошел от кода, используемого в перфокартах , и соответствующего шестибитного двоично-десятичного IBM кода, который использовался в большинстве компьютерных периферийных устройств в конце 1950-х - начале 1960-х годов. [3] Он поддерживается различными платформами сторонних производителей, такими как Fujitsu-Siemens BS2000 /OSD , OS-IV, MSP и MSP-EX, серия SDS Sigma , Unisys VS/9 , Unisys MCP и ICL VME .
История
[ редактировать ]EBCDIC был разработан в 1963 и 1964 годах компанией и анонсирован с выпуском IBM System/360 линейки мэйнфреймов IBM . Это восьмибитная кодировка символов, разработанная отдельно от семибитной схемы кодирования ASCII . Он был создан для расширения существующего двоично-десятичного кода обмена (BCD), или BCDIC , который сам по себе был разработан как эффективное средство кодирования двух зон и номеров на перфокартах в шесть бит. Отдельное кодирование «s» и «S» (с использованием позиции 2 вместо 1) сохранялось на перфокартах, где было желательно не располагать дыроколы слишком близко друг к другу, чтобы обеспечить целостность физической карты. [4] [ не удалось пройти проверку ]
Хотя IBM была главным сторонником комитета по стандартизации ASCII, [5] у компании не было времени подготовить периферийные устройства ASCII (например, перфокарты) к поставке вместе с компьютерами System/360, поэтому компания остановилась на EBCDIC. [3] System/360 стала чрезвычайно успешной вместе с такими клонами, как RCA Spectra 70 , ICL System 4 и Fujitsu FACOM, а также EBCDIC.
IBM для мэйнфреймов Все операционные системы и операционная система IBM i для компьютеров среднего класса используют EBCDIC в качестве встроенной кодировки. [6] (например, с поддержкой ASCII ISPF в z/OS может просматривать и редактировать файлы в кодировке EBCDIC и ASCII). Программное обеспечение может выполнять преобразование в кодировки и обратно, а современные мэйнфреймы (такие как IBM Z ) включают в себя инструкции процессора на аппаратном уровне для ускорения перевода между наборами символов.
Существует EBCDIC-ориентированный формат преобразования Unicode, называемый UTF-EBCDIC , предложенный Консорциумом Unicode , предназначенный для обеспечения простого обновления программного обеспечения EBCDIC для обработки Unicode , но не предназначенный для использования в средах открытого обмена. Даже в системах с обширной поддержкой EBCDIC он не пользовался популярностью. Например, z/OS поддерживает Unicode ( особенно UTF-16 ), но z/OS имеет лишь ограниченную поддержку UTF-EBCDIC.
Не все операционные системы, работающие на оборудовании IBM, используют EBCDIC; IBM AIX , Linux на IBM Z и Linux на Power используют ASCII, как и все операционные системы, работающие на персональном компьютере IBM и его преемниках.
Совместимость с ASCII
[ редактировать ]Этот раздел нуждается в дополнительных цитатах для проверки . ( Ноябрь 2022 г. ) |
Было множество трудностей при написании программного обеспечения, которое работало бы как в ASCII, так и в EBCDIC.
- Из-за промежутков между буквами простой код, работавший в ASCII, не работал с EBCDIC. Например
for (c = 'A'; c <= 'Z'; ++c) putchar(c);
будет печатать алфавит от А до Я, если используется ASCII, но напечатает 41 символ (включая ряд неназначенных) в EBCDIC. - При сортировке EBCDIC строчные буквы помещаются перед прописными буквами, а буквы — перед цифрами, что является полной противоположностью ASCII.
- Большинство языков программирования, форматов файлов и сетевых протоколов, разработанных для ASCII, использовали доступные знаки препинания (например, фигурные скобки { и } ), которых не было в EBCDIC, что затрудняло перевод в системы EBCDIC. обходные пути, такие как триграфы . Были использованы [7] И наоборот, в EBCDIC было несколько символов, таких как ¢ ( цент США ), которые использовались в системах IBM и не могли быть переведены в ASCII.
- Наиболее распространенным соглашением о переводе строки, используемым с EBCDIC, является использование кода NEL (NEXT LINE) между строками. Преобразователи в другие кодировки часто заменяют NEL на LF или CR/LF , даже если в целевой кодировке есть NEL. Это приводит к тому, что LF и NEL преобразуются в один и тот же символ и их невозможно различить.
- Если использовался семибитный ASCII, в 8-битных байтах был «неиспользуемый» старший бит, и многие программы хранили там другую информацию. Программное обеспечение также упаковывает семь бит и отбрасывает восьмой, например, упаковывая пять семибитных символов ASCII в 36-битное слово. [8] В PDP-11 байты с установленным старшим битом обрабатывались как отрицательные числа, поведение, которое было скопировано в C , вызывая неожиданные проблемы, если был установлен старший бит. Все это затрудняло переход с ASCII на 8-битный EBCDIC (а также затрудняло переход на 8-битную расширенную кодировку ASCII).
Макет кодовой страницы
[ редактировать ]Существуют сотни кодовых страниц EBCDIC, основанных на исходной кодировке символов EBCDIC; существует множество кодовых страниц EBCDIC , предназначенных для использования в разных частях мира, включая кодовые страницы для нелатинских алфавитов, таких как китайский, японский (например, EBCDIC 930, JEF и KEIS), корейский и греческий (EBCDIC 875). ). Существует также огромное количество вариантов, в которых буквы меняются местами без видимой причины. [ нужна ссылка ]
В таблице ниже показано «инвариантное подмножество». [9] EBCDIC, которые представляют собой символы, которые должны иметь одинаковые назначения на всех кодовых страницах EBCDIC, использующих латинский алфавит. (Это включает большую часть инвариантного репертуара ISO/IEC 646 , за исключением восклицательного знака .) Он также показывает (серым цветом) отсутствующие знаки препинания ASCII и EBCDIC, расположенные там, где они находятся на кодовой странице 37 (один из вариантов кодовой страницы EBCDIC). . Пустые ячейки в вариантах заполняются символами, специфичными для региона, но символы серого цвета также часто меняются местами или заменяются. Как и ASCII, инвариантное подмножество работает только для языков, использующих базовый латинский алфавит ISO , таких как английский (исключая заимствованные слова и некоторые необычные орфографические варианты) и голландский (если лигатуры «ij» и «IJ» написаны как два символа).
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
0x | НУЛЕВОЙ | СОХ | СТХ | И Т. Д | КЛЕТКА | ХТ | РНЛ | ПРИНАДЛЕЖАЩИЙ | GE | СПС | РПТ | ВТ | ФФ | ЧР | ТАК | И |
1x | В СООТВЕТСТВИИ С | DC1 | DC2 | DC3 | ВИЭ/ ЕПД | Нидерланды | БС | МАЛЕНЬКИЙ | МОЖЕТ | В | ЮБС | 1 CU | МФС | ИГС | Налоговое управление США | ИУС / ИТБ |
2x | ДС | SOS | ФС | ВУС | БП/ ИЯФ | НЧ | ЭТБ | ЭКУ | на | ЮФЭ | СМ/ ЮВ | CSP | МИД | ENQ | ПОДТВЕРЖДЕНИЕ | БЕЛ |
3x | СИН | И | ПП | ТРН | НБС | EOT | СБС | ЭТО | RFF | CU3 | DC4 | ХОТЕТЬ | СУБ | |||
4x | СП | ¢ | . | < | ( | + | | | |||||||||
5x | & | ! | $ | * | ) | ; | ¬ | |||||||||
6x | - | / | ¦ | , | % | _ | > | ? | ||||||||
7x | ` | : | # | @ | ' | = | " | |||||||||
8x | а | б | с | д | и | ж | г | час | я | ± | ||||||
9x | дж | к | л | м | н | тот | п | д | р | |||||||
Топор | ~ | с | т | в | v | В | х | и | С | |||||||
Бх | ^ | [ | ] | |||||||||||||
Сх | { | А | Б | С | Д | И | Ф | Г | ЧАС | я | ||||||
Дх | } | Дж | К | л | М | Н | ТО | П | вопрос | Р | ||||||
Бывший | \ | С | Т | В | V | В | Х | И | С | |||||||
Форекс | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | ЭО |
Определения элементов управления EBCDIC, отличных от ASCII,
[ редактировать ]Ниже приведены определения управляющих символов EBCDIC, которые либо не сопоставляются с управляющими символами ASCII , либо имеют дополнительное применение. При сопоставлении с Unicode они в основном сопоставляются с кодовыми точками управляющих символов C1 способом, указанным в архитектуре представления символьных данных IBM (CDRA). [10] [11]
Хотя сопоставление новой строки (NL) по умолчанию соответствует символу следующей строки (NEL) ISO/IEC 6429 (поведение которого также указано, но не обязательно, в Приложении 14 к Юникоду), [12] большинство этих элементов управления, сопоставленных с C1, не соответствуют ни элементам управления, входящим в набор C1 ISO/IEC 6429 , ни тем, которые входят в другие зарегистрированные наборы элементов управления C1, такие как ISO 6630 . [13] Хотя это фактически делает элементы управления EBCDIC, отличные от ASCII, уникальным набором элементов управления C1, они не входят в число наборов элементов управления C1, зарегистрированных в реестре ISO-IR . [14] это означает, что они не имеют назначенной последовательности обозначения набора элементов управления (как указано в ISO/IEC 2022 и опционально разрешено в ISO/IEC 10646 (Unicode)). [15]
Помимо U+0085 (следующая строка), стандарт Unicode не предписывает интерпретацию управляющих символов C1, оставляя их интерпретацию протоколам более высокого уровня (он предполагает, но не требует, их интерпретации ISO/IEC 6429 при отсутствии использования для другие цели), [16] поэтому это сопоставление допустимо в Юникоде, но не указано в нем.
Мнемоника | EBCDIC | Сопряжение CDRA [10] [11] | Имя | Описание [17] |
---|---|---|---|---|
КЛЕТКА | 04 | 009C | Выбирать | Символ управления устройством, принимающий однобайтовый параметр. |
ПФ | Удар офф | Перечислены по этому адресу по ГОСТ 19768-93 . [18] | ||
РНЛ | 06 | 0086 | Требуется новая строка | Сброс разрыва строки отступа табуляции Режим |
ЛК | Нижний регистр | Перечислены по этому адресу по ГОСТ 19768-93 . [18] | ||
GE | 08 | 0097 | Графический побег | Неблокирующий сдвиг, изменяющий интерпретацию следующего символа (см., например, кодовую страницу 310 ). Сравните стандарты ISO/IEC 6429 СС2 (008E). |
СПС | 09 | 008D | Надстрочный индекс | Начать верхний индекс или отменить нижний индекс. Сравните стандарты ISO/IEC 6429 БОЛЬШЕ (008C). |
РПТ | 0А | 008E | Повторить | Переключиться в режим работы с повторением буфера печати |
СММ | Начало ручного сообщения | Перечислены по этому адресу по ГОСТ 19768-93 . [18] | ||
ВИЭ/ЕПС | 14 | 009D | Восстановить, включить презентацию | Возобновить вывод (после ВВП/ИНП ) |
Нидерланды | 15 | 0085 (000А) | Новая линия | Разрыв строки. Сопоставление по умолчанию (0085) соответствует стандарту ISO/IEC 6429. НЭЛ . Сопоставления иногда заменяются переводом строки (EBCDIC 0x25) в соответствии с соглашением о разрыве строки UNIX. [10] |
МАЛЕНЬКИЙ | 17 | 0087 | Связь с оператором программы | За ним следуют два однобайтовых оператора, которые идентифицируют конкретную функцию, например световую или функциональную клавишу. Контраст со стандартами ISO/IEC 6429. CSI (009B), OSC (009D) и БТР (009F). |
ТО | Праздный | Перечислены по этому адресу по ГОСТ 19768-93 . [18] | ||
ЮБС | 1А | 0092 | Единица Backspace | Дробный возврат. |
СС | Управление курсором | Перечислены по этому адресу по ГОСТ 19768-93 . [18] | ||
1 CU | 1Б | 008F | Клиент использует один | Не используется IBM; для использования клиентом. |
ИУС/ИТБ | 1F | 001F | Сепаратор узла обмена, блок промежуточной передачи | Либо используется в качестве разделителя информации для завершения блока, называемого «единицей» (как в ASCII ; см. также IR ) или используется в качестве кода управления передачей для ограничения конца промежуточного блока. |
ДС | 20 | 0080 | Выбор цифры | Используется инструкцией редактирования ЦП S/360 (ED). |
SOS | 21 | 0081 | Начало значения | Используется инструкцией редактирования ЦП S/360 (ED). (Примечание: отличается от ISO/IEC 6429). СОС ; там, где необходимо их различать, IBM сокращает начало значимости как SOS. (с точкой) и Начало строки как SOS , в противном случае они сокращаются одинаково.) [19] |
ФС, [17] ФДС [18] | 22 | 0082 | Разделитель полей | Используется инструкцией редактирования ЦП S/360 (ED). (Примечание: (Обмен) Разделитель файлов , сокращенно FS в ASCII, имеет адрес 0x1C и сокращенно IFS.) [17] |
ВУС | 23 | 0083 | Слово подчеркивание | Подчеркивает непосредственно предыдущее слово. ISO/IEC 6429 В отличие от SGR . |
ВВП/ИНП | 24 | 0084 | Обход, запрет презентации | Деактивирует вывод, т.е. игнорирует все графические символы и символы управления, кроме кодов управления передачей и RES/ENP, до следующего ВИЭ/ЕПС . |
на | 28 | 0088 | Установить атрибут | Отмечает начало последовательности управления устройством фиксированной длины. Устарело в пользу ЦСП . |
ЮФЭ | 29 | 0089 | Расширенное стартовое поле | Отмечает начало управляющей последовательности устройства переменной длины. Устарело в пользу ЦСП . |
СМ/ЮЗ | 2А | 008А | Установить режим, переключить | Элемент управления, специфичный для устройства, который устанавливает режим работы, например, переключатель буфера. |
CU2 | 2Б | 008Б | Клиент использует два | Это указано в некоторых спецификациях, например ГОСТ 19768-93 ; [18] в новых спецификациях IBM для управляющих кодов EBCDIC указаны только CU1 и CU3 как используемые клиентом, и используйте эту позицию для ЦСП . [17] |
CSP | Префикс управляющей последовательности | Отмечает начало управляющей последовательности устройства переменной длины. За ним следует байт класса, определяющий категорию функции управления, байт счета, задающий длину последовательности (включая байты счета и типа, но не байт класса или начальный CSP), байт типа, идентифицирующий функцию управления в этой категории, и ноль или больше байтов параметров. Контраст со стандартами ISO/IEC 6429. DCS (0090) и CSI (009B). | ||
МИД | 2С | 008C | Изменить атрибут поля | Отмечает начало управляющей последовательности устройства переменной длины. Устарело в пользу ЦСП . |
30 | 0090 | (сдержанный) | Зарезервировано для будущего использования IBM | |
31 | 0091 | (сдержанный) | Зарезервировано для будущего использования IBM | |
И | 33 | 0093 | Возврат индекса | Либо перейдите к началу следующей строки (см. также NL ) или завершить информационную единицу (см. также IUS/ITB ). |
ПП | 34 | 0094 | Позиция презентации | За ним следуют два однобайтовых параметра (во-первых, функция, во-вторых, номер столбца или строки) для установки текущей позиции. ISO/IEC 6429 Сравните с CUP и HVP . |
ПН | Удар дальше | Перечислены по этому адресу по ГОСТ 19768-93 . [18] | ||
ТРН | 35 | 0095 | Прозрачный | За ним следует однобайтовый параметр, указывающий количество следующих за ним байтов прозрачных данных. |
РСТ | Читатель Стоп | Перечислены по этому адресу по ГОСТ 19768-93 . [18] | ||
НБС | 36 | 0096 | Числовой возврат | Переместитесь назад на ширину одной цифры. |
Калифорнийский университет | Верхний регистр | Перечислены по этому адресу по ГОСТ 19768-93 . [18] | ||
СБС | 38 | 0098 | Индекс | Начать нижний индекс или отменить верхний индекс. Сравните стандарты ISO/IEC 6429 ПЛД (008B). |
ЭТО | 39 | 0099 | Вкладка «Отступ» | Делает отступы к текущей и всем последующим строкам до тех пор, пока РНЛ или RFF Встречается . |
RFF | 3А | 009А | Обязательный фид формы | Сброс разрыва страницы Режим отступа табуляции . |
CU3 | 3Б | 009Б | Клиент использует три | Не используется IBM; для использования клиентом. |
3Е | 009E | (сдержанный) | Зарезервировано для будущего использования IBM | |
ЭО | ФФ | 009F | Восемь единиц | Все персонажи используются в качестве наполнителя |
Кодовые страницы с наборами символов Latin-1
[ редактировать ]Следующие кодовые страницы имеют полный набор символов Latin-1 (ISO/IEC 8859-1). В первом столбце указан исходный номер кодовой страницы. Во втором столбце указан номер кодовой страницы, обновленной знаком евро (€), заменяющим универсальный знак валюты (¤) (или, в случае EBCDIC 924, с измененным набором в соответствии с ISO 8859-15 ).
В разных странах используются разные кодовые страницы, поскольку эти кодовые страницы возникли как кодовые страницы с репертуаром символов для конкретной страны, а затем были расширены и теперь содержат весь репертуар ISO 8859-1, что означает, что данный символ ISO 8859-1 может иметь разные кодовых точек. значения в разных кодовых страницах. Они известны как расширенные кодовые страницы страны ( CECP ). [20]
CCSID | Евро обновлять | Страны |
---|---|---|
037 | 1140 | Австралия, Бразилия, Канада, Новая Зеландия, Португалия, Южная Африка, США |
273 | 1141 | Австрия, Германия |
277 | 1142 | Дания, Норвегия |
278 | 1143 | Финляндия, Швеция |
280 | 1144 | Италия |
284 | 1145 | Латинская Америка, Испания |
285 | 1146 | Ирландия, Великобритания |
297 | 1147 | Франция |
500 | 1148 | Международный |
871 | 1149 | Исландия |
1047 | 924 | Открытые системы ( MVS C компилятор ) |
Критика и юмор
[ редактировать ]Этот раздел , по-видимому, противоречит другому разделу этой статьи . ( май 2024 г. ) |
Сторонник программного обеспечения с открытым исходным кодом и разработчик программного обеспечения Эрик С. Рэймонд пишет в своем жаргонном файле , что хакеры ненавидели EBCDIC, под этим он имел в виду [21] члены субкультуры энтузиастов-программистов. Файл жаргона 4.4.7 дает следующее определение: [22]
EBCDIC: /eb´s@·dik/, /eb´see`dik/, /eb´k@·dik/, сущ.[аббревиатура, расширенный двоично-десятичный код обмена] Предполагаемый набор символов, используемый на динозаврах IBM. Он существует как минимум в шести взаимно несовместимых версиях, каждая из которых отличается такими прелестями, как несмежные последовательности букв и отсутствие нескольких символов пунктуации ASCII, что довольно важно для современных компьютерных языков (какие именно символы отсутствуют, зависит от того, какую версию EBCDIC вы используете). смотрю). IBM адаптировала EBCDIC из кода перфокарты в начале 1960-х годов и пропагандировала его как тактику контроля клиентов (см. «Заговор соединителей» ), отвергнув уже установленный стандарт ASCII. Сегодня IBM утверждает, что является компанией, занимающейся открытыми системами , но собственное описание IBM вариантов EBCDIC и способов преобразования между ними по-прежнему находится под грифом «совершенно секретно» и подлежит записи перед чтением. Хакеры недовольны самим названием EBCDIC и считают его проявлением чистейшего зла.
— Файл жаргона 4.4.7.
Дизайн EBCDIC также стал источником множества шуток. Одна такая шутка найдена в состояний файле Unix 4.3BSD Reno (1990). [23] шел:
Профессор: «Итак, американское правительство обратилось в IBM, чтобы разработать стандарт шифрования , и они придумали…»
Студент: «EBCDIC!»
Ссылки на набор символов EBCDIC сделаны в серии компьютерных игр Zork 1979 года . В «Машинном зале» Zork II EBCDIC используется для обозначения непонятного языка:
Это большая комната, полная разнообразной тяжелой техники, шумно жужжащей. В комнате пахнет сгоревшими резисторами. Вдоль одной стены расположены три кнопки круглой, треугольной и квадратной формы соответственно. Естественно, над этими кнопками находятся инструкции, написанные в EBCDIC...
В 2021 году стало известно, что бельгийский банк в 2019 году все еще использовал EBCDIC внутри компании. Клиент настаивал на том, что правильное написание его фамилии включало умлаут , который банк пропустил, и клиент подал жалобу, сославшись на гарантию в Общих данных. Положение о защите права на своевременное «исправление неточных персональных данных». Аргумент банка включал тот факт, что их система использовала EBCDIC, а также то, что она не поддерживала буквы с диакритическими знаками (или строчными буквами, если на то пошло). Апелляционный суд вынес решение в пользу заказчика. [24] [25]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Перейти обратно: а б Маккензи, Чарльз Э. (1980). Наборы кодированных символов, история и развитие (PDF) . Серия системного программирования (1-е изд.). издательской компании Addison-Wesley, Inc. ISBN 0-201-14460-3 . LCCN 77-90165 . Проверено 6 апреля 2022 г.
- ^ Донован, Джон Дж. (1972). Системное программирование . МакГроу-Хилл. п. 65. ИСБН 0-07-085175-1 .
- ^ Перейти обратно: а б Бемер, Боб . «EBCDIC и P-Bit (самая большая компьютерная глупость за всю историю) — краткие обзоры истории компьютеров» . Архивировано из оригинала 13 мая 2018 г. Проверено 2 июля 2013 г.
...но их принтеры и перфораторы не были готовы обрабатывать ASCII, и IBM просто ДОЛЖНА была объявить об этом.
- ^ «Коды перфокарт Дуга Джонса» . homepage.cs.uiowa.edu . Проверено 14 января 2023 г.
- ^ «Х3.4-1963» . 1963. с. 4. (Примечание. В последний подкомитет ASA X3.2, состоящий из 21 члена, у IBM было четыре сотрудника.)
- ^ IBMnt (2008). «IBM подтверждает использование EBCDIC в своих мейнфреймах в качестве практики по умолчанию» . Архивировано из оригинала 3 января 2013 г. Проверено 16 июня 2008 г.
- ^ «Обоснование международного стандарта — языки программирования — C» (PDF) . Версия 5.10. Апрель 2003 г. § MSE.4: Поддержка инварианта ISO/IEC 646. Архивировано (PDF) из оригинала 06 июня 2016 г. Проверено 24 ноября 2022 г.
- ^ Справочное руководство по PDP-10, Книга 2: Сборка исходной программы (PDF) . Корпорация цифрового оборудования . п. 221.
- ^ «Инвариантный набор символов» . Центр знаний IBM . 14 августа 2018 г.
- ^ Перейти обратно: а б с Умамахесваран, В.С. (8 ноября 1999 г.). «3.3 Шаг 2: Преобразование байтов» . UTF-EBCDIC . Консорциум Юникод . Технический отчет Unicode № 16.
64 управляющих символа... символ ASCII DELETE (U+007F)... отображаются в соответствии с соглашениями EBCDIC, как определено в архитектуре представления символьных данных IBM, CDRA, за одним исключением - сочетание перевода строки EBCDIC и новой строки. управляющие символы заменяются из пар CDRA по умолчанию на управляющие символы перевода строки (U+000A) и следующей строки (U+0085) ISO/IEC 6429.
- ^ Перейти обратно: а б Стил, Шон (24 апреля 1996 г.). «cp037_IBMUSCanada в таблицу Юникода» . Консорциум Microsoft / Unicode .
- ^ Хенингер, Энди (15 февраля 2019 г.). «NL: Следующая линия (A) (не настраивается)» . Алгоритм разрыва строки в Юникоде . Редакция 43. Консорциум Unicode . Стандартное приложение Unicode № 14.
- ^ ИСО/ТК 46 (1 февраля 1986 г.). Дополнительные функции контроля библиографического использования в соответствии с международным стандартом ISO 6630 (PDF) . ITSCJ/ IPSJ . ИСО-ИК -124.
{{citation}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ Международный реестр наборов кодированных символов ISO/IEC для использования с escape-последовательностями (PDF) , ITSCJ/ IPSJ , ISO-IR
- ^ ISO/IEC JTC 1/SC 2 (2017). «12.4: Идентификация набора функций управления». Информационные технологии - Универсальный набор кодированных символов (UCS) (5-е изд.). ИСО . стр. 19–20. ISO/IEC 10646.
Для других наборов C0 или C1 последний октет F должен быть получен из Международного реестра наборов кодированных символов.... Если такая escape-последовательность появляется в последовательности кодовой единицы, соответствующей настоящему международному стандарту, она должна быть дополнено в соответствии с пунктом 11.
{{citation}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ Консорциум Юникод (2019). «23.1: Коды управления». Стандарт Юникод (PDF) (изд. 12.0.0). стр. 868–870. ISBN 978-1-936213-22-1 .
- ^ Перейти обратно: а б с д «Приложение G-1. Определения управляющих символов EBCDIC» . Архитектура представления символьных данных . Корпорация IBM . Архивировано из оригинала 11 сентября 2018 г.
- ^ Перейти обратно: а б с д и ж г час я дж GOST (1993). "Информационная технология. Наборы 8-битных кодированных символов. Двоичный код обработки информации" [Information technology. 8-bit coded character sets. Binary code for information processing] (in Russian). GOST 19768-93.
- ^ ИБМ . «Архитектура представления символьных данных (CDRA)» . ИБМ . п. 327.
Мнемоника управляющего символа начала значения в EBCDIC была изменена и теперь включает точку (.) в конце (SOS.). Это было сделано для того, чтобы отличить его от мнемоники SOS, используемой в ISO-8 для управляющего символа начала строки. Точка никоим образом не изменяет свойство элемента управления.
- ^ «iso8859.txt» . Кермитский проект / Колумбийский университет .
- ^ Раймонд, Эрик С. (1997). «Словарь нового хакера» . п. 310.
- ^ «EBCDIC» . Файл жаргона . Архивировано из оригинала 13 мая 2018 г. Проверено 13 мая 2018 г.
- ^ 4.3BSD-Reno/share/games/fortune/fortunes
- ^ «Апелляционный суд Брюсселя – 2019/AR/1006 – GDPRhub» .
- ^ Иден, Теренс (25 октября 2021 г.). «EBCDIC несовместим с GDPR — блог Теренса Идена» .
Внешние ссылки
[ редактировать ]- Связанные с IBM:
- Архитектура представления символьных данных (CDRA) от IBM на Wayback Machine (архивировано 13 мая 2018 г.). Содержит официальную информацию IBM о кодовых страницах и наборах символов.
- Кодовая страница 37 на Wayback Machine (архивировано 19 июня 2015 г.)
- Кодовая страница 1047 в Wayback Machine (архивировано 7 июня 2015 г.)
- Справочник кодовых страниц хоста от IBM показывает кодовые диаграммы для нескольких однобайтовых страниц IBM EBCDIC.
- ICU Converter Explorer Содержит дополнительную информацию о EBCDIC, полученном из IBM CDRA, включая DBCS EBCDIC (набор двухбайтовых символов EBCDIC).
- «Кодовые страницы» . ИБМ . от «IBM и глобализация» . ИБМ .
- Архитектура представления символьных данных (CDRA) от IBM на Wayback Machine (архивировано 13 мая 2018 г.). Содержит официальную информацию IBM о кодовых страницах и наборах символов.
- Руководство по XHCS V2.0 , показывает кодовые схемы для нескольких однобайтовых страниц EBCDIC Siemens / Fujitsu (в отличие от IBM), используемых на BS2000 .
- Список символов EBCDIC, включая десятичные и шестнадцатеричные значения, символическое имя и символ / функцию на Wayback Machine (заархивировано 3 марта 2016 г.)
- Кодовые страницы EBCDIC с кодировкой Latin-1 (JavaScript) на Wayback Machine (архивировано 18 апреля 2018 г.)
- Все кодовые страницы EBCDIC и 3270 графических escape-кодов на Wayback Machine (архивировано 27 августа 2016 г.)
- Таблицы сопоставления наборов символов ICU Содержат читаемые компьютером таблицы сопоставления Unicode для EBCDIC и многих других наборов символов.