Шестибитный код символа
Шестибитный код символов — это кодировка символов, предназначенная для использования на компьютерах с длиной слова , кратной 6. Шесть битов могут кодировать только 64 различных символа, поэтому эти коды обычно включают только заглавные буквы, цифры и некоторые знаки пунктуации. , а иногда и управляющие символы. Для хранения данных в таких кодах был разработан формат 7-дорожечной магнитной ленты вместе с дополнительным битом четности .
Виды шестибитных кодов
[ редактировать ]Ранний шестибитный двоичный код использовался для Брайля , системы чтения для слепых, разработанной в 1820-х годах.
Самые ранние компьютеры работали только с числовыми данными и не предусматривали символьных данных. Шестибитный формат BCD с несколькими вариантами использовался IBM на ранних компьютерах, таких как IBM 702 в 1953 году и IBM 704 в 1954 году. [1] : стр.35 Шестибитные кодировки были заменены 8-битным кодом EBCDIC , начиная с 1964 года, когда System/360 стандартизировала 8-битные байты . Существует несколько вариантов этого типа кода (см. ниже ).
Шестибитные коды символов обычно следовали за пятибитным кодом Бодо и предшествовали семибитному ASCII .
Шестибитные коды могут кодировать более 64 символов с помощью символов Shift Out и Shift In , по существу объединяя два отдельных набора по 62 символа и переключаясь между ними. Например, популярный коммуникационный терминал IBM 2741 поддерживал различные наборы символов, содержащие до 88 печатных символов плюс управляющие символы.
Шестибитный BCD-код
[ редактировать ]Шестибитный двоично-десятичный код представлял собой адаптацию кода перфокарты к двоичному коду . IBM применила термины « двоично-десятичный» и BCD к вариантам буквенно-цифрового кодирования BCD, использовавшимся в большинстве ранних компьютеров IBM, включая IBM 1620 , IBM 1400 series и недесятичной архитектуры члены серии IBM 700/7000 .
Шестибитный код баз данных COBOL
[ редактировать ]Шестибитный код также использовался в базах данных COBOL, где информация о конце записи хранилась отдельно. [ нужна ссылка ]
Шестибитный код карты с магнитной полосой
[ редактировать ]Шестибитный код с добавленным битом нечетной четности используется на дорожке 1 карт с магнитной полосой , как указано в ISO/IEC 7811-2 .
Декабрьский шестибитный код
[ редактировать ]Популярным шестибитным кодом был DEC SIXBIT. Это просто коды символов ASCII от 32 до 95, закодированные как от 0 до 63 путем вычитания 32 (т. е. столбцов 2, 3, 4 и 5 таблицы ASCII (16 символов в столбце), сдвинутых к столбцам с 0 по 3, путем вычитания 2 из старших битов); он включает пробелы, знаки препинания, цифры и заглавные буквы, но не содержит управляющих символов. Поскольку он не содержал управляющих символов, даже конца строки, он не использовался для общей обработки текста. Однако шестисимвольные имена, такие как имена файлов и ассемблерные символы, могут храниться в одном 36-битном слове PDP-10 , при этом три символа помещаются в каждое слово PDP -1 , а два символа — в каждое слово PDP. -8 . См . таблицу ниже .
Другой, менее распространенный вариант получается путем удаления старшего бита кода ASCII в диапазоне 32–95 (коды 32–63 остаются на своих позициях, из них вычитается 64). Такой вариант иногда использовался на PDP-8 от DEC (1965 г.).
Шестибитный код ECMA
[ редактировать ]Шестибитный код, аналогичный коду DEC, но с заменой нескольких знаков препинания наиболее полезными управляющими символами, включая SO/SI , допускающий расширение кода, был указан как ECMA - 1 в 1963 году (см. ниже ).
ПОЛЕ ДАННЫХ шестибитный код
[ редактировать ]FIELDATA представлял собой семибитный код (с необязательной четностью), из которого формально были определены только 64 позиции кода (занимающие шесть бит). [2] Вариант использовался компьютерами UNIVAC серии 1100. [3] Рассматривая код как шестибитный код, эти системы использовали 36-битное слово (способное хранить шесть таких сокращенных символов FIELDATA). [4]
Шестибитный код Брайля
[ редактировать ]Символы Брайля представлены шестью точками, расположенными в прямоугольнике. Каждая позиция может содержать выпуклую точку или нет, поэтому Брайль можно рассматривать как шестибитный двоичный код. Некоторые более современные системы Брайля добавляют дополнительные две точки, превращая эти системы в восьмибитный код.
Шестибитные коды для кодирования двоичного текста в текст.
[ редактировать ]Передача двоичных данных по системам, предназначенным только для текста, иногда может создавать проблемы. Например, электронная почта исторически поддерживала только 7-битные коды ASCII и удаляла 8-й бит, тем самым повреждая двоичные данные, отправляемые непосредственно через любой проблемный почтовый сервер. Другие системы могут вызывать проблемы из-за неправильной интерпретации управляющих символов во время хранения или передачи.Существует ряд схем упаковки 8-битных данных в текстовые представления, которые могут проходить через системы текстовой почты для декодирования в пункте назначения. Примеры подмножеств 6-битных символов, используемых для упаковки двоичных данных, включают Uuencode и Base64 . Эти наборы не содержат управляющих символов (только печатные цифры, буквы, некоторые знаки препинания и, возможно, пробелы) и позволяют передавать данные по любой среде, которая также способна передавать удобочитаемый текст.
Примеры шестибитных BCD-кодов
[ редактировать ]IBM, которая доминировала в коммерческой обработке данных, использовала различные шестибитные коды, которые были привязаны к набору символов, используемому на перфокартах , см. BCD (кодировка символов) .
Коды символов других производителей показаны ниже вместе с их в Юникоде эквивалентами .
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
0x | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 0 | # | @ | ЛЕНТА ОТМЕТКА | |||
1x | СП | / | С | Т | В | V | В | Х | И | С | РЭЦ ОТМЕТКА | , | % | |||
2x | - | Дж | К | л | М | Н | ТО | П | вопрос | Р | -0 | $ | * | |||
3x | & | А | Б | С | Д | И | Ф | Г | ЧАС | я | +0 | . | ¤ | ВРП ОТМЕТКА |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
0x | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 0 | = | − | ||||
1x | СП | / | С | Т | В | V | В | Х | И | С | , | ( | ||||
2x | — | Дж | К | л | М | Н | ТО | П | вопрос | Р | -0 | $ | * | |||
3x | + | А | Б | С | Д | И | Ф | Г | ЧАС | я | +0 | . | ) |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
0x | : | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 0 | = | ≠ | ≤ | ! | [ |
1x | СП | / | С | Т | В | V | В | Х | И | С | ] | , | ( | → | ≡ | ~ |
2x | − | Дж | К | л | М | Н | ТО | П | вопрос | Р | % | $ | * | ↑ | ↓ | > |
3x | + | А | Б | С | Д | И | Ф | Г | ЧАС | я | < | . | ) | ≥ | ? | ; |
Примеры шестибитных вариантов ASCII
[ редактировать ]0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
0x | СП | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
1x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
2x | @ | А | Б | С | Д | И | Ф | Г | ЧАС | я | Дж | К | л | М | Н | ТО |
3x | П | вопрос | Р | С | Т | В | V | В | Х | И | С | [ | \ | ] | ^ | _ |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
0x | СП | ХТ | НЧ | ВТ | ФФ | ЧР | ТАК | И | ( | ) | * | + | , | - | . | / |
1x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
2x | НУЛЕВОЙ | А | Б | С | Д | И | Ф | Г | ЧАС | я | Дж | К | л | М | Н | ТО |
3x | П | вопрос | Р | С | Т | В | V | В | Х | И | С | [ | \ | ] | ЭКУ | ПРИНАДЛЕЖАЩИЙ |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
0x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
1x | СП | ! | " | # | £ | % | & | ' | ( | ) | * | + | , | - | . | / |
2x | @ | А | Б | С | Д | И | Ф | Г | ЧАС | я | Дж | К | л | М | Н | ТО |
3x | П | вопрос | Р | С | Т | В | V | В | Х | И | С | [ | $ | ] | ↑ | ← |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
0x | @ | А | Б | С | Д | И | Ф | Г | ЧАС | я | Дж | К | л | М | Н | ТО |
1x | П | вопрос | Р | С | Т | В | V | В | Х | И | С | [ | \ | ] | ^ | _ |
2x | СП | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
ГОСТ 6-битный код
[ редактировать ]0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
0x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | + | - | / | , | . | СП |
1x | ⏨ | ↑ | ( | ) | × | = | ; | [ | ] | * | ‘ | ’ | ≠ | < | > | : |
2x | А | Б | В | Г | Д | Хорошо | Же | С | И | И | К | л | М | Н | О | П |
3x | Р | С | Т | У | Ф | Х | Ц | Ч | Ш | Щ | Да | Ь | Э | Ю | Я | ПРИНАДЛЕЖАЩИЙ |
Пример шестибитных кодов Брайля
[ редактировать ]В следующей таблице показано расположение символов с указанием шестнадцатеричного значения, соответствующего символа ASCII, 6-битных кодов Брайля (комбинаций точек), символов Юникода Брайля и общего значения (фактическое значение может меняться в зависимости от контекста). [6] [7]
|
|
См. также
[ редактировать ]- Двоично-десятичный код
- BCD (кодировка символов)
- Код дисплея CDC
- РАДИКС ДЕКАБРЯ 50 / MOD40
- IBM СКВОЗЕ
- IBM Транскод
- ASCII
- Код Бодо
- EBCDIC
- Юникод
- АНСИ Х3.64
- UTF-8
- UTF-16
Ссылки
[ редактировать ]- ^ Корпорация IBM (1954 г.). Электронная вычислительная машина 704: инструкция по эксплуатации (PDF) .
- ^ Маккензи, Чарльз Э. (1980). Наборы кодированных символов, история и развитие (PDF) . Серия системного программирования (1-е изд.). издательской компании Addison-Wesley, Inc. ISBN 978-0-201-14460-4 . LCCN 77-90165 . Архивировано (PDF) из оригинала 26 мая 2016 г. Проверено 25 августа 2019 г.
- ^ Уокер, Джон (6 августа 1996 г.). «Код ПОЛЕВЫХ ДАННЫХ UNIVAC серии 1100» . УНИВАК Воспоминания . Архивировано из оригинала 22 мая 2016 г. Проверено 22 мая 2016 г.
- ^ Дженнингс, Томас Дэниел (20 апреля 2016 г.) [1999]. «Аннотированная история некоторых кодов символов или ASCII: американский стандартный код для проникновения информации» . чувствительные исследования (SR-IX) . ПОЛЕВЫЕ ДАННЫЕ . Проверено 1 июня 2022 г.
- ^ Раймонд, Эрик С. (24 июня 2023 г.). «Декодирование протокола AIVDM/AIVDO» . Типы данных полезной нагрузки AIS . Проверено 14 марта 2024 г.
- ^ «Представление и отображение Брайля» . DotlessBraille.org . 20 февраля 2002 г. Проверено 14 марта 2024 г.
- ^ Халлек, Джон (24 августа 2000 г.). "braille-ascii.ads" . Брайль.Ascii . Архивировано из оригинала 13 июня 2010 г. Проверено 10 августа 2009 г.
Внешние ссылки
[ редактировать ]- «Справочное руководство по компьютеру Control Data 1604-C» (PDF) . (7,44 МБ)
- «Стандарт ECMA для 6-битного кода символов ввода/вывода» . (1,53 МБ)
- Справочник по коду символов SIXBIT на Wayback Machine (архивировано 11 февраля 2020 г.) - Система кодирования символов SIXBIT корпорации Digital Equipment Corporation