ОСНОВАНИЕ ДЕКАБРЯ 50
РАДИКС 50 [ 1 ] [ 2 ] [ 3 ] или РАД50 [ 3 ] (также называемый RADIX50 , [ 4 ] РАДИКС-50 [ 5 ] или RAD-50 ) — кодировка символов только в верхнем регистре, созданная Digital Equipment Corporation (DEC) для использования на компьютерах DECsystem , PDP и VAX .
40-символьный набор RADIX 50 (050 в восьмеричном формате ) может кодировать шесть символов плюс четыре дополнительных бита в одно 36-битное машинное слово ( PDP-6 , PDP-10 /DECsystem-10, DECSYSTEM-20 ), три символа плюс два дополнительных бита. в одно 18-битное слово ( PDP-9 , [ 2 ] ПДП-15 ), [ 6 ] или три символа в одно 16-битное слово ( PDP-11 , VAX). [ 3 ]
Фактическое кодирование различается в 36-битной и 16-битной системах.
36-битные системы
[ редактировать ]В 36-битных системах DEC RADIX 50 обычно использовался в таблицах символов для ассемблеров или компиляторов, которые поддерживали имена шестисимвольных символов из 40-значного алфавита. Это оставило четыре бита для кодирования свойств символа.
Из-за сходства со схемой кодирования символов SQUOZE, используемой в IBM операционной системе SHARE для представления символов объектного кода, вариант DEC также иногда назывался DEC Squoze . [ 7 ] однако IBM SQUOZE упаковала шесть символов 50-значного алфавита плюс два дополнительных бита флага в одно 36-битное слово. [ 6 ]
RADIX 50 обычно не использовался в 36-битных системах для кодирования обычных строк символов; имена файлов обычно кодировались как шесть шестибитных символов, а полные строки ASCII — как пять семибитных символов и один неиспользуемый бит на 36-битное слово.
Большинство значительный биты |
Младшие значащие биты | |||||||
---|---|---|---|---|---|---|---|---|
000 | 001 | 010 | 011 | 100 | 101 | 110 | 111 | |
000 | космос | 0 | 1 | 2 | 3 | 4 | 5 | 6 |
001 | 7 | 8 | 9 | А | Б | С | Д | И |
010 | Ф | Г | ЧАС | я | Дж | К | л | М |
011 | Н | ТО | П | вопрос | Р | С | Т | В |
100 | V | В | Х | И | С | . | $ | % |
18-битные системы
[ редактировать ]RADIX 50 (также называемый Radix 50 8) . форматом [ 2 ] ) использовался в 18-битных компьютерах Digital PDP-9 и PDP-15 для хранения символов в таблицах символов, оставляя два дополнительных бита на 18-битное слово («биты классификации символов»). [ 2 ]
16-битные системы
[ редактировать ]Некоторые строки в 16-битных системах DEC кодировались как 8-битные байты, тогда как другие использовали RADIX 50 (тогда также называвшийся MOD40 ). [ 3 ] [ 8 ]
В RADIX 50 строки кодировались последовательными словами по мере необходимости, при этом первый символ каждого слова располагался в наиболее значимой позиции.
Например, при использовании кодировки PDP-11 строка «ABCDEF» со значениями символов 1, 2, 3, 4, 5 и 6 будет закодирована как слово, содержащее значение 1×40. 2 + 2×40 1 + 3×40 0 = 1683 , за которым следует второе слово, содержащее значение 4×40. 2 + 5×40 1 + 6×40 0 = 6606 . Таким образом, 16-битные слова кодируют значения в диапазоне от 0 (три пробела) до 63 999 («999»). Если в слове было менее трех символов, последнее слово строки дополнялось конечными пробелами. [ 3 ]
Было несколько незначительных вариаций этой кодировки с разными интерпретациями 27, 28, 29 кодовых точек. Если для имен файлов, хранящихся на носителе, использовался RADIX 50, кодовые точки обозначают $
, %
, *
символов и будет отображаться как таковой при указании каталога с помощью таких утилит, как DIR. [ 9 ] При кодировании строк в ассемблере PDP-11 и других языках программирования PDP-11 кодовые точки представляют собой $
, .
, %
символы и кодируются как таковые с помощью макроса RAD50 по умолчанию в файле глобальных макросов, и эта кодировка использовалась в таблицах символов . В некоторых ранних документах операционной системы RT-11 кодовая точка 29 считалась неопределенной. [ 3 ]
Использование RADIX 50 было источником соглашений о размерах имен файлов, используемых операционными системами Digital Equipment Corporation PDP-11. Используя кодировку RADIX 50, шесть символов имени файла можно было сохранить в двух 16-битных словах, а еще три символа расширения (типа файла) можно было сохранить в третьем 16-битном слове. Аналогично, трехзначное имя устройства, такое как «DL1», также может быть сохранено в 16-битном слове. Точка, разделяющая имя файла и его расширение, а также двоеточие, отделяющее имя устройства от имени файла, подразумевались (т. е. не сохранялись и всегда предполагались присутствующими).
Большинство значительный биты |
Младшие значащие биты | |||||||
---|---|---|---|---|---|---|---|---|
000 | 001 | 010 | 011 | 100 | 101 | 110 | 111 | |
000 | космос | А | Б | С | Д | И | Ф | Г |
001 | ЧАС | я | Дж | К | л | М | Н | ТО |
010 | П | вопрос | Р | С | Т | В | V | В |
011 | Х | И | С | $ | % . | * % | 0 | 1 |
100 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
См. также
[ редактировать ]- База 40
- Базовая конверсия
- Кодирование Чена – Хо
- Плотно упакованная десятичная дробь (DPD)
- Кодирование Герца
- Упакованный BCD
- Шестибитный код символа
- Разделить восьмеричный код
Ссылки
[ редактировать ]- ^ Jump up to: а б «Глава VI: Загрузчик - Представление символов по основанию 50». Руководство по системе мультипрограммирования PDP-6 (PDF) . Мейнард, Массачусетс, США: Корпорация цифрового оборудования (DEC). 1965. с. 57. DEC-6-0-EX-SYS-UM-IP-PRE00. Архивировано (PDF) из оригинала 14 июля 2014 г. Проверено 10 июля 2014 г. (1+84+10 страниц)
- ^ Jump up to: а б с д «Приложение 1». Служебные программы PDP-9 — Расширенная система программного обеспечения — Справочное руководство программиста (PDF) . Мейнард, Массачусетс, США: Digital Equipment Corporation . 1968 г. Приказ № ДЭК-9А-ГУАБ-Д. Архивировано (PDF) из оригинала 4 июня 2020 г. Проверено 4 июня 2020 г.
- ^ Jump up to: а б с д и ж г «8.10 .RAD50». Ассемблер PAL-11R - Руководство программиста - Язык ассемблера программ и перемещаемый ассемблер для дисковой операционной системы (2-е исправленное печатное издание). Мейнард, Массачусетс, США: Digital Equipment Corporation . Май 1971 г. [февраль 1971 г.]. п. 8-8. DEC-11-ASDB-D . Проверено 18 июня 2020 г. п. 8-8:
[…] Системные программы PDP-11 часто обрабатывают символы в специальной закодированной форме, называемой RADIX 50 (эту форму иногда называют MOD40). Эта форма позволяет упаковать 3 символа в 16 бит; следовательно, любой 6-значный символ можно уместить в два слова. Единственный операнд имеет форму /CCC/, где косая черта (разделитель) может быть любым печатаемым символом, кроме = и : . В разделителях заключаются преобразуемые символы: от A до Z, от 0 до 9, доллара ($), точки (.) и пробела ( ). Если количество символов меньше трех, они считаются выровненными по левому краю и предполагаются конечные пробелы. […] Алгоритм упаковки следующий: […] A. Каждый символ преобразуется в его эквивалент RADIX 50, как указано в следующей таблице: Символ — эквивалент RADIX 50 (восьмеричный): (пробел) — 0, A–Z — 1–32, $ - 33, . - 34, 0–9 – 36–47. Обратите внимание, что для кода 35 может быть определен другой символ. […] B. Эквиваленты RADIX 50 для символов с 1 по 3 (C1,C2,C3) объединяются следующим образом: РЕЗУЛЬТАТ=((C1*50)+C2)*50 +C3 […]
[1] - ^ Jump up to: а б Дурда IV., Франк (2004). «Справочник по кодам символов RADIX50» . Архивировано из оригинала 31 марта 2005 г. Проверено 31 марта 2005 г.
- ^ Jump up to: а б «Приложение B.3: Константы и набор символов Radix-50». Справочное руководство по языку Compaq Fortran 77 . Компьютерная корпорация Compaq . 1999. Архивировано из оригинала 14 октября 2012 г. Проверено 14 октября 2012 г.
- ^ Jump up to: а б Джонс, Дуглас В. (2018). «Лекция 7, Объектные коды, загрузчики и компоновщики — последние шаги на пути к машинному коду» . Операционные системы, весна 2018 г. Часть коллекции операционных систем CS:3620. Департамент компьютерных наук Университета Айовы . Архивировано из оригинала 6 июня 2020 г. Проверено 6 июня 2020 г.
- ^ Мюррелл, Стивен Дж. (2005). «Коды символов DEC/PDP» . Rabbit.eng.miami.edu . Университет Майами . Таблица символов DEC Squoze. Архивировано из оригинала 19 июня 2020 г. Проверено 19 июня 2020 г.
- ^ PDP-11. Вывод DOS в эфир (1-е изд.). Мейнард, Массачусетс, США: Digital Equipment Corporation . Август 1971 г. DEC-11-SYDC-D . Проверено 18 июня 2020 г. [2]
- ^ «Демо-версия RT11 Radix50» .
Дальнейшее чтение
[ редактировать ]- Уильямс, Эл (22 ноября 2016 г.). «Сжать ваши данные» . Хакадей . Архивировано из оригинала 6 июня 2020 г. Проверено 6 июня 2020 г.