ИСО/МЭК 646
![]() ISO/IEC 646 Инвариант. Красные квадраты с петлей ( ⌘ ) обозначают национальные кодовые точки. Другие красные символы изменены с незначительными изменениями. | |
Стандартный | ИСО/МЭК 646, МСЭ Т.50 |
---|---|
Классификация | 7-битная базовая латинская кодировка |
Предшественник | США-ASCII |
Преемник | ИСО/МЭК 8859 , ИСО/МЭК 10646 |
Другая связанная кодировка(и) | DEC NRCS , телетекст мировой системы Adaptations to other alphabets: ЭЛОТ 927 , Символ , КОИ-7 , SRPSCII и MAKSCII , ASMO 449 , SI 960 |
ISO/IEC 646 — это набор стандартов ISO / IEC , описанный как « Информационная технология — 7-битный набор символов ISO для обмена информацией и разработанный в сотрудничестве с ASCII по крайней мере с 1964 года». [1] [2] Со времени своего первого издания в 1967 г. [3] он определил 7- битный код символов, на основе которого созданы несколько национальных стандартов.
ISO/IEC 646 также был ратифицирован ECMA как ECMA-6 . Первая версия ECMA-6 была опубликована в 1965 году. [4] на основе работы Технического комитета TC1 ECMA, проведенной с декабря 1960 года. [4]
Символы в базовом наборе символов ISO/IEC 646 являются инвариантными символами . [5] Поскольку эта часть ISO/IEC 646, то есть инвариантный набор символов , общий для всех стран, определяет только те буквы, которые используются в базовом латинском алфавите ISO , странам, использующим дополнительные буквы, необходимо создать национальные варианты ISO/IEC 646, чтобы иметь возможность использовать свои родные скрипты. Поскольку в то время передача и хранение 8-битных кодов не были стандартными, национальные символы необходимо было уложить в ограничения в 7 бит, а это означало, что некоторые символы, которые появляются в ASCII, не появляются в других национальных вариантах ISO/ МЭК 646.
History
[edit]
ISO/IEC 646 and its predecessor ASCII (ASA X3.4) largely endorsed existing practice regarding character encodings in the telecommunications industry.

As ASCII did not provide a number of characters needed for languages other than English, a number of national variants were made that substituted some less-used characters with needed ones. Due to the incompatibility of the various national variants, an International Reference Version (IRV) of ISO/IEC 646 was introduced, in an attempt to at least restrict the replaced set to the same characters in all variants. The original version (ISO 646 IRV) differed from ASCII only in that code point 0x24, ASCII's dollar sign ($) was replaced by the international currency symbol (¤). The final 1991 version of the code ISO/IEC 646:1991 is also known as ITU T.50, International Reference Alphabet or IRA, formerly International Alphabet No. 5 (IA5). This standard allows users to exercise the 12 variable characters (i.e., two alternative graphic characters and 10 national defined characters). Among these exercises, ISO 646:1991 IRV (International Reference Version) is explicitly defined and identical to ASCII.[6]
The ISO/IEC 8859 series of standards governing 8-bit character encodings supersede the ISO/IEC 646 international standard and its national variants, by providing 96 additional characters with the additional bit and thus avoiding any substitution of ASCII codes. The ISO/IEC 10646 standard, directly related to Unicode, supersedes all of the ISO 646 and ISO/IEC 8859 sets with one unified set of character encodings using a larger 21-bit value.

A legacy of ISO/IEC 646 is visible on Windows, where in many East Asian locales the backslash character used in filenames is rendered as ¥ or other characters such as ₩. Despite the fact that a different code for ¥ was available even on the original IBM PC's code page 437, and a separate double-byte code for ¥ is available in Shift JIS (although this often uses alternative mapping), so much text was created with the backslash code used for ¥ (due to Shift_JIS being officially based on ISO 646:JP, although Microsoft maps it as ASCII) that even modern Windows fonts have found it necessary to render the code that way. A similar situation exists with ₩ and EUC-KR. Another legacy is the existence of trigraphs in the C programming language.
Published standards
[edit]- ECMA-6 (1965-04-30), first edition (withdrawn)[4]
- ISO/R646-1967 (withdrawn),[3] or ECMA-6 (1967-06), second edition (withdrawn)[3][4]
- ECMA-6 (1970-07), third edition (withdrawn)[4][7]
- ISO 646:1972 (withdrawn), or ECMA-6 (1973-08), fourth edition (withdrawn)[4][7]
- ISO 646:1983 (withdrawn),[8] or ECMA-6 (1984-12, 1985-03), fifth edition (withdrawn)[4]
- ITU-T Recommendation T.50 IA5 (1988-11-25) (withdrawn),[9][10] or ISO/IEC 646:1991 (in force),[11][12] or ECMA-6 (1991-12, 1997-08), sixth edition (in force)[11]
- ITU-T Recommendation T.50 IRA (1992-09-18) (in force)[9][13]
Code page layout
[edit]The following table shows the ISO/IEC 646 Invariant character set. Each character is shown with its Unicode equivalent. National code points are gray with the ASCII character that is replaced. Yellow indicates a character that, in some regions, could be combined with a previous character as a diacritic using the backspace character, which may affect glyph choice.
In addition to the invariant set restrictions, 0x23 is restricted to be either # or £ and 0x24 is restricted to be either $ or ¤ in ECMA-6:1991, equivalent to ISO/IEC 646:1991.[11] However, these restrictions are not followed by all national variants.[14][15]
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
0x | NUL | SOH | STX | ETX | EOT | ENQ | ACK | BEL | BS | HT | LF | VT | FF | CR | SO | SI |
1x | DLE | DC1 | DC2 | DC3 | DC4 | NAK | SYN | ETB | CAN | EM | SUB | ESC | FS | GS | RS | US |
2x | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | DEL |
Variant codes and descriptions
[edit]ISO/IEC 646 national variants
[edit]Some national variants of ISO/IEC 646 are as follows:
Код | ИСО-ИК | ЭСК ИСО/МЭК | Одобренный | Национальный стандарт | Описание |
---|---|---|---|---|---|
ЧТО | 121 | ЭСК 2/8 7/7 | ИСО 646 | CSA Z243.4-1985-1 | Канада (альтернатива № 1, с «î») ( французский , классический) ( Кодовая страница 1020 [16] ) |
СА2 | 122 | ЭСК 2/8 7/8 | ИСО 646 | CSA Z243.4-1985-2 | Канада (альтернатива № 2, с буквой «É») ( французский , реформированная орфография) |
Китай | 57 [17] | ЭСК 2/8 5/4 | ? | ГБ/Т 1988-80 гг. | Китайская Народная Республика (базовый латынь) |
С | 151 | ЭКУ 2/8 2/1 4/1 | ИСО 646 | НК 99-10:81 / НК НК00-10:81 | Куба ( испанский ) |
ПОВРЕЖДАТЬ | 9-1 [18] | ЭСК 2/8 4/5 [18] | СИС ? | НАТС-ДАНО | Норвегия и Дания (публицистические тексты). Инвариантная кодовая точка 0x22 отображается как « , (сравнивать " в ИРВ). Однако это по-прежнему считается двойной кавычкой. [19] СЕФИ Сопровождает (НАТС-СЕФИ). |
ИЗ | 21 [18] [17] | Евровидение 2/8 4/11 [18] | ИСО 646 | DIN 66003 | Германия ( Немецкий ) ( Кодовая страница 1011 , [20] 20106 [21] [22] [23] ) |
ДК | — | ? | ДС 2089 [24] [25] | Дания ( датский ) ( Кодовая страница 1017) [26] ) | |
ЯВЛЯЕТСЯ | 17 [18] | Евровидение 2/8 5/10 [18] | ЭКМА | Оливетти | Испанский (международный) ( Кодовая страница 1023) [27] ) |
ES2 | 85 [17] | ЭКУ 2/8 6/8 | ЭКМА | ИБМ | Испания ( баскский , кастильский , каталанский , галисийский ) ( Кодовая страница 1014) [28] ) |
БЫТЬ | 10 [17] | ИСО 646 | СФС 4017 | Финляндия (базовая версия) ( Кодовая страница 1018 [29] ) | |
фр. | 69 [17] | ЭСК 2/8 6/6 | ИСО 646 | АФНОР НФ З 62010-1982 | Франция ( Французский ) ( Кодовая страница 1010) [30] ) |
ФР1 | 25 [18] [17] | ЭСК 2/8 5/2 [18] | ИСО 646 | АФНОР НФ З 62010-1973 | Франция (устарело с апреля 1985 г.) ( Кодовая страница 1104). [31] ) |
ГБ | 4 [18] [17] | ЭСК 2/8 4/1 [18] | ИСО 646 | БС 4730 | Великобритания ( Английский ) ( Кодовая страница 1013) [32] ) |
ХУ | 86 | ЭСК 2/8 6/9 | ИСО 646 | МСЗ 7795/3 | Венгрия ( венгерский ) |
ИЕ | 207 | ? | НСАИ 433:1996 | Ирландия ( ирландский ) | |
ИНВ | 170 | ЭКУ 2/8 2/1 4/2 | ИСО 646 | ИСО 646:1983 | Инвариантное подмножество |
(ИРВ) | 2 [18] [17] | ЭСК 2/8 4/0 [18] | ИСО 646 | ИСО 646:1973 | Международная справочная версия. 0x7E как надстрочная линия (ISO-IR-002). [33] |
? | ? | ИСО 646 | ИСО 646:1983 | Международная справочная версия. 0x7E как тильда ( Кодовая страница 1009 , [34] 20105 [21] [22] [35] ). | |
Международная справочная версия ISO 646:1991 соответствует варианту для США (см. ниже). | |||||
ЯВЛЯЕТСЯ | ? | ? | ? | Исландия ( исландский ) | |
ЭТО | 15 [18] [17] | ЭСК 2/8 5/9 [18] | ЭКМА | UNI 0204-70 / Оливетти ? | Итальянский ( Кодовая страница 1012) [36] ) |
Япония | 14 [18] [17] | Евровидение 2/8 4/10 [18] | ИСО 646 | JIS C 6220:1969-до | Япония ( Ромадзи ) ( Кодовая страница 895) [37] ). Также используется как 8-битный код с соответствующим дополнительным набором катаканы . |
JP-OCR-B | 92 | Евровидение 2/8 6/14 | ИСО 646 | ДЖИС С 6229-1984-б | Япония ( OCR -B) |
НОК | — | ? | КС С 5636-1989 | Южная Корея | |
МТ | — | ? | ? | Мальта ( мальтийский , английский ) | |
Нидерланды | — | ЭКМА | ИБМ | Нидерланды ( голландский ) ( Кодовая страница 1019) [38] ) | |
НЕТ | 60 [17] | ЭСК 2/8 6/0 | ИСО 646 | НС 4551 версия 1 [17] | Норвегия ( Кодовая страница 1016) [39] ) |
NO2 | 61 [17] | ЭСК 2/8 6/1 | ИСО 646 | НС 4551 версия 2 [17] | Норвегия (устарело с июня 1987 г.) ( Кодовая страница 20108) [21] [22] [40] ) |
пожалуйста | — | БН-74/3101-01 | Польша (в польском языке 18 букв с диакритическими знаками, но только 9 строчных букв нормализуются из-за проблем с кодовым пространством.) | ||
ПТ | 16 [17] | Евровидение 2/8 4/12 | ЭКМА | Оливетти | Португальский (международный) |
ПТ2 | 84 [17] | ЭСК 2/8 6/7 | ЭКМА | ИБМ | Португалия ( Португальский , Испанский ) ( Кодовая страница 1015) [41] ) |
ЮВ | 10 [18] [17] | ЭСК 2/8 4/7 [18] | ИСО 646 | SEN 850200 Приложение B, SIS 63 61 27 | Швеция (базовый шведский ) ( Кодовая страница 1018 , [29] Д47) |
SE2 | 11 [18] [17] | ЭСК 2/8 4/8 [18] | ИСО 646 | SEN 850200 Приложение C, SIS 63 61 27 | Швеция (расширенный шведский для имен) ( Кодовая страница 20107 , [21] [22] [42] Е47) |
головы | 8-1 [18] | ЭСК 2/8 4/3 [18] | СИС | НАТС-СЕФИ | Швеция и Финляндия (публицистические тексты). Сопровождает ДАНО (НАТС-ДАНО). |
Т.61-7бит | 102 | ЭСК 2/8 7/5 | ? | МСЭ / CCITT T.61 Рекомендация | Международная ( Телетекс ). Также используется с соответствующим дополнительным набором в виде 8-битного кода. |
ТВ | — | ? | ЦНС 5205-1996 | Китайская Республика ( Тайвань ) | |
США / (ИРВ) | 6 [18] [17] | ЭСК 2/8 4/2 [18] | ИСО 646 | ANSI X3.4-1968 и ISO 646:1983 (также IRV в ISO/IEC 646:1991) | США ( ASCII , кодовая страница 367 , [43] 20127 [21] [22] [44] ) |
YU | 141 | Евровидение 2/8 7/10 | ИСО 646 | ЮС I.B1.002 ( ЮСКИИ ) | бывшая Югославия ( хорватский , словенский , сербский , боснийский ) |
РАЗДРАЖЕННЫЙ | 49 | ЭСК 2/8 5/7 | МАГАТЭ | РАЗДРАЖЕННЫЙ | Подмножество ISO 646 IRV |
Национальные деривативы
[ редактировать ]Также существуют некоторые национальные наборы символов, основанные на ISO/IEC 646, но не строго соответствующие его инвариантному набору (см. также § Производные для других алфавитов ):
Набор символов | ИСО-ИК | ИСО ЭСК | Одобренный | Национальный стандарт | Описание |
---|---|---|---|---|---|
BS_viewdata | 47 | ЭСК 2/8 5/6 | Британское почтовое отделение | Просмотр данных и телетекста . Квадрат данных просмотра (⌗) заменен обычно неизменным подчеркиванием (_), которое не может отображаться на целевом оборудовании. [45] На самом деле это кодировка Microsoft WST_Engl. | |
гр / греческий7 | 88 | Евровидение 2/8 6/10 | ? | ХОС ЭЛОТ 927 | Греция (снята в ноябре 1986 г.). Использует греческие буквы вместо римских. [46] и, следовательно, строго говоря, это не вариант ISO 646. |
греческий7-старый | 18 | Евровидение 2/8 5/11 | ЭКМА | ? | Греческий графический набор. По концепции похож на греческий7 , но использует другое сопоставление букв. Кроме того, верхний регистр следует за нижним регистром. |
Латинско-греческий | 19 | Евровидение 2/8 5/12 | ЭКМА | ? | Комбинированная латинско-греческая графика (только заглавные). Следует греческому7-старому , но включает латинские заглавные буквы без изменений, а также греческие заглавные буквы вместо латинских строчных букв. |
Латинско-греческий-1 | 27 [18] | ЭСК 2/8 5/5 [18] | ЭКМА | Ханивелл-Булл | Латино-греческая смешанная графика (только греческие заглавные буквы). [18] Визуально объединяет греческие заглавные буквы с латинскими заглавными буквами, где это возможно, и добавляет оставшиеся греческие заглавные буквы. В отличие от других греческих версий, все буквы базовой латиницы остались нетронутыми. Однако заменяет неизменяемую пунктуацию, а также национальные символы. [47] и, следовательно, строго говоря, это все еще не вариант ISO 646. |
это | — | ЭКМА | Оливетти | Швейцария ( французский , немецкий ) ( Кодовая страница 1021) [48] ) Инвариантный код 0x5F изменен с _ к è . Это вариант DEC NRCS , тесно связанный с ISO 646, но не имеющий полностью совместимого с ISO 646 эквивалента. |
Управляющие персонажи
[ редактировать ]Все перечисленные выше варианты представляют собой исключительно наборы графических символов и должны использоваться с набором управляющих символов C0 , например, указанным в следующей таблице:
ИСО-ИК | ИСО ЭСК | Одобренный | Описание |
---|---|---|---|
1 [18] | ЭСК 2/1 4/0 [18] | ИСО 646 | Органы управления ISO 646 [18] («Элементы управления ASCII») |
7 [18] | ЭСК 2/1 4/1 [18] | ИСО 646 | Скандинавская газета (NATS) контролирует [18] |
26 [18] | ЭСК 2/1 4/3 [18] | ИСО 646 | IPTC Элементы управления [18] |
Связанные дополнительные наборы символов
[ редактировать ]В следующей таблице перечислены дополнительные наборы графических символов, определенные тем же стандартом, что и отдельные варианты ISO/IEC 646. Они будут выбираться с использованием такого механизма, как сдвиг или суперсдвиг NATS (одиночная смена). [49] или установив восьмой бит в средах, где он был доступен:
ИСО-ИК | ЭСК ИСО/МЭК | Национальный стандарт | Описание |
---|---|---|---|
8-2 [18] | ЭКУ 2/8 4/4 [18] | НАТС-СЕФИ-ДОБАВИТЬ | Дополнительный код, используемый с NATS-SEFI. |
9-2 [18] | ЭКУ 2/8 4/6 [18] | НАТС-ДАНО-ДОБАВИТЬ | Дополнительный код, используемый с NATS-DANO. |
13 [18] [17] | ЭСК 2/8 4/9 [18] | JIS C 6220:1969-JP | Катакана , используется в качестве дополнительного кода к ISO-646-JP. |
103 | ЭСК 2/8 7/6 | Рекомендация ITU / CCITT T.61 , дополнительный набор | Дополнительный код, используемый с T.61. |
Таблица сравнения вариантов
[ редактировать ]Особенности изменений для некоторых из этих вариантов приведены в следующей таблице. Назначения символов, неизмененные во всех перечисленных вариантах (т. е. которые остаются такими же, как ASCII), не отображаются.
Для простоты сравнения подробно описаны варианты, включающие национальные варианты ISO/IEC 646, близкородственную серию набора национальных замещающих символов (NRCS) DEC, используемую на терминалах VT200 , соответствующую серию кодирования телетекста Европейской мировой системы, определенную в ETS 300 706, и некоторые другие. тесно связанные кодировки на основе ISO/IEC 646. Отдельные таблицы кодов связаны со вторым столбцом. Ячейки с небелым фоном подчеркивают отличия от US-ASCII (также подмножества базовой латиницы ISO/IEC 10646 и Unicode).
Несколько символов могут использоваться в качестве комбинируемых символов , если им предшествует или после них ставится обратный пробел C0 . Это подтверждается таблицами кодов для IRV, GB, FR1, CA и CA2, в которых отмечается, что "',^
будет вести себя как диэрезис , острый ударение , седиль и циркумфлекс (а не кавычки , запятая и стрелка вверх ), если перед ним или за ним стоит обратный пробел. Символ тильды (~) был введен аналогично диакритическому знаку (˜). Этот метод кодирования возник в эпоху пишущих машинок/ телетайпов , когда использование обратного пространства приводило к превышению глифа и может считаться устаревшим .
Позже, когда более широкие наборы символов получили большее признание, ISO/IEC 8859 , наборы символов, зависящие от поставщика, и, в конечном итоге, Unicode предпочтительными методами кодирования большинства этих вариантов стали .
Код варианта | Таблица кодов | Символы для каждой кодировки, совместимой с ISO 646/NRCS или производной. | |||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
США / ИРВ (1991) | ИСО-ИР-006 [50] | ! | " | # | $ | & | : | ? | @ | [ | \ | ] | ^ | _ | ` | { | | | } | ~ |
Старые международные справочные версии | |||||||||||||||||||
ИРВ (1973) | ИСО-ИР-002 [33] | ! | " | # | ¤ | & | : | ? | @ | [ | \ | ] | ^ | _ | ` | { | | | } | ‾ |
ИРВ (1983) | CP01009 [51] | ! | " | # | ¤ | & | : | ? | @ | [ | \ | ] | ^ | _ | ` | { | | | } | ~ |
Инвариант и другие подмножества IRV | |||||||||||||||||||
ИНВ | ИСО-ИР-170 [52] | ! | " | & | : | ? | _ | ||||||||||||
ИНВ ( НРКС ) [а] | --- | ! | " | $ | & | : | ? | ||||||||||||
ИНВ ( Телетекст ) [а] | ETS WST [53] | ! | " | & | : | ? | |||||||||||||
Подмножество ИНИС [а] | ИСО-ИР-049 [54] | $ | : | [ | ] | | | |||||||||||||
Т.61 | ИСО-ИР-102 [55] | ! | " | # | ¤ | & | : | ? | @ | [ | ] | _ | | | ||||||
Восточноазиатский | |||||||||||||||||||
Япония | ИСО-ИР-014 [56] | ! | " | # | $ | & | : | ? | @ | [ | ¥ | ] | ^ | _ | ` | { | | | } | ‾ |
JP-OCR-B | ИСО-ИР-092 [57] | ! | " | # | $ | & | : | ? | @ | [ | ¥ | ] | ^ | _ | { | | | } | ||
НОК | (КС Х 1003) [58] | ! | " | # | $ | & | : | ? | @ | [ | ₩ | ] | ^ | _ | ` | { | | | } | ‾ |
Китай | ИСО-ИР-057 [15] | ! | " | # | ¥ | & | : | ? | @ | [ | \ | ] | ^ | _ | ` | { | | | } | ‾ |
ТВ | (ЦНС 5205) [58] | ! | " | # | $ | & | : | ? | @ | [ | \ | ] | ^ | _ | ` | { | | | } | ‾ |
Британский и ирландский | |||||||||||||||||||
ГБ | ИСО-ИР-004 [59] | ! | " | £ | $ | & | : | ? | @ | [ | \ | ] | ^ | _ | ` | { | | | } | ‾ |
ГБ ( НРКС ) | CP01101 [60] | ! | " | £ | $ | & | : | ? | @ | [ | \ | ] | ^ | _ | ` | { | | | } | ~ |
Просмотр данных [б] [с] | ИСО-ИР-047 [45] | ! | " | £ | $ | & | : | ? | @ | ← | ½ | → | ↑ | ⌗ | ― | ¼ | ‖ | ¾ | ÷ |
ИЕ | ИСО-ИР-207 [61] | ! | " | £ | $ | & | : | ? | Ой | И | В | О | На | _ | от | и | в | ты | на |
Италофон или франкоязычный | |||||||||||||||||||
ЭТО [д] | ИСО-ИР-015 [62] | ! | " | £ | $ | & | : | ? | § | ° | Что | и | ^ | _ | ты | имеет | ò | И | я |
ИТ ( Телетекст ) [с] | ETS WST [63] | ! | " | £ | $ | & | : | ? | и | ° | Что | → | ↑ | ⌗ | ты | имеет | ò | И | я |
Франция (1983) | ИСО-ИР-069 [64] | ! | " | £ | $ | & | : | ? | имеет | ° | Что | § | ^ | _ | м | и | ты | И | ¨ |
Франция (1973) [д] | ИСО-ИР-025 [65] | ! | " | £ | $ | & | : | ? | имеет | ° | Что | § | ^ | _ | ` | и | ты | И | ¨ |
FR телетекст [с] | ETS WST [63] | ! | " | и | я | & | : | ? | имеет | ага | ага | ты | вопрос | ⌗ | И | â | Зонтик | и | Что |
ЧТО [д] | ИСО-ИР-121 [66] | ! | " | # | $ | & | : | ? | имеет | â | Что | ага | вопрос | _ | Зонтик | и | ты | И | и |
СА2 | ИСО-ИР-122 [67] | ! | " | # | $ | & | : | ? | имеет | â | Что | ага | И | _ | Зонтик | и | ты | И | и |
Франко-немецкий разговорный | |||||||||||||||||||
Сви ( NRCS ) [с] | CP01021 [68] | ! | " | ты | $ | & | : | ? | имеет | и | Что | ага | вопрос | И | Зонтик | ä | он | ты | и |
говорящий по-немецки | |||||||||||||||||||
ИЗ [д] [и] | ИСО-ИР-021 [69] | ! | " | # | $ | & | : | ? | § | Ä | ОН | О | ^ | _ | ` | ä | он | ты | SS |
Северные (Восточные) и Балтийские страны | |||||||||||||||||||
БЭ/ЮВ | ИСО-ИР-010 [70] | ! | " | # | ¤ | & | : | ? | @ | Ä | ОН | Ой | ^ | _ | ` | ä | он | к | ‾ |
SE2 [ф] | ИСО-ИР-011 [71] | ! | " | # | ¤ | & | : | ? | И | Ä | ОН | Ой | О | _ | и | ä | он | к | ты |
СЭ ( НРКС ) | CP01106 [72] | ! | " | # | $ | & | : | ? | И | Ä | ОН | Ой | О | _ | и | ä | он | к | ты |
ФИ ( НРКС ) | CP01103 [73] | ! | " | # | $ | & | : | ? | @ | Ä | ОН | Ой | О | _ | и | ä | он | к | ты |
СЕФИ (НАТС) [г] | ИСО-ИР-008-1 [74] | ! | " | # | $ | & | : | ? | | Ä | ОН | Ой | ■ | _ | | ä | он | к | – |
EE ( Телетекст ) [с] | ETS WST [63] | ! | " | # | он | & | : | ? | С | Ä | ОН | Ж | О | ОН | с | ä | он | час | ты |
LV/LT ( Телетекст ) [с] | ETS WST [63] | ! | " | # | $ | & | : | ? | С | Эм-м-м | ę | Ж | С | Эм-м-м | с | а | Эм-м-м | час | к |
Нордический (Западный) | |||||||||||||||||||
ДК | CP01017 [75] | ! | " | # | ¤ | & | : | ? | @ | Ой | Ø | Ой | О | _ | ` | ой | ø | к | ты |
НЕ ЗНАЮ/НО ( NRCS ) | CP01105 [76] | ! | " | # | $ | & | : | ? | Ä | Ой | Ø | Ой | О | _ | ä | ой | ø | к | ты |
ДК/НЕТ-все ( NRCS ) | CP01107 [77] | ! | " | # | $ | & | : | ? | @ | Ой | Ø | Ой | ^ | _ | ` | ой | ø | к | ~ |
НЕТ | ИСО-ИР-060 [78] | ! | " | # | $ | & | : | ? | @ | Ой | Ø | Ой | ^ | _ | ` | ой | ø | к | ‾ |
NO2 | ИСО-ИР-061 [14] | ! | " | § | $ | & | : | ? | @ | Ой | Ø | Ой | ^ | _ | ` | ой | ø | к | | |
УЩЕРБ (НАТС) [г] [час] | ИСО-ИР-009-1 [19] | ! | « | » | $ | & | : | ? | | Ой | Ø | Ой | ■ | _ | | ой | ø | к | – |
ЯВЛЯЕТСЯ | [79] | ! | " | # | ¤ | & | : | ? | Ð | че | \ | Ой | ОН | _ | д | то есть | | | ой | он |
говорящий по-испански | |||||||||||||||||||
ЯВЛЯЕТСЯ [д] | ИСО-ИР-017 [80] | ! | " | £ | $ | & | : | ? | § | ¡ | С | ¿ | ^ | _ | ` | ° | н | Что | ~ |
ES2 | ИСО-ИР-085 [81] | ! | " | # | $ | & | : | ? | · | ¡ | С | Что | ¿ | _ | ` | ´ | н | Что | ¨ |
С | ИСО-ИР-151 [82] | ! | " | # | ¤ | & | : | ? | @ | ¡ | С | ] | ¿ | _ | ` | ´ | н | [ | ¨ |
говорящие на испанском и португальском языках | |||||||||||||||||||
ES/PT Телетекст [с] | ETS WST [63] | ! | " | Что | $ | & | : | ? | ¡ | на | и | в | от | ты | ¿ | ты | н | И | имеет |
португалоязычный | |||||||||||||||||||
ПТ | ИСО-ИР-016 [83] | ! | " | # | $ | & | : | ? | § | Ã | Что | ОН | ^ | _ | ` | ã | Что | он | ° |
ПТ2 | ИСО-ИР-084 [84] | ! | " | # | $ | & | : | ? | ´ | Ã | Что | ОН | ^ | _ | ` | ã | Что | он | ~ |
ПТ ( НРКС ) | --- | ! | " | # | $ | & | : | ? | @ | Ã | Что | ОН | ^ | _ | ` | ã | Что | он | ~ |
Греческий | |||||||||||||||||||
Латино-GR смешанный [с] | ИСО-ИР-027 [47] | Х | " | С | ¤ | & | P.S. | П | Д | Ой | че | Ф | л | С | ` | { | | | } | ‾ |
ISO-IR-088 (GR/ELOT 927), ISO-IR-018 и ISO-IR-019 заменяют латинские буквы греческими буквами и подробно описаны в отдельной таблице . | |||||||||||||||||||
Славянский (латиница) | |||||||||||||||||||
YU | ИСО-ИР-141 [85] | ! | " | # | $ | & | : | ? | Ж | С | Д | Ć | С | _ | час | с | Д | Ч | С |
YU Teletext [с] | ETS WST [63] | ! | " | # | Э | & | : | ? | С | Ć | Ж | Д | С | ага | С | Ч | час | Д | с |
YU-alt Teletext [с] | ETS WST [63] | ! | " | # | $ | & | : | ? | С | Ć | Ж | Д | С | ага | С | Ч | час | Д | с |
CS/CZ/SK ( телетекст ) [с] | ETS WST [63] | ! | " | # | в | & | : | ? | С | й | час | идея | в | р | и | на | Э | ты | с |
ПЛ | БН-74/3101-01 [79] | ! | " | # | злотый | & | : | ? | ę | С | \ | является | поздно | _ | а | от | л | г | Ч |
PL Телетекст [с] | ETS WST [63] | ! | " | # | является | & | : | ? | а | Ƶ | С | Л | Ч | от | ę | г | поздно | л | С |
Адаптации для кириллицы заменяют латинские буквы и подробно описаны в отдельной таблице. | |||||||||||||||||||
Другой | |||||||||||||||||||
Нидерланды | CP01019 [86] | ! | " | # | $ | & | : | ? | @ | [ | \ | ] | ^ | _ | ` | { | | | } | ‾ |
НЛ НРКС | CP01102 [87] | ! | " | £ | $ | & | : | ? | ¾ | ij | ½ | | | ^ | _ | ` | ¨ | ƒ | ¼ | ´ |
ХУ | ИСО-ИР-086 [88] | ! | " | # | ¤ | & | : | ? | На | И | ОН | О | ^ | _ | на | и | он | ты | ˝ |
МТ | CP03041 [89] | ! | " | # | $ | & | : | ? | @ | с | г | час | ^ | _ | с | Г | З | ЧАС | С |
РО ( Телетекст ) [с] | ETS WST [63] | ! | " | # | ¤ | & | : | ? | Þ | Â | Ш | Хм | вопрос | я | Þ | â | ш | Хм | вопрос |
ТР ( ВТ420 ) [с] | [90] | я | " | # | $ | г | : | ? | Я | Ш | ОН | Что | О | _ | Ğ | ш | он | Что | ты |
ТР ( Телетекст ) [с] | ETS WST [63] | ! | " | ТЛ | г | & | : | ? | Я | Ш | ОН | Что | О | Ğ | я | ш | он | Что | ты |
- ^ Jump up to: а б с Является подмножеством одной из международных справочных версий ISO 646, но не включает все символы, присутствующие в инвариантном наборе. Включено для сравнения.
- ^ Также британский телетекст.
- ^ Jump up to: а б с д и ж г час я дж к л м н тот Не полностью соответствует набору инвариантов, но является близкой производной от ISO 646. Включено сюда для сравнения.
- ^ Jump up to: а б с д и Вариант ISO 646 идентичен варианту NRCS.
- ^ Также телетекст мировой системы (DE)
- ^ Также телетекст мировой системы (SE/FI/HU)
- ^ Jump up to: а б Кодировки NATS (например, NATS-SEFI [74] ) заменять
@
(0x40) и`
(0x60) с «Единичным пространством A» (UA) и «Единичным пространством B» (UB). Простое пространство (0x20) расширяется по ширине. UA и UB предназначены для фиксированной ширины, UA должен быть как минимум такой же ширины, как UB. RFC 1345 сопоставляет UA и UB с кодовыми точками ISO 10646 (UCS) U+E002 и U+E003, которые находятся в области частного использования соответственно (хотя в нем также перечислены сопоставления PUA для нескольких других символов, которые теперь имеют кодовые точки UCS). Юникод содержит ряд пробелов , которые могут примерно совпадать. - ^ Соответствие набору инвариантов ISO 646 сомнительно, но это тесно связанная производная от ISO 646. Включена сюда для сравнения.
Связанные семейства кодировок
[ редактировать ]Национальный набор заменяющих символов
[ редактировать ]Национальный набор замещающих символов ( NRCS ) — это семейство 7-битных кодировок, представленное в 1983 году компанией DEC в VT200 серии компьютерных терминалов . Он тесно связан с ISO/IEC 646, поскольку основан на аналогичном инвариантном подмножестве ASCII, отличающемся сохранением $
как инвариант, но не _
(хотя большинство вариантов NRCS сохраняют _
и, следовательно, соответствуют набору инвариантов ISO/IEC 646). Большинство вариантов NRCS тесно связаны с соответствующими национальными вариантами ISO/IEC 646 там, где они существуют, за исключением голландского варианта .
Мировая система телетекста
[ редактировать ]Европейский телекоммуникационный стандарт ETS 300 706, «Расширенная спецификация телетекста», определяет наборы кодов латинского, греческого, кириллического, арабского и иврита, а также несколько национальных вариантов как для латиницы, так и для кириллицы. [63] Подобно NRCS и ISO/IEC 646, в латинских вариантах семейство кодировок, известное как набор G0 , основано на аналогичном инвариантном подмножестве ASCII, но не сохраняет ни $
ни _
как инвариант. В отличие от NRCS, варианты часто значительно отличаются от соответствующих национальных вариантов ISO/IEC 646.
HP
[ редактировать ]У HP есть кодовая страница 1054 , которая добавляет средний оттенок (▒, U+2592) к 0x7F. [91] Кодовая страница 1052 заменяет несколько символов ASCII из кодовой страницы 1054. [92]
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
2x | СП | ! | ″ | # | $ | % | & | ′ | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | ‗ | = | ¢ | ? |
4x | @ | А | Б | С | Д | И | Ф | Г | ЧАС | я | Дж | К | л | М | Н | ТО |
5x | П | вопрос | Р | С | Т | В | V | В | Х | И | С | [ | ® | ] | © | _ |
6x | ° | а | б | с | д | и | ж | г | час | я | дж | к | л | м | н | тот |
7x | п | д | р | с | т | в | v | В | х | и | С | § | ¶ | † | ™ | ▒ |
Производные для других алфавитов
[ редактировать ]Некоторые 7-битные наборы символов для нелатинских алфавитов взяты из стандарта ISO/IEC 646: они сами по себе не составляют ISO/IEC 646 из-за несоблюдения его инвариантных кодовых точек (часто заменяющих буквы хотя бы одного регистра), из-за поддержки разных алфавитов, для которых набор национальных кодовых точек обеспечивает недостаточно места для кодирования. Примеры включают в себя:
- 7-битный туркменский (ISO-IR-230). [93]
- 7-битный греческий.
- В ELOT 927 (ISO-IR-088), [46] греческий алфавит отображается в алфавитном порядке (за исключением последней сигмы) в позиции 0x61–0x71 и 0x73–0x79 поверх латинских строчных букв.
- ИСО-ИР-018 [94] сопоставляет греческий алфавит с обоими регистрами букв, используя другую схему (не в алфавитном порядке, а пытаясь, где это возможно, сопоставить греческие буквы с латинскими буквами, которые в некотором смысле соответствуют), и ISO-IR-019 [95] отображает прописные греческие буквы на строчные латинские буквы, используя ту же схему, что и ISO-IR-018.
- Нижняя половина Symbol. кодировки символов шрифта [96] использует свою собственную схему сопоставления греческих букв обоих регистров с римскими буквами ASCII, а также пытается сопоставить греческие буквы с римскими буквами, которые в некотором смысле соответствуют, но принимает разные решения в этом отношении (см. таблицу ниже). Он также заменяет инвариантные кодовые точки 0x22 и 0x27 и пять национальных кодовых точек математическими символами. Хотя он не предназначен для набора греческой прозы, иногда его используют для этой цели.
- ИСО-ИР-027 [47] (подробно описано в таблице выше, а не ниже) включает латинский алфавит без изменений, но добавляет некоторые греческие заглавные буквы, которые не могут быть представлены гомоглифами латинского алфавита ; хотя он явно основан на ISO/IEC 646, некоторые из них сопоставлены с кодовыми точками, которые инвариантны в ISO/IEC 646 (0x21, 0x3A и 0x3F), и поэтому это не настоящий вариант ISO/IEC 646.
- для Кодирование телетекста Мировой системы греческого языка использует еще одну схему сопоставления греческих букв в алфавитном порядке с буквами ASCII в обоих случаях, в частности, включая несколько букв с диакритическими знаками. [97]
- 7-битная кириллица
- КОИ-7 или короткий КОИ, используемый для русского языка . Символы кириллицы сопоставляются с позициями 0x60–0x7E поверх латинских строчных букв, по возможности сопоставляя гомологичные буквы (где в отображается в w, а не в v). Заменен вариантами КОИ-8 .
- SRPSCII и MAKSCII , кириллические варианты YUSCII (латинский вариант — YU/ISO-IR-141 в таблице выше), используемые для сербского и македонского языков соответственно. Во многом гомологичен латинскому варианту YUSCII (в соответствии с сербской диграфии правилами ), за исключением Љ (lj), Њ (nj), Џ (dž) и ѕ (dz), которые соответствуют орграфам в орфографии латинского алфавита и отображаются на карте. над буквами, которые не используются в сербском или македонском языке (q, w, x, y).
- Наборы G0 для кодировок телетекста World System для русского/болгарского языков. [98] и украинский [99] использовать комплекты Г0, аналогичные КОИ-7 с некоторыми модификациями. Соответствующий набор G0 для сербской кириллицы. [а] [100] использует схему, основанную на кодировке телетекста для сербско-хорватского и словенского латинского алфавита , в отличие от значительно отличающейся схемы YUSCII.
- 7-битный иврит, SI 960 . Еврейский алфавит отображается в позициях 0x60–0x7A поверх строчных латинских букв (и серьезного ударения для алефа). 7-битный иврит всегда хранился в визуальном порядке. Это сопоставление с установленным старшим битом, т. е. с буквами иврита в диапазонах 0xE0–0xFA, соответствует стандарту ISO/IEC 8859-8 . Кодировка телетекста World System для иврита использует те же сопоставления букв, но использует BS_Viewdata в качестве базовой кодировки (тогда как SI 960 использует US-ASCII) и включает знак шекеля по адресу 0x7B.
- 7-битный арабский язык, ASMO 449 (ISO-IR-089). [101] Арабский алфавит отображается в позициях 0x41–0x5A и 0x60–0x6A поверх прописных и строчных латинских букв.
Сравнение некоторых из этих кодировок приведено ниже. Показан только один регистр, за исключением случаев, когда регистры сопоставлены с разными буквами. В таких случаях сначала отображается отображение с наименьшим кодом. Для некоторых букв даны возможные транскрипции; если это опущено, можно считать, что буква соответствует римской, на которую она нанесена.
Английский ( ASCII ) | Кириллические алфавиты | Греческий алфавит | иврит | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Полутранслитерационный | Естественно заказанный | ||||||||||
Русский ( ОБЯЗАТЕЛЬНО-7 ) | Русский, болгарский ( ЗСТ RU/BG ) | Украинский ( ДЖСТ УКР ) | сербский ( СЕРБИИ ) | македонский ( ЦЕЛЬ ) | Сербский, македонский [а] ( WST СРП ) | Греческий ( Символ ) | Греческий (ИР-18 [94] ) | Греческий ( ЭЛОТ 927 ) | Греческий ( WST EL ) | иврит ( СИ 960 ) | |
@ ` | Ю (ты/ты) | Ю (ты/ты) | Ю (ты/ты) | Ф (ж) | Ф (ж) | Ч (Нет) | ≅ ‾ | ´ ` | @ ` | я ЧАС | А (ʾ/ʔ) |
А | А | А (а/а) | А | А | А | А | А | А | А | А | в (б) |
Б | Б | Б | Б | Б | Б | Б | Б | Б | Б | Б | в (г) |
С | Ц (c/ts) | Ц (c/ts) | Ц (c/ts) | Ц (c/ts) | Ц (c/ts) | Ц (c/ts) | Х (ч/х) | пс | С (г) | С (г) | д (д) |
Д | Д | Д | Д | Д | Д | Д | Д | Д | Д | Д | (ч) |
И | это (дже/да) | это (дже/да) | это (е) | это (е) | это (е) | это (е) | Э | Э | Э | Э | и (ж) |
Ф | Ф | Ф | Ф | Ф | Ф | Ф | Φ (ф/ф) | Φ (ф/ф) | Ζ (з) | Ζ (з) | я |
Г | Г | Г | Г | Г | Г | С | С | С | (ē) | (ē) | ח (ч/х) |
ЧАС | Х (h/kh/ch) | Х (h/kh/ch) | Х (h/kh/ch) | Х (h/kh/ch) | Х (h/kh/ch) | Х (h/kh/ch) | (ē) | (ē) | Θ(th) | Θ(th) | ט (тт) |
я | И | И | И (y) | И | И | И | я | я | я | я | י (д/г) |
Дж | Й (д/г) | Й (д/г) | Й (д/г) | Ј (дж/г) | Ј (дж/г) | Ј (дж/г) | ϑ(й) φ (ф/ф) | Ξ (х/кс) | к | ך (к финал) | |
К | К | К | К | К | К | К | К | К | К | Л (л) | о |
л | л | л | л | л | л | л | л | л | л | м | к |
М | М | М | М | М | М | М | М | М | М | Н (н) | ם (конечная м) |
Н | Н | Н | Н | Н | Н | Н | Н | Н | Н | Ξ (х/кс) | от (м) |
ТО | О | О | О | О | О | О | ТО | ТО | Ξ (х/кс) | ТО | ן (конечная н) |
П | П | П | П | П | П | П | П | П | (о) | П | н (н) |
вопрос | Я (ха/я) | Я (ха/я) | Я (ха/я) | Љ (лдж/лай) | Љ (лдж/лай) | Ќ (Ḱ/кДж) | Θ(th) | ͺ ( | П (п) | Р | SS) |
Р | Р | Р | Р | Р | Р | Р | Р | Р | Р | ' ς (конечный) | ע (ʽ/ŋ) |
С | С | С | С | С | С | С | С | С | С | С | ף (конечная р) |
Т | Т | Т | Т | Т | Т | Т | Т | Т | Т | Т | п |
В | У | У | У | У | У | У | Да | Θ(th) | Да | Да | ץ (ש/ts финал) |
V | Ф (ж) | Ф (ж) | Ф (ж) | В | В | В | ς (конечный) ϖ (п) | О (о) | Φ (ж/ф) | Φ (ж/ф) | צ (ṣ/ц) |
В | в (в) | в (в) | в (в) | Њ (Нью-Джерси/Нью-Йорк/С) | Њ (Нью-Джерси/Нью-Йорк/С) | Ѓ (Ƶ/гдж) | О (о) | ς (конечный) | ς (конечный) | Х (ч/х) | к (к) |
Х | Ь (’) | Ь (’) | Ь (’) | Дж (Дж) | Дж (Дж) | Љ (лдж/лай) | Х | Х (ч/х) | Х (ч/х) | пс | Р |
И | й (г/г) | Ъ (''/ώ/ŭ) | И (i) | Ѕ (dz) | Ѕ (dz) | Њ (Нью-Джерси/Нью-Йорк/С) | пс | Й (ты) | пс | О (о) | ש (ж/б) |
С | С | С | С | С | С | С | Г | Г | О (о) | Да | т |
[ { | Ш (š/sh) | Ш (š/sh) | Ш (š/sh) | Ш (š/sh) | Ш (š/sh) | Ć (Ć) | [ { | ῏ ῟ | [ { | Да | [ { |
\ | | Э (e) | Э (e) | Є (дже/йе) | Ф (ж/ж) | Ѓ (Ƶ/гдж) | Ф (ж) | ∴ | | ᾿ ῾ (ч) | \ | | а тот | \ | |
] } | Щ (Щ) | Щ (Щ) | Щ (Щ) | Ć (Ć) | Ќ (Ḱ/кДж) | Ф (ж/ж) | ] } | ῎ ῞ | ] } | е й | ] } |
^ ~ | Ч (Нет) | Ч (Нет) | Ч (Нет) | Ч (Нет) | Ч (Нет) | Ш (š/sh) | ⊥ ~ | ˜ ¨ | ^ ‾ | или ой | ^ ‾ |
_ | Ъ (″) | й (г/г) | Ї (джи/йи) | _ | _ | Дж (Дж) | _ | _ | _ | я | _ |
См. также
[ редактировать ]- ISO/IEC 2022 Информационные технологии: Структура кода символов и методы расширения
- ИСО/МЭК 6937 (АНСИ)
- ИСО/МЭК ОТК 1/ПК 2
Сноски
[ редактировать ]- ^ Jump up to: а б Помечен как «Основной набор кириллицы G0 — Вариант 1 — сербский/хорватский», но включает македонские буквы Ќ и Ѓ (но не Ѕ ). Подмножество латинских букв, в основном без гомоглифов в наборе G0, включено в набор G1 (15.6.7 табл. 41), включая S /s по адресам 0x6B/7B. Хорватский язык пишется латиницей .
Ссылки
[ редактировать ]- ^ Маллендор, Ральф Элвин (1964) [1963]. Птак, Джон Ф. (ред.). «О раннем развитии ASCII — История ASCII» . JF Ptak Science Books (опубликовано в марте 2012 г.). Архивировано из оригинала 26 мая 2016 г. Проверено 26 мая 2016 г.
- ^ Наборы 6- и 7-битных кодированных символов для обмена информацией (проект), Международная организация по стандартизации , июль 1964 г. (Примечание. 21 страница. С сопроводительным письмом для членов X3.2 и рабочих групп от Эрика Клэймонса.)
- ^ Jump up to: а б с Маккензи, Чарльз Э. (1980). Наборы кодированных символов, история и развитие (PDF) . Серия системного программирования (1-е изд.). Addison-Wesley Publishing Company, Inc., стр. 7, 9, 412. ISBN. 978-0-201-14460-4 . LCCN 77-90165 . Архивировано (PDF) из оригинала 26 мая 2016 г. Проверено 25 августа 2019 г.
- ^ Jump up to: а б с д и ж г Стандарт ECMA-6: 7-битный набор кодированных символов (PDF) (5-е изд.). Женева, Швейцария: Европейская ассоциация производителей компьютеров (Ecma). Март 1985 года . Проверено 28 мая 2024 г.
Технический комитет TC1 ECMA впервые собрался в декабре 1960 года для подготовки стандартных кодов для целей ввода/вывода. [30] апреля 1965 года стандарт ECMA-6 был принят Генеральной ассамблеей ECMA.
- ^ Бодфиш, Джон; Уилсон, Марк; Грегори, Стивен; Най, Джули Блюм. Бодфиш, Джон (ред.). «Инвариантная обработка символов» . NISO Протокол циркуляционного обмена . Департамент образования штата Колорадо, США: Постоянный комитет NCIP (NCIP-SC). Архивировано из оригинала 24 декабря 2013 г. Проверено 30 мая 2016 г.
- ^ Демченко, Юрий (2000) [1997]. «Международная стандартизация 7-битных кодов, ISO 646» . ТЕРЕНА. 4. Архивировано из оригинала 17 июня 2016 г. Проверено 13 августа 2012 г.
- ^ Jump up to: а б Стандарт ECMA-6: 7-битный набор кодированных символов ввода/вывода (PDF) (4-е изд.). Женева, Швейцария: Европейская ассоциация производителей компьютеров (Ecma). Август 1973 года . Проверено 28 мая 2024 г.
- ^ «Обработка информации — 7-битный набор символов ISO для обмена информацией» . 1 июля 1983 г. ИСО 646:1983. Архивировано из оригинала 30 мая 2016 г. Проверено 30 мая 2016 г.
- ^ Jump up to: а б Сальсте, Туомас (январь 2016 г.). «7-битные наборы символов: версии ASCII» . Айвосто Ой. урна : nbn:fi-fe201201011004 . Архивировано из оригинала 13 июня 2016 г. Проверено 13 июня 2016 г.
- ^ Международный алфавит № 5 - Рекомендация T.50 , Международный союз электросвязи (ITU) - Международный консультативный комитет по телеграфии и телефонии (CCITT) - Серия T: Терминальное оборудование и протоколы для телематических услуг, 16 апреля 1993 г. [1988-11- 25], E 33116, заархивировано из оригинала 19 марта 2017 г. , получено 18 марта 2017 г.
- ^ Jump up to: а б с Стандарт ECMA-6: 7-битный набор символов (PDF) (6-е изд.). Женева, Швейцария: Европейская ассоциация производителей компьютеров (Ecma). Август 1997 г. [декабрь 1991 г.] . Проверено 28 мая 2024 г.
- ^ «Информационные технологии - 7-битный набор символов ISO для обмена информацией» (3-е изд.). 16 декабря 1991 г. ИСО/МЭК 646:1991. Архивировано из оригинала 30 мая 2016 г. Проверено 30 мая 2016 г.
- ^ Международный справочный алфавит (IRA) – Информационные технологии – 7-битный набор кодированных символов для обмена информацией – Рекомендация T.50 , Международный союз электросвязи (ITU) – Международный консультативный комитет по телеграфии и телефону (CCITT) – Терминальное оборудование и протоколы для телематических услуг , 16 апреля 1993 г. [18 сентября 1992 г.], E 3177, заархивировано из оригинала 19 декабря 2014 г. , получено 18 марта 2017 г.
- ^ Jump up to: а б Norge Standardiseringforbund (1 июня 1982 г.). Норвежский стандарт NS 4551, версия 2 (PDF) . ITSCJ/ IPSJ . ИСО ИК -61.
- ^ Jump up to: а б Китайская ассоциация по стандартизации (1 июня 1982 г.). 7-битный набор кодированных символов для обмена информацией (PDF) . ITSCJ/ IPSJ . ИСО-ИР -57.
- ^ «Информация о кодовой странице SBCS — CPGID: 01020 / Название: канадский (французский) вариант» . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и соответствующие ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. ИБМ . 01.10.1992. Архивировано из оригинала 17 июня 2016 г. Проверено 17 июня 2016 г.
- ^ Jump up to: а б с д и ж г час я дж к л м н тот п д р с т «Справочное руководство по сравнению HP PCL/PJL PCL 5» (PDF) (2-е изд.). Компания Хьюлетт-Паккард, LP . Июнь 2003 г. Номер детали HP 502-0378. Архивировано из оригинала (PDF) 10 августа 2016 г. Проверено 10 августа 2016 г.
- ^ Jump up to: а б с д и ж г час я дж к л м н тот п д р с т в v В х и С аа аб и объявление но из в ах есть также и аль являюсь а к ап Бемер, Роберт Уильям (1980). «Глава 1: Внутри ASCII». Программное обеспечение общего назначения (PDF) . Лучшее из эпохи интерфейса. Том. 2. Портленд, Орегон, США: dilitium Press. стр. 1–50. ISBN 0-918398-37-1 . LCCN 79-67462 . Архивировано из оригинала 27 августа 2016 г. Получено 27 августа 2016 г. из : Бемер, Роберт Уильям (май 1978 г.). «Внутри ASCII. Часть I». Возраст интерфейса . 3 (5). Портленд, Орегон, США: дилитий Пресс: 96–102. , Бемер, Роберт Уильям (июнь 1978 г.). «Внутри ASCII. Часть II». Возраст интерфейса . 3 (6). Портленд, Орегон, США: дилитий Пресс: 64–74. , Бемер, Роберт Уильям (июль 1978 г.). «Внутри ASCII. Часть III». Возраст интерфейса . 3 (7). Портленд, Орегон, США: дилитий Пресс: 80–87.
- ^ Jump up to: а б Шведская комиссия по стандартизации (1975). Основной графический набор символов NATS для передачи текста газет в Дании и Норвегии (PDF) . ITSCJ/ IPSJ . ИСО-ИР -9-1.
- ^ «Информация о кодовой странице SBCS — CPGID: 01011 / Имя: 7-битная Германия FR» Программное обеспечение IBM: Глобализация: Наборы кодированных символов и связанные ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. ИБМ . 1 августа 1987 г. Архивировано из оригинала 17 июня 2016 г. Проверено 17 июня 2016 г.
- ^ Jump up to: а б с д и «Идентификаторы кодовых страниц» . Сеть разработчиков Microsoft . Майкрософт . 2014. Архивировано из оригинала 19 июня 2016 г. Проверено 19 июня 2016 г.
- ^ Jump up to: а б с д и «Веб-кодировки — Internet Explorer — Кодировки» . WHATWG Wiki . 2012-10-23. Архивировано из оригинала 20 июня 2016 г. Проверено 20 июня 2016 г.
- ^ Фоллер, Антонин (2014) [2011]. «Немецкая кодировка (IA5) — кодировки Windows» . WUtils.com — Интернет-утилита и справка . Программное обеспечение Мотобит. Архивировано из оригинала 20 июня 2016 г. Проверено 20 июня 2016 г.
- ^ Датский стандарт DS 2089: Применение 7-битного набора символов ISO . Февраль 1974 г. УДК 681.3:003.62.
- ^ Страуструп, Бьярне (29 марта 1994 г.). Проектирование и эволюция C++ (1-е изд.). Издательская компания Аддисон-Уэсли . ISBN 0-201-54330-3 .
- ^ «Информация о кодовой странице SBCS — CPGID: 01017 / Имя: 7-битная Дания» . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и соответствующие ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. ИБМ . 1 августа 1987 г. Архивировано из оригинала 17 июня 2016 г. Проверено 17 июня 2016 г.
- ^ «Информация о кодовой странице SBCS — CPGID: 01023 / Название: Вариант Испании» . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и соответствующие ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. ИБМ . 01.10.1992. Архивировано из оригинала 17 июня 2016 г. Проверено 17 июня 2016 г.
- ^ «Информация о кодовой странице SBCS — CPGID: 01014 / Имя: 7-битная Испания» . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и соответствующие ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. ИБМ . 01.10.1987. Архивировано из оригинала 17 июня 2016 г. Проверено 17 июня 2016 г.
- ^ Jump up to: а б «Информация о кодовой странице SBCS — CPGID: 01018 / Название: 7-битная Финляндия/Швеция» . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и соответствующие ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. ИБМ . 1 августа 1987 г. Архивировано из оригинала 17 июня 2016 г. Проверено 17 июня 2016 г.
- ^ «Информация о кодовой странице SBCS — CPGID: 01010 / Имя: 7-битная Франция» . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и соответствующие ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. ИБМ . 1 августа 1987 г. Архивировано из оригинала 17 июня 2016 г. Проверено 17 июня 2016 г.
- ^ «Информация о кодовой странице SBCS — CPGID: 01104 / Название: French NRC Set» . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и соответствующие ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. ИБМ . 1 августа 1987 г. Архивировано из оригинала 21 июня 2016 г. Проверено 21 июня 2016 г.
- ^ «Информация о кодовой странице SBCS — CPGID: 01013 / Имя: 7-Bit United Kingdom» . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и соответствующие ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. ИБМ . 1 августа 1987 г. Архивировано из оригинала 17 июня 2016 г. Проверено 17 июня 2016 г.
- ^ Jump up to: а б ИСО/ТК 97/SC 2 (1975). Графический набор символов международной эталонной версии ISO 646 (PDF) . ITSCJ/ IPSJ . ИСО-ИК -2.
{{citation}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ «Информация о кодовой странице SBCS — CPGID: 01009 / Имя: ISO IRV» . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и соответствующие ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. ИБМ . 1 апреля 1990 г. Архивировано из оригинала 17 июня 2016 г. Проверено 17 июня 2016 г.
- ^ Фоллер, Антонин (2014) [2011]. «Западноевропейская (IA5) кодировка — кодировки Windows» . WUtils.com — Интернет-утилита и справка . Программное обеспечение Мотобит. Архивировано из оригинала 20 июня 2016 г. Проверено 20 июня 2016 г.
- ^ «Информация о кодовой странице SBCS — CPGID: 01012 / Имя: 7-Bit Italy» . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и соответствующие ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. ИБМ . 1 августа 1987 г. Архивировано из оригинала 17 июня 2016 г. Проверено 17 июня 2016 г.
- ^ «Информация о кодовой странице SBCS — CPGID: 00895 / Имя: Япония, 7-битная латиница» . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и соответствующие ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. ИБМ . 01.10.1986. Архивировано из оригинала 18 июня 2016 г. Проверено 18 июня 2016 г.
- ^ «Информация о кодовой странице SBCS — CPGID: 01019 / Имя: 7-бит Нидерланды» . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и соответствующие ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. ИБМ . 1 августа 1987 г. Архивировано из оригинала 17 июня 2016 г. Проверено 17 июня 2016 г.
- ^ «Информация о кодовой странице SBCS — CPGID: 01016 / Имя: 7-битная Норвегия» . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и соответствующие ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. ИБМ . 1 августа 1987 г. Архивировано из оригинала 17 июня 2016 г. Проверено 17 июня 2016 г.
- ^ Фоллер, Антонин (2014) [2011]. «Норвежская (IA5) кодировка — кодировки Windows» . WUtils.com — Интернет-утилита и справка . Программное обеспечение Мотобит. Архивировано из оригинала 20 июня 2016 г. Проверено 20 июня 2016 г.
- ^ «Информация о кодовой странице SBCS — CPGID: 01015 / Имя: 7-битная Португалия» . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и соответствующие ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. ИБМ . 1 августа 1987 г. Архивировано из оригинала 17 июня 2016 г. Проверено 17 июня 2016 г.
- ^ Фоллер, Антонин (2014) [2011]. «Шведская (IA5) кодировка — кодировки Windows» . WUtils.com — Интернет-утилита и справка . Программное обеспечение Мотобит. Архивировано из оригинала 20 июня 2016 г. Проверено 20 июня 2016 г.
- ^ «Информация о кодовой странице SBCS — CPGID: 00367 / Имя: ASCII» . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и соответствующие ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. ИБМ . 1 января 1978 г. Архивировано из оригинала 17 июня 2016 г. Проверено 17 июня 2016 г.
- ^ Фоллер, Антонин (2014) [2011]. «Кодировка US-ASCII — кодировки Windows» . WUtils.com — Интернет-утилита и справка . Программное обеспечение Мотобит. Архивировано из оригинала 20 июня 2016 г. Проверено 20 июня 2016 г.
- ^ Jump up to: а б БСИ (01.06.1981). Буквенно-цифровые символы для просмотра данных и телетекста вещания (PDF) . ITSCJ/ IPSJ . ИСО-ИР -47.
- ^ Jump up to: а б ЭЛОТ (1 июля 1984 г.). Набор греческих символов для греческого языка (PDF) . ITSCJ/ IPSJ . ИСО-ИК -88.
- ^ Jump up to: а б с ЭКМА (1976). Смешанный набор латинско-греческих графиков (только греческие заглавные буквы) (PDF) . ITSCJ/ IPSJ . ИСО-ИК -27.
- ^ «Информация о кодовой странице SBCS — CPGID: 01021 / Название: вариант Швейцарии» . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и соответствующие ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . 1. ИБМ . 01.10.1992. Архивировано из оригинала 17 июня 2016 г. Проверено 17 июня 2016 г.
- ^ Шведская комиссия по стандартизации (1975 г.). Комплект управления NATS для передачи газетного текста (PDF) . ITSCJ/ IPSJ . ИСО-ИК -7.
- ^ АНСИ (1975). Набор графических символов ASCII (PDF) . ITSCJ/ IPSJ . ИСО-ИК -6.
- ^ ИБМ (1990). «Кодовая страница 01009» (PDF) . РЕЕСТР: наборы графических символов и кодовые страницы .
- ^ Датский совет по стандартизации (21 января 1993 г.). Базовый набор символов ISO/IEC 646 (PDF) . ITSCJ/ IPSJ . ИСО-ИК -170.
- ^ «15.6.1 Набор Latin G0», ETS 300 706: Расширенная спецификация телетекста (PDF) , Европейский институт телекоммуникационных стандартов ( ETSI ), стр. 114
- ^ Международное агентство по атомной энергии (15 июля 1981 г.). Подкомплект ISO 646 для INIS (PDF) . ITSCJ/ IPSJ . ИСО-ИК -49.
- ^ Международный союз электросвязи (1 августа 1985 г.). Основной набор графических символов Teletex (PDF) . ITSCJ/ IPSJ . ИСО-ИР -102.
- ^ Японский комитет промышленных стандартов (1975). Набор японских римских графических символов (PDF) . ITSCJ/ IPSJ . ИСО-ИК -14.
- ^ ISO/TC 97/SC 2 (1 августа 1985 г.). Базовый набор графических символов японского языка OCR-B (PDF) . ITSCJ/ IPSJ . ИСО-ИР -92.
{{citation}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ Jump up to: а б Лунде, Кен (2008). «3. Стандарты набора символов (§ CJKV-Roman)». Обработка информации CJKV (2-е изд.). О'Рейли Медиа . стр. 91–92. ISBN 9780596514471 .
- ^ БСИ (1 декабря 1975 г.). Набор графических символов 7-битного кода данных Соединенного Королевства (PDF) . ITSCJ/ IPSJ . ИСО-ИК -4.
- ^ ИБМ (1992). «Кодовая страница 01101» (PDF) . РЕЕСТР: наборы графических символов и кодовые страницы .
- ^ НСАИ (07.12.1999). Вариант 7-битного набора символов ISO для ирландского гэльского языка (PDF) . ITSCJ/ IPSJ . ИСО-ИР -207.
- ^ ЭКМА (1976). Вариант 7-битного набора символов ISO (только графика) для итальянского языка (PDF) . ITSCJ/ IPSJ . ИСО-ИК -15.
- ^ Jump up to: а б с д и ж г час я дж к л «15.6.2 Подмножества латинских национальных опций, Таблица 36», ETS 300 706: Расширенная спецификация телетекста (PDF) , Европейский институт телекоммуникационных стандартов ( ETSI ), стр. 115
- ^ АФНОР (1 июня 1983 г.). Набор французских графических символов для французского языка (PDF) . ITSCJ/ IPSJ . ИСО-ИК -69.
- ^ АФНОР (1975). Французский набор графических символов для французского языка (PDF) . ITSCJ/ IPSJ . ИСО-ИК -25.
- ^ Совет по стандартам Канады (1 февраля 1986 г.). Альтернативный основной графический набор №. 1 (PDF) . ITSCJ/ IPSJ . ИСО-ИК -121.
- ^ Совет по стандартам Канады (1 февраля 1986 г.). Альтернативный основной графический набор №. 2 (PDF) . ITSCJ/ IPSJ . ИСО-ИК -122.
- ^ ИБМ (1992). «Кодовая страница 01021» (PDF) . РЕЕСТР: наборы графических символов и кодовые страницы .
- ^ ДИН (1975). Немецкая эталонная версия 7-битного набора символов ISO (только графика) для немецкого языка, как определено немецким стандартом DIN 66 003 – июнь 1974 г. (PDF) . ITSCJ/ IPSJ . ИСО-ИР -21.
- ^ Шведская комиссия по стандартизации (1975). Шведский базовый графический набор символов (PDF) . ITSCJ/ IPSJ . ИСО-ИК -10.
- ^ Шведская комиссия по стандартизации (1975). Шведский графический набор символов для официального написания имен (PDF) . ITSCJ/ IPSJ . ИСО-ИК -11.
- ^ ИБМ (1992). «Кодовая страница 01106» (PDF) . РЕЕСТР: наборы графических символов и кодовые страницы .
- ^ ИБМ (1992). «Кодовая страница 01103» (PDF) . РЕЕСТР: наборы графических символов и кодовые страницы .
- ^ Jump up to: а б Шведская комиссия по стандартизации (1975). Основной графический набор символов NATS для передачи текста газет в Финляндии и Швеции (PDF) . ITSCJ/ IPSJ . ИСО-ИР -8-1.
- ^ ИБМ (1987). «Кодовая страница 01017» (PDF) . РЕЕСТР: наборы графических символов и кодовые страницы .
- ^ ИБМ (1992). «Кодовая страница 01105» (PDF) . РЕЕСТР: наборы графических символов и кодовые страницы .
- ^ ИБМ (1992). «Кодовая страница 01107» (PDF) . РЕЕСТР: наборы графических символов и кодовые страницы .
- ^ Norge Standardiseringforbund (1 июня 1982 г.). Норвежский стандарт NS 4551 – Версия 1 (PDF) . ITSCJ/ IPSJ . ИСО ИК -60.
- ^ Jump up to: а б Дагиен, Валентина; Григас, Гинтаутас; Евсикова, Татьяна (2010). «3.2.2. Кодирование ISO 646». Локализация программного обеспечения (PDF) (на литовском языке). Институт математики и информатики. Мистер. 67. ИСБН 978-9986-680-47-5 . (примечание: в приведенной таблице иногда перепутаны регистры букв , например, ġ и Ġ оба появляются как Ġ в мальтийском ряду или Ä и ä оба появляются как Ä в шведских рядах)
- ^ ЭКМА (1976). Вариант 7-битного набора символов ISO (только графика) для испанского языка (PDF) . ITSCJ/ IPSJ . ИСО-ИК -17.
- ^ ЭКМА (1 июля 1984 г.). Набор графических символов для испанского языка (PDF) . ITSCJ/ IPSJ . ИСО-ИК -85.
- ^ Управление стандартизации и измерений (1 июля 1989 г.). Графический набор символов Республики Куба (PDF) . ITSCJ/ IPSJ . ИСО-ИК -151.
- ^ ЭКМА (30 декабря 1976 г.). Набор графических символов для португальского языка (PDF) . ITSCJ/ IPSJ . ИСО-ИК -16.
- ^ ЭКМА (1 июля 1984 г.). Набор графических символов португальского языка (PDF) . ITSCJ/ IPSJ . ИСО-ИР -84.
- ^ Федеральный институт стандартизации (1 ноября 1987 г.). Сербохорватский и словенский латинский алфавит (PDF) . ITSCJ/ IPSJ . ИСО-ИР -141.
- ^ ИБМ (1987). «Кодовая страница 01019» (PDF) . РЕЕСТР: наборы графических символов и кодовые страницы .
- ^ ИБМ (1992). «Кодовая страница 01102» (PDF) . РЕЕСТР: наборы графических символов и кодовые страницы .
- ^ Венгерское управление по стандартизации (1 июля 1984 г.). Справочная версия стандарта ISO 646 (HRV) на венгерском языке (PDF) . ITSCJ/ IPSJ . ИСО-ИР -86.
- ^ «Приложение D: Наборы символов (§ Кодовая страница #3041 мальтийский)» (PDF) . Руководство пользователя: Матричный принтер LC-8021 . Звезда Микроникс . 1997. с. 62. Архивировано из оригинала (PDF) 8 сентября 2004 г.
- ^ Корпорация Майкрософт . «charsets.hpp: определяет таблицы перевода для различных наборов символов VT, используемых в классе TerminalOutput» . Терминал Windows .
- ^ «Кодовая страница 1054» (PDF) . Архивировано из оригинала (PDF) 21 января 2013 г.
- ^ «Кодовая страница 1052» (PDF) . Архивировано из оригинала (PDF) 21 января 2013 г.
- ^ Туркменские стандарты (14 сентября 2000 г.). Туркменский алфавит (PDF) . ITSCJ/ IPSJ . ИСО-ИК -230.
- ^ Jump up to: а б ЭКМА (1976). Набор греческих графиков (PDF) . ITSCJ/ IPSJ . ИСО-ИК -18.
- ^ ЭКМА (1976). Комбинированный набор латинско-греческих графиков (только заглавные буквы) (PDF) . ITSCJ/ IPSJ . ИСО-ИК -19.
- ^ «Сопоставить (внешнюю версию) из набора символов Mac OS в Unicode 4.0 и более поздних версий» .
- ^ «15.6.8: Греческий набор G0», ETS 300 706: Расширенная спецификация телетекста (PDF) , Европейский институт телекоммуникационных стандартов ( ETSI ), стр. 121
- ^ «15.6.5: Набор кириллицы G0 — Вариант 2 — русский/болгарский», ETS 300 706: Расширенная спецификация телетекста (PDF) , Европейский институт телекоммуникационных стандартов ( ETSI ), стр. 118
- ^ «15.6.6: Набор кириллицы G0 — Вариант 3 — Украинский», ETS 300 706: Расширенная спецификация телетекста (PDF) , Европейский институт телекоммуникационных стандартов ( ETSI ), стр. 119
- ^ «15.6.4: Набор кириллицы G0 — Вариант 1 — сербский/хорватский», ETS 300 706: Расширенная спецификация телетекста (PDF) , Европейский институт телекоммуникационных стандартов ( ETSI ), стр. 117
- ^ АСМО (1 января 1985 г.). 7-битный набор арабских символов для обмена информацией (PDF) . ITSCJ/ IPSJ . ИСО-ИР -89.
Дальнейшее чтение
[ редактировать ]- Фишер, Эрик, изд. (1975) [1972]. Первоисточники по истории кодов символов, 1972–1975 гг. (Сборник). Архивировано из оригинала 07.06.2020 . Проверено 7 июня 2020 г.
{{cite book}}
: CS1 maint: bot: original URL status unknown (link) (79 pages) including: Бемер, Роберт Уильям (1972). «взгляд на историю набора символов ISO». Компьютерный журнал Honeywell . 6 (4). Финикс, Аризона, США: Информационные системы Honeywell: 274–286, 287–291. (13+5 страниц) и множество других документов и переписки.
Внешние ссылки
[ редактировать ]- ISO/IEC 646:1991 Информационные технологии. 7-битный набор символов ISO для обмена информацией.
- Набор символов согласно ISO 646 (ASCII) (на немецком языке)
- История на GNU Aspell веб-сайте
- Таблицы символов ISO646 Таблицы символов Коичи Ясуока (安岡孝) (см. Внутренние таблицы символов ISO646 и Таблицы символов квази-ISO646 )
- Турецкий текст Deasciifier - инструмент (основанный на статистическом анализе пентаграмм турецкого языка), который восстанавливает турецкий текст в формате ASCII, определяя соответствующие (но неоднозначные) диакритические знаки, которые обычно необходимы в турецком языке, но отсутствуют в наборе US-ASCII.