VSCII
Псевдоним(а) | x-viet-tcvn5712 [1] |
---|---|
Язык(и) | вьетнамский , английский |
Создано | ТКВН /TC1 |
Стандартный | ТКВН 5712:1993 |
Классификация | 8-битный SBCS ; Расширенный ASCII (VSCII-2/-3) |
VSCII ( Вьетнамский стандартный код обмена информацией ), также известный как TCVN 5712 , [2] ИСО-ИК -180 , [3] .ВН , [4] АВС [4] или просто кодировки TCVN , [4] [5] представляет собой набор из трех тесно связанных вьетнамских национальных стандартных кодировок символов для использования вьетнамского языка на компьютерах , разработанных Техническим комитетом по информационным технологиям TCVN (TCVN/TC1) и впервые принятых в 1993 году (как TCVN 5712:1993). [2]
Его не следует путать с неофициальной кодировкой VISCII с аналогичным названием , которую иногда использовали говорящие на вьетнамском языке за рубежом. [4] VISCII также должен был обозначать вьетнамский стандартный код обмена информацией , но не имеет отношения к VSCII. [6]
VSCII (TCVN) широко использовался на севере Вьетнама, тогда как VNI был популярен на юге. [4] Unicode и кодовая страница Windows-1258 теперь используются практически для всех компьютерных данных во Вьетнаме. [ нужна ссылка ] но устаревшие файлы или архивные сообщения могут нуждаться в преобразовании.
Кодировки
[ редактировать ]Все три формы VSCII сохраняют 95 печатных символов ASCII неизмененными.
VSCII-3 , также известный как TCVN 5712-3, VN3 или просто TCVN3, [7] содержит наименьшее количество заданий. Это расширенный ASCII , поскольку он сохраняет все 128 кодов ASCII неизмененными. Он не переназначает какие-либо управляющие коды C0 и C1 . По сравнению с ASCII он добавляет 75 символов:
- 67 символов нижнего регистра, что обеспечивает полную поддержку нижнего регистра.
- 7 символов верхнего регистра, что позволяет использовать прописные буквы для 29 основных букв без знаков тона.
- пространство Неразрывное .
Знаки тона для гласных в верхнем регистре выполняются в TCVN3 путем переключения на заглавный шрифт. [8]
VSCII-2 , также известный как TCVN 5712-2 и VN2, является расширенным набором VSCII-3. Это расширенный ASCII , поскольку он сохраняет все 128 кодов ASCII неизмененными. Он не переназначает ни один из управляющих кодов C0 и C1 , что делает его совместимым с ISO 2022 как набор из 96 кодов. [2] [3] По сравнению с VSCII-3 он добавляет (всего 96 символов, отличных от ASCII):
- Еще 16 символов верхнего регистра с предварительно составленными знаками тона (всего 23 символа верхнего регистра, не входящих в ASCII)
- 5 объединение диакритических знаков для знаков тона , позволяющее представлять другие комбинации заглавных букв и знаков тона. Комбинированные знаки следуют основной букве [2] как в VNI (а не перед ними, как в ANSEL ).
VSCII-1 , также известный как TCVN 5712-1 и VN1, является расширением VSCII-2 и модифицированным ASCII, поскольку он заменяет 12 из 33 управляющих символов заранее составленными символами. По сравнению с VSCII-2 он (всего 140 символов, отличных от ASCII):
- Добавляет еще 44 заранее составленных заглавных буквы, в результате чего их количество становится таким же, как и строчных.
- Делается это путем замены 12 управляющих символов ASCII и выделения 32 графических символов в область управления C1, что нарушает совместимость со стандартом ISO 2022.
Преобразование из VSCII-3 в VSCII-2 или VSCII-1 и преобразование из VSCII-2 в VSCII-1 не требуется, но может привести к уменьшению размера файлов.
Преобразование из VSCII-1 в VSCII-2 или VSCII-3 и преобразование из VSCII-2 в VSCII-3 требуют расширения некоторых заранее составленных символов.
Набор символов
[ редактировать ]0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
0x | НУЛЕВОЙ | О 00DA | ты 1EE4 | И Т. Д | ДА 1ЕЭЗ | Эм-м-м 1ЕЕС | Эм-м-м 1ЕЕЕ | БЕЛ | БС | ХТ | НЧ | ВТ | ФФ | ЧР | ТАК | И |
1x | В СООТВЕТСТВИИ С | Фу 1EE8 | Фу 1EF0 | Фу 1EF2 | ЗАВИСИТ ОТ 1EF6 | ВОДА 1EF8 | ИДЕЯ 00ДД | Да 1EF4 | МОЖЕТ | В | СУБ | ЭКУ | ФС | GS | РС | НАС |
2x | СП | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | А | Б | С | Д | И | Ф | Г | ЧАС | я | Дж | К | л | М | Н | ТО |
5x | П | вопрос | Р | С | Т | В | V | В | Х | И | С | [ | \ | ] | ^ | _ |
6x | ` | а | б | с | д | и | ж | г | час | я | дж | к | л | м | н | тот |
7x | п | д | р | с | т | в | v | В | х | и | С | { | | | } | ~ | ПРИНАДЛЕЖАЩИЙ |
8x | ИМЕЕТ 00C0 | ЕЕ 1EA2 | Ã 00C3 | На 00C1 | Ах 1EA0 | Фу 1ЕВ6 | Ах 1EAC | И 00C8 | Эх 1ЕБА | СКАЗАТЬ 1ЕВК | И 00C9 | Ой 1EB8 | Эх 1EC6 | Я 00СС | ЗАВИСИТ ОТ 1EC8 | Я 0128 |
9x | В 00CD | Ты 1ECA | Ò 00D2 | О 1ЕЭК | ОН 00D5 | Ой 00D3 | Он 1ЕСС | Ой 1ЭД8 | Эм-м-м 1EDC | ЖИТЬ 1 ЭДЕ | Фу 1EE0 | Фу 1 ЭДА | ОТРЫЖКА 1EE2 | Ù 00D9 | ИНКУБИРОВАТЬ 1ЕЕ6 | Ũ 0168 |
Топор | НБСП | Хм 0102 | Â 00C2 | Э 00CA | ЗОНТИК 00D4 | ЭХ 01А0 | Эм-м-м 01AF | Д 0110 | Хм 0103 | â 00E2 | ага 00ЕА | Зонтик 00F4 | Привет 01А1 | Эм-м-м 01B0 | Д 0111 | Ằ 1EB0 |
Бх | ◌̀ 0300 | ◌̉ 0309 | ◌̃ 0303 | ◌́ 0301 | ◌̣ 0323 | имеет 00E0 | ее 1ЕА3 | ã 00E3 | на 00E1 | сэр 1EA1 | Эх 1ЕВ2 | ах 1ЕВ1 | ага 1ЕВ3 | ах 1ЕВ5 | ах 1ЭАФ | Эх 1ЕВ4 |
Сх | Ах 1ЕАЕ | Ой 1EA6 | Ан 1EA8 | Эх 1ЕАА | Ах 1EA4 | Эх 1EC0 | Эм-м-м 1EB7 | ах 1EA7 | А 1EA9 | ага 1ЕАБ | ах 1EA5 | ах 1EAD | И 00E8 | Эх 1EC2 | ага 1ЕВБ | сказать 1ЕБД |
Дх | и 00E9 | ты 1ЕВ9 | ага 1EC1 | ага 1EC3 | Эх 1EC5 | неликвидный 1EBF | Эх 1EC7 | я 00EC | зависеть от 1EC9 | Эх 1EC4 | НЕПРОДАЖНЫЙ 1 ЭБЕ | ОЙ 1ЭД2 | ой 0129 | в 00ED | ты 1ЕЦБ | ò 00F2 |
Бывший | Водить машину 1ЭД4 | ой 1 еврокф | он 00F5 | от 00F3 | он 1ЭЦД | Ой 1ЭД3 | водить машину 1ЭД5 | ой 1ЭД7 | ой 1ЭД1 | Ой 1ЭД9 | Эм-м-м 1-е место | жить 1EDF | ой 1EE1 | Эм-м-м 1ЭДБ | отрыжка 1EE3 | ты 00F9 |
Форекс | Ой 1ЭД6 | инкубировать 1ЕЕ7 | фу 0169 | ты 00FA | да 1EE5 | Да 1ЕЕБ | Эм-м-м 1EED | фу 1ЭЭФ | застой 1ЕЕ9 | Фу 1EF1 | Инерция 1EF3 | зависеть от 1EF7 | вода 1EF9 | идея | Эм-м-м 1EF5 | Ой 1ЭД0 |
Ссылки
[ редактировать ]- ^ Сивонен, Анри (26 сентября 2014 г.). «Изменения кодировки символов в mc требуют действия cc» . mozilla.dev.apps.thunderbird .
- ^ Jump up to: а б с д и «[новости] TCVN 5712:1993 (VSCII) — национальный стандарт Вьетнама» . 2 июня 1993 г. Архивировано из оригинала 11 января 2017 г.
- ^ Jump up to: а б ТКВН (1993). ISO-IR-180: Правая часть таблицы кодов VSCII-2 (PDF) . ITSCJ/ IPSJ .
- ^ Jump up to: а б с д и Нго, Хок Динь; Тран, ТуБинь. «5. Зачем нужно конвертировать вьетнамскую кодировку (набор символов – кодировка)?» . Некоторые специальные функции WinVNKey .
- ^ Нгуен, Минь Т. «Вьетнамские преобразования (Vietnet/VIQR, VNI, VPS, VISCII, VNU, TCVN, VietWare, unicode)» .
- ^ Лунде, Кен (13 января 2009 г.). «Глава 1: Обзор обработки информации CJKV (§ Являются ли VISCII и VSCII идентичными? А как насчет TCVN?)». Обработка информации CJKV (2-е изд.). п. 17. ISBN 978-0-596-51447-1 .
- ^ «Юникод и устаревшие вьетнамские кодировки символов» . Часто задаваемые вопросы о вьетнамском Unicode .
- ^ «Юникод и устаревшие вьетнамские кодировки символов» . Часто задаваемые вопросы о вьетнамском Unicode .
TCVN3 не является двухбайтовым, но из-за особенностей его кодирования заглавные буквы (гласные) отображаются в отдельный заглавный шрифт, аналогичный обычному строчному.
- ^ Лунде, Кен (13 января 2009 г.). «Приложение L: Наборы вьетнамских символов» (PDF) . Обработка информации CJKV (2-е изд.). ISBN 978-0-596-51447-1 .