VSCII
Псевдоним(а) | x-viet-tcvn5712 [1] |
---|---|
Язык(и) | вьетнамский , английский |
Сделано | ТКВН /TC1 |
Стандартный | ТКВН 5712:1993 |
Классификация | 8-битный SBCS ; Расширенный ASCII (VSCII-2/-3) |
VSCII ( Вьетнамский стандартный код обмена информацией ), также известный как TCVN 5712 , [2] ИСО-ИК -180 , [3] .ВН , [4] АВС [4] или просто кодировки TCVN , [4] [5] представляет собой набор из трех тесно связанных вьетнамских национальных стандартных кодировок символов для использования вьетнамского языка на компьютерах , разработанных Техническим комитетом по информационным технологиям TCVN (TCVN/TC1) и впервые принятых в 1993 году (как TCVN 5712:1993). [2]
с аналогичным названием Его не следует путать с неофициальной кодировкой VISCII , которую иногда использовали говорящие на вьетнамском языке за рубежом. [4] VISCII также должен был обозначать вьетнамский стандартный код обмена информацией , но не имеет отношения к VSCII. [6]
VSCII (TCVN) широко использовался на севере Вьетнама, тогда как VNI был популярен на юге. [4] Unicode и кодовая страница Windows-1258 теперь используются практически для всех компьютерных данных во Вьетнаме. [ нужна цитата ] но устаревшие файлы или архивные сообщения могут нуждаться в преобразовании.
Кодировки [ править ]
Все три формы VSCII сохраняют 95 печатных символов ASCII неизмененными.
VSCII-3 , также известный как TCVN 5712-3, VN3 или просто TCVN3, [7] содержит наименьшее количество заданий. Это расширенный ASCII , поскольку он сохраняет все 128 кодов ASCII неизмененными. Он не переназначает какие-либо управляющие коды C0 и C1 . По сравнению с ASCII он добавляет 75 символов:
- 67 символов нижнего регистра, что обеспечивает полную поддержку нижнего регистра.
- 7 символов верхнего регистра, что позволяет использовать прописные буквы для 29 основных букв без знаков тона.
- Неразрывное пространство .
Знаки тона гласных в верхнем регистре выполняются в TCVN3 путем переключения на заглавный шрифт. [8]
VSCII-2 , также известный как TCVN 5712-2 и VN2, является расширенным набором VSCII-3. Это расширенный ASCII , поскольку он сохраняет все 128 кодов ASCII неизмененными. Он не переназначает ни один из управляющих кодов C0 и C1 , что делает его совместимым с ISO 2022 как набор из 96 кодов. [2] [3] По сравнению с VSCII-3 он добавляет (всего 96 символов, отличных от ASCII):
- Еще 16 символов верхнего регистра с предварительно составленными знаками тона (всего 23 символа верхнего регистра, не входящих в ASCII)
- 5 объединение диакритических знаков для знаков тона , позволяющее представлять другие комбинации заглавных букв и знаков тона. Комбинированные знаки следуют основной букве [2] как в VNI (а не перед ними, как в ANSEL ).
VSCII-1 , также известный как TCVN 5712-1 и VN1, является расширением VSCII-2 и модифицированным ASCII, поскольку он заменяет 12 из 33 управляющих символов заранее составленными символами. По сравнению с VSCII-2 он (всего 140 символов, отличных от ASCII):
- Добавляет еще 44 заранее составленных заглавных буквы, в результате чего их количество становится таким же, как и строчных.
- Делается это путем замены 12 управляющих символов ASCII и выделения 32 графических символов в область управления C1, что нарушает совместимость со стандартом ISO 2022.
Преобразование из VSCII-3 в VSCII-2 или VSCII-1 и преобразование из VSCII-2 в VSCII-1 не требуется, но может привести к уменьшению размера файлов.
Преобразование из VSCII-1 в VSCII-2 или VSCII-3 и преобразование из VSCII-2 в VSCII-3 требуют расширения некоторых заранее составленных символов.
Набор символов [ править ]
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
0x | НУЛЕВОЙ | О 00DA |
ты 1EE4 |
И Т. Д | ДА 1ЕЭЗ |
Эм-м-м 1ЕЕС |
Эм-м-м 1ЕЕЕ |
БЕЛ | БС | ХТ | НЧ | ВТ | ФФ | ЧР | ТАК | И |
1x | В СООТВЕТСТВИИ С | Фу 1EE8 |
Фу 1EF0 |
Фу 1EF2 |
ЗАВИСИТ ОТ 1EF6 |
ВОДА 1EF8 |
ИДЕЯ 00ДД |
Да 1EF4 |
МОЖЕТ | В | СУБ | ЭКУ | ФС | GS | РС | НАС |
2x | СП | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | А | Б | С | Д | И | Ф | г | ЧАС | я | Дж | К | л | М | Н | О |
5x | п | вопрос | р | С | Т | В | V | В | Икс | И | С | [ | \ | ] | ^ | _ |
6x | ` | а | б | с | д | Это | ж | г | час | я | дж | к | л | м | н | О |
7x | п | д | р | с | т | в | v | В | Икс | и | С | { | | | } | ~ | ПРИНАДЛЕЖАЩИЙ |
8x | ИМЕЕТ 00C0 |
ЕЕ 1EA2 |
à 00C3 |
На 00C1 |
Ах 1EA0 |
Фу 1ЕВ6 |
Ах 1EAC |
И 00C8 |
Эх 1ЕБА |
СКАЗАТЬ 1ЕВК |
И 00C9 |
Ой 1EB8 |
Эх 1EC6 |
Я 00СС |
ЗАВИСИТ ОТ 1EC8 |
Я 0128 |
9x | В 00CD |
Ты 1ECA |
Ò 00D2 |
О 1ЕЭК |
ОН 00D5 |
Ой 00D3 |
Он 1ЕСС |
Ой 1ЭД8 |
Эм-м-м 1EDC |
ЖИТЬ 1 ЭДЕ |
Фу 1EE0 |
Фу 1 ЭДА |
ОТРЫЖКА 1EE2 |
Ù 00D9 |
ИНКУБИРОВАТЬ 1ЕЕ6 |
Ũ 0168 |
Топор | НБСП | Хм 0102 |
 00C2 |
Э 00CA |
ЗОНТИК 00D4 |
ЭХ 01A0 |
Эм-м-м 01AF |
Д 0110 |
Хм 0103 |
â 00E2 |
ага 00ЕА |
Зонтик 00F4 |
Привет 01А1 |
Эм-м-м 01B0 |
Д 0111 |
Ằ 1EB0 |
Бх | ◌̀ 0300 |
◌̉ 0309 |
◌̃ 0303 |
◌́ 0301 |
◌̣ 0323 |
имеет 00E0 |
ее 1ЕА3 |
ã 00E3 |
на 00E1 |
ой 1EA1 |
Эх 1ЕВ2 |
ах 1ЕВ1 |
ага 1ЕВ3 |
ах 1ЕВ5 |
ах 1ЭАФ |
Эх 1ЕВ4 |
Сх | Ах 1ЕАЕ |
Ой 1EA6 |
Ан 1EA8 |
Эх 1ЕАА |
Ах 1EA4 |
Эх 1EC0 |
Эм-м-м 1EB7 |
ах 1EA7 |
А 1EA9 |
ага 1ЕАБ |
ах 1EA5 |
ах 1EAD |
И 00E8 |
Эх 1EC2 |
ага 1ЕВБ |
сказать 1ЕБД |
Дх | Это 00E9 |
ты 1ЕВ9 |
ага 1EC1 |
ага 1EC3 |
Эх 1EC5 |
неликвидный 1EBF |
Эх 1EC7 |
я 00EC |
зависит от 1EC9 |
Эх 1EC4 |
НЕПРОДАЖНЫЙ 1 ЭБЕ |
ОЙ 1ЭД2 |
ой 0129 |
в 00ED |
ты 1ЕЦБ |
ò 00F2 |
Бывший | Водить машину 1ЭД4 |
ой 1 еврокф |
Он 00F5 |
от 00F3 |
он 1ЭЦД |
Ой 1ЭД3 |
водить машину 1ЭД5 |
ой 1ЭД7 |
ой 1ЭД1 |
Ой 1ЭД9 |
Эм-м-м 1-е место |
жить 1EDF |
ой 1EE1 |
Эм-м-м 1ЭДБ |
отрыжка 1EE3 |
ты 00F9 |
Форекс | Ой 1ЭД6 |
инкубировать 1ЕЕ7 |
фу 0169 |
ты 00FA |
да 1EE5 |
Да 1ЕЕБ |
Эм-м-м 1EED |
фу 1ЭЭФ |
застой 1ЕЕ9 |
Фу 1EF1 |
Инерция 1EF3 |
зависит от 1EF7 |
вода 1EF9 |
идея | упс 1EF5 |
Ой 1ЭД0 |
Ссылки [ править ]
- ^ Сивонен, Анри (26 сентября 2014 г.). «Изменения кодировки символов в mc требуют действия cc» . mozilla.dev.apps.thunderbird .
- ^ Перейти обратно: а б с д Это «[новости] TCVN 5712:1993 (VSCII) — национальный стандарт Вьетнама» . 2 июня 1993 г. Архивировано из оригинала 11 января 2017 г.
- ^ Перейти обратно: а б ТКВН (1993). ISO-IR-180: Правая часть таблицы кодов VSCII-2 (PDF) . ITSCJ/ IPSJ .
- ^ Перейти обратно: а б с д Это Нго, Хок Динь; Тран, ТуБинь. «5. Зачем нужно конвертировать вьетнамскую кодировку (набор символов – кодировка)?» . Некоторые специальные функции WinVNKey .
- ^ Нгуен, Минь Т. «Вьетнамские преобразования (Vietnet/VIQR, VNI, VPS, VISCII, VNU, TCVN, VietWare, unicode)» .
- ^ Лунде, Кен (13 января 2009 г.). «Глава 1: Обзор обработки информации CJKV (§ Являются ли VISCII и VSCII идентичными? А как насчет TCVN?)». Обработка информации CJKV (2-е изд.). п. 17. ISBN 978-0-596-51447-1 .
- ^ «Юникод и устаревшие вьетнамские кодировки символов» . Часто задаваемые вопросы о вьетнамском Unicode .
- ^ «Юникод и устаревшие вьетнамские кодировки символов» . Часто задаваемые вопросы о вьетнамском Unicode .
TCVN3 не является двухбайтовым, но из-за особенностей его кодирования заглавные буквы (гласные) отображаются в отдельный прописной шрифт, аналогичный обычному строчному.
- ^ Лунде, Кен (13 января 2009 г.). «Приложение L: Наборы вьетнамских символов» (PDF) . Обработка информации CJKV (2-е изд.). ISBN 978-0-596-51447-1 .