ВИСКИ
МИМ / IANA | ВИСКИ |
---|---|
Язык(и) | вьетнамский , английский |
Создано | Вьетнамская группа |
Определения | RFC 1456 |
Классификация | 8-битный SBCS |
На основе | ASCII |
VISCII — это неофициально определенная модифицированная ASCII кодировка символов для использования вьетнамского языка на компьютерах . Его не следует путать с официально зарегистрированной кодировкой VSCII с аналогичным названием . VISCII сохраняет 95 печатных символов ASCII неизмененными, но заменяет 6 из 33 управляющих символов печатными символами. Он добавляет 128 заранее составленных символов . Unicode и кодовая страница Windows-1258 теперь используются практически для всех компьютерных данных во Вьетнаме. [ нужна ссылка ] но устаревшие файлы VSCII и VISCII могут нуждаться в преобразовании.
История и наименование [ править ]
VISCII был разработан Вьетнамской рабочей группой по стандартизации (Viet-Std Group). [1] под руководством Кристофера Куонг Т. Нгуена, Куонга М. Буи и Хок Д. Нго, базирующихся в Кремниевой долине , Калифорния, в 1992 году, когда они работали с консорциумом Unicode над включением заранее составленных вьетнамских символов в стандарт Unicode. VISCII, наряду с VIQR , был впервые опубликован в двуязычном отчете в сентябре 1992 года, в котором он был назван «Вьетнамским стандартным кодом обмена информацией». [2] В отчете отмечается рост использования компьютеров во Вьетнаме и увеличение объема компьютерных коммуникаций среди вьетнамцев за границей, а также то, что существующие приложения используют кодировки, специфичные для конкретного поставщика, которые не могут взаимодействовать друг с другом, и стандартизация поэтому необходима между поставщиками. Успешное включение составного и предварительно составленного вьетнамского языка в Unicode 1.0 стало результатом уроков, извлеченных из разработки 8-битного VISCII и 7-битного VIQR. [2]
В следующем, 1993 году, Вьетнам принял TCVN 5712 , свой первый национальный стандарт в области информационных технологий . [3] Это определило кодировку символов под названием VSCII , которая была разработана Техническим комитетом по информационным технологиям TCVN (TCVN/TC1), и ее название означает «Вьетнамский стандартный код для обмена информацией». [3] VSCII несовместим с ранее опубликованным VISCII и не имеет к нему никакого отношения. [4] В отличие от VISCII, VSCII является «вьетнамским стандартом» в смысле национального стандарта .
VISCII и VIQR утверждены в качестве информационно-статусных RFC 1456 , отнесенный к группе Viet-Std и датированный маем 1993 года. Как и в случае с RFC IETF, в RFC 1456 отмечается, что они являются «соглашениями», используемыми зарубежными носителями вьетнамского языка в Usenet , и что он «не определяет никакого уровня стандарта». . Несмотря на это, он продолжает называть VISCII «Вьетнамским стандартным кодом обмена информацией» (то же имя, что и VSCII). [5] Этикетки VISCII
и csVISCII
зарегистрированы в IANA для VISCII со ссылкой на RFC 1456. [6] (С другой стороны, для TCVN 5712/VSCII не существует официального ярлыка IANA, хотя x-viet-tcvn5712
ранее поддерживался Mozilla Firefox . [7] )
Дизайн [ править ]
Традиционный расширенный набор символов ASCII состоит из набора ASCII и до 128 символов. Вьетнамский язык требует 134 дополнительных буквенно-диакритических комбинаций, что на шесть слишком много. Существует (если не считать исключения поддержки тональных знаков для заглавных букв, как в VSCII-3 ) по существу четыре различных способа решения этой проблемы:
- Используйте кодировку переменной ширины (как и UTF-8 ).
- Включите объединение диакритических знаков для знаков тона (как VSCII-2 и Windows-1258 ) или для диакритических знаков в целом (как ANSEL и VNI ).
- Замените некоторые знаки препинания ASCII, желательно пунктуацию, которая не является инвариантной в ISO 646 (как и VNI для DOS ).
- Замените не менее шести основных управляющих символов ASCII (как и VPS и VSCII-1 ).
VISCII выбрал последний вариант, заменив шесть наименее проблемных (например, наименее вероятно распознаваемых приложением и обрабатываемых специальным образом) управляющих кодов C0 (STX, ENQ, ACK, DC4, EM и RS) на шесть из наименее используемые комбинации прописных букв и диакритических знаков. [2] Хотя этот вариант может привести к сбоям в работе программ, использующих эти управляющие коды при обработке текста VISCII, он создает меньше сложностей, чем два других варианта (разработчики отмечают, что на практике было обнаружено, что не- 8-битная чистая передача представляет больше трудностей, чем повторное использование управляющего символа). [2] Тем не менее, расположение управляющих символов C0 или C1, а также кодов, используемых для неразрывного пробела в ISO-8859-1 , Mac OS Roman и OEM-US, было намеренно присвоено прописным буквам с намерением использовать строчные кодовые точки. использование заглавного шрифта является полезным обходным решением, если графические символы не могут быть отображены для этих кодов. [2]
Однако использование всех расширенных кодовых точек для букв с диакритическими знаками не оставило места для добавления полезных символов, надстрочных чисел, изогнутых кавычек, правильных тире и т. д., как и большинство других расширенных наборов символов ASCII.
Расположение символов намеренно в основном соответствует стандарту ISO-8859-1 , где есть общие символы между двумя кодовыми страницами (заглавные буквы Õ отмечены как исключение), что мотивировано соображениями удобства использования. [2]
Поддержка [ править ]
VISCII частично поддерживается группой TriChlor Software Group в Калифорнии, которая выпустила различные VISCII-совместимые пакеты программного обеспечения, библиотеки и шрифты для MS-DOS и Windows, Unix и Macintosh. Программное обеспечение, совместимое с VISCII, доступно на многих FTP-сайтах .
в качестве кодировки исходящей электронной почты VISCII исторически предлагался Mozilla Thunderbird . [8] Он также поддерживался программным обеспечением для вьетнамской клавиатуры Windows WinVNKey, созданным Кристофером Куонгом Т. Нгуеном и позже обновленным до различных версий Windows Хок Д. Нго и другими.
VISCII в основном использовался за рубежом, говорящими на вьетнамском языке, при этом VSCII (TCVN) был более популярен в северном Вьетнаме, а VNI - в южном Вьетнаме. [9]
Набор символов [ править ]
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
0x | НУЛЕВОЙ | СОХ | Эх 1ЕВ2 | И Т. Д | ОТ | Эх 1ЕВ4 | Эх 1ЕАА | БЕЛ | БС | ХТ | НЧ | ВТ | ФФ | ЧР | ТАК | И |
1x | В СООТВЕТСТВИИ С | DC1 | DC2 | DC3 | ЗАВИСИТ ОТ 1EF6 | ХОТЕТЬ | СИН | ЭТБ | МОЖЕТ | ВОДА 1EF8 | СУБ | ЭКУ | ФС | GS | Да 1EF4 | НАС |
2x | СП | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | А | Б | С | Д | И | Ф | Г | ЧАС | я | Дж | К | л | М | Н | ТО |
5x | П | вопрос | Р | С | Т | В | V | В | Х | И | С | [ | \ | ] | ^ | _ |
6x | ` | а | б | с | д | и | ж | г | час | я | дж | к | л | м | н | тот |
7x | п | д | р | с | т | в | v | В | х | и | С | { | | | } | ~ | ПРИНАДЛЕЖАЩИЙ |
8x | Ах 1EA0 | Ах 1ЕАЕ | Ằ 1EB0 | Фу 1ЕВ6 | Ах 1EA4 | Ой 1EA6 | Ан 1EA8 | Ах 1EAC | СКАЗАТЬ 1ЕВК | Ой 1EB8 | НЕПРОДАЖНЫЙ 1 ЭБЕ | Эх 1EC0 | Эх 1EC2 | Эх 1EC4 | Эх 1EC6 | Ой 1ЭД0 |
9x | ОЙ 1ЭД2 | Водить машину 1ЭД4 | Ой 1ЭД6 | Ой 1ЭД8 | ОТРЫЖКА 1EE2 | Фу 1 ЭДА | Эм-м-м 1EDC | ЖИТЬ 1 ЭДЕ | Ты 1ECA | О 1ЕЭК | Он 1ЕСС | ЗАВИСИТ ОТ 1EC8 | ИНКУБИРОВАТЬ 1ЕЕ6 | Ũ 0168 | ты 1EE4 | Фу 1EF2 |
Топор | ОН 00D5 | ах 1ЭАФ | ах 1ЕВ1 | Эм-м-м 1ЕВ7 | ах 1EA5 | ах 1EA7 | А 1EA9 | ах 1EAD | сказать 1ЕБД | ты 1ЕВ9 | неликвидный 1EBF | ага 1EC1 | ага 1EC3 | Эх 1EC5 | Эх 1EC7 | ой 1ЭД1 |
Бх | Ой 1ЭД3 | водить машину 1ЭД5 | ой 1ЭД7 | Фу 1EE0 | ЭХ 01A0 | Ой 1ЭД9 | Эм-м-м 1-е место | жить 1EDF | ты 1ЕЦБ | Фу 1EF0 | Фу 1EE8 | ДА 1ЕЭЗ | Эм-м-м 1ЕЕС | Привет 01А1 | Эм-м-м 1ЭДБ | Эм-м-м 01AF |
Сх | ИМЕЕТ | На | Â | Ã | ЕЕ 1EA2 | Хм 0102 | ага 1ЕВ3 | ах 1ЕВ5 | И | И | Э | Эх 1ЕБА | Я | В | Я 0128 | Инерция 1EF3 |
Дх | Д 0110 | застой 1ЕЕ9 | Ò | Ой | ЗОНТИК | ой 1EA1 | зависеть от 1EF7 | Да 1ЕЕБ | Эм-м-м 1EED | Ù | О | вода 1EF9 | Эм-м-м 1EF5 | ИДЕЯ | ой 1EE1 | Эм-м-м 01B0 |
Бывший | имеет | на | â | ã | ее 1ЕА3 | Хм 0103 | фу 1ЭЭФ | ага 1ЕАБ | И | и | ага | ага 1ЕВБ | я | в | ой 0129 | зависеть от 1EC9 |
Форекс | Д 0111 | Фу 1EF1 | ò | от | Зонтик | он | ой 1 еврокф | он 1ЭЦД | да 1EE5 | ты | ты | фу 0169 | инкубировать 1ЕЕ7 | идея | отрыжка 1EE3 | Эм-м-м 1ЕЕЕ |
См. также [ править ]
- ASCII
- Вьетнамский цитируемо-читаемый (VIQR)
- Вьетнамский стандартный код обмена информацией (VSCII)
- Windows-1258
Ссылки [ править ]
- ^ Пхунг, Куанг; Нго, Хок Д.; Буи, Куонг. «Домашняя страница рабочей группы по вьетнамским стандартам» . Вьетнамская группа . Проверено 23 августа 2019 г.
- ↑ Перейти обратно: Перейти обратно: а б с д и ж Отчет о стандартизации кодировки символов Вьетнама — Спецификации кодировки символов VISCII и VIQR 1.1 (Технический отчет). Вьетнамская группа. 1992.
- ↑ Перейти обратно: Перейти обратно: а б «[новости] TCVN 5712:1993 (VSCII) — национальный стандарт Вьетнама» . 2 июня 1993 г. Архивировано из оригинала 11 января 2017 г.
- ^ Лунде, Кен (13 января 2009 г.). «Глава 1: Обзор обработки информации CJKV (§ Являются ли VISCII и VSCII идентичными? А как насчет TCVN?)». Обработка информации CJKV (2-е изд.). п. 17. ISBN 978-0-596-51447-1 .
- ^ Вьетнамская рабочая группа по стандартизации (май 1993 г.). Соглашения о кодировании вьетнамского языка . IETF . дои : 10.17487/RFC1456 . РФК 1456 .
- ^ «Наборы символов» . ИАНА .
- ^ Сивонен, Анри (26 сентября 2014 г.). «Изменения кодировки символов в mc требуют действия cc» . mozilla.dev.apps.thunderbird .
- ^ Сивонен, Анри (26 сентября 2014 г.). «Изменения кодировки символов в mc требуют действия cc» . mozilla.dev.apps.thunderbird .
VISCII и Armscii-8 особенные в том смысле, что долгое время сам Thunderbird (ошибочно) предоставлял эти кодировки в пользовательском интерфейсе для выбора исходящей кодировки символов при составлении сообщения. Таким образом, вполне возможно, что существует созданное Thunderbird наследие электронной почты VISCII и Armscii-8 и сообщений Usenet.
- ^ Нго, Хок Динь; Тран, ТуБинь. «5. Зачем нужно конвертировать вьетнамскую кодировку (набор символов – кодировка)?» . Некоторые специальные функции WinVNKey .
Дальнейшее чтение [ править ]
- Флор, Гвидо (2016) [2006]. «Locale::RecodeData::VISCII — процедуры преобразования для VISCII» . CPAN libintl-perl . Архивировано из оригинала 14 января 2017 г. Проверено 14 января 2017 г.
- https://www.math.nmsu.edu/~mleisher/Software/csets/VISCII.TXT
Внешние ссылки [ править ]
- RFC 1456 — Соглашения о кодировании вьетнамского языка
- Вьетнамская рабочая группа по стандартизации, базирующаяся в Калифорнии.
- Отчет Вьетнама за 1992 г.
- Программное обеспечение AnGiang
- VISCII-совместимое программное обеспечение и шрифты для MS-DOS и Windows.
- VISCII-совместимое программное обеспечение, библиотеки и шрифты для Unix.
- WinVNKey , драйвер вьетнамской клавиатуры для Windows, поддерживающий многонациональные наборы символов, включая VISCII.
- MacVNKey , VISCII-совместимый драйвер клавиатуры для Macintosh classic.