ВИСКИ
МИМ / IANA | ВИСКИ |
---|---|
Язык(и) | вьетнамский , английский |
Сделано | Вьетнамская группа |
Определения | RFC 1456 |
Классификация | 8-битный SBCS |
На основе | ASCII |
VISCII — это неофициально определенная модифицированная ASCII кодировка символов для использования вьетнамского языка на компьютерах . Его не следует путать с официально зарегистрированной кодировкой VSCII с аналогичным названием . VISCII сохраняет 95 печатных символов ASCII неизмененными, но заменяет 6 из 33 управляющих символов печатными символами. Он добавляет 128 заранее составленных символов . Unicode и кодовая страница Windows-1258 теперь используются практически для всех компьютерных данных во Вьетнаме. [ нужна цитата ] но устаревшие файлы VSCII и VISCII могут нуждаться в преобразовании.
История и наименование [ править ]
VISCII был разработан Вьетнамской рабочей группой по стандартизации (Viet-Std Group). [1] под руководством Кристофера Куонг Т. Нгуена, Куонга М. Буи и Хок Д. Нго, базирующихся в Кремниевой долине , Калифорния, в 1992 году, когда они работали с консорциумом Unicode над включением предварительно составленных вьетнамских символов в стандарт Unicode. VISCII, наряду с VIQR , был впервые опубликован в двуязычном отчете в сентябре 1992 года, в котором он был назван «Вьетнамским стандартным кодом обмена информацией». [2] В отчете отмечается рост использования компьютеров во Вьетнаме и увеличение объема компьютерных коммуникаций среди вьетнамцев за границей, а также то, что существующие приложения используют кодировки, специфичные для конкретного поставщика, которые не могут взаимодействовать друг с другом, и стандартизация поэтому необходима между поставщиками. Успешное включение составного и предварительно составленного вьетнамского языка в Unicode 1.0 стало результатом уроков, извлеченных из разработки 8-битного VISCII и 7-битного VIQR. [2]
В следующем, 1993 году, Вьетнам принял TCVN 5712 , свой первый национальный стандарт в области информационных технологий . [3] Это определило кодировку символов под названием VSCII , которая была разработана Техническим комитетом по информационным технологиям TCVN (TCVN/TC1), и ее название означает «Вьетнамский стандартный код для обмена информацией». [3] VSCII несовместим с ранее опубликованным VISCII и не имеет к нему никакого отношения. [4] В отличие от VISCII, VSCII является «вьетнамским стандартом» в смысле национального стандарта .
VISCII и VIQR утверждены в качестве информационно-статусных RFC 1456 , отнесенный к группе Viet-Std и датированный маем 1993 года. Как и в случае с RFC IETF, RFC 1456 отмечает, что они являются «соглашениями», используемыми зарубежными носителями вьетнамского языка в Usenet , и что он «не определяет никакого уровня стандарта». . Несмотря на это, он продолжает называть VISCII «Вьетнамским стандартным кодом обмена информацией» (то же имя, что и VSCII). [5] Этикетки VISCII
и csVISCII
зарегистрированы в IANA для VISCII со ссылкой на RFC 1456. [6] (С другой стороны, для TCVN 5712/VSCII не существует официального ярлыка IANA, хотя x-viet-tcvn5712
ранее поддерживался Mozilla Firefox . [7] )
Дизайн [ править ]
Традиционный расширенный набор символов ASCII состоит из набора ASCII плюс до 128 символов. Вьетнамский язык требует 134 дополнительных буквенно-диакритических комбинаций, что на шесть слишком много. Существует (если не считать исключения поддержки тональных знаков для заглавных букв, как в VSCII-3 ) по существу четыре различных способа решения этой проблемы:
- Используйте кодировку переменной ширины (как и UTF-8 ).
- Включите объединение диакритических знаков для знаков тона (как VSCII-2 и Windows-1258 ) или для диакритических знаков в целом (как ANSEL и VNI ).
- Замените некоторые знаки препинания ASCII, желательно пунктуацию, которая не является инвариантной в ISO 646 (как и VNI для DOS ).
- Замените не менее шести основных управляющих символов ASCII (как и VPS и VSCII-1 ).
VISCII выбрал последний вариант, заменив шесть наименее проблемных (например, наименее вероятно распознаваемых приложением и обрабатываемых специальным образом) управляющих кодов C0 (STX, ENQ, ACK, DC4, EM и RS) на шесть из наименее используемые комбинации прописных букв и диакритических знаков. [2] Хотя этот вариант может привести к сбоям в работе программ, использующих эти управляющие коды, при обработке текста VISCII, он создает меньше сложностей, чем два других варианта (разработчики отмечают, что на практике было обнаружено, что не- 8-битная чистая передача представляет больше трудностей, чем повторное использование управляющего символа). [2] Тем не менее, расположение управляющих символов C0 или C1, а также кодов, используемых для неразрывного пробела в ISO-8859-1 , Mac OS Roman и OEM-US, было намеренно присвоено прописным буквам с намерением использовать строчные кодовые точки. использование заглавного шрифта является полезным обходным решением, если графические символы не могут быть отображены для этих кодов. [2]
Однако использование всех расширенных кодовых точек для букв с диакритическими знаками не оставило места для добавления полезных символов, надстрочных чисел, изогнутых кавычек, правильных тире и т. д., как и большинство других расширенных наборов символов ASCII.
Расположение символов намеренно в основном соответствует стандарту ISO-8859-1, где есть общие символы между двумя кодовыми страницами (заглавные буквы Õ отмечены как исключение), что мотивировано соображениями удобства использования. [2]
Поддержка [ править ]
VISCII частично поддерживается группой TriChlor Software Group в Калифорнии, которая выпустила различные VISCII-совместимые пакеты программного обеспечения, библиотеки и шрифты для MS-DOS и Windows, Unix и Macintosh. Программное обеспечение, совместимое с VISCII, доступно на многих FTP-сайтах .
в качестве кодировки исходящей электронной почты VISCII исторически предлагался Mozilla Thunderbird . [8] Он также поддерживался программным обеспечением для вьетнамской клавиатуры Windows WinVNKey, созданным Кристофером Куонгом Т. Нгуеном и позже обновленным до различных версий Windows Хоком Д. Нго и другими.
VISCII в основном использовался за рубежом, говорящими на вьетнамском языке, при этом VSCII (TCVN) был более популярен в северном Вьетнаме, а VNI - в южном Вьетнаме. [9]
Набор символов [ править ]
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
0x | НУЛЕВОЙ | СОХ | Эх 1ЕВ2 |
И Т. Д | ОТ | Эх 1ЕВ4 |
Эх 1ЕАА |
БЕЛ | БС | ХТ | НЧ | ВТ | ФФ | ЧР | ТАК | И |
1x | В СООТВЕТСТВИИ С | DC1 | DC2 | DC3 | ЗАВИСИТ ОТ 1EF6 |
ХОТЕТЬ | СИН | ЭТБ | МОЖЕТ | ВОДА 1EF8 |
СУБ | ЭКУ | ФС | GS | Да 1EF4 |
НАС |
2x | СП | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | А | Б | С | Д | И | Ф | г | ЧАС | я | Дж | К | л | М | Н | О |
5x | п | вопрос | р | С | Т | В | V | В | Икс | И | С | [ | \ | ] | ^ | _ |
6x | ` | а | б | с | д | Это | ж | г | час | я | дж | к | л | м | н | О |
7x | п | д | р | с | т | в | v | В | Икс | и | С | { | | | } | ~ | ПРИНАДЛЕЖАЩИЙ |
8x | Ах 1EA0 |
Ах 1ЕАЕ |
Ằ 1EB0 |
Фу 1ЕВ6 |
Ах 1EA4 |
Ой 1EA6 |
Ан 1EA8 |
Ах 1EAC |
СКАЗАТЬ 1ЕВК |
Ой 1EB8 |
НЕПРОДАЖНЫЙ 1 ЭБЕ |
Эх 1EC0 |
Эх 1EC2 |
Эх 1EC4 |
Эх 1EC6 |
Ой 1ЭД0 |
9x | ОЙ 1ЭД2 |
Водить машину 1ЭД4 |
Ой 1ЭД6 |
Ой 1ЭД8 |
ОТРЫЖКА 1EE2 |
Фу 1 ЭДА |
Эм-м-м 1EDC |
ЖИТЬ 1 ЭДЕ |
Ты 1ECA |
О 1ЕЭК |
Он 1ЕСС |
ЗАВИСИТ ОТ 1EC8 |
ИНКУБИРОВАТЬ 1ЕЕ6 |
Ũ 0168 |
ты 1EE4 |
Фу 1EF2 |
Топор | ОН 00D5 |
ах 1ЭАФ |
ах 1ЕВ1 |
Эм-м-м 1EB7 |
ах 1EA5 |
ах 1EA7 |
А 1EA9 |
ах 1EAD |
сказать 1ЕБД |
ты 1ЕВ9 |
неликвидный 1EBF |
ага 1EC1 |
ага 1EC3 |
Эх 1EC5 |
Эх 1EC7 |
ой 1ЭД1 |
Бх | Ой 1ЭД3 |
водить машину 1ЭД5 |
ой 1ЭД7 |
Фу 1EE0 |
ЭХ 01A0 |
Ой 1ЭД9 |
Эм-м-м 1-е место |
жить 1EDF |
ты 1ЕЦБ |
Фу 1EF0 |
Фу 1EE8 |
ДА 1ЕЭЗ |
Эм-м-м 1ЕЕС |
Привет 01А1 |
Эм-м-м 1ЭДБ |
Эм-м-м 01AF |
Сх | ИМЕЕТ | На | Â | Ã | ЕЕ 1EA2 |
Хм 0102 |
ага 1ЕВ3 |
ах 1ЕВ5 |
И | И | Э | Эх 1ЕБА |
Я | В | Я 0128 |
Инерция 1EF3 |
Дх | Д 0110 |
застой 1ЕЕ9 |
Ò | Ой | ЗОНТИК | ой 1EA1 |
зависит от 1EF7 |
Да 1ЕЕБ |
Эм-м-м 1EED |
Ù | О | вода 1EF9 |
упс 1EF5 |
ИДЕЯ | ой 1EE1 |
Эм-м-м 01B0 |
Бывший | имеет | на | â | ã | ее 1ЕА3 |
Хм 0103 |
фу 1ЭЭФ |
ага 1ЕАБ |
И | Это | ага | ага 1ЕВБ |
я | в | ой 0129 |
зависит от 1EC9 |
Форекс | Д 0111 |
Фу 1EF1 |
ò | от | Зонтик | Он | ой 1 еврокф |
он 1ЭЦД |
да 1EE5 |
ты | ты | фу 0169 |
инкубировать 1ЕЕ7 |
идея | отрыжка 1EE3 |
Эм-м-м 1ЕЕЕ |
См. также [ править ]
- ASCII
- Вьетнамский цитируемо-читаемый (VIQR)
- Вьетнамский стандартный код обмена информацией (VSCII)
- Windows-1258
Ссылки [ править ]
- ^ Пхунг, Куанг; Нго, Хок Д.; Буи, Куонг. «Домашняя страница рабочей группы по вьетнамским стандартам» . Вьетнамская группа . Проверено 23 августа 2019 г.
- ^ Перейти обратно: а б с д Это ж Отчет о стандартизации кодировки символов Вьетнама — Спецификации кодировки символов VISCII и VIQR 1.1 (Технический отчет). Вьетнамская группа. 1992.
- ^ Перейти обратно: а б «[новости] TCVN 5712:1993 (VSCII) — национальный стандарт Вьетнама» . 2 июня 1993 г. Архивировано из оригинала 11 января 2017 г.
- ^ Лунде, Кен (13 января 2009 г.). «Глава 1: Обзор обработки информации CJKV (§ Являются ли VISCII и VSCII идентичными? А как насчет TCVN?)». Обработка информации CJKV (2-е изд.). п. 17. ISBN 978-0-596-51447-1 .
- ^ Вьетнамская рабочая группа по стандартизации (май 1993 г.). Соглашения о кодировании вьетнамского языка . IETF . дои : 10.17487/RFC1456 . РФК 1456 .
- ^ «Наборы символов» . ИАНА .
- ^ Сивонен, Анри (26 сентября 2014 г.). «Изменения кодировки символов в mc требуют действия cc» . mozilla.dev.apps.thunderbird .
- ^ Сивонен, Анри (26 сентября 2014 г.). «Изменения кодировки символов в mc требуют действия cc» . mozilla.dev.apps.thunderbird .
VISCII и Armscii-8 особенные в том смысле, что долгое время сам Thunderbird (ошибочно) предоставлял эти кодировки в пользовательском интерфейсе для выбора исходящей кодировки символов при составлении сообщения. Таким образом, вполне возможно, что существует созданное Thunderbird наследие электронной почты VISCII и Armscii-8 и сообщений Usenet.
- ^ Нго, Хок Динь; Тран, ТуБинь. «5. Зачем нужно конвертировать вьетнамскую кодировку (набор символов – кодировка)?» . Некоторые специальные функции WinVNKey .
Дальнейшее чтение [ править ]
- Флор, Гвидо (2016) [2006]. «Locale::RecodeData::VISCII — процедуры преобразования для VISCII» . CPAN libintl-perl . Архивировано из оригинала 14 января 2017 г. Проверено 14 января 2017 г.
- https://www.math.nmsu.edu/~mleisher/Software/csets/VISCII.TXT
Внешние ссылки [ править ]
- RFC 1456 — Соглашения о кодировании вьетнамского языка
- Вьетнамская рабочая группа по стандартизации, базирующаяся в Калифорнии.
- Отчет Вьетнама за 1992 г.
- Программное обеспечение AnGiang
- VISCII-совместимое программное обеспечение и шрифты для MS-DOS и Windows.
- VISCII-совместимое программное обеспечение, библиотеки и шрифты для Unix.
- WinVNKey , драйвер вьетнамской клавиатуры для Windows, поддерживающий многонациональные наборы символов, включая VISCII.
- MacVNKey , VISCII-совместимый драйвер клавиатуры для Macintosh classic.