Код тамильского письма для обмена информацией
Код тамильского алфавита для обмена информацией ( TSCII ) — это схема кодирования для представления тамильского алфавита . Нижние 128 кодовых точек представляют собой простой ASCII , верхние 128 кодовых точек относятся к TSCII. После долгих лет использования в Интернете только по частному соглашению, в 2007 году он был успешно зарегистрирован в IANA . [1]
TSCII кодирует символы в визуальном (письменном) порядке, аналогично использованию тамильской пишущей машинки.
Unicode использовал стратегию кодирования логического порядка для тамильского языка, следуя ISCII , в отличие от тайского языка , где было принято кодирование визуального порядка, унаследованное от TIS-620 .
Правительство Тамилнада поддерживает свои собственные стандарты TAB/TAM для 8-битного кодирования, а другие, более старые схемы кодирования все еще можно найти в WWW.
Бесплатная коллекция электронного текста в Project Madurai использует кодировку TSCII , но уже начала предоставлять версии Unicode .
История
[ редактировать ]Потребность в общей кодировке для тамильского языка ощущали участники различных форумов, основанных на списках рассылки, в середине 1990-х годов, поскольку на этих форумах было распространено несколько шрифтов с индивидуальной кодировкой. Хотя некоторые коммерческие кодировки были более популярны, чем другие, они не были приняты более широким сообществом из-за противоречия коммерческих интересов. Хотя Юникод был принят большинством в качестве будущего стандарта, большинство настольных систем в то время все еще не могли обрабатывать Юникод для тамильского языка, и требовалась временная 8-битная кодировка.
Отдельный список рассылки для обсуждения таких кодировок ( [email protected] ) был создан в 1997 году, чтобы инициировать это обсуждение, начиная с электронного письма, написанного доктором К. Кальянасундарамом популярному тамильскому писателю Суджате , который возглавлял комитет по стандартизации тамильской клавиатуры. . [2] Этот форум быстро привлек энтузиастов со всего мира, в том числе нескольких видных тамильских ученых. Архивы этих обсуждений поддерживаются INFITT . [3]
После публикации TSCII большинство членов списка рассылки [email protected] стали частью INFITT, который представляет собой более широкую инициативу, направленную на стандартизацию и дальнейшее развитие в различных областях тамильской вычислительной техники.
Макет кодовой страницы
[ редактировать ]0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
8x | ௦ [а] | ௧ | Шри | Дж | Ш | С | Ха | Кш | Дж | Ш | С | ЧАС | Кш | ௨ | ௩ | ௪ |
9x | ௫ | ‘ | ’ | “ | ” | ௬ | ௭ | ௮ | ௯ | Нг | Джон | Мистер | июнь | ௰ | ௱ | ௲ |
Топор | НБСП | ா | ி | ீ | ு | ூ | ெ | ே | ை | © | ௗ | А | б | Э | ты | |
Бх | Ф | А | А | я | О | ой | Ой | ж | К | ЧАС | Ч | Солнце | Д | Нет | че | Н |
Сх | п | М | Да | Р | Ла | Вт | Д | л | Р | Н | Д | Чай | Ку | вс | К | Ню |
Дх | че | Ню | Чт | М | ты | рупий | Лу | Ву | тащить | л | ру | Ню | Идти | Сью | Два | Число |
Бывший | Чт | Ню | Цветок | Муу | ты | рупий | Лу | Ву | доктор | туалет | рупий | Нет | К | Нг | Ч | Дж |
Форекс | Т | Нет | че | н | Б | м | Да | Р | В | Вт | л | в | Т | из | е |
- ^ U + 0BE6 ТАМИЛЬСКАЯ ЦИФРА НОЛЬ, которая была добавлена в Unicode версии 4.1 в марте 2005 г.
Инструменты преобразования
[ редактировать ]Вы можете конвертировать документы в кодировке UTF-8 в TSCII с помощью инструментов GNU iconv следующим образом:
$ iconv -f utf-8 -t tscii hello.utf8 > hello.tscii
Тогда как преобразование из TSCII в UTF-8 выполняется путем замены флагов -f и -t .
Визуальное приложение
[ редактировать ]Проект с открытым исходным кодом доступен по адресу AnyTaFont2UTF8 и поддерживается тамильским сообществом Isaiyini.
См. также
[ редактировать ]- TACE16 (кодировка всех символов тамильского языка)