Обозначение WX
Эта статья нуждается в дополнительных цитатах для проверки . ( февраль 2014 г. ) |
Нотация WX — это схема транслитерации для представления индийских языков в формате ASCII . Эта схема возникла в ИИТ Канпура для вычислительной обработки индийских языков и широко используется сообществом специалистов по обработке естественного языка (НЛП) в Индии. Обозначение (хотя и неопознанное) используется, например, в учебнике по НЛП ИИТ Канпура. [1] Существенными особенностями этой схемы транслитерации являются: Каждая согласная и каждая гласная буква преобразуются в римский язык. Следовательно, это префиксный код, [2] выгодно с вычислительной точки зрения. Обычно строчные буквы используются для согласных без придыхания и кратких гласных, а заглавные буквы используются для согласных с придыханием и долгих гласных. В то время как ретрофлексированные глухие и звонкие согласные сопоставляются с буквами «t, T, d и D», зубные зубы сопоставляются с буквами «w, W, x и X». Отсюда и название схемы «WX», относящееся к своеобразному отображению. Ubuntu Linux обеспечивает поддержку клавиатуры для обозначения WX.
В следующих таблицах жирным шрифтом выделено такое своеобразное присвоение букв фонемам, с которыми они обычно не связаны. Помимо «w», «W», «x» и «X», это «f», «F», «q», «Q», «L» и «R».
гласные
[ редактировать ]А | Приходить | и т. д. | Э | ты | он | А | да | О! | Ой |
а | А | я | я | в | В | и | И | тот | ТО |
Соноранты
[ редактировать ]долг | ॠ | ऌ |
д | вопрос | л |
Анусвара и висарга
[ редактировать ]ं | ः |
М | ЧАС |
Анунасика . представлена буквой «z» Например, अँ = az.На санскрите Аваграха обозначается буквой «Z». Например, वमतोऽन्तः = vamawoZnwaH. Это может вызвать путаницу, поскольку в других индийских языках буква «Z» используется и для другой цели (см. последний абзац ниже).
Согласные
[ редактировать ]что | Х | г | дх | Нг | Велар |
к | К | г | Г | ж | |
Ч | является | дж | дж | дж | Палатальный |
с | С | дж | Дж | Ф | |
т | че | д | Дх | н | Ретрофлекс |
т | Т | д | Д | Н | |
Т | че | Д | Дх | нет | Стоматологический |
В | В | х | Х | н | |
п | Ф | б | Бх | м | губной |
п | П | б | Б | м | |
или | Р | л | व | Полугласная | |
и | р | л | v | ||
ш | ш | с | хх | Фрикативный | |
С | Р | с | час |
Эта схема была расширена и теперь представляет все индийские письменности, произошедшие от Брахми.Чтобы учесть символы других индийских языков, отсутствующие в деванагари, используются три оператора: «Y» для получения следующего символа ISCII , «V» для получения предыдущего символа ISCII и «Z» для добавления нукты . Так, например, «l» представляет ल (U0932) деванагари, а «lY» представляет ळ (U0933) на маратхи. «e» представляет собой ए (U090F) деванагари или ఏ (U0C0F) телугу, а eV представляет ऎ (U090E) или ఎ (U0C0E) телугу. Точно так же «ка» представляет собой क Деванагари, а «кЗа» представляет क़.
См. также
[ редактировать ]- Деванагари транслитерация
- ИАСТ
- ИТРАНС
- Национальная библиотека в Калькутте, латинизация
- Международный алфавит санскритской транслитерации
Ссылки
[ редактировать ]- ^ Акшар Бхарати; Винит Чайтанья; Раджив Сангал (1996). «Приложение Б». Обработка естественного языка: взгляд Панина (PDF) . Прентис-Холл Индии. стр. 191–193. ISBN 9788120309210 . Проверено 16 февраля 2014 г.
- ^ {{Санскритская компьютерная лингвистикаПервый и Второй международные симпозиумы Рокенкур, Франция, 29-31 октября 2007 г. Провиденс, Род-Айленд, США, 15-17 мая 2008 г., Пересмотренные избранные статьиРедакторы: Юэ, Жерар, Кулкарни, Амба, Шарф, Петер (ред.) | URL = https://www.springer.com/gp/book/9783642001543 ; см. Приложение B}}