ИСО 11940

Из Википедии, бесплатной энциклопедии

ISO 11940 — это стандарт ISO для транслитерации тайских символов , опубликованный в 1998 году, обновленный в сентябре 2003 года и подтвержденный в 2008 году. Расширение этого стандарта под названием ISO 11940-2 определяет основанную на нем упрощенную транскрипцию.

Согласные [ править ]

тайский г б С д Э я М С Да
ИСО к кх х х к̛ ч хх из с c̄h ч с c̣h упс
 
тайский й й й на д Т че Т че н  
ИСО ṭ̄h хх правда д т да й эт н
 
тайский Б п п Дождь п Ф Ph м  
ИСО б п тьфу е тел. ж тьфу м
 
тайский Да р р л Вт Проф. С ЧАС О ЧАС
ИСО и р v л л В с̄ с̛̄ с̄ час Икс час

Транслитерация . чистых согласных происходит от их обычного произношения в качестве начального согласного Немаркированный h используется для образования орграфов, обозначающих придыхательные согласные . Пары высоких и низких согласных систематически различаются путем применения макрона к согласному высокого класса. Дальнейшую дифференциацию согласных с одинаковой фонетической функцией получают, оставляя наиболее часто встречающиеся неотмеченными, отмечая вторую по употреблению точкой внизу, третью по употреблению - рожком и четвертую по употреблению - подчеркиванием. Использование точки ниже имеет эффект, аналогичный индологической практике различения ретрофлексных согласных с помощью точки внизу, но есть тонкие различия: транслитерации ธ tho thong и ศ so sala внизу точкой отмечены , а не транслитерации ธ tho thong и ศ so sala. соответствующие ретрофлексные согласные . Транслитерацию согласных следует вводить в порядке базовой буквы, макрона, если таковой имеется, а затем точки внизу, рога или «макрона ниже».

Только три согласных имеют рог в транслитерации: ฅ kho khon , ฒ tho phuthao и ษ so ruesi , и только один согласный имеет подчеркивание, ฑ tho nangmontho .

Гласные [ править ]

тайский Ой – ฺ -Да -Ой – ฺ –У –У т И Ой В Что? р হๅ Да Вт О
ИСО а ой и к я я да да в Эм-м-м Это ой О я ты v л ɨ и В Икс

Буква å — единственный заранее составленный символ, указанный в результате транслитерации.

Лаккхангьяо (ๅ) показан только в сочетании с гласными буквами ฤ и ฦ. В стандарте просто перечислены ฤ и ฦ с согласными и лаккхангьяо с гласными. Изолированное лаккхангьяо также можно было бы транслитерировать маленькой буквой «i» со штрихом ( ɨ ), но такого не должно быть в тайском, пали или санскрите.

Транслитерации ว wo waen и อ o ang были включены сюда из-за их использования в качестве полных символов гласных, но их транслитерация не зависит от того, как они используются, и стандарт просто перечисляет их вместе с согласными.

Символы сложных гласных транслитерируются в соответствии с их составляющими.

Другие объединяющие знаки [ править ]

тайский -Да -Да -Ой -Ой -Да –๎ –� –ฺ
ИСО –̀ –̂ –́ –̌ –̆ –̒ ~ –̊ –̥

Обратите внимание, что ямаккан (–๎) обозначается пробельной тильдой, а не надстрочной тильдой.

Пунктуация и цифры [ править ]

тайский Любой другой и т. д. и т. д.
ИСО « ς § ـ ف » 0 1 2 3 4 5 6 7 8 9

ISO 11940:1998 отличает символ сокращения paiyannoi (ฯ) от терминатора предложения angkhandiao (ฯ), хотя ни национальный стандарт символов TIS 620-2533 , ни Unicode версии 5.0 не различают их. Пайанной транслитерируется как ς , а ангкхандиао транслитерируется как π . Обратите внимание, что пайанной , ангкхандиао и ангханкху (๚) транслитерируются буквами, используемыми для согласных щелчка , а не двойным кинжалом, вертикальными чертами или дандами .

Последовательность символов [ править ]

Обычно символы транслитерируются слева направо, а если символы имеют одинаковое горизонтальное положение, то сверху вниз. Вертикальная последовательность на самом деле просто определяется как знаки тона и тантахат (–์), предшествующие любым другим знакам выше или ниже согласного. В конце раздела 4.2 стандарт отрицает возможность возникновения комбинации сара у (◌ุ, ◌ู) и никхахит (◌ํ), а затем приводит пример этого при указании транслитерации никхахит , но не показывает транслитерацию. комбинации. Эффект этих правил заключается в том, что, за исключением никхаита , все негласные знаки, прикрепленные к согласной в тайском языке, присоединяются к согласной в римской транслитерации.

Стандарт признает, что попытка переставить предстоящие гласные и согласные может быть удобна для тех, кто использует латинский алфавит , но рекомендует не переставлять предлежащие гласные.

Например, тайский язык ( RTGS : Phasa Thai ) следует транслитерировать в p̣hās̛̄āịthy , а Чиангмай ( RTGS : Chiang Mai ) – в echīyngıh̄m̀ .

Вариации [ править ]

Причины [ править ]

Стандарт определяет порядок, в котором должны быть набраны диакритические знаки, но не все системы ввода записывают диакритические знаки в том порядке, в котором они набираются. Юникод определяет две нормализованные формы для букв с несколькими акцентами, и транслитерированный текст, скорее всего, будет храниться в одной из этих форм. Это усложняет автоматическую обратную транслитерацию. Поскольку процессы, совместимые с Unicode, должны правильно обрабатывать такие варианты, транслитерация на этой странице была выбрана для удобства отображения — современные системы рендеринга могут отображать эквивалентные формы по-разному.

Многие шрифты плохо отображают новые сочетания согласных и ударений. Например, Институт эстонского языка публикует в Интернете объяснение применения стандарта к тайскому языку , и, за одним исключением, это похоже на соответствие стандарту. Исключением является то, что, за исключением макрона, ударения над согласными фактически смещены вправо, создавая впечатление, что они были введены как соответствующие необъединяемые символы. Стандарт определяет транслитерацию в кодовых точках, но кто-то, работая на основе этого бесплатного объяснения, может легко сделать вывод, что следует использовать формы интервалов тоновых акцентов.

ОИТ (CLDR 1.4.1) [ править ]

Реализация ICU , записанная в версии 1.4.1 Common Locale Data Repository, спонсируемой Unicode , [1] при транслитерации согласных использует штрих вместо рога. Это влияет на транслитерацию ฅ kho khon , ฒ tho phuthao и ษ so bo ruesi . ฏ to patak также транслитерируется по-другому, как t̩, а не .

В этой реализации ำ транслитерируется как вместо å, чтобы избежать двусмысленности с гипотетической последовательностью тайского письма ะํ ( sara a , nikkhahit ). Реализация ICU транслитерирует ฺ phinthu как ˌ вместо того, чтобы избежать проблем с Unicode нормализацией . Побочным эффектом этого является улучшение разборчивости при применении к согласному с недооценкой.

Реализация ICU транслитерирует ฯ paiyannoi как (двойной кинжал) и ангханху как || (две вертикальные полосы ASCII). Поскольку реализация ICU использует Unicode, она не может надежно отличить angkhandiao от paiyannoi без семантического анализа и не делает такой попытки.

Последовательность символов реализации ICU другая. Он транспонирует предлежащие гласные со следующей согласной и обрабатывает знаки согласной в том порядке, в котором они хранятся в памяти. (Большинство тайских методов ввода гарантируют, что знаки хранятся в порядке снизу вверх.) Он не переставляет предлежащие гласные с полными группами согласных; группы согласных не могут быть идентифицированы с полной точностью, а для транспонирования гласных группами потребуется дополнительный символ, чтобы обеспечить надежное преобразование обратно в тайский сценарий.

Например, в соответствии с этой реализацией тайский язык транслитерируется в p̣hās̄ʹāthịy , а Чиангмай – в cheīyngh̄ım̀ .

Наконец, эта реализация генерирует транслитерацию в форме нормализации Unicode C (NFC).

См. также [ править ]

Ссылки [ править ]

  1. ^ http://unicode.org/Public/cldr/1.4.1/core.zip файлы Transforms/ThaiLogical-Latin.xml и Transforms/Thai-ThaiLogical.xml (используются транслитераторами ICU «тайско-латинский» и «латино-латинский»). тайский")

Внешние ссылки [ править ]