Jump to content

Myanmar (Unicode block)

Myanmar
RangeU+1000..U+109F
(160 code points)
PlaneBMP
ScriptsMyanmar
Major alphabetsBurmese
Mon
Karen
Kayah
Shan
Palaung
Assigned160 code points
Unused0 reserved code points
Unicode version history
3.0 (1999)78 (+78)
5.1 (2008)156 (+78)
5.2 (2009)160 (+4)
Unicode documentation
Code chart ∣ Web page
Note: [1][2]
Range used for Tibetan script prior to Unicode 1.0.1 (see Tibetan (obsolete Unicode block)).

Myanmar is a Unicode block containing characters for the Burmese, Mon, Shan, Palaung, and the Karen languages of Myanmar, as well as the Aiton and Phake languages of Northeast India. It is also used to write Pali and Sanskrit in Myanmar.

Block[edit]

Myanmar[1]
Official Unicode Consortium code chart (PDF)
 0123456789ABCDEF
U+100xက
U+101x
U+102x
U+103x    
U+104x
U+105x
U+106x
U+107x
U+108x
U+109x
Notes
1.^ As of Unicode version 15.1

The block has sixteen variation sequences defined for standardized variants.[3] They use U+FE00 VARIATION SELECTOR-1 (VS01) to denote the dotted letters used for the Khamti, Aiton, and Phake languages.[4] (Note that this is font dependent. For example, the Padauk font supports some of the dotted forms.)

Variation sequences for dotted forms
U+1000100210041010101110151019101A101C101D1022103110751078107A1080
base code pointက
base + VS01က︀ဂ︀င︀တ︀ထ︀ပ︀မ︀ယ︀လ︀ဝ︀ဢ︀ေ︀ၵ︀ၸ︀ၺ︀ႀ︀

History[edit]

The following Unicode-related documents record the purpose and process of defining specific characters in the Myanmar block:

Historic and nonstandard uses of range[edit]

In Unicode 1.0.0, part of the current Myanmar block was used for Tibetan. In Microsoft Windows, collation data referring to the old Tibetan block was retained as late as Windows XP, and removed in Windows 2003.[5]

In Myanmar, devices and software localisation often use Zawgyi fonts rather than Unicode-compliant fonts.[6] These use the same range as the Unicode Myanmar block (0x1000–0x109F), and are even applied to text encoded like UTF-8 (although Zawgyi text does not officially constitute UTF-8), despite only a subset of the code points being interpreted the same way. Zawgyi lacks support for Myanmar-script languages other than Burmese, but heuristic methods exist for detecting the encoding of text which is assumed to be Burmese.[7]

References[edit]

  1. ^ "Unicode character database". The Unicode Standard. Retrieved 2023-07-26.
  2. ^ "Enumerated Versions of The Unicode Standard". The Unicode Standard. Retrieved 2023-07-26.
  3. ^ "Unicode Character Database: Standardized Variation Sequences". The Unicode Consortium.
  4. ^ Hosken, Martin (2015-11-03). "L2/15-320: Proposal to Create Variation Sequences for Khamti Characters" (PDF).
  5. ^ Kaplan, Michael (2007-08-28). "Every character has a story #29: U+1000^H^H^H^H0f40, (TIBETAN or MYANMAR LETTER KA, depending on when you ask)". Sorting it all out.
  6. ^ Nagarajah, Sasha. "Zawgyi vs. Unicode". Global App Testing.
  7. ^ Loomis, Steven R.; Cornelius, Craig (2019). "Myanmar Scripts and Languages". Frequently Asked Questions. Unicode Consortium.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 6539a84062f754f14dfb95ed3a8fa94c__1690562760
URL1:https://arc.ask3.ru/arc/aa/65/4c/6539a84062f754f14dfb95ed3a8fa94c.html
Заголовок, (Title) документа по адресу, URL1:
Myanmar (Unicode block) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)