Нижние и верхние индексы Юникода
![](http://upload.wikimedia.org/wikipedia/commons/thumb/9/97/Sub_super_num_dem.svg/220px-Sub_super_num_dem.svg.png)
В Юникоде есть индексированные и надстрочные версии ряда символов, включая полный набор арабских цифр . [1] Эти символы позволяют любые полиномиальные , химические и некоторые другие уравнения представлять в виде обычного текста без использования какой-либо разметки , такой как HTML или TeX .
Консорциум World Wide Web и Консорциум Unicode дали рекомендации по выбору между использованием разметки и использованием надстрочных и подстрочных символов:
При использовании в математическом контексте ( MathML ) рекомендуется последовательно использовать разметку стиля для надстрочных и подстрочных индексов […] Однако, когда надстрочные и подстрочные индексы должны отражать семантические различия, легче работать с этими значениями, закодированными в тексте, а не разметка, например, в фонетической или фонематической транскрипции . [2]
Использует [ править ]
Предполагаемое использование [2] когда эти символы были добавлены в Unicode, они должны были создавать настоящие верхние и нижние индексы, чтобы химические и алгебраические формулы можно было писать без разметки. Таким образом, «H₂O» (с использованием символа нижнего индекса 2) должен быть идентичен «H 2 O» (с индексной разметкой).
На самом деле многие шрифты, включающие эти символы, игнорируют определение Юникода и вместо этого создают цифры для математических символов числителя и знаменателя . [3] [4] которые выровнены по линии ограничения и базовой линии соответственно. При использовании с солидом эти глифы являются обычной заменой диагональных дробей, например, ³/₄ вместо глифа ¾. Это изменение было сделано потому, что использование разметки не дает хорошего графического приближения дробей (сравните разметку 3 / 4 с надстрочным/подстрочным индексом ³/₄). Это изменение также делает надстрочные буквы полезными для порядковых индикаторов , поскольку они более точно соответствуют символам ª и º. Однако это делает их неверными для обычных верхних и нижних индексов, поэтому химические и алгебраические формулы лучше отображаются с использованием разметки.
Юникод предполагал, что диагональные дроби будут отображаться с помощью другого механизма: косая черта дроби U + 2044 визуально похожа на солид, но при использовании с обычными цифрами (а не с верхними и нижними индексами) она указывает системе макета, что дробь, такая как ¾ должен отображаться с использованием автоматической замены глифов. [5] [а] Поддержка со стороны пользователей в течение ряда лет была довольно плохой, но шрифты, браузеры, [б] текстовые процессоры, [с] программное обеспечение для настольных издательских систем [д] и другие все чаще поддерживают предполагаемое поведение Unicode. Выбор поддерживаемых шрифтов показан в таблице ниже. (Они не будут отображаться должным образом, если у вас не установлены шрифты или если ваш браузер не поддерживает такое поведение.)
Шрифт | U+00BD ОБЫЧНАЯ ДРОБЬ ОДНА ПОЛОВИНА | U + 0031 ЦИФРА ОДИН U + 2044 ДРОБНАЯ косая черта U + 0032 ЦИФРА ДВА |
---|---|---|
Шрифт браузера по умолчанию | ½ | 1⁄2 |
Андика | ½ | 1⁄2 |
Арно Про | ½ | 1⁄2 |
Книжник URW | ½ | 1⁄2 |
Брилл | ½ | 1⁄2 |
Бриозо Про | ½ | 1⁄2 |
суппорты | ½ | 1⁄2 |
Чандара | ½ | 1⁄2 |
Карлито | ½ | 1⁄2 |
лисичка | ½ | 1⁄2 |
ФираГО | ½ | 1⁄2 |
ЭБ Гарамонд | ½ | 1⁄2 |
Книга язычников | ½ | 1⁄2 |
URW Готика | ½ | 1⁄2 |
Сторона | ½ | 1⁄2 |
Linux Распутник | ½ | 1⁄2 |
Нимб Роман | ½ | 1⁄2 |
Нимбус Санс | ½ | 1⁄2 |
Ното Санс | ½ | 1⁄2 |
Ното с засечками | ½ | 1⁄2 |
Открыть Санс | ½ | 1⁄2 |
Убунту | ½ | 1⁄2 |
Йрса | ½ | 1⁄2 |
Блок верхних и нижних индексов [ править ]
Наиболее распространенные цифры надстрочного индекса (1, 2 и 3) были в ISO-8859-1 и поэтому были перенесены в эти позиции в диапазоне Latin-1 Unicode. Остальные были помещены в специальный раздел Unicode по адресам от U+ 2070 до U+209F. В двух таблицах ниже показаны эти символы. Каждому символу верхнего или нижнего индекса предшествует обычный знак x , чтобы показать нижний/надстрочный индекс. Таблица слева содержит фактические символы Юникода; тот, что справа, содержит эквиваленты с использованием HTML- разметки для нижнего или верхнего индекса.
|
|
Другие символы верхнего и нижнего индекса [ править ]
Юникод версии 15.1 также включает символы нижнего и верхнего индекса, предназначенные для семантического использования, в следующих блоках: [1] [6]
- Надстрочный индекс
- Блок Latin-1 Supplement женского и мужского рода содержит порядковые указатели ª и º.
- Блок Latin Extended-C содержит один верхний индекс, ⱽ.
- Блок Latin Extended-D содержит шесть надстрочных индексов: ꝰ ꟲ ꟳ ꟴ ꟸ ꟹ.
- Блок Latin Extended-E содержит пять верхних индексов: ꭜ ꭝ ꭞ ꭟ ꭩ.
- Блок Latin Extended-F полностью состоит из надстрочных букв IPA : 𐞁 𐞂 𐞃 𐞄 𐞅 𐞇 𐞈 𐞉 𐞊 𐞋 𐞌 𐞍 𐞎 𐞏 𐞐 𐞑 𐞒 𐞓 𐞔 𐞕 𐞖 𐞗 𐞘 𐞙 𐞚 𐞛 𐞜 𐞝 𐞞 𐞟 𐞠 𐞡 𐞢 𐞣 𐞤 𐞥 𐞦 𐞧 𐞨 𐞩 𐞪 𐞫 𐞬 𐞭 𐞮 𐞯 𐞰 𐞲 𐞳 𐞴 𐞵 𐞶 𐞷 𐞸 𐞹 𐞺.
- В блоке «Письма-модификаторы интервала» есть надстрочные буквы и символы, используемые для фонетической транскрипции: ʰ ʱ ʲ ʳ ʴ ʵ ʶ ʷ ʸ ˀ ˁ ˠ ˡ ˢ ˣ ˤ.
- Блок фонетических расширений имеет несколько надстрочных букв и символов: Latin/IPA ᴬ ᴭ ᴮ ᴯ ᴰ ᴱ ᴲ ᴳ ᴴ ᴵ ᴶ ᴷ ᴸ ᴹ ᴺ ᴻ ᴼ ᴽ ᴾ ᴿ ᵀ ᵁ ᵂ ᵃ ᵄ ᵆ ᵇ ᵈ ᵉ ᵊ ᵋ ᵌ ᵍ ᵏ ᵐ ᵑ ᵒ ᵓ ᵖ ᵗ ᵘ ᵚ ᵛ, греческий ᵝ ᵞ ᵟ ᵠ ᵡ, кириллица ᵸ, другое ᵎ ᵔ ᵕ ᵙ ᵜ. Они предназначены для обозначения вторичной артикуляции .
- В блоке «Дополнение к фонетическим расширениям» есть еще несколько: Latin/IPA ᶛ ᶜ ᶝ ᶞ ᶟ ᶠ ᶡ ᶢ ᶣ ᶤ ᶥ ᶦ ᶧ ᶨ ᶩ ᶪ ᶫ ᶬ ᶭ ᶮ ᶯ ᶰ ᶱ ᶲ ᶳ ᶴ ᶵ ᶶ ᶷ ᶸ ᶹ ᶺ ᶻ ᶼ ᶽ ᶾ, греческий ᶿ.
- Блок Cyrillic Extended-B содержит два надстрочных кириллических индекса: ꚜ ꚝ.
- Блок Cyrillic Extended-D содержит много кириллических надстрочных индексов: 𞀰 𞀱 𞀲 𞀳 𞀷 𞀵 𞀶 𞀷 𞀸 𞀹 𞀺 𞀻 𞀼 𞀽 𞀾 𞀿 𞁀 𞁁 𞁂 𞁃 𞁅 𞁆 𞁇 𞁈 𞁉 𞁊 𞁋 𞁌 𞁍 𞁎 𞁏 𞁐 𞁫 𞁬 𞁭.
- Грузинский блок содержит одну надстрочную букву Мхедрули : ჼ.
- Блок Канбун имеет надстрочные символы аннотации, используемые в японских копиях классических китайских текстов: ㆒ ㆓ ㆔ ㆕ ㆖ ㆗ ㆘ ㆙ ㆚ ㆛ ㆜ ㆝ ㆞ ㆟.
- В блоке Тифинаг есть одна надстрочная буква: ⵯ.
- Унифицированное слоговое письмо канадских аборигенов и его расширенные блоки содержат несколько в основном согласных букв для обозначения слоговой коды , называемой финалами, а также некоторые символы, обозначающие среднюю часть слога, известную как медиалы: основной блок ᐜ ᐝ ᐞ ᐟ ᐠ ᐡ ᐢ ᐣ ᐤ ᐥ ᐦ ᐧ ᐨ ᐩ ᐪ ??? ᕐ ᕑ ᕝ ᕪ ᕻ ᕯ ᕽ ᖅ ᖕ ᖖ ᖟ ᖦ ᖮ ᗮ ᘁ ᙆ ᙇ ᙚ ᙾ ᙿ ; Расширенный блок: ᣔ ᣕ ᣖ ᣗ ᣘ ᣙ ᣚ ᣛ ᣜ ᣝ ᣞ ᣟ ᣳ ᣴ ᣵ.
- Объединение верхнего индекса
- Блок « Объединение диакритических знаков» содержит диакритические знаки средневековых надстрочных букв. Эти буквы пишутся непосредственно над другими буквами, встречающимися в средневековых германских рукописях, поэтому в этих глифах нет пробелов, например uͤ. Они показаны здесь над заполнителем в виде пунктирного круга ◌: ◌ͣ ◌ͤ ◌ͥ ◌ͦ ◌ͧ ◌ͨ ◌ͩ ◌ͪ ◌ͫ ◌ͬ ◌ͭ ◌ͮ ◌ͯ.
- содержит Расширенный блок «Объединение диакритических знаков» три комбинированные островные буквы для среднеанглийского Ormulum , ◌ᫌ ◌ᫍ ◌ᫎ. [7]
- Блок «Дополнение к комбинированным диакритическим знакам» содержит дополнительные диакритические знаки средневековых надстрочных букв, достаточные для завершения основного строчного латинского алфавита, за исключением j, q и y, нескольких маленьких заглавных букв и лигатур (ae, ao, av), а также дополнительных букв: ◌᷒ ◌ ᷓ ◌ᷔ ◌ᷕ ◌ᷖ ◌ᷗ ◌ᷘ ◌ᷙ ◌ᷚ ◌ᷛ ◌ᷜ ◌ᷝ ◌ᷞ ◌ᷟ ◌ᷠ ◌ᷡ ◌ᷢ ◌ᷣ ◌ᷤ ◌ᷥ ◌ᷦ ◌ᷧ ◌ᷨ ◌ᷪ ◌ᷫ ◌ᷬ ◌ ᷭ ◌ᷮ ◌ᷯ ◌ᷰ ◌ᷱ ◌ᷲ ◌ᷳ ◌ᷴ, греческий ◌ᷩ.
- Блоки Cyrillic Extended-A и -B содержат несколько диакритических знаков средневековых надстрочных букв, достаточных для завершения основного нижнего регистра кириллицы, используемого в церковнославянских текстах, а также включает дополнительную лигатуру (ст): ◌ⷠ ◌ⷡ ◌ⷢ ◌ⷣ ◌ⷤ ◌ ⷥ ◌ⷦ ◌ⷧ ◌ⷨ ◌ⷩ ◌ⷪ ◌ⷫ ◌ⷬ ◌ⷭ ◌ⷮ ◌ⷯ ◌ⷰ ◌ⷱ ◌ⷲ ◌ⷳ ◌ⷴ ◌ⷵ ◌ⷶ ◌ⷷ ◌ⷸ ◌ⷹ ◌ⷺ ◌ⷻ ◌ⷼ ◌ⷽ ◌ ⷾ ◌ⷿ ◌ꙴ ◌ꙵ ◌ꙶ ◌ꙷ ◌ꙸ ◌ꙹ ◌ꙺ ◌ꙻ ◌ꚞ ◌ꚟ.
- Блок Cyrillic Extended-D имеет один дополнительный объединяющий символ і: ◌𞂏.
- Индекс
- Блок Latin Extended-C содержит один нижний индекс, ⱼ.
- Блок фонетических расширений имеет несколько нижних букв и символов: латинский/IPA ᵢ ᵣ ᵤ ᵥ и греческий ᵦ ᵧ ᵨ ᵩ ᵪ.
- Блок Cyrillic Extended-D также содержит множество кириллических индексов: 𞁑 𞁒 𞁓 𞁔 𞁕 𞁖 𞁗 𞁘 𞁙 𞁚 𞁛 𞁜 𞁝 𞁞 𞁟 𞁠 𞁡 𞁢 𞁣 𞁤 𞁥 𞁦 𞁧 𞁨 𞁩 𞁪.
- Объединение индекса
- Блок «Дополнение к комбинированным диакритическим знакам» содержит объединяющий индекс: ◌᷊.
- содержит Расширенный блок «Объединение диакритических знаков» две буквы, объединяющие лингвистические транскрипции шотландского языка , ◌ᪿ ◌ᫀ.
Таблицы латинского, греческого, кириллического и IPA [ править ]
Объединенный стандарт Unicode содержит надстрочные и подстрочные версии подмножества латинских, греческих и кириллических букв. Здесь они расположены в алфавитном порядке для сравнения (или для удобства копирования и вставки). Поскольку эти символы встречаются в разных диапазонах Юникода, они могут иметь разный размер или положение из-за подмены шрифтов в браузере. Заштрихованные ячейки обозначают маленькие заглавные буквы, которые не сильно отличаются от минускулов, и греческие буквы, которые неотличимы от латинских, и поэтому не ожидается, что они будут поддерживаться Unicode.
Небольшая пунктуация закодирована. Круглые скобки и восклицательный знак показаны выше. Вопросительный знак может быть создан с помощью надстрочного вопросительного знака и комбинированной точки: ⟨ ˀ̣ ⟩, хотя некоторые шрифты не отображают его должным образом.
А | Б | С | Д | И | Ф | г | ЧАС | я | Дж | К | л | М | Н | О | п | вопрос | р | С | Т | В | V | В | Икс | И | С | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Надстрочный капитал | ᴬ | ... | ꟲ | ᴰ | ᴱ | ꟳ | ᴳ | ᴴ | ᴵ | ᴶ | ᴷ | ᴸ | ᴹ | ᴺ | ᴼ | ᴾ | ꟴ | ᴿ | [8] | ᵀ | ᵁ | ⱽ | ᵂ | |||
Надстрочная маленькая прописная | 𐞄 | 𐞒 | 𐞖 | ᶦ | ᶫ | ᶰ | 𐞪 | ᶸ | 𐞲 | |||||||||||||||||
Надстрочный минускул | ᵃ | ᵇ | ᶜ | ᵈ | ᵉ | ᶠ | ᵍ | ʰ | ⁱ | ʲ | ᵏ | ˡ | ᵐ | ⁿ | ᵒ | ᵖ | 𐞥 | ʳ | ˢ | ᵗ | ᵘ | ᵛ | ʷ | ˣ | ʸ | ᶻ |
Надпись капитала | ◌ᷛ | ◌ᷞ | ◌ᷟ | ◌ᷡ | ◌ᷢ | |||||||||||||||||||||
Надпись мизерная | ◌ͣ | ◌ᷨ | ◌ͨ | ◌ͩ | ◌ͤ | ◌ᷫ | ◌ᷚ | ◌ͪ | ◌ͥ | ◌ᷜ | ◌ᷝ | ◌ͫ | ◌ᷠ | ◌ͦ | ◌ᷮ | ◌ͬ | ◌ᷤ | ◌ͭ | ◌ͧ | ◌ͮ | ◌ᷱ | ◌ͯ | ◌ᷦ | |||
Нижний индекс | ₐ | ₑ | ₕ | ᵢ | ⱼ | ₖ | ₗ | ₘ | ₙ | ₒ | ₚ | ᵣ | ₛ | ₜ | ᵤ | ᵥ | ₓ | |||||||||
Нижний индекс мизерный | ◌᷊ | ◌ᪿ |
А | Б | С | Д | Э | г | ТО | че | я | К | л | М | Н | Икс | ТО | Пи | р | С | Т | Да | Фи | Икс | P.S. | Ой | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Надстрочный минускул | [А] | ᵝ | ᵞ | ᵟ | ᵋ | ᶿ | ᶥ | [А] | ᵠ | ᵡ | ||||||||||||||
Надпись мизерная | ◌ᷩ | |||||||||||||||||||||||
Нижний индекс | ᵦ | ᵧ | ᵨ | ᵩ | ᵪ |
- ^ Перейти обратно: а б В некоторых шрифтах латинская альфа ᵅ и ипсилон ᶹ могут использоваться в качестве надстрочного греческого альфа и ипсилон. ᵋ и ᶥ также официально являются латинскими буквами, но отображаются так же, как греческие.
А | А | Б | В | Г | Г | Д | Хорошо | Есть | Же | С | С | Ꚉ | И | я | Ей | Дж | К | л | М | Н | О | О | П | Р | С | Ҫ | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Надстрочный индекс | 𞀰 | 𞁋 | 𞀱 | 𞀲 | 𞀳 | 𞀴 | 𞀵 | 𞀶 | 𞀷 | 𞁊 | 𞀸 | 𞁌 | 𞁍 | 𞀹 | 𞀺 | 𞀻 | ᵸ | 𞀼 | 𞁎 | 𞀽 | 𞀾 | 𞀿 | 𞁫 | ||||
надстрочный индекс | ◌ⷶ | ◌ⷠ | ◌ⷡ | ◌ⷢ | ◌ⷣ | ◌ⷷ | ◌ꙴ | ◌ⷤ | ◌ⷥ | ◌ꙵ | ◌𞂏 | ◌ꙶ | ◌ⷦ | ◌ⷧ | ◌ⷨ | ◌ⷩ | ◌ⷪ | ◌ⷫ | ◌ⷬ | ◌ⷭ | |||||||
Индекс | 𞁑 | 𞁒 | 𞁓 | 𞁔 | 𞁧 | 𞁕 | 𞁖 | 𞁗 | 𞁘 | 𞁩 | 𞁙 | 𞁨 | 𞁚 | 𞁛 | 𞁜 | 𞁝 | 𞁞 | ||||||||||
Т | У | Да | Н | Ꙋ | Ф | Х | Ѡ | Ц | Ч | Дж | Ш | Щ | Ъ | Ꙑ | Да | Ь | Ѣ | Э | Ю | Ꙗ | Ѥ | Ѧ | Ѫ | Ѭ | Ѳ | Ӏ | |
Надстрочный индекс | 𞁀 | 𞁁 | 𞁏 | 𞁭 | 𞁂 | 𞁃 | 𞁄 | 𞁅 | 𞁆 | ꚜ | 𞁬 | 𞁇 | ꚝ | 𞁈 | 𞁉 | 𞁐 | |||||||||||
надстрочный индекс | ◌ⷮ | ◌ꙷ | ◌ⷹ | ◌ꚞ | ◌ⷯ | ◌ꙻ | ◌ⷰ | ◌ⷱ | ◌ⷲ | ◌ⷳ | ◌ꙸ | ◌ꙹ | ◌ꙺ | ◌ⷺ | ◌ⷻ | ◌ⷼ | ◌ꚟ | ◌ⷽ | ◌ⷾ | ◌ⷿ | ◌ⷴ | ||||||
Индекс | 𞁟 | 𞁠 | 𞁡 | 𞁢 | 𞁣 | 𞁪 | 𞁤 | 𞁥 | 𞁦 |
Многие символы кириллицы были добавлены в блок Cyrillic Extended-D , который был добавлен в бесплатные шрифты Gentium Plus и Andika с версией 6.2 в феврале 2023 года.
См. также строчные буквы в Юникоде .
Надстрочный индекс IPA [ править ]
Блок Latin Extended-F был создан для остальных надстрочных букв IPA . Они были добавлены в бесплатные шрифты Gentium Plus и Andika в версии 6.2 в феврале 2023 года.
Символы Юникода для надстрочных (модификаторов) согласных букв IPA и extIPA следующие. Символы звуков со вторичной артикуляцией выделяются в скобках и располагаются под основными буквами. Пары клик-букв — это текущая буква слева и традиционная буква или буква пара-IPA справа; последние находятся на рассмотрении в Unicode. [Это]
Bilabial | Labiodental | Стоматологический | Альвеолярный | Postalveolar | Retroflex | Палатальный | Велар | Увулярный | Pharyngeal | Глоттальный | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
носовой | м ᵐ 1Д50 |
ɱ ᶬ 1DAC |
п ⁿ 207F ( ᶇ ) 1DFF7 |
ɳ ᶯ 1ДАФ |
ɲ ᶮ 1ДАЭ |
№ 5 1Д51 |
ɴᶰ 1DB0 |
|||||||||||||||
взрывной | п ᵖ 1Д56 |
б ᵇ 1Д47 |
т ᵗ 1Д57 ( ƫ ᶵ ) 1DB5 |
д ᵈ 1Д48 ( ᶁ ) 1DFF5 |
ʈ 𐞯 107АФ |
ɖ 𐞋 1078Б |
с ᶜ 1D9C |
ɟ ᶡ 1DA1 |
в ᵏ 1Д4Ф |
ɡ ᶢ / г да 1DA2/1D4D |
д 𐞥 107А5 |
ɢ 𐞒 10792 |
ʡ 𐞳 107Б3 |
ʔ ˀ 02C0 | ||||||||
Аффрикат | ʦ 𐞬 107AC |
ʣ 𐞇 10787 |
ʧ 𐞮 107АЭ ( ʨ 𐞫 ) 107АБ |
ʤ 𐞊 1078А ( ʥ 𐞉 ) 10789 |
ꭧ 𐞭 107 год нашей эры |
ꭦ 𐞈 10788 |
||||||||||||||||
Фрикативный | ɸ ᶲ 1DB2 |
б ᵝ 1Д5Д |
ж ᶠ 1DA0 |
v ᵛ 1Д5Б |
θ ᶿ 1ДБФ |
ð ᶞ 1Д9Е |
с ˢ 02E2 ( ᶊ ) 1DFF8 |
с ᶻ 1 дББ ( ᶎ ) 1DFF9 |
ʃ ᶴ 1DB4 ( ɕ ᶝ ) 1D9D |
ʒ ᶾ 1ДБЕ ( ʑ ᶽ ) 1ДБД |
ʂ ᶳ 1DB3 |
ʐ ᶼ 1ДБК |
ç ᶜ̧ 1D9C+0327 [ф] |
ʝ ᶨ 1DA8 |
Икс 02E3 ( ɧ 𐞗 ) 10797 |
ɣ ˠ 02E0 |
х ᵡ 1Д61 |
ʁ ʶ 02Б6 |
ч 𐞕 10795 ( ʩ 𐞐 ) 10790 |
ʕ ˤ 02E4 [г] |
ч ʰ 02B0 ( ꞕ ) 1DFF6 |
ɦ ʱ 02Б1 |
аппроксимант | ʋ ᶹ 1DB9 |
ɹ ʴ 02Б4 |
ɻ ʵ 02B5 |
j ʲ 02Б2 ( ɥ ᶣ ) 1DA3 |
( ʍ ꭩ ) АБ69 |
ɰ ᶭ 1ДАД ( В ) 02Б7 |
||||||||||||||||
Нажмите / взмахните | ⱱ 𐞰 107B0 |
ɾ 𐞩 107А9 |
ɽ 𐞨 107А8 |
|||||||||||||||||||
Трель | ʙ 𐞄 10784 |
р 02Б3 |
ʀ 𐞪 107АА |
ʜ 𐞖 10796 |
ʢ 𐞴 107Б4 |
|||||||||||||||||
Латеральный фрикативный | ɬ 𐞛 1079Б ( ʪ 𐞙 ) 10799 |
ɮ 𐞞 1079Э ( ʫ 𐞚 ) 1079А |
ꞎ 𐞝 1079D |
𝼅 𐞟 1079F |
𝼆 𐞡 107А1 |
𝼄 𐞜 1079С |
||||||||||||||||
Латеральный аппроксимант | л ˡ 02E1 (ɫ ꭞ, [час] ᶅ ᶪ) АБ5Е , 1ДАА |
ɭ ᶩ 1DA9 |
ʎ 𐞠 107А0 |
ʟ ᶫ 1 ДАБ |
||||||||||||||||||
Боковой кран/заслонка | ɺ 𐞦 107А6 |
𝼈 𐞧 107А7 |
||||||||||||||||||||
Имплозивный | ƥ 1ДФФК |
ɓ 𐞅 10785 |
ƭ 1ДФФЕ |
д 𐞌 1078С |
𝼉 1ДФФФ |
ᶑ 𐞍 1078D |
ƈ 1ДФФА |
ʄ 𐞘 10798 |
1ДФФБ |
ɠ 𐞓 10793 |
ʠ 1ДФФД |
ʛ 𐞔 10794 |
||||||||||
Нажмите «Отпустить» [Это] | ʘ 𐞵 107Б5 |
ـ 𐞶 107Б6 |
ʇ 107ББ |
ƃ ꜝ A71D |
ʗ 107БД |
𝼊 𐞹 107Б9 |
ψ 1DFF3 |
ق 𐞸 107Б8 |
𝼋 107БФ |
( ʞ ) 107BE |
||||||||||||
Боковой щелчок выпускать |
ف 𐞷 107Б7 |
ʖ 107 г. до н. э. |
||||||||||||||||||||
ударный | ¡ ꜞ А71Е [я] |
Диакритический интервал для отрывных согласных, U + 2BC, работает с надстрочными буквами, хотя сам по себе не является надстрочным индексом: ⟨ ᵖʼ ᵗʼ ᶜʼ ᵏˣʼ ⟩. Если необходимо провести различие, можно использовать объединяющий апостроф U + 315: ⟨ ᵖ̕ ᵗ̕ ᶜ̕ ᵏˣ̕ ⟩. Диакритический интервал следует использовать для базовой буквы с надстрочным выпуском, например [tˢʼ] или [kˣʼ] , где область действия апострофа включает букву без надстрочного индекса, но для обозначения можно использовать комбинированный апостроф U+315. слабо артикулированный отрывной согласный, такой как [ᵗ̕] или [ᵏ̕] , где весь согласный записывается как надстрочный индекс, или вместе с U + 2BC, когда отдельные апострофы имеют область действия над основной буквой и буквами-модификаторами, как в ⟨ pʼᵏˣ̕ ⟩. [9]
Диакритические пробелы, такие как ⟨ tʲ ⟩, не могут быть вторично надстрочными в обычном тексте: ⟨ ᵗʲ ⟩. (В этом случае старая буква IPA для [tʲ] , ⟨ ƫ ⟩, имеет вариант надстрочного индекса в Юникоде, U+1DB5 ⟨ ᶵ ⟩, но обычно это не так.)
Среди старых букв ⟨ ꜧ ⟩ (U+A727), графический вариант ⟨ ɮ ⟩, поддерживается в ⟨ ꭜ ⟩ (U+AB5C).
Символы Юникода для надстрочных (модификаторов) гласных букв IPA, а также пары расширенных букв, найденных в английских словарях, следующие. Также поддерживаются недавно устаревшие альтернативные буквы; они выделены в скобки и помещены под стандартными буквами IPA:
Передний | Центральный | Назад | ||||
---|---|---|---|---|---|---|
Закрывать | я ⁱ 2071 |
и 02Б8 |
ɨ ᶤ 1DA4 |
ʉ ᶶ 1DB6 |
ɯ ᵚ 1Д5А |
в ᵘ 1Д58 |
Почти близко | ɪ ᶦ 1DA6 ( ɩ ᶥ ) 1DA5 |
ʏ 𐞲 107Б2 |
ᵻ ᶧ 1DA7 |
ᵿ 1ДФДА |
ʊ ᶷ 1DB7 ( ɷ 𐞤 ) 107А4 | |
Близко-средне | и ᵉ 1Д49 |
ø 𐞢 107А2 |
ɘ 𐞎 1078Э |
ɵ ᶱ 1ДБ1 |
ɤ 𐞑 10791 |
ᵒ 1Д52 |
Средний | ᵊ 1Д4А |
|||||
Открытая середина | ɛ ᵋ 1D4B |
œ ꟹ A7F9 |
ɜ ᶟ 1Д9Ф ( ᴈ ᵌ ) 1D4C |
ɞ 𐞏 1078F |
ʌ ᶺ 1DBA |
ɔ ᵓ 1Д53 |
Почти открытый | æ 𐞃 10783 |
ɶ 𐞣 107А3 |
ɐ ᵄ 1Д44 |
ɑ ᵅ 1Д45 |
ɒ ᶛ 1Д9Б | |
Открыть | а ᵃ 1Д43 |
Предварительно составленные ротические гласные буквы Юникода ⟨ ɚ ɝ ⟩ напрямую не поддерживаются. ротический диакритический знак U+02DE ◌˞ Вместо этого следует использовать : ⟨ ᵊ˞ ᶟ˞ ⟩. [10]
⟨ ɜ ⟩ и ⟨ ᶟ ⟩ перевернуты ɛ . Старый IPA, получивший название ɛ , ⟨ ᴈ ⟩, также поддерживается по адресу U+1D4C ⟨ ᵌ ⟩. Однако кратковременно возрожденная гласная буква ⟨ ʚ ⟩ (U + 029A) не поддерживается, поддерживается только ее перевернутая замена ⟨ ɞ ⟩.
Среди старых гласных ⟨ ᴜ ⟩ (U+1D1C), графический вариант ⟨ ʊ ⟩, поддерживается в ⟨ ᶸ ⟩ (U+1DB8).
Также поддерживаются две метки длины:
Длинный | полудлинный |
---|---|
ː 𐞁 10781 |
ˑ 𐞂 10782 |
Подстановочные знаки надстрочного индекса (полные прописные буквы) поддерживаются частично: например, ᴺC (преназализованный согласный), ꟲN (назальный с предзадержкой), Pꟳ (фрикативный выпуск), NᴾF (эпентетический взрывной звук), CVNᵀ (тональный слог), Cᴸ (жидкий или боковой выпуск). , Cᴿ (ротический или резонансный выпуск), Vᴳ (скольжение/дифтонг), Cⱽ (мимолетная гласная). Надстрочный индекс S для шипящего выпуска имеет предварительное одобрение для Unicode 17 (как ); Надстрочный индекс Ʞ для мимолетного/эпентетического щелчка отсутствует. Другие базовые латинские надстрочные подстановочные знаки для тона и слабых неопределенных звуков, как описано в статье о Международном фонетическом алфавите , в основном поддерживаются. (См. таблицу в предыдущем разделе.)
Кроме того, очень немногие буквы IPA, выходящие за рамки основного латинского алфавита, имеют комбинированные формы или поддерживаются в виде нижних индексов:
ɑ | ой | Что | д | а | ʃ | ʍ | ʔ | ʼ | |
---|---|---|---|---|---|---|---|---|---|
надстрочный индекс | ◌ᷧ | ◌ᷔ | ◌ᷗ | ◌ᷙ | ◌ᷪ | ◌ᷯ | ◌̉ [Дж] | ◌̓ | |
Индекс | ₔ | ||||||||
Нижний индекс | ◌ᫀ | ◌̦ |
Составные символы [ править ]
Прежде всего для совместимости с более ранними наборами символов, Unicode содержит ряд символов, которые составляют надстрочные и нижние индексы с другими символами. [1] В большинстве шрифтов они отображаются гораздо лучше, чем попытки создать эти символы из вышеуказанных символов или с помощью разметки.
- Блок дополнения Latin -1 содержит предварительно составленные дроби ½, ¼ и ¾. авторские права © и зарегистрированные товарные знаки ®. В этом блоке также находятся
- Блок общей пунктуации содержит знак промилле ‰ и знак десятитысячных ‱, а базовая латиница содержит знак процента %.
- Блок Числовых форм содержит несколько заранее составленных дробей: ⅐ ⅑ ⅒ ⅓ ⅔ ⅕ ⅖ ⅗ ⅘ ⅙ ⅚ ⅛ ⅜ ⅝ ⅞ ⅟ ↉.
- Блок Буквенные символы содержит несколько символов, состоящих из подстрочных и надстрочных символов: ℀ ℁ ℅ ℆ № ℠ ™ ⅍.
- Блок «Закрытое буквенно-цифровое дополнение» содержит три надстрочных сокращения 🅪 🅫 🅬: MC для торговой марки ( торговая марка ), MD для торговой марки ( зарегистрированная торговая марка ), оба используются в Канаде; MR для marca registrada (зарегистрированная торговая марка) в испано- и португалоязычных странах. [11]
- Блок «Разное техническое» имеет один дополнительный индекс, индекс 10 (⏨), для целей научного обозначения .
- Унифицированное слоговое письмо канадских аборигенов и его расширенные блоки содержат несколько букв, состоящих из надстрочных букв для обозначения расширенных звуковых значений: Основной блок ᐂ ᐫ ᐬ ᐭ ᐮ ᐰ ᑍ ᑧ ᑨ ᑩ ᑪ ᑬ ᒅ ᒆ ᒇ ᒈ ᒊ ᒤ ᓁ ᓔ ᓮ ᔌ ᔍ ᔎ ᔏ ᔧ ᕅ ᕔ ᕿ ᖀ ᖁ ᖂ ᖃ ᖄ ᖎ ᖏ ᖐ ᖑ ᖒ ᖓ ᖔ ᙯ ᙰ ᙱ ᙲ ᙳ ᙴ ᙵ ᙶ, Расширенный блок ᢰ ᢱ ᢲ ᢳ ᢴ ᢵ ᢶ ᢷ ᢸ ᢹ ᢺ ᢻ ᢼ ᢽ ᢾ ᢿ ᣀ ᣁ ᣂ ᣃ ᣄ ᣅ.
Примечания [ править ]
- ^ Общий обзор и техническая информация о замене глифов (но не конкретно для дробей): GSUB — Таблица замены глифов в спецификации OpenType на сайте Microsoft Typography .
- ^ Такие как Chrome , Firefox и Falkon.
- ^ Например, LibreOffice Writer.
- ^ Например, Adobe InDesign и Scribus.
- ^ Перейти обратно: а б Клик-письма старого образца были одобрены в 2024 году по запросу IPA. Конвейер Unicode: латинские буквы-модификаторы для кликов
- ^ Надстрочный индекс ⟨ ç ⟩ состоит из надстрочного индекса , который должен c и седила правильно отображаться хорошим шрифтом. Надстрочный индекс c был специально запрошен для этой цели в предложении Unicode L2/03-180.
- ^ U + 02E4 ˤ БУКВА-МОДИФИКАТОР МАЛЕНЬКАЯ ПЕРЕВЕРНУТАЯ ГЛОТТАЛЬНАЯ СТОП - это надстрочный вариант U + 0295 ʕ ЛАТИНСКАЯ БУКВА ГЛОТОЧНАЯ ЗВОНОЧНАЯ ФРИКАТИВНАЯ и предназначена для использования в IPA. Похожий персонаж U+02C1 ˁ БУКВА-МОДИФИКАТОР ПЕРЕВЕРНУТАЯ ГЛОТТАЛЬНАЯ СТОП является перевернутой U+02C0 ˀ БУКВА-МОДИФИКАТОР ГЛОТТАЛЬНАЯ СТОП , возможно, перевернутый вопросительный знак. Шрифты непоследовательны в том, выглядят ли они по-разному и в чем разница.
- ^ В шрифтах Microsoft верхний индекс ⟨ ɫ ⟩ был ошибочно спроектирован как верхний индекс ⟨ ꬸ ⟩.
- ^ U + A71D ⟨ ꜝ ⟩ и A71E ⟨ ꜞ ⟩ были приняты как африканские эквиваленты символов IPA ⟨ ꜜ ⟩ downstep и ⟨ ꜛ ⟩ upstep . Таким образом , соответствие U + A71D ⟨ ꜝ ⟩ букве клика IPA ⟨ ك ⟩ является случайным. По совпадению, U + A71E ⟨ ꜞ ⟩ служит надстрочным вариантом ударного согласного extIPA ⟨ ¡ ⟩; другие ударные буквы, ⟨ ʬ ⟩ и ⟨ ʭ ⟩, не поддерживают надстрочные индексы в Юникоде.
- ^ На самом деле это вьетнамский диакритический знак dấu hỏi , а не IPA, но графически оба представляют собой кастрированные вопросительные знаки.
Ссылки [ править ]
- ^ Перейти обратно: а б с «UCD: UnicodeData.txt» . Стандарт Юникод . Проверено 14 мая 2016 г.
- ^ Перейти обратно: а б Мартин Дюрст, Асмус Фрейтаг (16 мая 2007 г.). «Юникод в XML и других языках разметки» . W3C . Проверено 13 сентября 2010 г.
- ^ «фракция | Дартс-пакет» . Дартс-пакеты . 27 декабря 2021 г. Проверено 21 сентября 2022 г.
- ^ «MathML | Элементы общего вида | Дроби» . data2type GmbH (на немецком языке). 30 марта 2021 г. Проверено 13 января 2022 г. [ мертвая ссылка ]
- ^ Мартин Дюрст, Асмус Фрейтаг (16 мая 2007 г.). «Фракционный слэш» . W3C . Проверено 13 сентября 2010 г.
- ^ «UCD: Scripts.txt» . Стандарт Юникод . Проверено 21 сентября 2022 г.
- ^ Эверсон, Майкл; Уэст, Эндрю (05.10.2020). «L2/20-268: Пересмотренное предложение о добавлении десяти символов среднеанглийского языка в UCS» (PDF) .
- ^ Утверждено в 2024 году. Конвейер Unicode: ЗАГЛАВНАЯ БУКВА-МОДИФИКАТОР S
- ^ Кирк Миллер и Майкл Эшби, L2 / 20-253R Запрос Unicode для букв-модификаторов IPA (b), нелегочных.
- ^ Кирк Миллер и Майкл Эшби, L2 / 20-252R Запрос Unicode для букв-модификаторов IPA (a), легочный
- ^ Сильва, Эдуардо Марин (01 марта 2017 г.). «L2/17-066R: Предложение по кодированию знака Marca Registrada» (PDF) .