Нижние и верхние индексы Юникода
В Юникоде есть индексированные и надстрочные версии ряда символов, включая полный набор арабских цифр . [1] Эти символы позволяют любые полиномиальные , химические и некоторые другие уравнения представлять в виде обычного текста без использования какой-либо разметки, такой как HTML или TeX .
Консорциум World Wide Web и Консорциум Unicode дали рекомендации по выбору между использованием разметки и использованием надстрочных и подстрочных символов:
При использовании в математическом контексте ( MathML ) рекомендуется последовательно использовать разметку стиля для надстрочных и подстрочных индексов […] Однако, когда надстрочные и подстрочные индексы должны отражать семантические различия, легче работать с этими значениями, закодированными в тексте, а не разметка, например, в фонетической или фонематической транскрипции . [2]
Использование
[ редактировать ]Предполагаемое использование [2] Когда эти символы были добавлены в Юникод, они должны были создавать настоящие верхние и нижние индексы, чтобы химические и алгебраические формулы можно было писать без разметки. Таким образом, «H₂O» (с использованием символа нижнего индекса 2) должен быть идентичен «H 2 O» (с индексной разметкой).
На самом деле многие шрифты, включающие эти символы, игнорируют определение Юникода и вместо этого создают цифры для математических символов числителя и знаменателя . [3] [4] которые выровнены по линии ограничения и базовой линии соответственно. При использовании с солидом эти глифы являются обычной заменой диагональных дробей, например, ³/₄ вместо глифа ¾. Это изменение было сделано потому, что использование разметки не дает хорошего графического приближения дробей (сравните разметку 3 / 4 с надстрочным/подстрочным индексом ³/₄). Это изменение также делает надстрочные буквы полезными для порядковых индикаторов , поскольку они более точно соответствуют символам ª и º. Однако это делает их неверными для обычных верхних и нижних индексов, поэтому химические и алгебраические формулы лучше отображаются с использованием разметки.
Юникод предполагал, что диагональные дроби будут отображаться с помощью другого механизма: косая черта дроби U + 2044 визуально похожа на солид, но при использовании с обычными цифрами (а не с верхними и нижними индексами) она указывает системе макета, что дробь, такая как ¾ должен отображаться с использованием автоматической замены глифов. [5] [а] Поддержка со стороны пользователей в течение ряда лет была довольно плохой, но шрифты, браузеры, [б] текстовые процессоры, [с] программное обеспечение для настольных издательских систем [д] и другие все чаще поддерживают предполагаемое поведение Unicode.
Выбор поддерживаемых шрифтов показан в таблице ниже. (Они не будут отображаться должным образом, если у вас не установлены шрифты или если ваш браузер не поддерживает такое поведение.)
Шрифт | U+00BD ОБЫЧНАЯ ДРОБЬ ОДНА ПОЛОВИНА | U + 0031 ЦИФРА ОДИН U + 2044 ДРОБНАЯ косая черта U + 0032 ЦИФРА ДВА |
---|---|---|
Шрифт браузера по умолчанию | ½ | 1⁄2 |
Андика | ½ | 1⁄2 |
Арно Про | ½ | 1⁄2 |
Книжник URW | ½ | 1⁄2 |
Брилл | ½ | 1⁄2 |
Бриозо Про | ½ | 1⁄2 |
суппорты | ½ | 1⁄2 |
Чандара | ½ | 1⁄2 |
Карлито | ½ | 1⁄2 |
лисичка | ½ | 1⁄2 |
ФираГО | ½ | 1⁄2 |
ЭБ Гарамонд | ½ | 1⁄2 |
Книга язычников | ½ | 1⁄2 |
URW Готика | ½ | 1⁄2 |
Сторона | ½ | 1⁄2 |
Linux Распутник | ½ | 1⁄2 |
Нимб Роман | ½ | 1⁄2 |
Нимбус Санс | ½ | 1⁄2 |
Ното Санс | ½ | 1⁄2 |
Ното с засечками | ½ | 1⁄2 |
Открыть Санс | ½ | 1⁄2 |
Убунту | ½ | 1⁄2 |
Йрса | ½ | 1⁄2 |
Блок верхних и нижних индексов
[ редактировать ]Наиболее распространенные цифры надстрочного индекса (1, 2 и 3) были в ISO-8859-1 и поэтому были перенесены в эти позиции в диапазоне Latin-1 Unicode. Остальные были помещены в специальный раздел Unicode по адресам от U+ 2070 до U+209F. В двух таблицах ниже показаны эти символы. Каждому символу верхнего или нижнего индекса предшествует обычный знак x, чтобы показать нижний/надстрочный индекс. Таблица слева содержит фактические символы Юникода; тот, что справа, содержит эквиваленты с использованием HTML- разметки для нижнего или верхнего индекса.
|
|
Другие символы верхнего и нижнего индекса
[ редактировать ]Юникод версии 15.1 также включает символы нижнего и верхнего индекса, предназначенные для семантического использования, в следующих блоках: [1] [6]
- Надстрочный индекс
- Блок Latin-1 Supplement женского и мужского рода содержит порядковые указатели ª и º.
- Блок Latin Extended-C содержит один верхний индекс, ⱽ.
- Блок Latin Extended-D содержит шесть надстрочных индексов: ꝰ ꟲ ꟳ ꟴ ꟸ ꟹ.
- Блок Latin Extended-E содержит пять надстрочных индексов: ꭜ ꭝ ꭞ ꭟ ꭩ.
- Блок Latin Extended-F полностью состоит из надстрочных букв IPA : 𐞁 𐞂 𐞃 𐞄 𐞅 𐞇 𐞈 𐞉 𐞊 𐞋 𐞌 𐞍 𐞎 𐞏 𐞐 𐞑 𐞒 𐞓 𐞔 𐞕 𐞖 𐞗 𐞘 𐞙 𐞚 𐞛 𐞜 𐞝 𐞞 𐞟 𐞠 𐞡 𐞢 𐞣 𐞤 𐞥 𐞦 𐞧 𐞨 𐞩 𐞪 𐞫 𐞬 𐞭 𐞮 𐞯 𐞰 𐞲 𐞳 𐞴 𐞵 𐞶 𐞷 𐞸 𐞹 𐞺.
- В блоке букв-модификаторов интервала есть надстрочные буквы и символы, используемые для фонетической транскрипции: ʰ ʱ ʲ ʳ ʴ ʵ ʶ ʷ ʸ ˀ ˁ ˠ ˡ ˢ ˣ ˤ.
- Блок фонетических расширений имеет несколько надстрочных букв и символов: Latin/IPA ᴬ ᴭ ᴮ ᴯ ᴰ ᴱ ᴲ ᴳ ᴴ ᴵ ᴶ ᴷ ᴸ ᴹ ᴺ ᴻ ᴼ ᴽ ᴾ ᴿ ᵀ ᵁ ᵂ ᵃ ᵄ ᵆ ᵇ ᵈ ᵉ ᵊ ᵋ ᵌ ᵍ ᵏ ᵐ ᵑ ᵒ ᵓ ᵖ ᵗ ᵘ ᵚ ᵛ, греческий ᵝ ᵞ ᵟ ᵠ ᵡ, кириллица ᵸ, другое ᵎ ᵔ ᵕ ᵙ ᵜ. Они предназначены для обозначения вторичной артикуляции .
- В блоке «Дополнение к фонетическим расширениям» есть еще несколько: Latin/IPA ᶛ ᶜ ᶝ ᶞ ᶟ ᶠ ᶡ ᶢ ᶣ ᶤ ᶥ ᶦ ᶧ ᶨ ᶩ ᶪ ᶫ ᶬ ᶭ ᶮ ᶯ ᶰ ᶱ ᶲ ᶳ ᶴ ᶵ ᶶ ᶷ ᶸ ᶹ ᶺ ᶻ ᶼ ᶽ ᶾ, греческий ᶿ.
- Блок Cyrillic Extended-B содержит два надстрочных кириллических индекса: ꚜ ꚝ.
- Блок Cyrillic Extended-D содержит много кириллических надстрочных индексов: 𞀰 𞀱 𞀲 𞀳 𞀷 𞀵 𞀶 𞀷 𞀸 𞀹 𞀺 𞀻 𞀼 𞀽 𞀾 𞀿 𞁀 𞁁 𞁂 𞁃 𞁅 𞁆 𞁇 𞁈 𞁉 𞁊 𞁋 𞁌 𞁍 𞁎 𞁏 𞁐 𞁫 𞁬 𞁭.
- Грузинский букву блок содержит одну надстрочную Мхедрули : ჼ.
- Блок Канбун имеет надстрочные символы аннотации, используемые в японских копиях классических китайских текстов: ㆒ ㆓ ㆔ ㆕ ㆖ ㆗ ㆘ ㆙ ㆚ ㆛ ㆜ ㆝ ㆞ ㆟.
- В блоке Тифинаг есть одна надстрочная буква: ⵯ.
- Унифицированное слоговое письмо канадских аборигенов и его расширенные блоки содержат несколько в основном согласных букв для обозначения слоговой коды, называемой финалами, а также некоторые символы, обозначающие средний слог, известный как медиалы: основной блок ᐜ ᐝ ᐞ ᐟ ᐠ ᐡ ᐢ ᐣ ᐤ ᐥ ᐦ ᐧ ᐨ ᐩ ᐪ ??? ᕐ ᕑ ᕝ ᕪ ᕻ ᕯ ᕽ ᖅ ᖕ ᖖ ᖟ ᖦ ᖮ ᗮ ᘁ ᙆ ᙇ ᙚ ᙾ ᙿ ; Расширенный блок: ᣔ ᣕ ᣖ ᣗ ᣘ ᣙ ᣚ ᣛ ᣜ ᣝ ᣞ ᣟ ᣳ ᣴ ᣵ.
- Объединение верхнего индекса
- Блок «Объединение диакритических знаков» содержит диакритические знаки средневековых надстрочных букв. Эти буквы пишутся непосредственно над другими буквами, встречающимися в средневековых германских рукописях, поэтому в этих глифах нет пробелов, например uͤ. Они показаны здесь над заполнителем в виде пунктирного круга ◌: ◌ͣ ◌ͤ ◌ͥ ◌ͦ ◌ͧ ◌ͨ ◌ͩ ◌ͪ ◌ͫ ◌ͬ ◌ͭ ◌ͮ ◌ͯ.
- Расширенный блок « Объединение диакритических знаков» содержит три комбинированные островные буквы для среднеанглийского Ormulum , ◌ᫌ ◌ᫍ ◌ᫎ. [7]
- Блок «Дополнение к комбинированным диакритическим знакам» содержит дополнительные диакритические знаки средневековых надстрочных букв, достаточные для завершения основного строчного латинского алфавита, за исключением j, q и y, нескольких маленьких заглавных букв и лигатур (ae, ao, av), а также дополнительных букв: ◌᷒ ◌ ᷓ ◌ᷔ ◌ᷕ ◌ᷖ ◌ᷗ ◌ᷘ ◌ᷙ ◌ᷚ ◌ᷛ ◌ᷜ ◌ᷝ ◌ᷞ ◌ᷟ ◌ᷠ ◌ᷡ ◌ᷢ ◌ᷣ ◌ᷤ ◌ᷥ ◌ᷦ ◌ᷧ ◌ᷨ ◌ᷪ ◌ᷫ ◌ᷬ ◌ ᷭ ◌ᷮ ◌ᷯ ◌ᷰ ◌ᷱ ◌ᷲ ◌ᷳ ◌ᷴ, греческий ◌ᷩ.
- Блоки Cyrillic Extended-A и -B содержат несколько диакритических знаков средневековых надстрочных букв, достаточных для завершения основного нижнего регистра кириллицы, используемого в церковнославянских текстах, а также включает дополнительную лигатуру (ст): ◌ⷠ ◌ⷡ ◌ⷢ ◌ⷣ ◌ⷤ ◌ ⷥ ◌ⷦ ◌ⷧ ◌ⷨ ◌ⷩ ◌ⷪ ◌ⷫ ◌ⷬ ◌ⷭ ◌ⷮ ◌ⷯ ◌ⷰ ◌ⷱ ◌ⷲ ◌ⷳ ◌ⷴ ◌ⷵ ◌ⷶ ◌ⷷ ◌ⷸ ◌ⷹ ◌ⷺ ◌ⷻ ◌ⷼ ◌ⷽ ◌ ⷾ ◌ⷿ ◌ꙴ ◌ꙵ ◌ꙶ ◌ꙷ ◌ꙸ ◌ꙹ ◌ꙺ ◌ꙻ ◌ꚞ ◌ꚟ.
- Блок Cyrillic Extended-D имеет один дополнительный объединяющий символ і: ◌𞂏.
- Индекс
- Блок Latin Extended-C содержит один нижний индекс, ⱼ.
- Блок фонетических расширений имеет несколько нижних букв и символов: латинский/IPA ᵢ ᵣ ᵤ ᵥ и греческий ᵦ ᵧ ᵨ ᵩ ᵪ.
- Блок Cyrillic Extended-D также содержит множество кириллических индексов: 𞁑 𞁒 𞁓 𞁔 𞁕 𞁖 𞁗 𞁘 𞁙 𞁚 𞁛 𞁜 𞁝 𞁞 𞁟 𞁠 𞁡 𞁢 𞁣 𞁤 𞁥 𞁦 𞁧 𞁨 𞁩 𞁪.
- Объединение индекса
- Блок «Дополнение к комбинированным диакритическим знакам» содержит объединяющий индекс: ◌᷊.
- Расширенный блок «Объединение диакритических знаков» содержит две буквы, объединяющие лингвистические транскрипции шотландского языка , ◌ᪿ ◌ᫀ.
Таблицы латиницы, греческого, кириллицы и IPA.
[ редактировать ]Объединенный стандарт Unicode содержит надстрочные и подстрочные версии подмножества латинских, греческих и кириллических букв. Здесь они расположены в алфавитном порядке для сравнения (или для удобства копирования и вставки). Поскольку эти символы встречаются в разных диапазонах Юникода, они могут иметь разный размер или положение из-за подмены шрифтов в браузере. Заштрихованные ячейки обозначают маленькие заглавные буквы, которые не сильно отличаются от минускулов, и греческие буквы, которые неотличимы от латинских, и поэтому не ожидается, что они будут поддерживаться Unicode.
Небольшая пунктуация закодирована. Круглые скобки и восклицательный знак показаны выше. Вопросительный знак может быть создан с помощью надстрочного вопросительного знака и комбинированной точки: ⟨ ˀ̣ ⟩, хотя некоторые шрифты не отображают его должным образом.
А | Б | С | Д | И | Ф | Г | ЧАС | я | Дж | К | л | М | Н | ТО | П | вопрос | Р | С | Т | В | V | В | Х | И | С | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Надстрочный капитал | ᴬ | ... | ꟲ | ᴰ | ᴱ | ꟳ | ᴳ | ᴴ | ᴵ | ᴶ | ᴷ | ᴸ | ᴹ | ᴺ | ᴼ | ᴾ | ꟴ | ᴿ | [8] | ᵀ | ᵁ | ⱽ | ᵂ | |||
Надстрочная маленькая прописная | [9] | 𐞄 | [10] | [9] | 𐞒 | 𐞖 | ᶦ | ᶫ | ᶰ | 𐞪 | ᶸ | 𐞲 | ||||||||||||||
Надстрочный минускул | ᵃ | ᵇ | ᶜ | ᵈ | ᵉ | ᶠ | ᵍ | ʰ | ⁱ | ʲ | ᵏ | ˡ | ᵐ | ⁿ | ᵒ | ᵖ | 𐞥 | ʳ | ˢ | ᵗ | ᵘ | ᵛ | ʷ | ˣ | ʸ | ᶻ |
Надстрочная маленькая кепка | ◌ᷛ | ◌ᷞ | ◌ᷟ | ◌ᷡ | ◌ᷢ | |||||||||||||||||||||
Надпись мизерная | ◌ͣ | ◌ᷨ | ◌ͨ | ◌ͩ | ◌ͤ | ◌ᷫ | ◌ᷚ | ◌ͪ | ◌ͥ | ◌ᷜ | ◌ᷝ | ◌ͫ | ◌ᷠ | ◌ͦ | ◌ᷮ | ◌ͬ | ◌ᷤ | ◌ͭ | ◌ͧ | ◌ͮ | ◌ᷱ | ◌ͯ | ◌ᷦ | |||
Нижний индекс | ₐ | ₑ | ₕ | ᵢ | ⱼ | ₖ | ₗ | ₘ | ₙ | ₒ | ₚ | ᵣ | ₛ | ₜ | ᵤ | ᵥ | ₓ | |||||||||
Нижний индекс мизерный | ◌᷊ | ◌ᪿ |
А | Б | С | Д | Э | Г | ИЛИ | че | я | К | л | М | Н | Х | ТО | П | Р | С | Т | Да | Ф | Х | P.S. | Ой | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Надстрочный минускул | [А] | ᵝ | ᵞ | ᵟ | ᵋ | ᶿ | ᶥ | [А] | ᵠ | ᵡ | [11] | [12] | ||||||||||||
Надпись мизерная | ◌ᷩ | |||||||||||||||||||||||
Нижний индекс | ᵦ | ᵧ | ᵨ | ᵩ | ᵪ |
- ^ Перейти обратно: а б В некоторых шрифтах латинская альфа ᵅ и ипсилон ᶹ могут использоваться в качестве надстрочного греческого альфа и ипсилон. ᵋ и ᶥ также официально являются латинскими буквами, но отображаются так же, как греческие.
А | А | Б | В | Г | Г | Д | Хорошо | Есть | Же | С | С | Ꚉ | И | я | Ей | Дж | К | л | М | Н | О | О | П | Р | С | Ҫ | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Надстрочный индекс | 𞀰 | 𞁋 | 𞀱 | 𞀲 | 𞀳 | 𞀴 | 𞀵 | 𞀶 | 𞀷 | 𞁊 | 𞀸 | 𞁌 | 𞁍 | 𞀹 | 𞀺 | 𞀻 | ᵸ | 𞀼 | 𞁎 | 𞀽 | 𞀾 | 𞀿 | 𞁫 | ||||
надстрочный индекс | ◌ⷶ | ◌ⷠ | ◌ⷡ | ◌ⷢ | ◌ⷣ | ◌ⷷ | ◌ꙴ | ◌ⷤ | ◌ⷥ | ◌ꙵ | ◌𞂏 | ◌ꙶ | ◌ⷦ | ◌ⷧ | ◌ⷨ | ◌ⷩ | ◌ⷪ | ◌ⷫ | ◌ⷬ | ◌ⷭ | |||||||
Индекс | 𞁑 | 𞁒 | 𞁓 | 𞁔 | 𞁧 | 𞁕 | 𞁖 | 𞁗 | 𞁘 | 𞁩 | 𞁙 | 𞁨 | 𞁚 | 𞁛 | 𞁜 | 𞁝 | 𞁞 | ||||||||||
Т | У | Да | Н | Ꙋ | Ф | Х | Ѡ | Ц | Ч | Дж | Ш | Щ | Ъ | Ꙑ | Да | Ь | Ѣ | Э | Ю | Ꙗ | Ѥ | Ѧ | Ѫ | Ѭ | Ѳ | Ӏ | |
Надстрочный индекс | 𞁀 | 𞁁 | 𞁏 | 𞁭 | 𞁂 | 𞁃 | 𞁄 | 𞁅 | 𞁆 | ꚜ | 𞁬 | 𞁇 | ꚝ | 𞁈 | 𞁉 | 𞁐 | |||||||||||
надстрочный индекс | ◌ⷮ | ◌ꙷ | ◌ⷹ | ◌ꚞ | ◌ⷯ | ◌ꙻ | ◌ⷰ | ◌ⷱ | ◌ⷲ | ◌ⷳ | ◌ꙸ | ◌ꙹ | ◌ꙺ | ◌ⷺ | ◌ⷻ | ◌ⷼ | ◌ꚟ | ◌ⷽ | ◌ⷾ | ◌ⷿ | ◌ⷴ | ||||||
Индекс | 𞁟 | 𞁠 | 𞁡 | 𞁢 | 𞁣 | 𞁪 | 𞁤 | 𞁥 | 𞁦 |
Многие символы кириллицы были добавлены в блок Cyrillic Extended-D , который был добавлен в бесплатные шрифты Gentium Plus и Andika с версией 6.2 в феврале 2023 года.
См. также строчные буквы в Юникоде .
Надстрочный индекс IPA
[ редактировать ]Блок Latin Extended-F был создан для остальных надстрочных букв IPA . Они были добавлены в бесплатные шрифты Gentium Plus и Andika в версии 6.2 в феврале 2023 года. Дополнительные символы для исторических букв и букв пара-IPA ожидаются с 2024 года.
Согласные буквы
[ редактировать ]Символы Юникода для надстрочных (модификаторов) согласных букв IPA и extIPA следующие. Символы звуков со вторичной артикуляцией выделяются в скобках и располагаются под основными буквами. Пары клик-букв — это текущая буква слева и традиционная буква или буква пара-IPA справа; последние находятся на рассмотрении в Unicode. [и]
Bilabial | Labiodental | Стоматологический | Альвеолярный | Postalveolar | Retroflex | Палатальный | Велар | Увулярный | Pharyngeal | Глоттальный | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
носовой | м ᵐ 1Д50 | ɱ ᶬ 1DAC | п ⁿ 207F ( ᶇ ) 1DFF7 | ( ᵿ ) 1DFF1 | ɳ ᶯ 1ДАФ | ɲ ᶮ 1ДАЭ | № 5 1Д51 | ɴᶰ 1DB0 | ||||||||||||||
взрывной | п ᵖ 1Д56 | б ᵇ 1Д47 | т ᵗ 1Д57 ( ƫ ᶵ ) 1DB5 | д ᵈ 1Д48 ( ᶁ ) 1DFF5 | ( ) 1DFF2 | ( ) 1 ДФЭФ | ʈ 𐞯 107АФ | ɖ 𐞋 1078Б | с ᶜ 1D9C | ɟ ᶡ 1DA1 | в ᵏ 1Д4Ф | ɡ ᶢ / г да 1DA2/1D4D | д 𐞥 107А5 | ɢ 𐞒 10792 | ʡ 𐞳 107Б3 | ʔ ˀ 02C0 | ||||||
Аффрикат | ʦ 𐞬 107AC | ʣ 𐞇 10787 | ʧ 𐞮 107АЭ ( ʨ 𐞫 ) 107АБ | ʤ 𐞊 1078А ( ʥ 𐞉 ) 10789 | ꭧ 𐞭 107 год нашей эры ( 𝼜 ) 1DFE5 | ꭦ 𐞈 10788 ( 𝼙 ) 1DFE1 | ||||||||||||||||
Фрикативный | ɸ ᶲ 1DB2 | б ᵝ 1Д5Д | ж ᶠ 1DA0 | v ᵛ 1Д5Б | θ ᶿ 1ДБФ | ð ᶞ 1Д9Е | с ˢ 02E2 ( ᶊ ) 1DFF8 | с ᶻ 1 дББ ( ᶎ ) 1DFF9 | ʃ ᶴ 1DB4 ( ɕ ᶝ ) 1D9D | ʒ ᶾ 1ДБЕ ( ʑ ᶽ ) 1ДБД | ʂ ᶳ 1DB3 ( ᶘ ) 1DFE3 | ʐ ᶼ 1ДБК ( ᶚ ) 1DFE7 | ç ᶜ̧ 1D9C+0327 [ф] | ʝ ᶨ 1DA8 | х ˣ 02E3 ( ɧ 𐞗 ) 10797 | ɣ ˠ 02E0 | х ᵡ 1Д61 | ʁ ʶ 02Б6 | ч 𐞕 10795 ( ʩ 𐞐 ) 10790 | ʕ ˤ 02E4 [г] | ч ʰ 02B0 ( ꞕ ) 1DFF6 | ɦ ʱ 02Б1 |
аппроксимант | ʋ ᶹ 1DB9 | ɹ ʴ 02Б4 | ɻ ʵ 02B5 | j ʲ 02Б2 ( ɥ ᶣ ) 1DA3 | ( ʍ ꭩ ) АБ69 | ɰ ᶭ 1ДАД ( В ) 02Б7 | ||||||||||||||||
Нажмите / взмахните | ⱱ 𐞰 107B0 | ɾ 𐞩 107А9 | ɽ 𐞨 107А8 | |||||||||||||||||||
Трель | ʙ 𐞄 10784 | р ʳ 02Б3 | ʀ 𐞪 107АА | ʜ 𐞖 10796 | ʢ 𐞴 107Б4 | |||||||||||||||||
Латеральный фрикативный | ɬ 𐞛 1079Б ( ʪ 𐞙 ) 10799 | ɮ 𐞞 1079Э ( ʫ 𐞚 ) 1079А | ꞎ 𐞝 1079D | 𝼅 𐞟 1079F | 𝼆 𐞡 107А1 | 𝼄 𐞜 1079С | ||||||||||||||||
Латеральный аппроксимант | л ˡ 02E1 ( ᶅ ᶪ ) 1ДАА | ( ) 1DFF0 | ɭ ᶩ 1DA9 | ʎ 𐞠 107А0 | ʟ ᶫ 1 ДАБ ( ɫꭞ ) [час] АБ5Е | |||||||||||||||||
Боковой кран/заслонка | ɺ 𐞦 107А6 | 𝼈 𐞧 107А7 | ||||||||||||||||||||
Имплозивный | ƥ 1ДФФК | ɓ 𐞅 10785 | ƭ 1ДФФЕ | д 𐞌 1078С | 𝼉 1ДФФФ | ᶑ 𐞍 1078D | ƈ 1ДФФА | ʄ 𐞘 10798 | ᝩ 1ДФФБ | ɠ 𐞓 10793 | ʠ 1ДФФД | ʛ 𐞔 10794 | ||||||||||
Нажмите «Отпустить» [и] | ʘ 𐞵 107Б5 | ـ 𐞶 107Б6 | ʇ 107ББ | ƃ ꜝ A71D | ʗ 107БД | 𝼊 𐞹 107Б9 | ψ 1DFF3 | ق 𐞸 107Б8 | 𝼋 107БФ | ( ʞ ) 107BE | ||||||||||||
Боковой щелчок выпускать | ف 𐞷 107Б7 | ʖ 107 г. до н. э. | ||||||||||||||||||||
ударный | ¡ ꜞ А71Е [я] |
Диакритический интервал для отрывных согласных, U + 2BC, работает с надстрочными буквами, хотя сам по себе не является надстрочным индексом: ⟨ ᵖʼ ᵗʼ ᶜʼ ᵏˣʼ ⟩. Если необходимо провести различие, можно использовать объединяющий апостроф U + 315: ⟨ ᵖ̕ ᵗ̕ ᶜ̕ ᵏˣ̕ ⟩. Диакритический интервал следует использовать для базовой буквы с надстрочным выпуском, например [tˢʼ] или [kˣʼ] , где область действия апострофа включает букву без надстрочного индекса, но для обозначения можно использовать комбинированный апостроф U+315. слабо артикулированный отрывной согласный, такой как [ᵗ̕] или [ᵏ̕] , где весь согласный записывается как надстрочный индекс, или вместе с U + 2BC, когда отдельные апострофы имеют область действия над основной буквой и буквами-модификаторами, как в ⟨ pʼᵏˣ̕ ⟩. [13]
Диакритические пробелы, такие как ⟨ tʲ ⟩, не могут быть надстрочными в обычном тексте: ⟨ ᵗʲ ⟩. (В этом случае старая буква IPA для [tʲ] , ⟨ ƫ ⟩, имеет вариант надстрочного индекса в Юникоде, U+1DB5 ⟨ ᶵ ⟩, но обычно это не так.)
Среди старых букв ⟨ ꜧ ⟩ (U+A727) случайно напоминает некогда распространенный графический вариант ⟨ ɮ ⟩. Его верхний индекс поддерживается ⟨ ꭜ ⟩ (U+AB5C). наиболее распространенные буквы с небным крючком Также поддерживаются ; они отображены в таблице выше. Когда-то у IPA был своеобразный завиток на некоторых палатализованных буквах: это фрикативные буквы ⟨ ʆ ʓ ⟩ и аффрикатные лигатуры ⟨ ⟩. В 2024 году их надстрочные формы ожидают рассмотрения по адресу ⟨ ⟩ (U+1DFE6, 1DFE2, 1DFE4, 1DFE0). Устаревшие буквы ⟨ ƞ ⟩ и ⟨ ɼ ⟩ ожидают поддержки в ⟨ ⟩ (1DFDC) и ⟨ ⟩ (1DFDD).
Среди букв пара-IPA китаеведческий надстрочный индекс ⟨ ş ş ş ş ⟩ ожидает рассмотрения по адресу ⟨ ⟩ (U + 1DFEF – 1DFF2). [9] Надстрочные индексы бантуистских губно-зубных взрывчатых веществ ⟨ ş ⟩ и ⟨ ş ⟩ находятся на рассмотрении в ⟨ ⟩ и ⟨ ⟩.Центральные полугласные ⟨ ɉ ⟩, ⟨ ⟩ ( ɥ̶ ) и ⟨ ⟩ ( w̶ ) ожидаются в U + 1DFD9 ⟨ ⟩, 1DFD8 ⟨ ⟩, 1DFDB ⟨ ⟩.
Гласные буквы
[ редактировать ]Символы Юникода для надстрочных (модификаторов) гласных букв IPA, а также пары расширенных букв, найденных в английских словарях, следующие. Также поддерживаются недавно устаревшие альтернативные буквы; они выделены в скобки и помещены под стандартными буквами IPA:
Передний | Центральный | Назад | ||||
---|---|---|---|---|---|---|
Закрывать | я ⁱ 2071 | и 02Б8 | ɨ ᶤ 1DA4 | ʉ ᶶ 1DB6 | ɯ ᵚ 1Д5А | в ᵘ 1Д58 |
Почти близко | ɪ ᶦ 1DA6 ( ɩ ᶥ ) 1DA5 | ʏ 𐞲 107Б2 | ( ᵻ ᶧ ) 1DA7 | ( ᵿ ) 1ДФДА | ʊ ᶷ 1DB7 ( ɷ 𐞤 ) 107А4 | |
Близко-средне | и ᵉ 1Д49 | ø 𐞢 107А2 | ɘ 𐞎 1078Э | ɵ ᶱ 1ДБ1 | ɤ 𐞑 10791 | ᵒ 1Д52 |
Средний | ᵊ 1Д4А | |||||
Открытая середина | ɛ ᵋ 1D4B | œ ꟹ A7F9 | ɜ ᶟ 1Д9Ф ( ᴈ ᵌ ) 1D4C | ɞ 𐞏 1078F | ʌ ᶺ 1DBA | и Γ 1Д53 |
Почти открытый | æ 𐞃 10783 | ɶ 𐞣 107А3 | ɐ ᵄ 1Д44 | ɑ ᵅ 1Д45 | ɒ ᶛ 1Д9Б | |
Открыть | а ᵃ 1Д43 |
Предварительно составленные ротические гласные буквы Юникода ⟨ ɚ ɝ ⟩ напрямую не поддерживаются. ротический диакритический знак U+02DE ◌˞ Вместо этого следует использовать : ⟨ ᵊ˞ ᶟ˞ ⟩. [14]
⟨ ɜ ⟩ и ⟨ ᶟ ⟩ перевернуты ɛ . Старый IPA, получивший название ɛ , ⟨ ᴈ ⟩, также поддерживается по адресу U+1D4C ⟨ ᵌ ⟩. Однако кратковременно возрожденная гласная буква ⟨ ʚ ⟩ (U + 029A) не поддерживается, поддерживается только ее перевернутая замена ⟨ ɞ ⟩.
Среди старых букв ⟨ ᴜ ⟩ (U+1D1C), графический вариант ⟨ ʊ ⟩, поддерживается в ⟨ ᶸ ⟩ (U+1DB8).
Среди букв пара-IPA китаеведческий надстрочный индекс ⟨ ɿ ʅ ʮ ʯ ⟩ находится на рассмотрении в ⟨ ⟩ (U+1DFEB – 1DFEE). [9]
Маркировка длины
[ редактировать ]Также поддерживаются две метки длины:
Длинный | полудлинный |
---|---|
ː 𐞁 10781 | ˑ 𐞂 10782 |
Они используются для увеличения длины другого верхнего индекса, например длинного стремления.
Подстановочные знаки
[ редактировать ]Подстановочные знаки надстрочного индекса (полные прописные буквы) поддерживаются частично: например, ᴺC (преназальный согласный), ꟲN (назальный с предзадержкой), Pꟳ (фрикативный выпуск), NᴾF (эпентетический взрывной звук), CVNᵀ (тональный слог), Cᴸ (жидкий или боковой выпуск). , Cᴿ (ротический или резонансный выпуск), Vᴳ (скольжение/дифтонг), Cⱽ (мимолетная гласная). Надстрочный индекс S для шипящего выпуска имеет предварительное одобрение для Unicode 17 (как ); Надстрочный индекс Ʞ для мимолетного/эпентетического щелчка отсутствует. Другие базовые латинские надстрочные подстановочные знаки для тона и слабых неопределенных звуков, как описано в статье о Международном фонетическом алфавите , в основном поддерживаются. (См. таблицу в предыдущем разделе.)
Объединение знаков и индексов
[ редактировать ]Кроме того, очень немногие буквы IPA, выходящие за рамки основного латинского алфавита, имеют комбинированные формы или поддерживаются в виде нижних индексов:
ɑ | ой | Что | д | а | ʃ | ʍ | ʔ | ʼ | |
---|---|---|---|---|---|---|---|---|---|
надстрочный индекс | ◌ᷧ | ◌ᷔ | ◌ᷗ | ◌ᷙ | ◌ᷪ | ◌ᷯ | ◌̉ [Дж] | ◌̓ | |
Индекс | ₔ | ||||||||
Нижний индекс | ◌ᫀ | ◌̦ |
Составные персонажи
[ редактировать ]Прежде всего для совместимости с более ранними наборами символов, Unicode содержит ряд символов, которые составляют надстрочные и нижние индексы с другими символами. [1] В большинстве шрифтов они отображаются гораздо лучше, чем попытки создать эти символы из вышеуказанных символов или с помощью разметки.
- Блок дополнения Latin-1 содержит предварительно составленные дроби ½, ¼ и ¾. В этом блоке также находятся авторские права © и зарегистрированные товарные знаки ®.
- Блок общей пунктуации содержит знак промилле ‰ и знак десятитысячных ‱, а базовая латиница содержит знак процента %.
- Блок Числовых форм содержит несколько заранее составленных дробей: ⅐ ⅑ ⅒ ⅓ ⅔ ⅕ ⅖ ⅗ ⅘ ⅙ ⅚ ⅛ ⅜ ⅝ ⅞ ⅟ ↉.
- Блок Буквенные символы содержит несколько символов, состоящих из подстрочных и надстрочных символов: ℀ ℁ ℅ ℆ № ℠ ™ ⅍.
- Блок « Закрытое буквенно-цифровое дополнение» содержит три надстрочных сокращения 🅪 🅫 🅬: MC для торговой марки ( торговая марка ), MD для торговой марки ( зарегистрированная торговая марка ), оба используются в Канаде; MR для marca registrada (зарегистрированная торговая марка) в испано- и португалоязычных странах. [15]
- Блок «Разное техническое» имеет один дополнительный индекс, индекс 10 (⏨), для целей научного обозначения .
- Унифицированное слоговое письмо канадских аборигенов и его расширенные блоки содержат несколько букв, состоящих из надстрочных букв для обозначения расширенных звуковых значений: Основной блок ᐂ ᐫ ᐬ ᐭ ᐮ ᐰ ᑍ ᑧ ᑨ ᑩ ᑪ ᑬ ᒅ ᒆ ᒇ ᒈ ᒊ ᒤ ᓁ ᓔ ᓮ ᔌ ᔍ ᔎ ᔏ ᔧ ᕅ ᕔ ᕿ ᖀ ᖁ ᖂ ᖃ ᖄ ᖎ ᖏ ᖐ ᖑ ᖒ ᖓ ᖔ ᙯ ᙰ ᙱ ᙲ ᙳ ᙴ ᙵ ᙶ, Расширенный блок ᢰ ᢱ ᢲ ᢳ ᢴ ᢵ ᢶ ᢷ ᢸ ᢹ ᢺ ᢻ ᢼ ᢽ ᢾ ᢿ ᣀ ᣁ ᣂ ᣃ ᣄ ᣅ.
Примечания
[ редактировать ]- ^ Общий обзор и техническая информация о замене глифов (хотя и не конкретно для дробей): GSUB — Таблица замены глифов в спецификации OpenType на сайте Microsoft Typography .
- ^ Такие как Chrome , Firefox и Falkon.
- ^ Например, LibreOffice Writer.
- ^ Например, Adobe InDesign и Scribus.
- ^ Перейти обратно: а б Клик-письма старого образца были одобрены в 2024 году по запросу IPA. Конвейер Unicode: латинские буквы-модификаторы для кликов
- ^ Надстрочный индекс ⟨ ç ⟩ состоит из надстрочного индекса , который должен c и седиля правильно отображаться хорошим шрифтом. Надстрочный индекс c был специально запрошен для этой цели в предложении Unicode L2/03-180.
- ^ U + 02E4 ˤ БУКВА -МОДИФИКАТОР МАЛЕНЬКАЯ ПЕРЕВЕРНУТАЯ ГЛОТТАЛЬНАЯ СТОП - это надстрочный вариант U + 0295 ʕ ЛАТИНСКАЯ БУКВА ГЛОТОЧНАЯ ЗВОНОЧНАЯ ФРИКАТИВНАЯ и предназначена для использования в IPA. Похожий персонаж U+02C1 ˁ БУКВА-МОДИФИКАТОР ПЕРЕВЕРНУТАЯ ГЛОТТАЛЬНАЯ СТОП является перевернутой U+02C0 ˀ БУКВА-МОДИФИКАТОР ГЛОТТАЛЬНАЯ СТОП , возможно, перевернутый вопросительный знак. Шрифты непоследовательны в том, выглядят ли они по-разному и в чем разница.
- ^ В шрифтах Microsoft верхний индекс ⟨ ɫ ⟩ был ошибочно спроектирован как верхний индекс ⟨ ꬸ ⟩.
- ^ U + A71D ⟨ ꜝ ⟩ и A71E ⟨ ꜞ ⟩ были приняты как африканистские эквиваленты символов IPA ⟨ ꜜ ⟩ downstep и ⟨ ꜛ ⟩ upstep . Таким образом, соответствие U + A71D ⟨ ꜝ ⟩ букве клика IPA ⟨ ك ⟩ является случайным. По совпадению, U + A71E ⟨ ꜞ ⟩ служит надстрочным вариантом ударного согласного extIPA ⟨ ¡ ⟩; другие ударные буквы, ⟨ ʬ ⟩ и ⟨ ʭ ⟩, не поддерживают надстрочные индексы в Юникоде.
- ^ На самом деле это вьетнамский диакритический знак dấu hỏi , а не IPA, но графически оба представляют собой кастрированные вопросительные знаки.
Ссылки
[ редактировать ]- ^ Перейти обратно: а б с «UCD: UnicodeData.txt» . Стандарт Юникод . Проверено 14 мая 2016 г.
- ^ Перейти обратно: а б Мартин Дюрст, Асмус Фрейтаг (16 мая 2007 г.). «Юникод в XML и других языках разметки» . W3C . Проверено 13 сентября 2010 г.
- ^ «фракция | Дартс-пакет» . Дартс-пакеты . 27 декабря 2021 г. Проверено 21 сентября 2022 г.
- ^ «MathML | Элементы общего вида | Дроби» . data2type GmbH (на немецком языке). 30 марта 2021 г. Проверено 13 января 2022 г. [ мертвая ссылка ]
- ^ Мартин Дюрст, Асмус Фрейтаг (16 мая 2007 г.). «Фракционный слэш» . W3C . Проверено 13 сентября 2010 г.
- ^ «UCD: Scripts.txt» . Стандарт Юникод . Проверено 21 сентября 2022 г.
- ^ Эверсон, Майкл; Уэст, Эндрю (05.10.2020). «L2/20-268: Пересмотренное предложение о добавлении десяти символов среднеанглийского языка в UCS» (PDF) .
- ^ Утверждено в 2024 году. Конвейер Unicode: ЗАГЛАВНАЯ БУКВА-МОДИФИКАТОР S
- ^ Перейти обратно: а б с д Утверждено в 2024 году. Латинская буква-модификатор Синологическое расширение IPA.
- ^ Утверждено в 2024 году. Латинские исторические буквы и буквы-модификаторы пара-IPA.
- ^ Утверждено в 2024 году. Конвейер Unicode: БУКВА-МОДИФИКАТОР МАЛЕНЬКАЯ ГРЕЧЕСКАЯ PSI
- ^ Утверждено в 2024 году. Конвейер Unicode: БУКВА-МОДИФИКАТОР МАЛЕНЬКАЯ ГРЕЧЕСКАЯ ОМЕГА
- ^ Кирк Миллер и Майкл Эшби, L2 / 20-253R Запрос Unicode для букв-модификаторов IPA (b), нелегочных.
- ^ Кирк Миллер и Майкл Эшби, L2 / 20-252R Запрос Unicode для букв-модификаторов IPA (a), легочный
- ^ Сильва, Эдуардо Марин (01 марта 2017 г.). «L2/17-066R: Предложение по кодированию знака Marca Registrada» (PDF) .