Пунктирное и безточечное I в вычислениях
![]() | Тема этой статьи Википедии может не соответствовать общему правилу по известности . ( июнь 2022 г. ) |
этой статьи Начальный раздел может быть слишком коротким, чтобы адекватно суммировать ключевые моменты . ( июнь 2022 г. ) |

Латинские буквы İ i с точками и I ı без точек , которые являются отдельными буквами в алфавитах ряда тюркских языков , в отличие от английского и большинства языков, использующих латиницу, вызвали некоторые проблемы при вычислениях.
Трудности
[ редактировать ]![]() | Этот раздел нуждается в расширении . Вы можете помочь, добавив к нему . ( сентябрь 2022 г. ) |
Unicode не кодирует прописную форму буквы I без точки и строчную форму буквы İ с точкой отдельно от их основных букв, а вместо этого объединяет их с формами верхнего и нижнего регистра латинской буквы I соответственно. Джон Коуэн предложил разделить простое Ii на заглавную букву I без точки и строчную букву I с точкой вверху, чтобы сделать регистр более последовательным. [1] Технический комитет Unicode ранее отклонил подобное предложение. [2] потому что это приведет к повреждению сопоставления наборов символов с точками и без точек I и повреждению данных на этих языках. [ нужна ссылка ]
В большинстве программ Unicode от ı используется верхний регистр до I , но, если он специально не настроен для турецкого языка, он записывает от I до i строчные буквы . Таким образом, верхний регистр, а затем нижний регистр меняют буквы. Аналогично, большинство программ Unicode преобразуют i в верхний регистр I , меняя при этом букву.
В Microsoft Windows SDK , начиная с Windows Vista , несколько соответствующих функций имеют флаг NORM_LINGUISTIC_CASING, указывающий, что для турецкой и азербайджанской локалей мне следует сопоставить их с ı .
На языке набора текста LaTeX безточечный ı можно записать с помощью команды обратной косой черты-i: \i
.
Использование İ с точкой и ı без точки проблематично в турецкой локали некоторых программных пакетов, включая СУБД Oracle, PHP , Java (программная платформа), [3] [4] и Unixware 7, где неявное использование заглавных букв в именах ключевых слов, переменных и таблицах имеет последствия, не предусмотренные разработчиками приложений. В локалях C или английском языке (США) подобных проблем нет. В .NET Framework есть специальные возможности для обработки «турецкого i» . [5]
Многие мобильные телефоны, доступные в Турции (по состоянию на 2008 год), не имели надлежащей локализации, что приводило к замене ı на i в SMS , что иногда сильно искажало смысл текста. В одном случае недопонимание сыграло свою роль в смерти Эмине и Рамазана Чалчобана в 2008 году. [6] [7] Обычной заменой является использование символа 1 вместо ı без точки . В Азербайджане это тоже распространено (см. также транслит), но значение слов в целом понятно.
В некоторых переводчиках Ectaco буква İ также трактовалась как I (например, TRAFIK ⟨traffic⟩ , хотя обычно это TRAFİK ).
Предварительный просмотр | я | я | Я | я | ||||
---|---|---|---|---|---|---|---|---|
Имя в Юникоде | ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА I | ЛАТИНСКАЯ СТРОЧНАЯ БУКВА I | ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА Я С ТОЧКОЙ НАВЕРХУ | ЛАТИНСКАЯ СТРОЧНАЯ БУКВА ДОТЛЕСС Я | ||||
Кодировки | десятичный | шестигранник | декабрь | шестигранник | декабрь | шестигранник | декабрь | шестигранник |
Юникод | 73 | U + 0049 | 105 | U + 0069 | 304 | U + 0130 | 305 | U + 0131 |
UTF-8 | 73 | 49 | 105 | 69 | 196 176 | С4 Б0 | 196 177 | С4 Б1 |
Ссылка на числовые символы | I | I | i | i | İ | İ | ı | ı |
Ссылка на именованный персонаж | &Идот; | ı, ı | ||||||
ИСО 8859-9 | 73 | 49 | 105 | 69 | 221 | ДД | 253 | ФД |
ИСО 8859-3 | 73 | 49 | 105 | 69 | 169 | А9 | 185 | Б9 |
См. также
[ редактировать ]- Африканский справочный алфавит , где происходит аналогичная ситуация, хотя и с засечками, а не с заглавными буквами.
Ссылки
[ редактировать ]- ^ Коуэн, Джон (10 сентября 1997 г.). «Разрешение точечного и бесточечного «i» » . [электронная почта защищена] (список рассылки).
- ^ Дэвис, Марк (11 сентября 1997 г.). "Re: Разрешение "i" с точками и без точек " . [электронная почта защищена] (список рассылки).
- ^ Винчестер, Джо (7 сентября 2004 г.). «Турецкая Ява нуждается в особом пивоварении» . Джей-Джей . Архивировано из оригинала 26 июля 2017 г. Проверено 12 сентября 2008 г.
- ^ Шиндлер, Уве (11 июля 2012 г.). «Ужас полицейского: локали по умолчанию, кодировки по умолчанию и часовые пояса по умолчанию» . Блог дженерикового полицейского .
- ^ «Написание культурно-безопасного управляемого кода: пример Турции» . msdn.microsoft.com . 13 сентября 2006 г.
- ^ Диас, Хесус (21 апреля 2008 г.). «Отсутствующая точка на мобильном телефоне убила двух человек, а еще троих посадила в тюрьму» . Гизмодо . Проверено 28 августа 2015 г. Использование буквы «i» привело к получению SMS с совершенно искаженным смыслом: вместо слова «sıkışınca» он выглядел так, как будто он написал «sikişince». Рамазан хотел написать: «Ты меняешь тему каждый раз, когда у тебя заканчиваются аргументы» (звучит достаточно знакомо), но Эмине прочитала: «Ты меняешь тему каждый раз, когда тебя трахают» (тоже звучит знакомо).
- ^ Орион, Иган (26 апреля 2008 г.). «Сбой с локализацией мобильных телефонов в Турции стал смертельным: пунктир i ведет к трагедии» . Спрашивающий . Архивировано из оригинала 2 января 2010 г. Проверено 28 августа 2015 г.
{{cite news}}
: CS1 maint: неподходящий URL ( ссылка )
Внешние ссылки
[ редактировать ]- Tex Texin, Интернационализация турецкого языка: буква «I» с точкой и без точки , по состоянию на 15 ноября 2005 г.
- Турецкая проблема İ и почему вас это должно волновать | Вас взломали