Jump to content

Пунктирное и безточечное I в вычислениях

Ошибка при отображении İ с точкой как I без точки при переводе с турецкого на польский

Латинские буквы İ i с точками и I ı без точек , которые являются отдельными буквами в алфавитах ряда тюркских языков , в отличие от английского и большинства языков, использующих латиницу, вызвали некоторые проблемы при вычислениях.

Трудности

[ редактировать ]

Unicode не кодирует прописную форму буквы I без точки и строчную форму буквы İ с точкой отдельно от их основных букв, а вместо этого объединяет их с формами верхнего и нижнего регистра латинской буквы I соответственно. Джон Коуэн предложил разделить простое Ii на заглавную букву I без точки и строчную букву I с точкой вверху, чтобы сделать регистр более последовательным. [1] Технический комитет Unicode ранее отклонил подобное предложение. [2] потому что это приведет к повреждению сопоставления наборов символов с точками и без точек I и повреждению данных на этих языках. [ нужна ссылка ]

В большинстве программ Unicode от ı используется верхний регистр до I , но, если он специально не настроен для турецкого языка, он записывает от I до i строчные буквы . Таким образом, верхний регистр, а затем нижний регистр меняют буквы. Аналогично, большинство программ Unicode преобразуют i в верхний регистр I , меняя при этом букву.

В Microsoft Windows SDK , начиная с Windows Vista , несколько соответствующих функций имеют флаг NORM_LINGUISTIC_CASING, указывающий, что для турецкой и азербайджанской локалей мне следует сопоставить их с ı .

На языке набора текста LaTeX безточечный ı можно записать с помощью команды обратной косой черты-i: \i.

Использование İ с точкой и ı без точки проблематично в турецкой локали некоторых программных пакетов, включая СУБД Oracle, PHP , Java (программная платформа), [3] [4] и Unixware 7, где неявное использование заглавных букв в именах ключевых слов, переменных и таблицах имеет последствия, не предусмотренные разработчиками приложений. В локалях C или английском языке (США) подобных проблем нет. В .NET Framework есть специальные возможности для обработки «турецкого . [5]

Многие мобильные телефоны, доступные в Турции (по состоянию на 2008 год), не имели надлежащей локализации, что приводило к замене ı на i в SMS , что иногда сильно искажало смысл текста. В одном случае недопонимание сыграло свою роль в смерти Эмине и Рамазана Чалчобана в 2008 году. [6] [7] Обычной заменой является использование символа 1 вместо ı без точки . В Азербайджане это тоже распространено (см. также транслит), но значение слов в целом понятно.

В некоторых переводчиках Ectaco буква İ также трактовалась как I (например, TRAFIK ⟨traffic⟩ , хотя обычно это TRAFİK ).

Информация о персонаже
Предварительный просмотр я я Я я
Имя в Юникоде ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА I ЛАТИНСКАЯ СТРОЧНАЯ БУКВА I ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА
Я С ТОЧКОЙ НАВЕРХУ
ЛАТИНСКАЯ СТРОЧНАЯ БУКВА
ДОТЛЕСС Я
Кодировки десятичный шестигранник декабрь шестигранник декабрь шестигранник декабрь шестигранник
Юникод 73 U + 0049 105 U + 0069 304 U + 0130 305 U + 0131
UTF-8 73 49 105 69 196 176 С4 Б0 196 177 С4 Б1
Ссылка на числовые символы I I i i İ İ ı ı
Ссылка на именованный персонаж &Идот; ı, ı
ИСО 8859-9 73 49 105 69 221 ДД 253 ФД
ИСО 8859-3 73 49 105 69 169 А9 185 Б9

См. также

[ редактировать ]
  1. ^ Коуэн, Джон (10 сентября 1997 г.). «Разрешение точечного и бесточечного «i» » . [электронная почта защищена] (список рассылки).
  2. ^ Дэвис, Марк (11 сентября 1997 г.). "Re: Разрешение "i" с точками и без точек " . [электронная почта защищена] (список рассылки).
  3. ^ Винчестер, Джо (7 сентября 2004 г.). «Турецкая Ява нуждается в особом пивоварении» . Джей-Джей . Архивировано из оригинала 26 июля 2017 г. Проверено 12 сентября 2008 г.
  4. ^ Шиндлер, Уве (11 июля 2012 г.). «Ужас полицейского: локали по умолчанию, кодировки по умолчанию и часовые пояса по умолчанию» . Блог дженерикового полицейского .
  5. ^ «Написание культурно-безопасного управляемого кода: пример Турции» . msdn.microsoft.com . 13 сентября 2006 г.
  6. ^ Диас, Хесус (21 апреля 2008 г.). «Отсутствующая точка на мобильном телефоне убила двух человек, а еще троих посадила в тюрьму» . Гизмодо . Проверено 28 августа 2015 г. Использование буквы «i» привело к получению SMS с совершенно искаженным смыслом: вместо слова «sıkışınca» он выглядел так, как будто он написал «sikişince». Рамазан хотел написать: «Ты меняешь тему каждый раз, когда у тебя заканчиваются аргументы» (звучит достаточно знакомо), но Эмине прочитала: «Ты меняешь тему каждый раз, когда тебя трахают» (тоже звучит знакомо).
  7. ^ Орион, Иган (26 апреля 2008 г.). «Сбой с локализацией мобильных телефонов в Турции стал смертельным: пунктир i ведет к трагедии» . Спрашивающий . Архивировано из оригинала 2 января 2010 г. Проверено 28 августа 2015 г. {{cite news}}: CS1 maint: неподходящий URL ( ссылка )
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: db6915f802269c27455e2b064d66aee8__1717464840
URL1:https://arc.ask3.ru/arc/aa/db/e8/db6915f802269c27455e2b064d66aee8.html
Заголовок, (Title) документа по адресу, URL1:
Dotted and dotless I in computing - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)