Jump to content

Алгоритм сопоставления Unicode

Алгоритм сопоставления Unicode ( UCA ) — это алгоритм, определенный в Техническом отчете Unicode № 10, который представляет собой настраиваемый метод создания двоичных ключей из строк, представляющих текст в любой системе письма и языке , которые могут быть представлены с помощью Unicode . Затем эти ключи можно эффективно сравнивать побайтно, чтобы сопоставить или отсортировать их в соответствии с правилами языка с возможностью игнорирования регистра, диакритических знаков и т. д. [1]

Технический отчет Unicode № 10 также определяет таблицу элементов сопоставления Unicode по умолчанию (DUCET). Этот файл данных определяет порядок сопоставления по умолчанию, DUCET настраивается для разных языков. [1] [2] Некоторые такие настройки можно найти в репозитории данных Unicode Common Locale (CLDR). [3]

Реализация UCA с открытым исходным кодом включена в состав международных компонентов Unicode , ICU. [4] [5] ICU поддерживает адаптацию, а настройки сортировки из CLDR включены в ICU. [6] [2]

См. также [ править ]

Ссылки [ править ]

  1. ^ Jump up to: Перейти обратно: а б Уистлер, Кен; Шерер, Маркус; Дэвис, Марк (26 августа 2022 г.). «UTS № 10: Алгоритм сопоставления Unicode» . Юникод . Проверено 16 августа 2023 г.
  2. ^ Jump up to: Перейти обратно: а б Хоскен, Мартин (23 сентября 2021 г.). Настройка сортировки в Юникоде: Учебное пособие (PDF) (изд. 1.3). Технология систем письма SIL . стр. 2–3 . Проверено 16 августа 2023 г.
  3. ^ «Выпуски/Загрузки CLDR» . Юникод CLDR . Проверено 16 августа 2023 г.
  4. ^ «ICU — Международные компоненты для Юникода» . Юникод . Проверено 16 августа 2023 г.
  5. ^ «Сопоставления» . Сибукс онлайн . Проверено 16 августа 2023 г.
  6. ^ «Кастомизация» . Документация ОИТ . Проверено 16 августа 2023 г.

Внешние ссылки [ править ]

Инструменты [ править ]


Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: e244129650ef046e30b8d29e73692316__1712173560
URL1:https://arc.ask3.ru/arc/aa/e2/16/e244129650ef046e30b8d29e73692316.html
Заголовок, (Title) документа по адресу, URL1:
Unicode collation algorithm - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)