Европейские правила заказа
Европейские правила упорядочения (EOR/EN 13710) определяют порядок строк, написанных на языках, написанных с использованием латинского , греческого и кириллического алфавитов . Стандарт охватывает языки, используемые Европейским Союзом , Европейской ассоциацией свободной торговли и некоторыми частями бывшего Советского Союза . Это адаптация общего настраиваемого шаблона ISO /IEC 14651 . [1] EOR, в свою очередь, может быть адаптирован для разных (европейских) языков. Но в межевропейском контексте МУН может использоваться без дальнейшей адаптации.
Метод
[ редактировать ]Как и в ISO/IEC 14651 , на котором основан EOR, EOR имеет 4 уровня весов.
Уровень 1
[ редактировать ]Первый уровень сортирует буквы. следующие латинские К этому уровню относятся буквы по порядку:
- abcd ð efghijklmnopqrstuvwxy z þ
Греческий алфавит имеет следующий порядок:
Кириллица имеет следующий порядок:
- а б в г ґ д ђ ѓ е ё є ж з з́ ѕ и і ї й ј к л љ м н њ о п р с с́ т ћ ќ у ў ф х ц ч џ ш щ ъ ы ь ѣ э ю я
Порядок трех алфавитов следующий:
- Латинский алфавит
- Греческий алфавит
- Кириллица
Грузинский армянский и алфавиты не были включены в ENV 13710:2000. Однако они были описаны в CR 14400:2001 «Европейские правила упорядочения – Порядок латинского, греческого, кириллического, грузинского и армянского алфавитов». Оба они были включены в стандарт EN 13710:2011 и заменены им. [2]
Все сценарии, закодированные в стандарте ISO/IEC 10646 (Unicode), подпадают под действие стандарта ISO/IEC 14651 (и его файла данных CTT), а также алгоритма сопоставления Unicode (UCA и связанный с ним DUCET), оба из которых доступны бесплатно.
Уровень 2
[ редактировать ]На втором уровне , такие как диакритические знаки упорядочиваются различные дополнения к буквам и вариации. Буквы с диакритическими знаками (например , ⟨à⟩ , ⟨î⟩ , ⟨õ⟩ и ⟨ü⟩ ) упорядочены как варианты базовой буквы. ⟨æ⟩ , ⟨œ⟩ , ⟨ij⟩ и ⟨ŋ⟩ упорядочены как модификации ⟨ae⟩ , ⟨oe⟩ , ⟨ij⟩ и ⟨n⟩ соответственно, аналогично для аналогичных случаев.
Уровень 2 определяет следующий порядок диакритических знаков и других модификаций:
- острый акцент
- Серьезный акцент (к)
- Breveкраткий
- Циркумфлекс (â)
- Кэрон (ш)
- позвонить (к)
- Диэрезис (ä)
- Двойной острый акцент (она)
- Тильда (ã)
- Точка (ж)
- Седилья (ç)
- Черешок (а)
- Макрон (а)
- Со сквозным ходом (ø)
- Измененная буква(ы) (æ)
Уровень 3
[ редактировать ]Третий уровень проводит различие между заглавными и строчными буквами, например, «Польский» и «Польский».
Уровень 4
[ редактировать ]Четвертый уровень касается знаков препинания и пробелов . Этот уровень проводит различие между «Макдональд» и «Мак Дональд», «его» и «это».
Уровень 5
[ редактировать ]Необязательный и обычно опускаемый пятый уровень позволяет различать типографские различия, в том числе то, выделен ли текст курсивом , обычным или жирным шрифтом .
См. также
[ редактировать ]- Сортировка
- Общее хранилище данных локали (CLDR)
- Юникод
- Универсальный набор символов
- DIN 91379 — европейское подмножество Unicode (также включает греческий и кириллицу для болгарского языка ), использует UTF-8 на интерфейсах, форма нормализации C ( NFC ) — немецкий стандарт 2022 года; будет обязательным для немецких властей и организаций при обмене данными с 1 ноября 2024 г.
- UTF-8
Ссылки
[ редактировать ]- Примечания
- Хэнсон, Роджер; Линдгрен, Карл Йоран; Люнг, Элен; Лунден, Томас. Язык и письменность в Европе . Издательство СНС. (2004) ISBN 91-7150-936-4
- Секстон, Марк Вильгельм: Упорядоченное мировоззрение. Традиция алфавитной сортировки от клинописи до компьютерной. Культурная история. Нимейер (2006) ISBN 3-484-10899-1 . Написанный редактором ENV 13710, в главе 17.4 обсуждается происхождение и содержание МУН. См. также [1] , в частности также [2]
Внешние ссылки
[ редактировать ]- Европейские правила заказа , ENV 13710 – «Европейский предварительный стандарт».