Интернационализированный идентификатор ресурса
Интернационализированный идентификатор ресурса | |
Аббревиатура | ЭТО |
---|---|
Статус | Предлагаемый стандарт |
Год начался | 22 апреля 2002 г. |
Впервые опубликовано | 22 апреля 2002 г. |
Последняя версия | 21 января 2020 г. |
Организация | IETF |
Авторы |
|
Базовые стандарты |
|
Домен | Кодировка символов |
Веб-сайт | РФК 3987 |
Интернационализированный идентификатор ресурса ( IRI ) — это стандарт интернет-протокола , который основан на протоколе унифицированного идентификатора ресурса (URI) и значительно расширяет набор разрешенных символов. [1] [2] [3] Он был определен Инженерной группой Интернета (IETF) в 2005 году в RFC 3987. Хотя URI ограничены подмножеством набора символов US-ASCII (символы вне этого набора должны быть сопоставлены с октетами в соответствии с некоторой неопределенной кодировкой символов, тогда в процентном кодировании ), IRI могут дополнительно содержать большинство символов из универсального набора символов (Unicode/ ISO 10646 ), [4] [5] включая китайские , японские , корейские и кириллические символы.
Синтаксис
[ редактировать ]IRI расширяют URI, используя универсальный набор символов , где URI были ограничены ASCII и содержали гораздо меньше символов. IRI могут быть представлены последовательностью октетов, но по определению они определяются как последовательность символов, поскольку IRI можно произносить или писать от руки. [6]
Совместимость
[ редактировать ]IRI сопоставляются с URI, чтобы сохранить обратную совместимость с системами, которые не поддерживают новый формат. [6]
Для приложений и протоколов, которые не допускают прямого использования IRI, IRI следует сначала преобразовать в Юникод с использованием нормализации канонической композиции (NFC) , если еще не в формате Юникод.
Все кодовые точки, отличные от ASCII, в IRI должны быть затем закодированы как UTF-8 , а полученные байты закодированы в процентах , чтобы создать действительный URI.
Пример: IRI https://en.wiktionary.org/wiki/Ῥόδος становится URI https://en.wiktionary.org/wiki/%E1%BF%AC%CF%8C%CE%B4%CE%BF. %CF%82
Кодовые точки ASCII, являющиеся недопустимыми символами URI, могут быть закодированы одинаково, в зависимости от реализации. [6]
Это преобразование легко обратимо; по определению преобразование IRI в URI и обратно даст IRI, который семантически эквивалентен исходному IRI, даже если он может отличаться в точном представлении. [7]
Некоторые протоколы могут требовать дальнейших преобразований; например Punycode для меток DNS .
Преимущества
[ редактировать ]Есть причины видеть URI, отображаемые на разных языках; в основном это облегчает работу пользователям, незнакомым с латинским алфавитом (A–Z). Если предположить, что кому-либо не составит большого труда воспроизвести произвольный Unicode на своей клавиатуре, это может сделать систему URI более доступной. [8]
Недостатки
[ редактировать ]Смешение IRI и ASCII URI может значительно упростить выполнение фишинговых атак, которые заставляют кого-то поверить, что он находится на другом сайте, чем он есть на самом деле. Например, можно заменить ASCII «а» в www.myfictionalbank.com
с аналогом Юникода " α ", чтобы дать www.myfictionαlbank.com
и укажите этот IRI на вредоносный сайт. Это известно как атака омографа IDN .
Хотя URI не дает людям возможности указывать веб-ресурсы, используя их собственные алфавиты, IRI не поясняет, как можно получить доступ к веб-ресурсам с помощью клавиатур, которые не способны генерировать необходимые интернационализированные символы. Это означает, что IRI теперь обрабатываются так же, как и многие другие программы, которые могут потребовать использования метода ввода без клавиатуры при работе с текстами на разных языках.
См. также
[ редактировать ]- IDN (интернационализированное доменное имя)
- Семантическая сеть
- Пуникод
- XRI (расширяемый идентификатор ресурса)
Ссылки
[ редактировать ]- ^ Гангеми, Альдо; Пресутти, Валентина (2006). «Идентификация веб-ресурса» (PDF) . Труды по идентификации личности и веб-семинар (IRW) . Лаборатория прикладной онтологии: 3.
Обратите внимание, что IRI (интернационализированный идентификатор ресурса) [11] должны заменить URI в следующем будущем.
- ^ Суиньяр, Мишель (январь 2005 г.). «Интернационализированные идентификаторы ресурсов (IRI)» . www.tools.ietf.org . Проверено 9 июня 2018 г.
Этот документ определяет новый элемент протокола, интернационализированный идентификатор ресурса (IRI), как дополнение к единому идентификатору ресурса (URI). IRI — это последовательность символов из универсального набора символов (Unicode/ISO 10646). Определено сопоставление IRI с URI, что означает, что IRI можно использовать вместо URI, где это необходимо, для идентификации ресурсов. Вместо расширения или изменения определения URI был выбран подход определения нового элемента протокола.
- ^ Суиньяр, Мишель (январь 2005 г.). «Интернационализированные идентификаторы ресурсов (IRI)» . www.tools.ietf.org . Проверено 9 июня 2018 г.
Этот документ определяет новый элемент протокола, называемый интернационализированным идентификатором ресурса (IRI), путем расширения синтаксиса URI до гораздо более широкого набора символов. Он также определяет «интернационализированные» версии, соответствующие другим конструкциям из [RFC3986], таким как ссылки URI. Синтаксис IRI определен в разделе 2, а взаимосвязь между IRI и URI — в разделе 3.
- ^ Суиньяр, Мишель (январь 2005 г.). «Интернационализированные идентификаторы ресурсов (IRI)» . www.tools.ietf.org . Проверено 9 июня 2018 г.
- ^ Суиньяр, Мишель (январь 2005 г.). «Интернационализированные идентификаторы ресурсов (IRI)» . www.tools.ietf.org . Проверено 9 июня 2018 г.
- ^ Jump up to: а б с Дюрст, М. (2005). «РФК 3987» . Сетевая рабочая группа . Трек стандартов . Проверено 12 октября 2014 г.
- ^ Хендлер, редактор Дитер Фензель; Эд Джон Доминг; Эд. Джеймс А. (2010). Справочник по семантическим веб-технологиям (1-е изд.). Берлин: Springer Verlag GmbH. ISBN 978-3-540-92912-3 . Проверено 12 октября 2014 г.
{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Кларк, Кендалл (7 мая 2003 г.). «Интернационализация URI» . О'Рейли Медиа, Инк . Проверено 12 октября 2014 г.