Jump to content

Интернационализированный идентификатор ресурса

Интернационализированный идентификатор ресурса
Интернационализированный идентификатор ресурса
Аббревиатура ЭТО
Статус Предлагаемый стандарт
Год начался 22 апреля 2002 г. ( 22 апреля 2002 г. )
Впервые опубликовано 22 апреля 2002 г. ( 22 апреля 2002 г. )
Последняя версия 21 января 2020 г. ( 21.01.2020 )
Организация IETF
Авторы
  • Мартин Дюрст
  • Мишель Суиньяр
Базовые стандарты
Домен Кодировка символов
Веб-сайт РФК   3987

Интернационализированный идентификатор ресурса ( IRI ) — это стандарт интернет-протокола , который основан на протоколе унифицированного идентификатора ресурса (URI) и значительно расширяет набор разрешенных символов. [1] [2] [3] Он был определен Инженерной группой Интернета (IETF) в 2005 году в RFC 3987. Хотя URI ограничены подмножеством набора символов US-ASCII (символы вне этого набора должны быть сопоставлены с октетами в соответствии с некоторой неопределенной кодировкой символов, тогда в процентном кодировании ), IRI могут дополнительно содержать большинство символов из универсального набора символов (Unicode/ ISO 10646 ), [4] [5] включая китайские , японские , корейские и кириллические символы.

Синтаксис

[ редактировать ]

IRI расширяют URI, используя универсальный набор символов , где URI были ограничены ASCII и содержали гораздо меньше символов. IRI могут быть представлены последовательностью октетов, но по определению они определяются как последовательность символов, поскольку IRI можно произносить или писать от руки. [6]

Совместимость

[ редактировать ]

IRI сопоставляются с URI, чтобы сохранить обратную совместимость с системами, которые не поддерживают новый формат. [6]

Для приложений и протоколов, которые не допускают прямого использования IRI, IRI следует сначала преобразовать в Юникод с использованием нормализации канонической композиции (NFC) , если еще не в формате Юникод.

Все кодовые точки, отличные от ASCII, в IRI должны быть затем закодированы как UTF-8 , а полученные байты закодированы в процентах , чтобы создать действительный URI.

Пример: IRI https://en.wiktionary.org/wiki/Ῥόδος становится URI https://en.wiktionary.org/wiki/%E1%BF%AC%CF%8C%CE%B4%CE%BF. %CF%82

Кодовые точки ASCII, являющиеся недопустимыми символами URI, могут быть закодированы одинаково, в зависимости от реализации. [6]

Это преобразование легко обратимо; по определению преобразование IRI в URI и обратно даст IRI, который семантически эквивалентен исходному IRI, даже если он может отличаться в точном представлении. [7]

Некоторые протоколы могут требовать дальнейших преобразований; например Punycode для меток DNS .

Преимущества

[ редактировать ]

Есть причины видеть URI, отображаемые на разных языках; в основном это облегчает работу пользователям, незнакомым с латинским алфавитом (A–Z). Если предположить, что кому-либо не составит большого труда воспроизвести произвольный Unicode на своей клавиатуре, это может сделать систему URI более доступной. [8]

Недостатки

[ редактировать ]

Смешение IRI и ASCII URI может значительно упростить выполнение фишинговых атак, которые заставляют кого-то поверить, что он находится на другом сайте, чем он есть на самом деле. Например, можно заменить ASCII «а» в www.myfictionalbank.com с аналогом Юникода " α ", чтобы дать www.myfictionαlbank.com и укажите этот IRI на вредоносный сайт. Это известно как атака омографа IDN .

Хотя URI не дает людям возможности указывать веб-ресурсы, используя их собственные алфавиты, IRI не поясняет, как можно получить доступ к веб-ресурсам с помощью клавиатур, которые не способны генерировать необходимые интернационализированные символы. Это означает, что IRI теперь обрабатываются так же, как и многие другие программы, которые могут потребовать использования метода ввода без клавиатуры при работе с текстами на разных языках.

См. также

[ редактировать ]
  1. ^ Гангеми, Альдо; Пресутти, Валентина (2006). «Идентификация веб-ресурса» (PDF) . Труды по идентификации личности и веб-семинар (IRW) . Лаборатория прикладной онтологии: 3. Обратите внимание, что IRI (интернационализированный идентификатор ресурса) [11] должны заменить URI в следующем будущем.
  2. ^ Суиньяр, Мишель (январь 2005 г.). «Интернационализированные идентификаторы ресурсов (IRI)» . www.tools.ietf.org . Проверено 9 июня 2018 г. Этот документ определяет новый элемент протокола, интернационализированный идентификатор ресурса (IRI), как дополнение к единому идентификатору ресурса (URI). IRI — это последовательность символов из универсального набора символов (Unicode/ISO 10646). Определено сопоставление IRI с URI, что означает, что IRI можно использовать вместо URI, где это необходимо, для идентификации ресурсов. Вместо расширения или изменения определения URI был выбран подход определения нового элемента протокола.
  3. ^ Суиньяр, Мишель (январь 2005 г.). «Интернационализированные идентификаторы ресурсов (IRI)» . www.tools.ietf.org . Проверено 9 июня 2018 г. Этот документ определяет новый элемент протокола, называемый интернационализированным идентификатором ресурса (IRI), путем расширения синтаксиса URI до гораздо более широкого набора символов. Он также определяет «интернационализированные» версии, соответствующие другим конструкциям из [RFC3986], таким как ссылки URI. Синтаксис IRI определен в разделе 2, а взаимосвязь между IRI и URI — в разделе 3.
  4. ^ Суиньяр, Мишель (январь 2005 г.). «Интернационализированные идентификаторы ресурсов (IRI)» . www.tools.ietf.org . Проверено 9 июня 2018 г.
  5. ^ Суиньяр, Мишель (январь 2005 г.). «Интернационализированные идентификаторы ресурсов (IRI)» . www.tools.ietf.org . Проверено 9 июня 2018 г.
  6. ^ Jump up to: а б с Дюрст, М. (2005). «РФК 3987» . Сетевая рабочая группа . Трек стандартов . Проверено 12 октября 2014 г.
  7. ^ Хендлер, редактор Дитер Фензель; Эд Джон Доминг; Эд. Джеймс А. (2010). Справочник по семантическим веб-технологиям (1-е изд.). Берлин: Springer Verlag GmbH. ISBN  978-3-540-92912-3 . Проверено 12 октября 2014 г. {{cite book}}: CS1 maint: несколько имен: список авторов ( ссылка )
  8. ^ Кларк, Кендалл (7 мая 2003 г.). «Интернационализация URI» . О'Рейли Медиа, Инк . Проверено 12 октября 2014 г.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 45b7eef1d3e29edb2d49b59509986e90__1702366020
URL1:https://arc.ask3.ru/arc/aa/45/90/45b7eef1d3e29edb2d49b59509986e90.html
Заголовок, (Title) документа по адресу, URL1:
Internationalized Resource Identifier - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)