Jump to content

URL-адрес

Страница полузащищена

URL-адрес
Единый указатель ресурсов
Аббревиатура URL-адрес
Статус Опубликовано
Впервые опубликовано 1994 год ; 30 лет назад ( 1994 )
Последняя версия Уровень жизни
2023
Организация Целевая группа по интернет-инжинирингу (IETF)
комитет Рабочая группа по технологиям веб-гипертекстовых приложений (WHATWG)
Ряд Запрос комментариев (RFC)
Редакторы Энн ван Кестерен
Авторы Тим Бернерс-Ли
Базовые стандарты
  • РФК   1738 . – Единые указатели ресурсов (URL).
  • РФК   3986 . – Унифицированный идентификатор ресурса (URI): общий синтаксис.
  • РФК   4248 . – Схема URI Telnet.
  • РФК   4266 . – Схема URI суслика.
  • РФК   6068 . – Схема URI «mailto».
  • РФК   6196 . – Перемещение почтового сервера: схема URI в исторический.
  • РФК   6270 . – Схема URI «tn3270».
Сопутствующие стандарты УРИ , УРН
Домен Всемирная паутина
Лицензия CC BY 4.0
Веб-сайт URL .spec .чтоwg .org

Единый указатель ресурса ( URL ), в просторечии известный как адрес в Интернете . [1] это ссылка на ресурс , определяющая его местоположение в компьютерной сети и механизм его получения. URL-адрес — это особый тип универсального идентификатора ресурса (URI). [2] [3] хотя многие люди используют эти два термина как синонимы. [4] [а] URL-адреса чаще всего используются для ссылки на веб-страницы ( HTTP / HTTPS ), но также используются для передачи файлов ( FTP ), электронной почты ( mailto ), доступа к базе данных ( JDBC ) и многих других приложений.

Большинство веб-браузеров отображают URL-адрес веб-страницы над страницей в адресной строке . Типичный URL-адрес может иметь форму http://www.example.com/index.html, что указывает на протокол ( http), имя хоста ( www.example.com) и имя файла ( index.html).

История

Унифицированные локаторы ресурсов были определены в RFC   1738 в 1994 году Тима Бернерса-Ли , изобретателя Всемирной паутины , и рабочей группы URI Инженерной рабочей группы Интернета (IETF), [7] как результат сотрудничества, начавшегося на сессии IETF «Живые документы с высоты птичьего полета» в 1992 году. [7] [8]

Формат сочетает в себе ранее существовавшую систему доменных имен (созданную в 1985 году) с синтаксисом пути к файлу , где косые черты используются для разделения имен каталогов и файлов . Уже существовали соглашения, согласно которым имена серверов могли начинаться с полного пути к файлу, которому предшествовала двойная косая черта ( //). [9]

Позже Бернерс-Ли выразил сожаление по поводу использования точек для разделения частей доменного имени в URI , сожалея, что он не использовал косую черту повсюду: [9] а также сказал, что, учитывая двоеточие, следующее за первым компонентом URI, две косые черты перед именем домена не нужны. [10]

Первые сотрудники WorldWideWeb, включая Бернерса-Ли, первоначально предложили использовать UDI: универсальные идентификаторы документов. Ранний (1993 г.) проект спецификации HTML. [11] называются «универсальными» локаторами ресурсов. Это было отменено где-то между июнем 1994 года ( RFC 1630 ) и октябрь 1994 г. (draft-ietf-uri-url-08.txt). [12] В своей книге «Плетение паутины » Бернерс-Ли подчеркивает свое предпочтение первоначальному включению слова «универсальный» в расширение, а не слову «униформный», на которое оно было позже изменено, и дает краткое описание разногласий, которые привели к к изменению.

Синтаксис

Каждый URL-адрес HTTP соответствует синтаксису общего URI. Общий синтаксис URI состоит из пяти компонентов, организованных иерархически в порядке убывания значимости слева направо: [13]

URI = scheme ":" ["//" authority] path ["?" query] ["#" fragment]

Компонент не определен , если он имеет связанный разделитель и этот разделитель не отображается в URI; компоненты схемы и пути всегда определены. [14] Компонент пуст, если в нем нет символов; компонент схемы всегда непустой. [13]

Компонент полномочий состоит из подкомпонентов :

authority = [userinfo "@"] host [":" port]

это представлено На синтаксической диаграмме как:

Синтаксическая диаграмма URI

URI включает в себя:

  • Непустой компонент схемы, за которым следует двоеточие ( :), состоящая из последовательности символов, начинающейся с буквы и сопровождаемой любой комбинацией букв, цифр плюс ( +), период ( .) или дефис ( -). Хотя схемы нечувствительны к регистру, каноническая форма — строчные, и документы, в которых указаны схемы, должны писаться строчными буквами. Примеры популярных схем включают в себя http, https, ftp, mailto, file, data и irc. Схемы URI должны быть зарегистрированы в Управлении по присвоению номеров Интернета (IANA) , хотя на практике используются незарегистрированные схемы. [б]
  • Дополнительный компоненту полномочий , которому предшествуют две косые черты ( //), включающий:
    • Дополнительный подкомпонент userinfo, за которым следует символ at ( @), который может состоять из имени пользователя и необязательного пароля , которым предшествует двоеточие ( :). Использование формата username:password в подкомпоненте userinfo устарел по соображениям безопасности. Приложения не должны отображать в виде открытого текста любые данные после первого двоеточия ( :), найденный в подкомпоненте userinfo, если только данные после двоеточия не являются пустой строкой (означающей отсутствие пароля).
    • А Подкомпонент хоста , состоящий либо из зарегистрированного имени (включая, помимо прочего, имя хоста ), либо из IP-адреса . Адреса IPv4 должны быть записаны в десятичном формате , а IPv6 должны быть заключены в скобки ( адреса []). [16] [с]
    • Дополнительный подкомпонент порта , которому предшествует двоеточие ( :), состоящее из десятичных цифр.
  • А компонент пути , состоящий из последовательности сегментов пути, разделенных косой чертой ( /). Для URI всегда определяется путь, хотя определенный путь может быть пустым (нулевая длина). Сегмент также может быть пустым, что приводит к двум последовательным косым чертам ( //) в компоненте пути. Компонент пути может напоминать или точно соответствовать пути файловой системы , но не всегда подразумевает связь с ним. Если определен компонент полномочий, то компонент пути должен быть либо пустым, либо начинаться с косой черты ( /). Если компонент полномочий не определен, то путь не может начинаться с пустого сегмента, то есть с двух косых черт ( //) — поскольку следующие символы будут интерпретироваться как авторитетный компонент. [18]
По соглашению в URI http и https последняя часть пути называется pathinfo , и это необязательно. Он состоит из нуля или более сегментов пути, которые относятся не к существующему имени физического ресурса (например, файлу, программе внутреннего модуля или исполняемой программе), а к логической части (например, команде или части квалификатора), которая должна передаваться отдельно в первую часть пути, которая идентифицирует исполняемый модуль или программу, управляемую веб-сервером ; это часто используется для выбора динамического контента (документа и т. д.) или для его адаптации по запросу (см. также: CGI и PATH_INFO и т. д.).
Пример:
ТИП: "http://www.example.com/questions/3456/my-document"
где: "/questions" это первая часть пути ( исполняемый модуль или программа) и "/3456/my-document" — это вторая часть пути с именем pathinfo , которая передается исполняемому модулю или программе с именем "/questions" выбрать требуемый документ.
URI http или https, содержащий часть pathinfo без части запроса , также может называться « чистым URL », последняя часть которого может быть « слагом ».
Разделитель запроса Пример
Амперсанд ( &) key1=value1&key2=value2
Точка с запятой ( ;) [д] key1=value1;key2=value2
  • Дополнительный компонент запроса , которому предшествует вопросительный знак ( ?), состоящий из строки запроса неиерархических данных. Его синтаксис не очень четко определен, но по соглашению чаще всего представляет собой последовательность пар атрибут-значение, разделенных разделителем .
  • Дополнительный компонент фрагмента, которому предшествует хэш ( #). Фрагмент содержит идентификатор фрагмента, указывающий направление к вторичному ресурсу, например заголовок раздела в статье, идентифицируемый остатком URI. Если первичным ресурсом является документ HTML , фрагмент часто представляет собой id атрибут определенного элемента, и веб-браузеры будут прокручивать этот элемент в поле зрения.

Веб-браузер обычно разыменовывает URL-адрес, выполняя HTTP- запрос к указанному хосту, по умолчанию через порт номер 80. URL-адреса, использующие https Схема требует, чтобы запросы и ответы выполнялись через безопасное соединение с веб-сайтом .

Интернационализированный URL-адрес

Пользователи Интернета разбросаны по всему миру, используют самые разные языки и алфавиты и ожидают, что смогут создавать URL-адреса на своих собственных местных алфавитах. Интернационализированный идентификатор ресурса (IRI) — это форма URL-адреса, включающая Юникода символы . Все современные браузеры поддерживают IRI. Части URL-адреса, требующие особого обращения для разных алфавитов, — это имя домена и путь. [20] [21]

Доменное имя в IRI известно как интернационализированное доменное имя (IDN). Программное обеспечение для Интернета и Интернета автоматически преобразует доменное имя в punycode, который может использоваться системой доменных имен ; например, китайский URL http://例子.卷筒纸 становится http://xn--fsqu00a.xn--3lr804guic/. xn-- указывает, что символ изначально не был ASCII . [22]

Имя URL-адреса также может быть указано пользователем в локальной системе записи. Если он еще не закодирован, он преобразуется в UTF-8 , а любые символы, не входящие в базовый набор символов URL, экранируются как шестнадцатеричные с использованием процентного кодирования ; например, японский URL http://example.com/引き割り.html становится http://example.com/%E5%BC%95%E3%81%8D%E5%89%B2%E3%82%8A.html. Целевой компьютер декодирует адрес и отображает страницу. [20]

URL-адреса, относящиеся к протоколу

Ссылки, относящиеся к протоколу (PRL), также известные как URL-адреса, относящиеся к протоколу (PRURL), — это URL-адреса, для которых не указан протокол. Например, //example.com будет использовать протокол текущей страницы, обычно HTTP или HTTPS. [23] [24]

См. также

Примечания

  1. ^ URL-адрес подразумевает средство доступа к указанному ресурсу и обозначается протоколом или механизмом доступа, что верно не для каждого URI. [5] [4] Таким образом http://www.example.com является URL-адресом, а www.example.com нет. [6]
  2. ^ Процедуры регистрации новых схем URI были первоначально определены в 1999 году RFC   2717 и теперь определяются RFC 7595 , опубликованный в июне 2015 года. [15]
  3. ^ Для URI, относящихся к ресурсам во Всемирной паутине, некоторые веб-браузеры позволяют .0 части десятично-точечной записи, которые следует отбросить, или использовать необработанные целые IP-адреса. [17]
  4. ^ Исторический RFC   1866 (устарел RFC 2854 ) призывает авторов CGI поддерживать ';' в дополнение к '&'. [19]

Цитаты

  1. ^ W3C (2009) .
  2. ^ «Вперед и обратная косая черта в URL-адресах» . zzz.buzz . Архивировано из оригинала 04 сентября 2018 г. Проверено 19 сентября 2018 г.
  3. ^ RFC 3986 (2005) .
  4. ^ Jump up to: Перейти обратно: а б Объединенная группа по планированию URI W3C/IETF (2002 г.) .
  5. ^ RFC 2396 (1998) .
  6. ^ Мисслер, Дэниел. «Разница между URL-адресами и URI» . Архивировано из оригинала 17 марта 2017 г. Проверено 16 марта 2017 г.
  7. ^ Jump up to: Перейти обратно: а б W3C (1994) .
  8. ^ IETF (1992) .
  9. ^ Jump up to: Перейти обратно: а б Бернерс-Ли (2015) .
  10. ^ Новости BBC (2009) .
  11. ^ Бернерс-Ли, Тим ; Коннолли, Дэниел «Дэн» (март 1993 г.). Язык гипертекстовой разметки (проект RFCxxx) (Технический отчет). п. 28. Архивировано из оригинала 23 октября 2017 г. Проверено 23 октября 2017 г.
  12. ^ Бернерс-Ли, Тим ; Масинтер, Ларри ; МакКахилл, Марк Перри (октябрь 1994 г.). Единые указатели ресурсов (URL) (Технический отчет). (Этот Интернет-проект был опубликован как предлагаемый стандарт RFC, RFC 1738 (1994 г.) ). Цитируется в Анг, CS; Мартин, округ Колумбия (январь 1995 г.). Компонентный интерфейс++ (Технический отчет). Библиотека UCSF и Центр управления знаниями. Архивировано из оригинала 23 октября 2017 г. Проверено 23 октября 2017 г.
  13. ^ Jump up to: Перейти обратно: а б RFC 3986 (2005) , §3.
  14. ^ RFC 3986 (2005) , §5.2.1.
  15. ^ IETF (2015) .
  16. ^ RFC 3986 (2005) , §3.2.2.
  17. ^ Лоуренс (2014) .
  18. ^ RFC 2396 (1998) , §3.3.
  19. ^ RFC 1866 (1995) , §8.2.1.
  20. ^ Jump up to: Перейти обратно: а б W3C (2008) .
  21. ^ W3C (2014) .
  22. ^ IANA (2003) .
  23. ^ Глейзер, доктор медицинских наук (10 марта 2014 г.). Безопасная разработка мобильных приложений: как проектировать и кодировать безопасные мобильные приложения с помощью PHP и JavaScript (1-е изд.). ЦРК Пресс . п. 193. ИСБН  978-1-48220903-7 . Проверено 12 октября 2015 г.
  24. ^ Шафер, Стивен М. (2011). Библия HTML, XHTML и CSS (1-е изд.). Джон Уайли и сыновья . п. 124. ИСБН  978-1-11808130-3 . Проверено 12 октября 2015 г.

Ссылки

Внешние ссылки

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: d947533d170376e3e81ccee41923e4c4__1714067160
URL1:https://arc.ask3.ru/arc/aa/d9/c4/d947533d170376e3e81ccee41923e4c4.html
Заголовок, (Title) документа по адресу, URL1:
URL - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)