Jump to content

Веб-запрос

Веб -запрос или запрос веб-поиска — это запрос, который пользователь вводит в поисковую систему Интернета для удовлетворения своих информационных потребностей . Запросы веб-поиска отличаются тем, что они часто представляют собой простой текст, а логические директивы поиска используются редко. Они сильно отличаются от стандартных языков запросов , которые регулируются строгими синтаксическими правилами, как командные языки с ключевыми словами или позиционными параметрами .

Существует три широкие категории, которые охватывают большинство поисковых запросов в Интернете: информационные, навигационные и транзакционные. [1] Их еще называют «делай, знай, иди». [2] Хотя эта модель поиска не была выведена теоретически, классификация была подтверждена эмпирически с помощью реальных запросов поисковых систем. [3]

  • Информационные запросы — запросы, охватывающие широкую тему (например, Колорадо или грузовики ), для которых могут быть тысячи релевантных результатов.
  • Навигационные запросы – запросы, которые ищут один веб-сайт или веб-страницу одного объекта (например, YouTube или Delta Air Lines ).
  • Транзакционные запросы — запросы, отражающие намерение пользователя выполнить определенное действие, например покупку автомобиля или загрузку заставки.

Поисковые системы часто поддерживают четвертый тип запросов, который используется гораздо реже:

  • Запросы на подключение — запросы, которые сообщают о связности проиндексированного веб-графа (например, «Какие ссылки указывают на этот URL-адрес ?» и «Сколько страниц проиндексировано с этого доменного имени ?»). [4]

Характеристики

[ редактировать ]
Список поисковых предложений по поисковому запросу

Большинство коммерческих поисковых систем не раскрывают свои журналы поиска, поэтому получить информацию о том, что пользователи ищут в Интернете, сложно. [5] Тем не менее, научные исследования начали появляться в 1998 году. [6] [7] Исследование 2001 года, [8] который проанализировал запросы поисковой системы Excite , выявил некоторые интересные характеристики веб-поиска:

  • Средняя длина запроса составила 2,4 термина.
  • Около половины пользователей ввели один запрос, а чуть менее трети пользователей ввели три или более уникальных запроса.
  • Около половины пользователей просматривали только первые одну или две страницы результатов (10 результатов на страницу).
  • Менее 5% пользователей использовали расширенные функции поиска (например, логические операторы, такие как «И», «ИЛИ» и «НЕ»).
  • Четырьмя наиболее часто используемыми терминами были (пустой поиск), и, и секс.

Исследование тех же журналов запросов Excite показало, что 19% запросов содержат географические термины (например, названия мест, почтовые индексы, географические объекты и т. д.). [9]

Исследования также показывают, что помимо коротких запросов (запросов с небольшим количеством терминов) существуют предсказуемые закономерности того, как пользователи меняют свои запросы. [10]

Исследование журналов запросов Yahoo, проведенное в 2005 году, показало, что 33% запросов одних и тех же пользователей были повторяющимися и что в 87% случаев пользователь нажимал на один и тот же результат. [11] Это говорит о том, что многие пользователи используют повторяющиеся запросы для повторного посещения или повторного поиска информации. Этот анализ подтверждается сообщением в блоге поисковой системы Bing, в котором говорится, что около 30% запросов являются навигационными. [12]

Кроме того, исследования показали, что распределение частот терминов запроса соответствует степенному закону или с длинным хвостом кривым распределения . То есть небольшая часть терминов, наблюдаемых в большом журнале запросов (например, > 100 миллионов запросов), используется чаще всего, тогда как остальные термины по отдельности используются реже. [13] Этот пример принципа Парето (или правила 80–20 ) позволяет поисковым системам использовать методы оптимизации, такие как секционирование индекса или базы данных , кэширование и предварительная выборка. Кроме того, были проведены исследования лингвистически ориентированных атрибутов, которые позволяют распознавать, является ли веб-запрос навигационным, информационным или транзакционным. [14]

Исследование 2011 года показало, что средняя длина запросов со временем неуклонно росла, а средняя длина запросов на неанглоязычных языках увеличилась больше, чем на английском. [15] Google внедрил обновление «Колибри» в августе 2013 года для обработки более длинных поисковых запросов, поскольку больше поисковых запросов являются диалоговыми (например, «где находится ближайшая кофейня?»). [16]

Структурированные запросы

[ редактировать ]

Поисковые системы, поддерживающие логические операторы и круглые скобки, позволяют применить технику, традиционно используемую библиотекарями. Пользователь, который ищет документы, охватывающие несколько тем или аспектов, может захотеть описать каждый из них путем разделения характерных слов, например: vehicles OR cars OR automobiles. — Фасетный запрос это сочетание таких фасетов; например, такой запрос, как (electronic OR computerized OR DRE) AND (voting OR elections OR election OR balloting OR electoral) скорее всего найдет документы об электронном голосовании, даже если в них опущено одно из слов «электронное» или «голосование», или даже то и другое. [17]

См. также

[ редактировать ]
  1. ^ Бродер, А. (2002). Таксономия веб-поиска. Форум СИГИР, 36 (2), 3–10.
  2. ^ Гиббонс, Кевин (11 января 2013 г.). «Делай, знай, иди: как создавать контент на каждом этапе цикла покупки» . Поисковые системы . Проверено 24 мая 2014 г.
  3. ^ Янсен, Б.Дж., Бут, Д., и Спинк, А. (2008) Определение информационных, навигационных и транзакционных целей веб-запросов , обработка информации и управление. 44(3), 1251-1266.
  4. ^ Мур, Росс. «Серверы подключения» . Издательство Кембриджского университета . Проверено 24 мая 2014 г.
  5. ^ Дон Кавамото и Элинор Миллс (2006), AOL приносит извинения за публикацию данных о поиске пользователей.
  6. ^ Янсен, Б. Дж., Спинк, А., Бейтман, Дж. и Сарацевич, Т. 1998. Поиск информации в реальной жизни: исследование пользовательских запросов в Интернете . Форум СИГИР, 32(1), 5–17.
  7. ^ Сильверстайн К., Хенцингер М., Марэ Х. и Мориц М. (1999). Анализ очень большого журнала запросов веб-поисковой системы . СИГИР Форум,33 (1), 6–12.
  8. ^ Аманда Спинк; Дитмар Вольфрам; майор Би Джей Янсен; Тефко Сарацевич (2001). «Поиск в Интернете: публика и ее запросы» (PDF) . Журнал Американского общества информатики и технологий . 52 (3): 226–234. CiteSeerX   10.1.1.23.9800 . doi : 10.1002/1097-4571(2000)9999:9999<::AID-ASI1591>3.3.CO;2-I .
  9. ^ Марк Сандерсон и Джанет Колер (2004). «Анализ географических запросов» . Материалы семинара по географической информации (SIGIR '04) .
  10. ^ Янсен, Б.Дж., Бут, Д.Л., и Спинк, А. (2009). Шаблоны изменения запроса во время веб-поиска . Журнал Американского общества информатики и технологий. 60(3), 557-570. 60 (7), 1358–1371.
  11. ^ Джейми Тиван; Эйтан Адар; Рози Джонс; Майкл Поттс (2005). «История повторяется: повторяющиеся запросы в журналах запросов Yahoo» (PDF) . Материалы 29-й ежегодной конференции ACM по исследованиям и разработкам в области информационного поиска (SIGIR '06) . стр. 703–704. дои : 10.1145/1148170.1148326 . [ постоянная мертвая ссылка ]
  12. ^ «Bing делает поиск вашим — Поиск по блогам — Блоги сайта — Сообщество Bing» . Архивировано из оригинала 14 марта 2011 г. Проверено 1 марта 2011 г.
  13. ^ Рикардо Баэса-Йейтс (2005). «Приложения анализа веб-запросов». Достижения в области поиска информации . Конспекты лекций по информатике. Том. 3408. Шпрингер Берлин/Гейдельберг. стр. 7–22. дои : 10.1007/978-3-540-31865-1_2 . ISBN  978-3-540-25295-5 .
  14. ^ Алехандро Фигероа (2015). «Изучение эффективных функций для распознавания намерений пользователя, стоящих за веб-запросами» . Компьютеры в промышленности . 68 . Эльзевир: 162–169. дои : 10.1016/j.compind.2015.01.005 .
  15. ^ Мона Тагави; Ахмед Патель; Никита Шмидт; Кристофер Уиллс; Ици Тью (2011). «Анализ журналов веб-прокси с использованием шаблона распределения запросов для поисковых систем». Журнал компьютерных стандартов и интерфейсов . 34 (1): 162–170. дои : 10.1016/j.csi.2011.07.001 .
  16. ^ Салливан, Дэнни (26 сентября 2013 г.). «Часто задаваемые вопросы: все о новом алгоритме Google «Колибри»» . Земля поисковых систем . Проверено 24 мая 2014 г.
  17. ^ Войкан Михайлович; Джорд Химстра; Хенк Эрнст Блок; Питер М.Г. Аперс (октябрь 2006 г.). «Использование структуры запроса и структуры документа для повышения эффективности поиска документов» (PDF) . {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: b1c0e610859c99954aa63ec8e797a1ea__1716283140
URL1:https://arc.ask3.ru/arc/aa/b1/ea/b1c0e610859c99954aa63ec8e797a1ea.html
Заголовок, (Title) документа по адресу, URL1:
Web query - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)