Веб-запрос
Веб -запрос или запрос веб-поиска — это запрос, который пользователь вводит в поисковую систему Интернета для удовлетворения своих информационных потребностей . Запросы веб-поиска отличаются тем, что они часто представляют собой простой текст, а логические директивы поиска используются редко. Они сильно отличаются от стандартных языков запросов , которые регулируются строгими синтаксическими правилами, как командные языки с ключевыми словами или позиционными параметрами .
Типы
[ редактировать ]Существует три широкие категории, которые охватывают большинство поисковых запросов в Интернете: информационные, навигационные и транзакционные. [1] Их еще называют «делай, знай, иди». [2] Хотя эта модель поиска не была выведена теоретически, классификация была подтверждена эмпирически с помощью реальных запросов поисковых систем. [3]
- Информационные запросы — запросы, охватывающие широкую тему (например, Колорадо или грузовики ), для которых могут быть тысячи релевантных результатов.
- Навигационные запросы – запросы, которые ищут один веб-сайт или веб-страницу одного объекта (например, YouTube или Delta Air Lines ).
- Транзакционные запросы — запросы, отражающие намерение пользователя выполнить определенное действие, например покупку автомобиля или загрузку заставки.
Поисковые системы часто поддерживают четвертый тип запросов, который используется гораздо реже:
- Запросы на подключение — запросы, которые сообщают о связности проиндексированного веб-графа (например, «Какие ссылки указывают на этот URL-адрес ?» и «Сколько страниц проиндексировано с этого доменного имени ?»). [4]
Характеристики
[ редактировать ]Большинство коммерческих поисковых систем не раскрывают свои журналы поиска, поэтому получить информацию о том, что пользователи ищут в Интернете, сложно. [5] Тем не менее, научные исследования начали появляться в 1998 году. [6] [7] Исследование 2001 года, [8] который проанализировал запросы поисковой системы Excite , выявил некоторые интересные характеристики веб-поиска:
- Средняя длина запроса составила 2,4 термина.
- Около половины пользователей ввели один запрос, а чуть менее трети пользователей ввели три или более уникальных запроса.
- Около половины пользователей просматривали только первые одну или две страницы результатов (10 результатов на страницу).
- Менее 5% пользователей использовали расширенные функции поиска (например, логические операторы, такие как «И», «ИЛИ» и «НЕ»).
- Четырьмя наиболее часто используемыми терминами были (пустой поиск), и, и секс.
Исследование тех же журналов запросов Excite показало, что 19% запросов содержат географические термины (например, названия мест, почтовые индексы, географические объекты и т. д.). [9]
Исследования также показывают, что помимо коротких запросов (запросов с небольшим количеством терминов) существуют предсказуемые закономерности того, как пользователи меняют свои запросы. [10]
Исследование журналов запросов Yahoo, проведенное в 2005 году, показало, что 33% запросов одних и тех же пользователей были повторяющимися и что в 87% случаев пользователь нажимал на один и тот же результат. [11] Это говорит о том, что многие пользователи используют повторяющиеся запросы для повторного посещения или повторного поиска информации. Этот анализ подтверждается сообщением в блоге поисковой системы Bing, в котором говорится, что около 30% запросов являются навигационными. [12]
Кроме того, исследования показали, что распределение частот терминов запроса соответствует степенному закону или с длинным хвостом кривым распределения . То есть небольшая часть терминов, наблюдаемых в большом журнале запросов (например, > 100 миллионов запросов), используется чаще всего, тогда как остальные термины по отдельности используются реже. [13] Этот пример принципа Парето (или правила 80–20 ) позволяет поисковым системам использовать методы оптимизации, такие как секционирование индекса или базы данных , кэширование и предварительная выборка. Кроме того, были проведены исследования лингвистически ориентированных атрибутов, которые позволяют распознавать, является ли веб-запрос навигационным, информационным или транзакционным. [14]
Исследование 2011 года показало, что средняя длина запросов со временем неуклонно росла, а средняя длина запросов на неанглоязычных языках увеличилась больше, чем на английском. [15] Google внедрил обновление «Колибри» в августе 2013 года для обработки более длинных поисковых запросов, поскольку больше поисковых запросов являются диалоговыми (например, «где находится ближайшая кофейня?»). [16]
Структурированные запросы
[ редактировать ]Поисковые системы, поддерживающие логические операторы и круглые скобки, позволяют применить технику, традиционно используемую библиотекарями. Пользователь, который ищет документы, охватывающие несколько тем или аспектов, может захотеть описать каждый из них путем разделения характерных слов, например: vehicles OR cars OR automobiles
. — Фасетный запрос это сочетание таких фасетов; например, такой запрос, как (electronic OR computerized OR DRE) AND (voting OR elections OR election OR balloting OR electoral)
скорее всего найдет документы об электронном голосовании, даже если в них опущено одно из слов «электронное» или «голосование», или даже то и другое. [17]
См. также
[ редактировать ]- Поиск информации
- Веб-поисковая система
- Классификация веб-запросов
- Таксономия для поисковых систем
- Намерение пользователя
Ссылки
[ редактировать ]- ^ Бродер, А. (2002). Таксономия веб-поиска. Форум СИГИР, 36 (2), 3–10.
- ^ Гиббонс, Кевин (11 января 2013 г.). «Делай, знай, иди: как создавать контент на каждом этапе цикла покупки» . Поисковые системы . Проверено 24 мая 2014 г.
- ^ Янсен, Б.Дж., Бут, Д., и Спинк, А. (2008) Определение информационных, навигационных и транзакционных целей веб-запросов , обработка информации и управление. 44(3), 1251-1266.
- ^ Мур, Росс. «Серверы подключения» . Издательство Кембриджского университета . Проверено 24 мая 2014 г.
- ^ Дон Кавамото и Элинор Миллс (2006), AOL приносит извинения за публикацию данных о поиске пользователей.
- ^ Янсен, Б. Дж., Спинк, А., Бейтман, Дж. и Сарацевич, Т. 1998. Поиск информации в реальной жизни: исследование пользовательских запросов в Интернете . Форум СИГИР, 32(1), 5–17.
- ^ Сильверстайн К., Хенцингер М., Марэ Х. и Мориц М. (1999). Анализ очень большого журнала запросов веб-поисковой системы . СИГИР Форум,33 (1), 6–12.
- ^ Аманда Спинк; Дитмар Вольфрам; майор Би Джей Янсен; Тефко Сарацевич (2001). «Поиск в Интернете: публика и ее запросы» (PDF) . Журнал Американского общества информатики и технологий . 52 (3): 226–234. CiteSeerX 10.1.1.23.9800 . doi : 10.1002/1097-4571(2000)9999:9999<::AID-ASI1591>3.3.CO;2-I .
- ^ Марк Сандерсон и Джанет Колер (2004). «Анализ географических запросов» . Материалы семинара по географической информации (SIGIR '04) .
- ^ Янсен, Б.Дж., Бут, Д.Л., и Спинк, А. (2009). Шаблоны изменения запроса во время веб-поиска . Журнал Американского общества информатики и технологий. 60(3), 557-570. 60 (7), 1358–1371.
- ^ Джейми Тиван; Эйтан Адар; Рози Джонс; Майкл Поттс (2005). «История повторяется: повторяющиеся запросы в журналах запросов Yahoo» (PDF) . Материалы 29-й ежегодной конференции ACM по исследованиям и разработкам в области информационного поиска (SIGIR '06) . стр. 703–704. дои : 10.1145/1148170.1148326 . [ постоянная мертвая ссылка ]
- ^ «Bing делает поиск вашим — Поиск по блогам — Блоги сайта — Сообщество Bing» . Архивировано из оригинала 14 марта 2011 г. Проверено 1 марта 2011 г.
- ^ Рикардо Баэса-Йейтс (2005). «Приложения анализа веб-запросов». Достижения в области поиска информации . Конспекты лекций по информатике. Том. 3408. Шпрингер Берлин/Гейдельберг. стр. 7–22. дои : 10.1007/978-3-540-31865-1_2 . ISBN 978-3-540-25295-5 .
- ^ Алехандро Фигероа (2015). «Изучение эффективных функций для распознавания намерений пользователя, стоящих за веб-запросами» . Компьютеры в промышленности . 68 . Эльзевир: 162–169. дои : 10.1016/j.compind.2015.01.005 .
- ^ Мона Тагави; Ахмед Патель; Никита Шмидт; Кристофер Уиллс; Ици Тью (2011). «Анализ журналов веб-прокси с использованием шаблона распределения запросов для поисковых систем». Журнал компьютерных стандартов и интерфейсов . 34 (1): 162–170. дои : 10.1016/j.csi.2011.07.001 .
- ^ Салливан, Дэнни (26 сентября 2013 г.). «Часто задаваемые вопросы: все о новом алгоритме Google «Колибри»» . Земля поисковых систем . Проверено 24 мая 2014 г.
- ^ Войкан Михайлович; Джорд Химстра; Хенк Эрнст Блок; Питер М.Г. Аперс (октябрь 2006 г.). «Использование структуры запроса и структуры документа для повышения эффективности поиска документов» (PDF) .
{{cite journal}}
: Для цитирования журнала требуется|journal=
( помощь )