Сессия (веб-аналитика)
В веб-аналитике сеанс — или посещение это единица измерения действий пользователя, предпринятых в течение определенного периода времени или в отношении выполнения задачи. Сессии также используются для оперативной аналитики и предоставления рекомендаций для конкретных пользователей . Для определения сеанса используются два основных метода: подходы, ориентированные на время, основанные на непрерывности активности пользователя, и подходы, основанные на навигации, основанные на непрерывности цепочки запрошенных страниц.
Определение
[ редактировать ]Определение «сеанса» варьируется, особенно применительно к поисковым системам . [1] Обычно под сеансом понимают «последовательность запросов, сделанных одним конечным пользователем во время посещения определенного сайта». [2] В контексте поисковых систем «сеансы» и «сеансы запросов» имеют как минимум два определения. [1] Сеанс или сеанс запросов могут представлять собой все запросы, сделанные пользователем в определенный период времени. [3] или это также может быть серия запросов или переходов, связанных с постоянными базовыми потребностями пользователя. [4] [5]
Использование
[ редактировать ]Количество сеансов на пользователя можно использовать для измерения использования веб-сайта. [6] [7] Другие показатели, используемые в исследованиях и прикладной веб-аналитике, включают продолжительность сеанса, [8] и действия пользователя за сеанс. [9] Продолжительность сеанса рассматривается как более точная альтернатива измерению просмотров страниц . [10]
Восстановленные сеансы также использовались для измерения общего объема пользовательского ввода, в том числе для измерения количества рабочих часов, затраченных на создание Википедии . [11] Сессии также используются для оперативной аналитики, анонимизации данных , выявления сетевых аномалий и генерации синтетической рабочей нагрузки для тестирования серверов с искусственным трафиком. [12] [13]
Реконструкция сеанса
[ редактировать ]Для использования сеансов в веб-аналитике крайне важно иметь возможность их идентифицировать. Это известно как «реконструкция сеанса». Подходы к реконструкции сеанса можно разделить на две основные категории: ориентированные на время и ориентированные на навигацию. [14]
Подходы, ориентированные на время
[ редактировать ]Подходы к реконструкции сеанса, ориентированные на время, предусматривают установленный период бездействия пользователя, обычно называемый «порогом бездействия». По достижении этого периода бездействия предполагается, что пользователь покинул сайт или полностью прекратил использовать браузер, и сеанс завершается. Дальнейшие запросы от того же пользователя считаются вторым сеансом. Обычное значение порога бездействия составляет 30 минут и иногда считается отраслевым стандартом. [15] [16] Некоторые утверждали, что порог в 30 минут приводит к артефактам в ходе естественно длительных сеансов, и экспериментировали с другими порогами. [17] [18] Другие просто заявляют: «Ни один временной порог не эффективен для идентификации [сессий]». [19]
Одной из предложенных альтернатив является использование пороговых значений, специфичных для пользователя, а не единого глобального порогового значения для всего набора данных. [20] [21] Проблема состоит в том, что пороговые значения следуют бимодальному распределению и не подходят для наборов данных, охватывающих длительный период времени. [17]
Навигационно-ориентированные подходы
[ редактировать ]Подходы, ориентированные на навигацию, используют структуру веб-сайтов, в частности, наличие гиперссылок и склонность пользователей перемещаться между страницами одного и того же веб-сайта, нажимая на них, а не вводя полный URL-адрес в свой браузер. [14] Одним из способов идентификации сеансов на основе этих данных является построение карты веб-сайта: если можно идентифицировать первую страницу пользователя, «сеанс» действий длится до тех пор, пока они не попадут на страницу, к которой нельзя получить доступ ни с одной из предыдущих страниц. -доступные страницы. При этом учитывается возврат, когда пользователь повторяет свои шаги перед открытием новой страницы. [22] Более простой подход, который не принимает во внимание возврат назад, состоит в том, чтобы просто потребовать, чтобы HTTP-реферер каждого запроса был страницей, которая уже находится в сеансе. Если это не так, создается новый сеанс. [23] Этот класс эвристики «демонстрирует очень низкую производительность» на веб-сайтах, содержащих наборы фреймов . [24]
Ссылки
[ редактировать ]- ^ Jump up to: а б Гайо-Авелло 2009 , с. 1824.
- ^ Арлитт 2000 , с. 2.
- ^ Донато, Бончи и Чи 2010 , стр. 324.
- ^ Гайо-Авелло 2009 , с. 1825.
- ^ Лам, Рассел и Тан 2007 , стр. 147.
- ^ Weischdel & Huizingh 2006 , с. 464.
- ^ Catledge & Pitkow 1995 , с. 5.
- ^ Янсен и Спинк 2006 , с. 10.
- ^ Янсен, Спинк и Сарацевич 2000 , стр. 12.
- ^ Ху и др. 2008 , с. 377.
- ^ Гейгер и Халфакер 2014 , с. 1.
- ^ Мейсс и др. 2009 , с. 177.
- ^ Арлитт 2000 , с. 8.
- ^ Jump up to: а б Спилиопулу и др. 2003 , с. 176.
- ^ Ортега и Агильо 2010 , с. 332.
- ^ Эйкхофф и др. 2014 , с. 3.
- ^ Jump up to: а б Мехрзади и Фейтельсон 2012 , с. 3.
- ^ Он, Гокер и Харпер 2002 , с. 733.
- ^ Джонс и Клинкнер 2008 , с. 2.
- ^ Мюррей, Лин и Чоудхури 2006 , стр. 3.
- ^ Мехрзади и Фейтельсон 2012 , с. 1.
- ^ Кули, Мобашер и Шривастава 1999 , стр. 19.
- ^ Кули, Мобашер и Шривастава 1999 , стр. 23.
- ^ Берендт и др. 2003 , стр. 179.
Библиография
[ редактировать ]- Арлитт, Мартин (2000). «Характеристика сеансов веб-пользователей» (PDF) . Обзор оценки производительности SIGMETRICS . 28 (2): 50–63. дои : 10.1145/362883.362920 . S2CID 2946044 .
- Берендт, Беттина; Мобашер, Бамшад; Накагава, Мики; Спилиопулу, Майра (2003). «Влияние структуры сайта и пользовательской среды на реконструкцию сеанса при анализе использования веб-страниц» (PDF) . WEBKDD 2002 — Анализ веб-данных для обнаружения моделей и профилей использования . Конспекты лекций по информатике. Том. 2703. Спрингер. стр. 159–179. дои : 10.1007/978-3-540-39663-5_10 . ISBN 978-3-540-39663-5 .
- Кэтледж, Л.; Питкоу, Дж. (1995). «Характеристика стратегий просмотра во Всемирной паутине» (PDF) . Компьютерные сети и системы Isdn . 27 (6): 1065–1073. дои : 10.1016/0169-7552(95)00043-7 . S2CID 14313721 .
- Кули, Роберт; Мобашер, Бамшад; Шривастава, Джайдип (1999). «Подготовка данных для анализа шаблонов просмотра Всемирной паутины» (PDF) . Знания и информационные системы . 1 (1): 5–32. CiteSeerX 10.1.1.33.2792 . дои : 10.1007/BF03325089 . ISSN 0219-3116 . S2CID 1165622 .
- Донато, Дебора ; Бончи, Франческо; Чи, Том (2010). «Хотите делать заметки?: Определение исследовательских миссий в поисковой панели Yahoo!» (PDF) . Материалы 19-й международной конференции по Всемирной паутине . АКМ. стр. 321–330. дои : 10.1145/1772690.1772724 . ISBN 9781605587998 . S2CID 6951065 .
- Эйкхофф, Карстен; Тиван, Джейме; Уайт, Райен; Дюмэ, Сьюзен. (2014). «Уроки путешествия». Материалы 7-й международной конференции ACM по веб-поиску и интеллектуальному анализу данных (PDF) . АКМ. стр. 223–232. дои : 10.1145/2556195.2556217 . ISBN 9781450323512 . S2CID 14666769 .
- Гайо-Авелло, Даниэль (2009). «Опрос по методам обнаружения сеансов в журналах запросов и предложения по будущей оценке» (PDF) . Информационные науки . 179 (12): 1822–1843. дои : 10.1016/j.ins.2009.01.026 . hdl : 10651/8686 . ISSN 0020-0255 . Архивировано из оригинала (PDF) 4 марта 2016 г. Проверено 18 февраля 2015 г.
- Гейгер, Р.С.; Халфакер, А. (2014). «Использование сеансов редактирования для измерения участия в Википедии». Материалы конференции 2013 г. по совместной работе с компьютерной поддержкой (PDF) . АКМ. стр. 861–870. дои : 10.1145/2441776.2441873 . ISBN 9781450313315 . S2CID 7166943 .
- Он, Дацин; Гокер, Айше; Харпер, Дэвид Дж. (2002). «Объединение доказательств для автоматической идентификации веб-сессии». Обработка информации и управление . 38 (5): 727–742. дои : 10.1016/S0306-4573(01)00060-7 . ISSN 0306-4573 .
- Хир, Джеффри; Чи, Эд Х. (2002). «Разделение роя: методы категоризации пользовательских сеансов в Интернете» (PDF) . Материалы конференции SIGCHI по человеческому фактору в вычислительных системах . Том. 4. АКМ. стр. 243–250. дои : 10.1145/503376.503420 . ISBN 1581134533 . S2CID 14018957 .
- Хуанг, Чиен-Канг; Чиен, Ли-Фэн; Оян, Йен-Джен (2003). «Предложение соответствующего термина при интерактивном веб-поиске на основе контекстной информации в журналах сеансов запросов». Журнал Американского общества информатики и технологий . 54 (7): 638–649. CiteSeerX 10.1.1.105.5584 . дои : 10.1002/asi.10256 .
- Янсен, Бернард Дж.; Спинк, Аманда; Сарацевич, Тефко (2000). «Реальная жизнь, реальные пользователи и реальные потребности: исследование и анализ запросов пользователей в сети» (PDF) . Обработка информации и управление . 36 (2): 207–227. CiteSeerX 10.1.1.155.1383 . дои : 10.1016/S0306-4573(99)00056-4 . ISSN 0306-4573 .
- Янсен, Бернард Дж.; Спинк, Аманда (2006). «Как мы ищем информацию во всемирной паутине? Сравнение девяти журналов транзакций поисковых систем» (PDF) . Обработка информации и управление . 42 (1): 248–263. дои : 10.1016/j.ipm.2004.10.007 . ISSN 0306-4573 .
- Джонс, Рози; Клинкнер, Кристина Лиза (2008). «Помимо тайм-аута сеанса: автоматическая иерархическая сегментация тем поиска в журналах запросов». Материалы 17-й конференции ACM по управлению информацией и знаниями (PDF) . АКМ. стр. 699–708. дои : 10.1145/1458082.1458176 . ISBN 9781595939913 . S2CID 6548724 .
- Ху, Майкл; Пагано, Джо; Вашингтон, Энн Л.; Рекер, Мими; Палмер, Барт; Донахью, Роберт А. (2008). «Использование веб-метрик для анализа цифровых библиотек» (PDF) . Материалы 8-й совместной конференции ACM/IEEE-CS по цифровым библиотекам . АКМ.
- Лам, Хайди ; Рассел, Дэниел; Тан, Дайан (2007). «Просмотр сеанса: визуальный исследовательский анализ журналов веб-сеансов». Симпозиум IEEE по науке и технологиям визуальной аналитики . IEEE.
- Мехрзади, Дэвид; Фейтельсон, Дрор Г. (2012). «Об извлечении данных сеанса из журналов активности» (PDF) . Материалы 5-й ежегодной международной конференции по системам и хранилищам . СИСТОР '12. АКМ. CiteSeerX 10.1.1.381.1956 . дои : 10.1145/2367589.2367592 . ISBN 978-1-4503-1448-0 . S2CID 8820623 .
- Мейс, Марк; Дункан, Джон; Гонсалвес, Бруно; Рамаско, Хосе Дж.; Менцер, Филиппо (2009). «Что входит в сеанс: отслеживание индивидуального поведения в Интернете» (PDF) . Материалы 20-й конференции ACM по гипертексту и гипермедиа . АКМ. стр. 173–182. arXiv : 1003.5325 . дои : 10.1145/1557914.1557946 . ISBN 9781605584867 . S2CID 6564335 .
- Менаске, Дэниел А.; Алмейда, В.; Фонсека, Р.; Мендес, М. (1999). «Методология характеристики рабочей нагрузки сайтов электронной коммерции» (PDF) . Материалы 1-й конференции ACM по электронной коммерции . АКМ. стр. 119–128. дои : 10.1145/336992.337024 . ISBN 1581131763 . S2CID 7239612 .
- Мюррей, Дж. Крейг; Лин, Джимми; Чоудхури, Абдур (2006). «Идентификация пользовательских сеансов с помощью иерархической агломеративной кластеризации» (PDF) . Труды Американского общества информатики и технологий . 43 (1): 1–9. дои : 10.1002/meet.14504301312 .
- Ортега, Дж.Л.; Агильо, И. (2010). «Различия между веб-сессиями в зависимости от происхождения их посещений» (PDF) . Журнал информаметрики . 4 (3): 331–337. дои : 10.1016/j.joi.2010.02.001 . ISSN 1751-1577 .
- Спилиопулу, Майра; Мобашер, Бамшад; Берендт, Беттина; Накагава, Мики (2003). «Среда оценки эвристики реконструкции сеанса при анализе использования Интернета» (PDF) . ИНФОРМС Журнал по вычислительной технике . 15 (2): 171–190. CiteSeerX 10.1.1.621.3037 . дои : 10.1287/ijoc.15.2.171.14445 . ISSN 1526-5528 .
- Вайшдель, Биргит; Хейзинг, Элко КРЭ (2006). «Оптимизация сайта с помощью веб-метрик». Материалы 8-й международной конференции «Электронная коммерция: новая электронная коммерция: инновации для преодоления существующих барьеров, препятствий и ограничений для ведения успешного бизнеса в Интернете» - ICEC '06 (PDF) . п. 463. дои : 10.1145/1151454.1151525 . ISBN 978-1595933928 . S2CID 2965255 .