Jump to content

Человеко-компьютерный поиск информации

Поиск информации человеком-компьютером ( HCIR ) — это исследование и разработка методов поиска информации , которые используют человеческий интеллект в процессе поиска . Он объединяет области взаимодействия человека и компьютера (HCI) и поиска информации (IR) и создает системы, которые улучшают поиск, принимая во внимание человеческий контекст или посредством многоэтапного процесса поиска, который обеспечивает возможность обратной связи с человеком.

Этот термин «поиск информации человеком и компьютером» был придуман Гэри Маркионини в серии лекций, прочитанных в период с 2004 по 2006 год. [ 1 ] Основной тезис Маркионини заключается в том, что «HCIR стремится дать людям возможность исследовать крупномасштабные информационные базы, но требует, чтобы люди также взяли на себя ответственность за этот контроль, затрачивая когнитивную и физическую энергию».

была проведена пара семинаров В 1996 и 1998 годах в Университете Глазго по поиску информации и взаимодействию человека и компьютера , направленная на устранение совпадения между этими двумя областями. Маркионини отмечает влияние Всемирной паутины и внезапный рост информационной грамотности – изменения, которые в конце 1990-х годов находились в зачаточном состоянии.

Несколько семинаров были посвящены пересечению IR и HCI. Семинар по исследовательскому поиску, инициированный Университета Мэриленда в 2005 году, чередуется с Лабораторией взаимодействия человека и компьютера конференциями Специальной группы по поиску информации (SIGIR) и Специальной группы по взаимодействию человека и компьютера (CHI). Также в 2005 году Европейский научный фонд провел исследовательский семинар по поиску информации в контексте. был проведен первый семинар по поиску информации с помощью компьютера Затем в 2007 году в Массачусетском технологическом институте .

Описание

[ редактировать ]

HCIR включает в себя различные аспекты IR и HCI. К ним относятся исследовательский поиск , при котором пользователи обычно сочетают стратегии запроса и просмотра, чтобы способствовать обучению и исследованию; поиск информации в контексте (т. е. с учетом аспектов пользователя или среды, которые обычно не отражаются в запросе); и интерактивный поиск информации, который Питер Ингверсен определяет как «процессы интерактивной связи, которые происходят во время поиска информации с участием всех основных участников поиска информации (ПИ), то есть пользователя, посредника и системы ИР». [ 2 ]

Ключевой задачей HCIR является то, чтобы системы IR, предназначенные для пользователей-людей, внедрялись и оценивались таким образом, чтобы отражать потребности этих пользователей. [ 3 ]

Большинство современных IR-систем используют ранжированную модель поиска, в которой документы оцениваются на основе вероятности документа релевантности запросу. [ 4 ] В этой модели система представляет пользователю только документы с самым высоким рейтингом. Эти системы обычно оцениваются на основе их средней точности по набору эталонных запросов от таких организаций, как Text Retrival Conference (TREC).

Из-за акцента на использовании человеческого интеллекта в процессе поиска информации, HCIR требует различных моделей оценки – той, которая сочетает в себе оценку компонентов системы IR и HCI. Ключевая область исследований в области HCIR включает оценку этих систем. Ранние работы по интерактивному поиску информации, такие как исследование Юргена Кунеманна и Николаса Дж. Белкина в 1996 году различных уровней взаимодействия для автоматического переформулирования запросов, используют стандартные IR-меры точности и полноты , но применяют их к результатам нескольких итераций пользователя. взаимодействие, а не одиночный ответ на запрос. [ 5 ] В других исследованиях HCIR, таких как модель оценки IIR Пиа Борлунд , применяется методология, больше напоминающая HCI, с упором на характеристики пользователей, детали экспериментального плана и т. д. [ 6 ]

Исследователи HCIR выдвинули следующие цели: создать систему, в которой пользователь будет иметь больше контроля над определением соответствующих результатов. [ 1 ] [ 7 ]

Системы должны

  • больше не только доставляет соответствующие документы, но также должен предоставлять семантическую информацию вместе с этими документами.
  • повысить ответственность пользователей, а также контроль; то есть информационные системы требуют интеллектуальных усилий человека
  • иметь гибкую архитектуру, чтобы они могли развиваться и адаптироваться к все более требовательным и знающим пользовательским базам.
  • стремитесь быть частью информационной экологии личных и общих воспоминаний и инструментов, а не отдельными автономными услугами.
  • поддерживать весь жизненный цикл информации (от создания до сохранения), а не только этап распространения или использования
  • поддержка настройки конечными пользователями и особенно специалистами по информационным технологиям, которые повышают ценность информационных ресурсов
  • быть интересным и интересным в использовании

Короче говоря, ожидается, что системы поиска информации будут работать так же, как хорошие библиотеки. Системы должны помогать пользователям преодолевать разрыв между данными или информацией (в очень узком и детальном смысле этих терминов) и знаниями (обработанными данными или информацией, которые обеспечивают контекст, необходимый для информирования следующей итерации процесса поиска информации). То есть хорошие библиотеки предоставляют как информацию, необходимую посетителю, так и партнера в процессе обучения — специалиста по информации — который помогает ориентироваться в этой информации, осмысливать ее, сохранять и превращать ее в знания (что, в свою очередь, создает новые знания). , требуется более информированная информация).

Методы, связанные с HCIR, делают упор на представление информации, использующее человеческий интеллект, чтобы привести пользователя к релевантным результатам. Эти методы также направлены на то, чтобы позволить пользователям исследовать и анализировать набор данных без каких-либо штрафов, т. е. без ненужных затрат времени, щелчков мышью или изменения контекста.

Многие поисковые системы имеют функции, включающие методы HCIR. Предложения по правописанию и автоматическое переформулирование запроса предоставляют механизмы, предлагающие потенциальные пути поиска, которые могут привести пользователя к релевантным результатам. Эти предложения предоставляются пользователю, передавая ему контроль над выбором и интерпретацией.

Фасетный поиск позволяет пользователям перемещаться по информации иерархически , переходя от категории к ее подкатегориям, но выбирая порядок представления категорий. Это контрастирует с традиционными таксономиями , в которых иерархия категорий фиксирована и неизменна. Фасетная навигация , как и таксономическая навигация, направляет пользователей, показывая им доступные категории (или фасеты), но не требует от них просмотра иерархии, которая может не совсем соответствовать их потребностям или образу мышления. [ 8 ]

Lookahead обеспечивает общий подход к исследованию без штрафов. Например, различные веб-приложения используют AJAX для автоматического заполнения условий запроса и предложения популярных поисковых запросов. Другим распространенным примером упреждающего просмотра является способ, которым поисковые системы аннотируют результаты со сводной информацией об этих результатах, включая как статическую информацию (например, метаданные об объектах), так и «фрагменты» текста документа, которые наиболее подходят к словам в поиске. запрос.

Обратная связь по релевантности позволяет пользователям управлять системой IR, указывая, являются ли конкретные результаты более или менее релевантными. [ 9 ]

Суммирование и аналитика помогают пользователям усвоить результаты запроса. Под обобщением здесь подразумеваются любые средства агрегирования или сжатия результатов запроса в более удобную для человека форму. Фасетный поиск, описанный выше, является одной из таких форм обобщения. Другой вариант — кластеризация , которая анализирует набор документов путем группировки похожих или одновременно встречающихся документов или терминов. Кластеризация позволяет разделить результаты на группы связанных документов. Например, поиск по запросу «java» может возвращать кластеры для Java (язык программирования) , Java (остров) или Java (кофе) .

Визуальное представление данных также считается ключевым аспектом HCIR. Представление обобщения или аналитики может отображаться в виде таблиц, диаграмм или сводок агрегированных данных. Другие виды визуализации информации , которые позволяют пользователям получить доступ к сводным представлениям результатов поиска, включают облака тегов и древовидное отображение .

[ редактировать ]
  1. ^ Перейти обратно: а б Маркионини, Г. (2006). Бюллетень «На пути к информационному поиску человека и компьютера», июнь/июль 2006 г., Бюллетень Американского общества информатики.
  2. ^ «Ингверсен, П. (1992). Взаимодействие при поиске информации. Лондон: Тейлор Грэм» . Архивировано из оригинала 25 ноября 2007 г. Проверено 28 ноября 2007 г.
  3. ^ «Рабочая группа Мира (1996). Рамки оценки для приложений интерактивного мультимедийного поиска информации» . Архивировано из оригинала 1 февраля 2008 г.
  4. ^ Гроссман Д. и Фридер О. (2004). Алгоритмы и эвристики информационного поиска.
  5. ^ Кенеманн, Дж. и Белкин, Нью-Джерси (1996). Аргументы в пользу взаимодействия: исследование поведения и эффективности интерактивного поиска информации. В материалах конференции SIGCHI по человеческому фактору в вычислительных системах: точки соприкосновения (Ванкувер, Британская Колумбия, Канада, 13–18 апреля 1996 г.). М. Дж. Таубер, Эд. ЧИ '96. ACM Press, Нью-Йорк, Нью-Йорк, 205–212.
  6. ^ Борлунд, П. (2003). Модель оценки IIR: основа оценки интерактивных систем поиска информации. Информационные исследования, 8 (3), документ 152
  7. ^ Уайт Р., Капра Р., Головчинский Г., Кулес Б., Смит К. и Тункеланг Д. (2013). Введение в специальный выпуск по поиску информации «человек-компьютер». Журнал обработки информации и управления 49 (5), 1053-1057.
  8. ^ Херст, М. (1999). Пользовательские интерфейсы и визуализация, глава 10 книги Баеза-Йейтс Р. и Рибейро-Нето Б. Современный поиск информации.
  9. ^ Роккио, Дж. (1971). Релевантность обратной связи при поиске информации. В: Солтон, Дж. (редактор), Поисковая система SMART.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 234a1c09c63ef09162f6849735dd6b09__1636022460
URL1:https://arc.ask3.ru/arc/aa/23/09/234a1c09c63ef09162f6849735dd6b09.html
Заголовок, (Title) документа по адресу, URL1:
Human–computer information retrieval - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)