Облако тегов


Облако тегов (также известное как облако слов или взвешенный список в визуальном дизайне) — это визуальное представление текстовых данных, которое часто используется для отображения метаданных ключевых слов на веб-сайтах или для визуализации текста произвольной формы. Теги обычно представляют собой отдельные слова, и важность каждого тега отображается размером или цветом шрифта. [2] [3] При использовании в качестве средств навигации по веб-сайту термины представляют собой гиперссылки на элементы, связанные с тегом.
История
[ редактировать ]
На языке визуального дизайна облако тегов (или облако слов) — это один из видов «взвешенного списка», который обычно используется на географических картах для представления относительного размера городов с точки зрения относительного размера шрифта. Ранним печатным примером взвешенного списка английских ключевых слов были «файлы подсознания» в книге Дугласа Коупленда « Microserfs » (1995). Появление в Германии произошло в 1992 году. [4]
Специфическая визуальная форма и широкое использование термина «облако тегов» приобрели известность в первом десятилетии 21 века как широко распространенная особенность ранних веб-сайтов и блогов Web 2.0 , используемая в первую очередь для визуализации частотного распределения метаданных ключевых слов, описывающих веб-сайт. контент и в качестве средства навигации.
Первые облака тегов на известном веб-сайте появились на сайте обмена фотографиями Flickr , созданном соучредителем Flickr и дизайнером взаимодействия Стюартом Баттерфилдом в 2004 году. Эта реализация была основана на поисковой ссылке Zeitgeist Джима Фланагана, [5] визуализация ссылок на веб-сайты. Примерно в то же время облака тегов были популяризированы, в частности, Del.icio.us и Technorati .
Перенасыщение методом облака тегов и двойственное отношение к его полезности в качестве инструмента веб-навигации привели к снижению его использования среди первых пользователей. [6] Flickr произнес вступительную речь из пяти слов на премию Webby Award 2006 года «Best Practices» , в которой просто говорилось: «Извините за облака тегов». [7]
Второе поколение разработчиков программного обеспечения открыло более широкое разнообразие применений облаков тегов как основного метода визуализации текстовых данных. В этом контексте было предложено несколько расширений облаков тегов.
Типы
[ редактировать ]
существует три основных типа приложений облака тегов В социальном программном обеспечении , отличающихся своим значением, а не внешним видом. В первом типе имеется тег для частоты каждого элемента, тогда как во втором типе существуют глобальные облака тегов, в которых частоты агрегируются по всем элементам и пользователям. В третьем типе облако содержит категории, размер которых указывает на количество подкатегорий.
Частота
[ редактировать ]В первом типе размер представляет собой количество раз, когда тег был применен к одному элементу. [8] Это полезно как средство отображения метаданных об элементе, за который было проведено демократическое «голосование» и где точные результаты нежелательны.
Во втором, более распространенном типе, [ нужна ссылка ] Размер представляет собой количество элементов, к которым был применен тег, и отражает популярность каждого тега .
Значение
[ редактировать ]Вместо частоты можно использовать размер для представления значимости слов и совпадений слов по сравнению с фоновым корпусом (например, по сравнению со всем текстом в Википедии). [9] Этот подход нельзя использовать отдельно, он основан на сравнении частоты появления документов с ожидаемыми распределениями.
Категоризация
[ редактировать ]В третьем типе теги используются как метод категоризации элементов контента. Теги представлены в облаке, где более крупные теги представляют количество элементов контента в этой категории.
Существует несколько подходов к созданию кластеров тегов вместо облаков тегов, например, путем применения совместного появления тегов в документах. [10]
В более общем плане тот же визуальный метод можно использовать для отображения данных без тегов. [11] как в облаке слов или облаке данных.
Термин « облако ключевых слов» иногда используется как термин поискового маркетинга (SEM), который относится к группе ключевых слов, имеющих отношение к конкретному веб-сайту. В последние годы облака тегов приобрели популярность благодаря своей роли в поисковой оптимизации веб-страниц, а также поддержке пользователя в эффективной навигации по контенту в информационной системе. [12] Облака тегов как инструмент навигации делают ресурсы веб-сайта более связанными, [13] при сканировании пауком поисковой системы, что может повысить рейтинг сайта в поисковых системах . С точки зрения пользовательского интерфейса они часто используются для обобщения результатов поиска, чтобы помочь пользователю быстрее найти контент в конкретной информационной системе. [14]
Внешний вид
[ редактировать ]Облака тегов обычно представляются с помощью встроенных элементов HTML . Теги могут располагаться в алфавитном порядке, в случайном порядке, их можно сортировать по весу и так далее. Иногда помимо размера шрифта манипулируют и другими визуальными свойствами, такими как цвет, интенсивность или насыщенность шрифта. [15] Наиболее популярным является прямоугольное расположение тегов с алфавитной сортировкой в последовательном построчном расположении. Решение об оптимальном макете должно основываться на ожидаемых целях пользователя. [15] Некоторые предпочитают группировать теги семантически, чтобы похожие теги появлялись рядом друг с другом. [16] [17] [18] или используйте методы встраивания, такие как tSNE, для позиционирования слов. [9] Можно добавить края, чтобы подчеркнуть совпадение тегов и визуализировать взаимодействие. [9] Эвристику можно использовать для уменьшения размера облака тегов независимо от того, является ли целью кластеризация тегов. [17]
Визуальная таксономия облака тегов определяется рядом атрибутов: правилом упорядочения тегов (например, по алфавиту, по важности, по контексту, случайным образом, упорядочено по визуальному качеству), формой всего облака (например, прямоугольной, круговой, с учетом границ карты), формой границ тега (прямоугольник или тело символа), вращение тега (нет, бесплатно, ограничено), выравнивание тега по вертикали (с соблюдением типографских базовых линий, бесплатно). Облако тегов в сети должно решать проблемы моделирования и управления эстетикой, построения двумерного макета тегов, и все это должно быть выполнено в короткие сроки на нестабильной платформе браузера. Облака тегов, которые будут использоваться в Интернете, должны быть в формате HTML , а не в графике, чтобы сделать их читабельными для роботов. Они должны быть созданы на стороне клиента с использованием шрифтов, доступных в браузере, и должны помещаться в прямоугольную рамку. [19]
Облака данных
[ редактировать ]
Облако данных или облачные данные — это отображение данных, в котором для обозначения числовых значений используется размер и/или цвет шрифта. [20] Это похоже на облако тегов [21] но вместо количества слов отображает такие данные, как численность населения или цены на фондовом рынке .
Текстовые облака
[ редактировать ]

Текстовое облако или облако слов — это визуализация частоты слов в заданном тексте в виде взвешенного списка. [23] Эта техника недавно появилась [ когда? ] широко использовался для визуализации актуального содержания политических выступлений. [22] [24]
Разместите облака
[ редактировать ]Расширяя принципы текстового облака, совместное облако обеспечивает более четкое представление документа или корпуса . Вместо обобщения всего документа совместное облако проверяет использование определенного слова. Полученное облако содержит слова, которые часто используются вместе с искомым словом. Эти коллокации отформатированы так, чтобы показывать частоту (как размер), а также силу коллокации (как яркость). Это обеспечивает интерактивные способы просмотра и изучения языка. [25]
Восприятие
[ редактировать ]Облака тегов были предметом исследования в нескольких исследованиях удобства использования. Следующее резюме основано на обзоре результатов исследований, предоставленных Lohmann et al.: [15]
- Размер тега: большие теги привлекают больше внимания пользователя, чем маленькие (на эффект влияют дополнительные свойства, например, количество символов, положение, соседние теги).
- Сканирование: пользователи сканируют, а не читают облака тегов.
- Центрирование: теги в середине облака привлекают больше внимания пользователя, чем теги вблизи границ (эффект зависит от макета ).
- Позиция: верхний левый квадрант получает больше внимания пользователей, чем остальные (западные привычки чтения).
- Исследование. Облака тегов обеспечивают неоптимальную поддержку при поиске определенных тегов (если они не имеют очень большого размера шрифта).
Феликс и др. [26] сравнили, чем производительность чтения человека отличается от традиционных облаков тегов, которые сопоставляют числовые значения с размером шрифта, и альтернативных дизайнов, в которых используются, например, цвет или дополнительные формы, такие как круг и полоса. Они также сравнили, как различное расположение слов влияет на производительность.
- Использование дополнительной полосы или круга вместо размера шрифта повышает точность при чтении числового значения.
- Однако пользователи могут найти конкретное слово быстрее, если не используется дополнительный знак.
- Производительность зависит от задачи, на простые задачи, такие как поиск слова, сильно влияет выбор дизайна, однако влияние на такие задачи, как определение темы облака тегов, гораздо меньше.
Создание
[ редактировать ]
В принципе, размер шрифта тега в облаке тегов определяется его частотой. Например, для облака слов категорий, таких как веб-журналы, частота соответствует количеству записей веб-журнала, отнесенных к категории. Для меньших частот можно напрямую указать размеры шрифта, от единицы до максимального размера шрифта. Для больших значений следует произвести масштабирование. При линейной нормализации вес дескриптора отображается в масштабе от 1 до f , где и указывают диапазон доступных весов.
- для ; еще
- : размер шрифта отображения
- : макс. размер шрифта
- : считать
- : мин. считать
- : макс. считать
Поскольку количество индексированных элементов на один дескриптор обычно распределяется по степенному закону , [28] для более широких диапазонов значений логарифмическое представление. имеет смысл [29]
Реализации облаков тегов также включают анализ текста и фильтрацию бесполезных тегов, таких как общие слова, цифры и знаки препинания.
Существуют также веб-сайты, создающие облака тегов с искусственным или случайным весом для рекламы или юмористических результатов.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Генератор Word-Cloud (архив)
- ^ Мартин Халви и Марк Т. Кин, Оценка методов представления тегов , заархивировано 14 мая 2017 г. в Wayback Machine , презентация плаката на WWW 2007, 2007 г.
- ^ Гелич, Денис; Траттнер, Кристоф; Стромайер, Маркус; Эндрюс, Кейт (2011). «Полезны ли облака тегов для навигации? Сетевой анализ» . Международный журнал социальных вычислений и киберфизических систем . 1 (1): 33. doi : 10.1504/IJSCCPS.2011.043603 . ISSN 2040-0721 .
- ^ Жиль Делёз, Феликс Гваттари (1992). Тысяча плато. Капитализм и шизофрения . Издательство Мерве. ISBN 978-3-88396-094-4 .
- ↑ Копия «Search Referral Zeitgeis t» Джима Фланагана была доступна на archive.org, но с тех пор была заблокирована. В комментариях к записи в блоге, заархивированной 26 апреля 2006 г. на Wayback Machine , пользователь по имени Стив Минутилло приписывает эту идею Джиму Фланагану, заявляя, что на сайте Фланагана были такие дисплеи в 2002 году.
- ^ «Облака тегов RIP?» . Прочтите сайт writeweb.com. 30 марта 2011 г. Архивировано из оригинала 19 марта 2012 г.
- ^ «Добро пожаловать на премию Webby Awards» . Webbyawards.com. 28 октября 2011 г. Архивировано из оригинала 3 июля 2006 г. Проверено 27 июля 2013 г.
- ^ Биленберг, К. и Захер, М., Группы в социальном программном обеспечении: использование тегов для интеграции отдельных контекстов для социальной навигации. Архивировано 8 октября 2007 г. в Wayback Machine , магистерская диссертация, представленная в Программу цифровых медиа, Университет Бремена (2006). )
- ^ Перейти обратно: а б с Шуберт, Эрих; Шпиц, Андреас; Вейлер, Майкл; Гейсс, Йоханна; Герц, Майкл (11 августа 2017 г.). «Семантические облака слов с нормализацией фонового корпуса и t-распределенным стохастическим встраиванием соседей». arXiv : 1708.03569 [ cs.IR ].
- ^ Кнауц, К., Субуста, С. и Сток, WG (2010). Кластеры тегов как интерфейсы поиска информации. Архивировано 17 июля 2011 г. на Wayback Machine . Материалы 43-й ежегодной Гавайской международной конференции по системным наукам (HICSS-43), 5–8 января 2010 г. IEEE Computer Society Press (10 страниц).
- ^ Ауиш, Камель; Лемир, Дэниел; Годин, Роберт (2007). «Совместная OLAP с облаками тегов: формализм OLAP Web 2.0 и экспериментальная оценка». arXiv : 0710.2156 [ cs.DB ].
- ^ Хелик, Д.; Траттнер, К.; Стромайер, М.; Эндрюс, К. (2011). «Полезны ли облака тегов для навигации? Сетевой анализ» (PDF) . Международный журнал социальных вычислений и киберфизических систем . 1 (1): 33–55. дои : 10.1504/IJSCCPS.2011.043603 .
- ^ Траттнер, К.: Связывание соответствующего контента в веб-энциклопедиях с облаками тегов поисковых запросов . Архивировано 15 июня 2012 г. на Wayback Machine . Международный журнал IADIS о WWW/Интернете, том 9, выпуск 2, 2011 г.
- ^ Траттер, К., Лин, Ю., Парра, Д., Юэ, З., Брусиловский, П.: Оценка доступа к информации на основе тегов в коллекциях изображений, заархивировано 15 июня 2012 г. на Wayback Machine . В материалах 23-й конференции ACM по гипертексту и социальным сетям (HT 2012). ACM, Нью-Йорк, США, 2012 г.
- ^ Перейти обратно: а б с Ломанн, С., Зиглер, Дж., Тецлафф, Л. Сравнение макетов облака тегов: производительность, связанная с задачами, и визуальное исследование. Архивировано 7 октября 2009 г. в Wayback Machine , Т. Гросс и др. (Ред.): INTERACT 2009, Часть I, LNCS 5726, стр. 392–404, 2009 г.
- ^ Хасан-Монтеро, Ю., Эрреро-Солана, В. Улучшение облаков тегов как интерфейсов визуального поиска информации. Архивировано 13 августа 2006 г. в Wayback Machine . InSciT 2006: Мерида, Испания. 25–28 октября 2006 г.
- ^ Перейти обратно: а б Касер, Оуэн; Лемир, Дэниел (2007). «Отрисовка облака тегов: алгоритмы облачной визуализации». arXiv : cs/0703109 .
- ^ Салонен, Дж. 2007. Самоорганизующиеся облака тегов на основе карт – создание пространственно значимых представлений данных тегов. Архивировано 24 декабря 2008 г. в Wayback Machine . Материалы 1-й конференции OPAALS, 26–27 ноября 2007 г., Рим, Италия.
- ^ Маршалковски Дж., Моква Д., Дроздовски М., Русецкий Л., Нарожный Х. Быстрые алгоритмы для онлайн-построения облаков веб-тегов , Инженерные приложения искусственного интеллекта 64, стр. 378–390, 2017.
- ^ Апель, Уоррен. «Визуализация и комментарии ManyEyes: облако данных о мировом населении » . Архивировано из оригинала 29 октября 2007 г. Проверено 26 августа 2007 г.
- ^ Ваттенберг, Мартин. «Визуализация ManyEyes: рекламное облако » . Архивировано из оригинала 14 февраля 2008 г. Проверено 12 марта 2007 г.
- ^ Перейти обратно: а б Стейнбок, Дэниел (5 марта 2011 г.). «Визуализация TagCrowd: состояние страны» . Архивировано из оригинала 11 апреля 2011 г. Проверено 5 марта 2011 г.
- ^ Ламантия, Джо. «Текстовые облака: новая форма облака тегов?» . Архивировано из оригинала 10 сентября 2008 г. Проверено 11 сентября 2008 г.
{{cite web}}
: CS1 maint: bot: исходный статус URL неизвестен ( ссылка ) - ^ Мехта, Чираг. «Облако тегов выступлений президента США» . Архивировано из оригинала 19 октября 2007 г. Проверено 11 сентября 2008 г.
- ^ «Сопоставить облако» . Проверено 5 декабря 2008 г.
- ^ Феликс, Кристиан; Франконери, Стивен; Бертини, Энрико (январь 2018 г.). «Разбор облаков слов: эмпирическое исследование пространства дизайна для сводок ключевых слов». Транзакции IEEE по визуализации и компьютерной графике . 24 (1): 657–666. дои : 10.1109/TVCG.2017.2746018 . ПМИД 28866593 . S2CID 6570943 .
- ^ «Ежемесячные посещения вики-страницы для en.wikipedia» . Wikistics.falsikon.de. 31 августа 2009 г. Архивировано из оригинала 19 апреля 2013 г. Проверено 27 июля 2013 г.
- ^ Восс, Якоб (2006). «Совместный тезаурус, отмечающий путь Википедии». arXiv : cs/0604036 .
- ^ «Kentbyte: Алгоритм распределения шрифтов облака тегов . Июнь 2005 г.» . Echochamberproject.com. Архивировано из оригинала 2 октября 2013 г. Проверено 27 июля 2013 г.
Внешние ссылки
[ редактировать ]
- Понимание облаков тегов - анализ информационного дизайна облаков тегов.
- Советы по проектированию для создания облаков тегов — руководство по разработке программного обеспечения от ONLamp от O'Reilly