Jump to content

Облако тегов

(Перенаправлено из облаков тегов )
Облако тегов списка рассылки [1]
Облако тегов с терминами, связанными с Web 2.0.

Облако тегов (также известное как облако слов или взвешенный список в визуальном дизайне) — это визуальное представление текстовых данных, которое часто используется для отображения метаданных ключевых слов на веб-сайтах или для визуализации текста произвольной формы. Теги обычно представляют собой отдельные слова, и важность каждого тега отображается размером или цветом шрифта. [2] [3] При использовании в качестве средств навигации по веб-сайту термины представляют собой гиперссылки на элементы, связанные с тегом.

Хайди Пэрис: первоначальный вариант обложки немецкого издания книги Жиля Делеза и Феликса Гваттари «Тысяча плато» от 14 ноября 1991 г.

На языке визуального дизайна облако тегов (или облако слов) — это один из видов «взвешенного списка», который обычно используется на географических картах для представления относительного размера городов с точки зрения относительного размера шрифта. Ранним печатным примером взвешенного списка английских ключевых слов были «файлы подсознания» в книге Дугласа Коупленда « Microserfs » (1995). Появление в Германии произошло в 1992 году. [4]

Специфическая визуальная форма и широкое использование термина «облако тегов» приобрели известность в первом десятилетии 21 века как широко распространенная особенность ранних веб-сайтов и блогов Web 2.0 , используемая в первую очередь для визуализации частотного распределения метаданных ключевых слов, описывающих веб-сайт. контент и в качестве средства навигации.

Первые облака тегов на известном веб-сайте появились на сайте обмена фотографиями Flickr , созданном соучредителем Flickr и дизайнером взаимодействия Стюартом Баттерфилдом в 2004 году. Эта реализация была основана на поисковой ссылке Zeitgeist Джима Фланагана, [5] визуализация ссылок на веб-сайты. Примерно в то же время облака тегов были популяризированы, в частности, Del.icio.us и Technorati .

Перенасыщение методом облака тегов и двойственное отношение к его полезности в качестве инструмента веб-навигации привели к снижению его использования среди первых пользователей. [6] Flickr произнес вступительную речь из пяти слов на премию Webby Award 2006 года «Best Practices» , в которой просто говорилось: «Извините за облака тегов». [7]

Второе поколение разработчиков программного обеспечения открыло более широкое разнообразие применений облаков тегов как основного метода визуализации текстовых данных. В этом контексте было предложено несколько расширений облаков тегов.

Облако данных, показывающее население каждой из стран мира. Создано в R с использованием пакета wordcloud с использованием данных о населении страны . Пропорциональные размеры Китая и Индии были разделены пополам.

существует три основных типа приложений облака тегов В социальном программном обеспечении , отличающихся своим значением, а не внешним видом. В первом типе имеется тег для частоты каждого элемента, тогда как во втором типе существуют глобальные облака тегов, в которых частоты агрегируются по всем элементам и пользователям. В третьем типе облако содержит категории, размер которых указывает на количество подкатегорий.

В первом типе размер представляет собой количество раз, когда тег был применен к одному элементу. [8] Это полезно как средство отображения метаданных об элементе, за который было проведено демократическое «голосование» и где точные результаты нежелательны.

Во втором, более распространенном типе, [ нужна ссылка ] Размер представляет собой количество элементов, к которым был применен тег, и отражает популярность каждого тега .

Значение

[ редактировать ]

Вместо частоты можно использовать размер для представления значимости слов и совпадений слов по сравнению с фоновым корпусом (например, по сравнению со всем текстом в Википедии). [9] Этот подход нельзя использовать отдельно, он основан на сравнении частоты появления документов с ожидаемыми распределениями.

Категоризация

[ редактировать ]

В третьем типе теги используются как метод категоризации элементов контента. Теги представлены в облаке, где более крупные теги представляют количество элементов контента в этой категории.

Существует несколько подходов к созданию кластеров тегов вместо облаков тегов, например, путем применения совместного появления тегов в документах. [10]

В более общем плане тот же визуальный метод можно использовать для отображения данных без тегов. [11] как в облаке слов или облаке данных.

Термин « облако ключевых слов» иногда используется как термин поискового маркетинга (SEM), который относится к группе ключевых слов, имеющих отношение к конкретному веб-сайту. В последние годы облака тегов приобрели популярность благодаря своей роли в поисковой оптимизации веб-страниц, а также поддержке пользователя в эффективной навигации по контенту в информационной системе. [12] Облака тегов как инструмент навигации делают ресурсы веб-сайта более связанными, [13] при сканировании пауком поисковой системы, что может повысить рейтинг сайта в поисковых системах . С точки зрения пользовательского интерфейса они часто используются для обобщения результатов поиска, чтобы помочь пользователю быстрее найти контент в конкретной информационной системе. [14]

Внешний вид

[ редактировать ]

Облака тегов обычно представляются с помощью встроенных элементов HTML . Теги могут располагаться в алфавитном порядке, в случайном порядке, их можно сортировать по весу и так далее. Иногда помимо размера шрифта манипулируют и другими визуальными свойствами, такими как цвет, интенсивность или насыщенность шрифта. [15] Наиболее популярным является прямоугольное расположение тегов с алфавитной сортировкой в ​​последовательном построчном расположении. Решение об оптимальном макете должно основываться на ожидаемых целях пользователя. [15] Некоторые предпочитают группировать теги семантически, чтобы похожие теги появлялись рядом друг с другом. [16] [17] [18] или используйте методы встраивания, такие как tSNE, для позиционирования слов. [9] Можно добавить края, чтобы подчеркнуть совпадение тегов и визуализировать взаимодействие. [9] Эвристику можно использовать для уменьшения размера облака тегов независимо от того, является ли целью кластеризация тегов. [17]

Визуальная таксономия облака тегов определяется рядом атрибутов: правилом упорядочения тегов (например, по алфавиту, по важности, по контексту, случайным образом, упорядочено по визуальному качеству), формой всего облака (например, прямоугольной, круговой, с учетом границ карты), формой границ тега (прямоугольник или тело символа), вращение тега (нет, бесплатно, ограничено), выравнивание тега по вертикали (с соблюдением типографских базовых линий, бесплатно). Облако тегов в сети должно решать проблемы моделирования и управления эстетикой, построения двумерного макета тегов, и все это должно быть выполнено в короткие сроки на нестабильной платформе браузера. Облака тегов, которые будут использоваться в Интернете, должны быть в формате HTML , а не в графике, чтобы сделать их читабельными для роботов. Они должны быть созданы на стороне клиента с использованием шрифтов, доступных в браузере, и должны помещаться в прямоугольную рамку. [19]

Облака данных

[ редактировать ]
Облако данных, показывающее движение цен на акции. Цвет указывает на положительное или отрицательное изменение, размер шрифта указывает на процентное изменение.

Облако данных или облачные данные — это отображение данных, в котором для обозначения числовых значений используется размер и/или цвет шрифта. [20] Это похоже на облако тегов [21] но вместо количества слов отображает такие данные, как численность населения или цены на фондовом рынке .

Текстовые облака

[ редактировать ]
Текстовое облако, сравнивающее о положении страны в 2002 году Обращение президента США Буша о положении страны в 2011 году. и Обращение президента Обамы [22]
Текстовое облако малаялам со словами, связанными с наукой

Текстовое облако или облако слов — это визуализация частоты слов в заданном тексте в виде взвешенного списка. [23] Эта техника недавно появилась [ когда? ] широко использовался для визуализации актуального содержания политических выступлений. [22] [24]

Разместите облака

[ редактировать ]

Расширяя принципы текстового облака, совместное облако обеспечивает более четкое представление документа или корпуса . Вместо обобщения всего документа совместное облако проверяет использование определенного слова. Полученное облако содержит слова, которые часто используются вместе с искомым словом. Эти коллокации отформатированы так, чтобы показывать частоту (как размер), а также силу коллокации (как яркость). Это обеспечивает интерактивные способы просмотра и изучения языка. [25]

Восприятие

[ редактировать ]

Облака тегов были предметом исследования в нескольких исследованиях удобства использования. Следующее резюме основано на обзоре результатов исследований, предоставленных Lohmann et al.: [15]

  • Размер тега: большие теги привлекают больше внимания пользователя, чем маленькие (на эффект влияют дополнительные свойства, например, количество символов, положение, соседние теги).
  • Сканирование: пользователи сканируют, а не читают облака тегов.
  • Центрирование: теги в середине облака привлекают больше внимания пользователя, чем теги вблизи границ (эффект зависит от макета ).
  • Позиция: верхний левый квадрант получает больше внимания пользователей, чем остальные (западные привычки чтения).
  • Исследование. Облака тегов обеспечивают неоптимальную поддержку при поиске определенных тегов (если они не имеют очень большого размера шрифта).

Феликс и др. [26] сравнили, чем производительность чтения человека отличается от традиционных облаков тегов, которые сопоставляют числовые значения с размером шрифта, и альтернативных дизайнов, в которых используются, например, цвет или дополнительные формы, такие как круг и полоса. Они также сравнили, как различное расположение слов влияет на производительность.

  • Использование дополнительной полосы или круга вместо размера шрифта повышает точность при чтении числового значения.
  • Однако пользователи могут найти конкретное слово быстрее, если не используется дополнительный знак.
  • Производительность зависит от задачи, на простые задачи, такие как поиск слова, сильно влияет выбор дизайна, однако влияние на такие задачи, как определение темы облака тегов, гораздо меньше.

Создание

[ редактировать ]
Облако тегов, созданное на основе 1000 самых важных статей Википедии, отсортированных по количеству просмотров. [27]

В принципе, размер шрифта тега в облаке тегов определяется его частотой. Например, для облака слов категорий, таких как веб-журналы, частота соответствует количеству записей веб-журнала, отнесенных к категории. Для меньших частот можно напрямую указать размеры шрифта, от единицы до максимального размера шрифта. Для больших значений следует произвести масштабирование. При линейной нормализации вес дескриптора отображается в масштабе от 1 до f , где и указывают диапазон доступных весов.

для ; еще
  • : размер шрифта отображения
  • : макс. размер шрифта
  • : считать
  • : мин. считать
  • : макс. считать

Поскольку количество индексированных элементов на один дескриптор обычно распределяется по степенному закону , [28] для более широких диапазонов значений логарифмическое представление. имеет смысл [29]

Реализации облаков тегов также включают анализ текста и фильтрацию бесполезных тегов, таких как общие слова, цифры и знаки препинания.

Существуют также веб-сайты, создающие облака тегов с искусственным или случайным весом для рекламы или юмористических результатов.

См. также

[ редактировать ]
  1. ^ Генератор Word-Cloud (архив)
  2. ^ Мартин Халви и Марк Т. Кин, Оценка методов представления тегов , заархивировано 14 мая 2017 г. в Wayback Machine , презентация плаката на WWW 2007, 2007 г.
  3. ^ Гелич, Денис; Траттнер, Кристоф; Стромайер, Маркус; Эндрюс, Кейт (2011). «Полезны ли облака тегов для навигации? Сетевой анализ» . Международный журнал социальных вычислений и киберфизических систем . 1 (1): 33. doi : 10.1504/IJSCCPS.2011.043603 . ISSN   2040-0721 .
  4. ^ Жиль Делёз, Феликс Гваттари (1992). Тысяча плато. Капитализм и шизофрения . Издательство Мерве. ISBN  978-3-88396-094-4 .
  5. Копия «Search Referral Zeitgeis t» Джима Фланагана была доступна на archive.org, но с тех пор была заблокирована. В комментариях к записи в блоге, заархивированной 26 апреля 2006 г. на Wayback Machine , пользователь по имени Стив Минутилло приписывает эту идею Джиму Фланагану, заявляя, что на сайте Фланагана были такие дисплеи в 2002 году.
  6. ^ «Облака тегов RIP?» . Прочтите сайт writeweb.com. 30 марта 2011 г. Архивировано из оригинала 19 марта 2012 г.
  7. ^ «Добро пожаловать на премию Webby Awards» . Webbyawards.com. 28 октября 2011 г. Архивировано из оригинала 3 июля 2006 г. Проверено 27 июля 2013 г.
  8. ^ Биленберг, К. и Захер, М., Группы в социальном программном обеспечении: использование тегов для интеграции отдельных контекстов для социальной навигации. Архивировано 8 октября 2007 г. в Wayback Machine , магистерская диссертация, представленная в Программу цифровых медиа, Университет Бремена (2006). )
  9. ^ Перейти обратно: а б с Шуберт, Эрих; Шпиц, Андреас; Вейлер, Майкл; Гейсс, Йоханна; Герц, Майкл (11 августа 2017 г.). «Семантические облака слов с нормализацией фонового корпуса и t-распределенным стохастическим встраиванием соседей». arXiv : 1708.03569 [ cs.IR ].
  10. ^ Кнауц, К., Субуста, С. и Сток, WG (2010). Кластеры тегов как интерфейсы поиска информации. Архивировано 17 июля 2011 г. на Wayback Machine . Материалы 43-й ежегодной Гавайской международной конференции по системным наукам (HICSS-43), 5–8 января 2010 г. IEEE Computer Society Press (10 страниц).
  11. ^ Ауиш, Камель; Лемир, Дэниел; Годин, Роберт (2007). «Совместная OLAP с облаками тегов: формализм OLAP Web 2.0 и экспериментальная оценка». arXiv : 0710.2156 [ cs.DB ].
  12. ^ Хелик, Д.; Траттнер, К.; Стромайер, М.; Эндрюс, К. (2011). «Полезны ли облака тегов для навигации? Сетевой анализ» (PDF) . Международный журнал социальных вычислений и киберфизических систем . 1 (1): 33–55. дои : 10.1504/IJSCCPS.2011.043603 .
  13. ^ Траттнер, К.: Связывание соответствующего контента в веб-энциклопедиях с облаками тегов поисковых запросов . Архивировано 15 июня 2012 г. на Wayback Machine . Международный журнал IADIS о WWW/Интернете, том 9, выпуск 2, 2011 г.
  14. ^ Траттер, К., Лин, Ю., Парра, Д., Юэ, З., Брусиловский, П.: Оценка доступа к информации на основе тегов в коллекциях изображений, заархивировано 15 июня 2012 г. на Wayback Machine . В материалах 23-й конференции ACM по гипертексту и социальным сетям (HT 2012). ACM, Нью-Йорк, США, 2012 г.
  15. ^ Перейти обратно: а б с Ломанн, С., Зиглер, Дж., Тецлафф, Л. Сравнение макетов облака тегов: производительность, связанная с задачами, и визуальное исследование. Архивировано 7 октября 2009 г. в Wayback Machine , Т. Гросс и др. (Ред.): INTERACT 2009, Часть I, LNCS 5726, стр. 392–404, 2009 г.
  16. ^ Хасан-Монтеро, Ю., Эрреро-Солана, В. Улучшение облаков тегов как интерфейсов визуального поиска информации. Архивировано 13 августа 2006 г. в Wayback Machine . InSciT 2006: Мерида, Испания. 25–28 октября 2006 г.
  17. ^ Перейти обратно: а б Касер, Оуэн; Лемир, Дэниел (2007). «Отрисовка облака тегов: алгоритмы облачной визуализации». arXiv : cs/0703109 .
  18. ^ Салонен, Дж. 2007. Самоорганизующиеся облака тегов на основе карт – создание пространственно значимых представлений данных тегов. Архивировано 24 декабря 2008 г. в Wayback Machine . Материалы 1-й конференции OPAALS, 26–27 ноября 2007 г., Рим, Италия.
  19. ^ Маршалковски Дж., Моква Д., Дроздовски М., Русецкий Л., Нарожный Х. Быстрые алгоритмы для онлайн-построения облаков веб-тегов , Инженерные приложения искусственного интеллекта 64, стр. 378–390, 2017.
  20. ^ Апель, Уоррен. «Визуализация и комментарии ManyEyes: облако данных о мировом населении » . Архивировано из оригинала 29 октября 2007 г. Проверено 26 августа 2007 г.
  21. ^ Ваттенберг, Мартин. «Визуализация ManyEyes: рекламное облако » . Архивировано из оригинала 14 февраля 2008 г. Проверено 12 марта 2007 г.
  22. ^ Перейти обратно: а б Стейнбок, Дэниел (5 марта 2011 г.). «Визуализация TagCrowd: состояние страны» . Архивировано из оригинала 11 апреля 2011 г. Проверено 5 марта 2011 г.
  23. ^ Ламантия, Джо. «Текстовые облака: новая форма облака тегов?» . Архивировано из оригинала 10 сентября 2008 г. Проверено 11 сентября 2008 г. {{cite web}}: CS1 maint: bot: исходный статус URL неизвестен ( ссылка )
  24. ^ Мехта, Чираг. «Облако тегов выступлений президента США» . Архивировано из оригинала 19 октября 2007 г. Проверено 11 сентября 2008 г.
  25. ^ «Сопоставить облако» . Проверено 5 декабря 2008 г.
  26. ^ Феликс, Кристиан; Франконери, Стивен; Бертини, Энрико (январь 2018 г.). «Разбор облаков слов: эмпирическое исследование пространства дизайна для сводок ключевых слов». Транзакции IEEE по визуализации и компьютерной графике . 24 (1): 657–666. дои : 10.1109/TVCG.2017.2746018 . ПМИД   28866593 . S2CID   6570943 .
  27. ^ «Ежемесячные посещения вики-страницы для en.wikipedia» . Wikistics.falsikon.de. 31 августа 2009 г. Архивировано из оригинала 19 апреля 2013 г. Проверено 27 июля 2013 г.
  28. ^ Восс, Якоб (2006). «Совместный тезаурус, отмечающий путь Википедии». arXiv : cs/0604036 .
  29. ^ «Kentbyte: Алгоритм распределения шрифтов облака тегов . Июнь 2005 г.» . Echochamberproject.com. Архивировано из оригинала 2 октября 2013 г. Проверено 27 июля 2013 г.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 8e2b8697f3c9414bc6582b4ae392f1d1__1717259640
URL1:https://arc.ask3.ru/arc/aa/8e/d1/8e2b8697f3c9414bc6582b4ae392f1d1.html
Заголовок, (Title) документа по адресу, URL1:
Tag cloud - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)