Jump to content

Расстроенный сюжет

График UpSet, показывающий наборы в строках и пересечения в столбцах. Установленные размеры и размеры пересечений показаны в виде гистограмм.
UpSet Plot, показывающий, как пересекаются жанры фильмов. Самым большим пересечением двух площадок является пересечение комедии и драмы.

Графики UpSet — это метод визуализации данных для отображения данных набора, содержащего более трех пересекающихся наборов . UpSet показывает пересечения в матрице, причем строки матрицы соответствуют наборам, а столбцы — пересечениям между этими наборами (или наоборот). Размер наборов и пересечений показаны в виде гистограмм .

Графики UpSet были впервые предложены в 2014 году. [ 1 ] Первый прототип был реализован как интерактивное веб-приложение. [ 2 ] Графики UpSet связаны с графиками мозаики , хотя графики мозаики предназначены для категориальных, а не заданных данных.

Графики UpSet стали популярными, когда они стали доступны в виде R -библиотеки на основе ggplot2 . [ 3 ] и впоследствии были перереализованы в различных языках программирования, таких как Python и других. [ 4 ] По состоянию на январь 2024 года UpSetR был загружен с CRAN более 1,5 миллиона раз, хотя последний раз обновлялся 5 лет назад. [ 5 ] Графики UpSet теперь часто используются вместо диаграмм Венна, особенно в науках о жизни. [ 6 ]

Использование

[ редактировать ]
Слева показана расстроенная матрица, где каждая строка соответствует пересечению нескольких наборов, которые показаны в столбцах. Три пересечения (только в B; в A и B, но не в C; и во всех A, B и C) выделены, а соответствующие сегменты показаны на диаграмме Венна.
Иллюстрация, показывающая, как строки графика UpSet соответствуют сегментам диаграммы Венна.
График UpSet, показывающий три набора (A, B и C) и соответствующую диаграмму Венна. Размер пересечений (мощность) на графике UpSet визуализируется с помощью помеченных гистограмм. На диаграмме Венна отмечены пересечения.
График UpSet, показывающий три набора и соответствующую диаграмму Венна.

Графики UpSet визуализируют пересечения между наборами в матрице. На вертикальном графике UpSet столбцы матрицы соответствуют наборам, строки — пересечениям. Для каждой строки заполняются ячейки, являющиеся частью пересечения. Если заполнено несколько ячеек, они соединяются линией, чтобы подчеркнуть направление чтения графика. Поскольку наборы различаются по размеру, размер набора отображается в виде гистограммы поверх столбцов. Размер пересечений отображается в соответствии со строками, а также в виде гистограмм. Такая компоновка облегчает сравнение размеров отдельных пересечений, поскольку размеры стержней легко сравнивать. UpSets можно использовать горизонтально и вертикально.

Графики UpSet можно сортировать различными способами. Например, распространенный подход к сортировке — сортировка по мощности (размеру пересечения), при которой самые большие пересечения помещаются сверху. Альтернативная сортировка осуществляется по степени пересечения или по множествам.

Графики UpSet также можно использовать для визуализации атрибутов перекрестков, размещая визуализации атрибутов рядом со столбчатыми диаграммами. [ 7 ] Обычным выбором для этих визуализаций атрибутов являются подходы компактной визуализации для распределений, такие как коробчатые диаграммы или скрипичные диаграммы .

Расширенные функции графиков UpSet включают запрос, группировку и агрегирование данных. [ 1 ] Эти функции, как правило, доступны только в интерактивных веб-реализациях UpSet. [ 4 ]

Преимущества и ограничения

[ редактировать ]

Графики UpSet, как правило, работают лучше, чем диаграммы Венна, для большего количества наборов и когда желательно также отображать контекстную информацию о пересечениях наборов. [ 8 ] Для визуализации диаграмм, содержащих менее трех наборов или когда пересечений всего несколько, обычно предпочтительнее использовать диаграммы Венна и Эйлера, поскольку они, как правило, более привычны и интуитивно понятны для чтения. [ 9 ]

Графики UpSet ограничены отображением 20-30 наборов, хотя специфика зависит от реальных данных. [ 9 ] Альтернативный подход для больших наборов данных — показать тепловую карту совместного появления , хотя они не могут отображать пересечения более высокого порядка. [ 9 ]

См. также

[ редактировать ]
  1. ^ Jump up to: а б Лекс, Александр; Геленборг, Нильс; Стробельт, Хендрик; Вийемо, Ромен; Пфистер, Ханспетер (31 декабря 2014 г.). «UpSet: визуализация пересекающихся множеств» . Транзакции IEEE по визуализации и компьютерной графике . 20 (12): 1983–1992. дои : 10.1109/TVCG.2014.2346248 . ПМК   4720993 . ПМИД   26356912 .
  2. ^ Лекс, Александр; Геленборг, Нильс; Стробельт, Хендрик; Вийемо, Ромен; Пфистер, Ханспетер. " "UpSet — визуализация пересекающихся множеств" " .
  3. ^ Конвей, Джейк Р.; Лекс, Александр; Геленборг, Нильс (15 сентября 2017 г.). «UpSetR: пакет R для визуализации пересекающихся множеств и их свойств» . Биоинформатика . 33 (18): 2938–2940. doi : 10.1093/биоинформатика/btx364 . ПМК   5870712 . ПМИД   28645171 .
  4. ^ Jump up to: а б Лекс, Александр. "Расстройство" . расстроен.приложение . Проверено 18 февраля 2022 г.
  5. ^ Конвей, Джейк Р.; Геленборг, Нильс (9 мая 2019 г.). «УпсетР» . Гитхаб . Проверено 23 августа 2024 г.
  6. ^ Гадхаве, Киран. " "UpSet 2: от прототипа к инструменту" " . Проверено 28 апреля 2022 г.
  7. ^ Гу, Цзугуан. Расстроенный сюжет . {{cite book}}: |website= игнорируется ( помогите )
  8. ^ Лора, Эллис. «Анализ множеств: сопоставление диаграмм Венна и графиков UpSet» . Маленькая мисс Дейта . Проверено 28 апреля 2022 г.
  9. ^ Jump up to: а б с Лекс, Александр; Геленборг, Нильс (1 августа 2014 г.). «Множества и пересечения» . Природные методы . 11 (8): 779. doi : 10.1038/nmeth.3033 . S2CID   39124565 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: b8b91a1f9604844456ae08d5f3b20a11__1713835920
URL1:https://arc.ask3.ru/arc/aa/b8/11/b8b91a1f9604844456ae08d5f3b20a11.html
Заголовок, (Title) документа по адресу, URL1:
UpSet plot - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)