Скрипичный сюжет
Скрипичный график — это статистический график для сравнения распределений вероятностей . Он похож на коробчатую диаграмму с добавлением повернутой диаграммы плотности ядра с каждой стороны. [1]
История [ править ]
Скрипичный сюжет был предложен в 1997 году Джерри Л. Хинтце и Рэем Д. Нельсоном как способ отображения даже большего количества информации, чем коробчатые сюжеты , которые были созданы Джоном Тьюки в 1977 году. [2] Название происходит от предполагаемого сходства сюжета со скрипкой . [2]
О [ править ]
Графики скрипки похожи на ящичковые диаграммы , за исключением того, что они также показывают плотность вероятности данных при разных значениях, обычно сглаживаемую с помощью средства оценки плотности ядра . Скрипичный график будет включать в себя все данные, находящиеся в ящичковой диаграмме: маркер медианы данных; квадратик или маркер, обозначающий межквартильный размах; и, возможно, все точки выборки, если количество выборок не слишком велико.
В то время как ящичковая диаграмма показывает сводную статистику, такую как среднее/медиана и межквартильные размахи, скрипичная диаграмма показывает полное распределение данных. График скрипки можно использовать в мультимодальных данных (более одного пика). В этом случае скрипичный график показывает наличие различных пиков, их положение и относительную амплитуду.
Как и коробчатые диаграммы, скрипичные диаграммы используются для сравнения распределения переменных (или выборочного распределения) по различным «категориям» (например, сравнение распределения температуры днем и ночью или распределение цен на автомобили по сравнению с разными автопроизводителями).
Скрипичный сюжет может иметь несколько слоев. Например, внешняя форма представляет все возможные результаты. Следующий слой внутри может представлять значения, которые встречаются в 95% случаев. Следующий слой (если он существует) внутри может представлять значения, которые встречаются в 50% случаев.
Скрипичные сюжеты менее популярны, чем коробочные. Скрипичные сюжеты могут быть труднее понять читателям, не знакомым с ними. В этом случае более доступной альтернативой является построение серии составных гистограмм или графиков плотности ядра .
Первоначальное значение слова «скрипичный график» представляло собой комбинацию коробчатого графика и двустороннего графика плотности ядра. [1] Однако в настоящее время под «скрипичными графиками» иногда понимают просто двусторонние диаграммы плотности ядра, без коробчатой диаграммы или каких-либо других элементов. [3] [4]
См. также [ править ]
Ссылки [ править ]
- ^ Jump up to: Перейти обратно: а б «Скрипичный сюжет» . График данных НИСТ . Национальный институт стандартов и технологий. 13 октября 2015 г.
- ^ Jump up to: Перейти обратно: а б Хинтце, Джерри Л.; Нельсон, Рэй Д. (май 1998 г.). «Скрипичные графики: синергизм коробчатой диаграммы и плотности следов» . Американский статистик . 52 (2): 181–184. дои : 10.1080/00031305.1998.10480559 . ISSN 0003-1305 .
- ^ Уилке, Клаус О. Основы визуализации данных .
- ^ «Скрипичный сюжет — geom_violin» . ggplot2.tidyverse.org . Проверено 19 ноября 2023 г.
Внешние ссылки [ править ]
- Надстройка Vioplot для Stata
- График скрипки из набора данных широкой формы с использованием библиотеки статистической визуализации seaborn на основе matplotlib.
В этой статье использованы общедоступные материалы из Справочное руководство по Dataplot: Сюжет скрипки . Национальный институт стандартов и технологий .