Функциональная коробчатая диаграмма
В статистической графике функциональная диаграмма представляет собой информативный исследовательский инструмент, предложенный для визуализации функциональных данных. [1] [2] По аналогии с классической коробчатой диаграммой , описательная статистика функциональной коробчатой диаграммы представляет собой: огибающую 50% центральной области, срединную кривую и максимальную невыступающую огибающую.
Для построения функциональной коробчатой диаграммы первым шагом является упорядочивание данных. В функциональном анализе данных каждое наблюдение представляет собой реальную функцию, поэтому в отличие от классической коробчатой диаграммы, где данные просто упорядочены от наименьшего значения выборки к наибольшему, в функциональной коробчатой диаграмме функциональные данные, например кривые или изображения, упорядочены по понятие глубины полосы или модифицированной глубины полосы. [3] Это позволяет упорядочивать функциональные данные от центра к краям и, таким образом, вводит меру для определения функциональных квантилей, а также централизации или удаленности наблюдения. Функциональная коробчатая диаграмма, имеющая ранги функциональных данных, является естественным расширением классической коробчатой диаграммы.
Строительство
[ редактировать ]В классической блочной диаграмме сама ячейка представляет собой средние 50% данных. Поскольку данные на функциональной диаграмме упорядочены от центра к краям, 50% центральная область определяется полосой, ограниченной 50% самых глубоких или самых центральных наблюдений.Граница 50%-ной центральной области определяется как конверт, представляющий блок в классической коробчатой диаграмме. Таким образом, это 50% центральноеЭта область является аналогом « межквартильного размаха » (IQR) и дает полезный индикатор разброса центральных 50% кривых.Это надежный диапазон для интерпретации, поскольку на центральную область 50% не влияют выбросы или экстремальные значения, и она даетменее предвзятая визуализация разброса кривых. Наблюдение в рамке указывает медиану или самое центральное наблюдение, которое также является надежной статистикой для измерения центральности.
«Усы» коробчатого графика — это вертикальные линии графика, идущие от прямоугольника и обозначающие максимальную огибающую диаграммы.набор данных, кроме выбросов.
Обнаружение выбросов
[ редактировать ]Выбросы можно обнаружить на функциональной коробчатой диаграмме с помощью эмпирического правила 1,5 раза по сравнению с 50% центральной области, аналогичного эмпирическому правилу 1,5 IQR для классических коробчатых диаграмм. Заборы получаются путем увеличения оболочки 50% центральной области в 1,5 раза.высота 50% центральной области. Любые наблюдения за пределами границ помечаются как потенциальные выбросы. Когда каждое наблюдение представляет собой просто точку, функциональная коробчатая диаграмма вырождается в классическую коробчатую диаграмму и отличается от точечных коробчатых диаграмм.
Расширенный функциональный коробчатый график
[ редактировать ]Введя концепцию центральных регионов, функциональную коробчатую диаграмму можно обобщить до расширенной функциональной коробчатой диаграммы, в которой также представлены центральные регионы 25% и 75%.
Поверхностная коробчатая диаграмма
[ редактировать ]Пространственно-временные данные можно рассматривать как временную кривую в каждом пространственном положении или пространственную поверхность в каждый момент времени. В последнем случае глубина поверхностной полосы на основе объема может использоваться для упорядочения поверхностей образца и приводит к трехмерной коробчатой диаграмме поверхности с характеристиками, аналогичными функциональным коробчатым диаграммам. Аналогично, заборы получаются по правилу 1,5 умноженного на 50% центрального региона. Любая поверхность за пределами ограждений помечается как кандидат на выбросы. Поверхностная коробчатая диаграмма является естественным расширением функциональной коробчатой диаграммы для R. 3 .
Примеры
[ редактировать ]- Данные о ежемесячных температурах поверхности моря (SST), измеренных в градусах Цельсия над восточно-центральной тропической частью Тихого океана с 1951 по 2007 год.
- Функциональная диаграмма SST с синими кривыми, обозначающими конверты, и черной кривой, обозначающей срединную кривую. Красные пунктирные кривые представляют собой кандидатов-выбросов, обнаруженных по правилу 1,5-кратного увеличения 50% центральной области.
- Расширенная функциональная диаграмма SST: темно-пурпурный цвет обозначает 25% центральную область, пурпурный цвет представляет 50% центральную область, а розовый указывает на 75% центральную область.
- Точечные диаграммы SST с медианами, соединенными черной линией.
- Поверхностная ящичная диаграмма с рамкой посередине, представляющей 50% центральную область в R. 3 , средняя поверхность внутри рамки обозначает срединную поверхность, а верхняя и нижняя поверхности указывают на максимальную невыступающую огибающую.
Код статистики
[ редактировать ]Команда fbplot для функциональных коробчатых диаграмм находится в FDA R. пакете [4] и код MATLAB также доступен.
Statsmodels библиотеки Python делает функциональные коробчатые диаграммы доступными через функцию fboxplot. [5] Также можно использовать функцию boxplot в пакете scikit-fda . [6]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Гайндман, Роб Дж.; Шан, Хань Линь (2010). «Радужные диаграммы, мешочные диаграммы и коробчатые диаграммы для функциональных данных» (PDF) . Журнал вычислительной и графической статистики . 19 (1): 29–45. дои : 10.1198/jcgs.2009.08158 .
- ^ Сан, Ю.; Гентон, МГ (2011). «Функциональные коробчатые диаграммы». Журнал вычислительной и графической статистики . 20 (2): 316–334. дои : 10.1198/jcgs.2011.09224 .
- ^ Лопес-Пинтадо, С.; Ромо, Дж. (2009). «О концепции глубины функциональных данных». Журнал Американской статистической ассоциации . 104 (486): 718–734. CiteSeerX 10.1.1.596.7755 . дои : 10.1198/jasa.2009.0108 .
- ^ https://cran.r-project.org/web/packages/fda/fda.pdf файл справки fbplot.
- ^ https://www.statsmodels.org/stable/generated/statsmodels.graphics.functional.fboxplot.html документация по моделям статистики.
- ^ https://fda.readthedocs.io/en/latest/auto_examples/plot_boxplot.html пример функционального коробчатого графика scikit-fda