Контурная диаграмма
В статистической графике и научной визуализации контурная диаграмма [1] это исследовательский инструмент, который был предложен для визуализации ансамблей наборов объектов, определяемых порогом некоторой скалярной функции (например, наборов уровней , изоконтуров ). Аналогично классическому коробчатому графику и считается расширением концепций, определяющих функциональный коробчатый сюжет , [2] [3] описательной статистикой контурной диаграммы являются: конверт 50% центральной области, медианная кривая и максимальный невыходящий конверт.
Для построения контурной диаграммы первым шагом является упорядочивание данных. В функциональном анализе данных каждое наблюдение представляет собой реальную функцию, поэтому порядок данных отличается от классического коробчатого графика, где скалярные данные просто упорядочены от наименьшего значения выборки к наибольшему. В более общем смысле, глубина данных обеспечивает упорядочение точек данных по центру наружу и, таким образом, обеспечивает механизм для построения ранговой статистики различных видов многомерных данных. Например, примеры функциональных данных можно заказать с использованием метода глубины полосы или модифицированной глубины полосы. При анализе контурных данных каждое наблюдение представляет собой набор признаков (подмножество предметной области) и, следовательно, не является функцией. Таким образом, понятие глубины полосы и модифицированной глубины полосы дополнительно расширяется, чтобы учесть признаки, которые могут быть выражены в виде наборов, но не обязательно в виде функций. Глубина контурной полосы позволяет упорядочить данные набора функций от центра к краям и, таким образом, вводит меру для определения функциональных квантилей, а также централизации или удаленности наблюдения. Имея ранги данных набора признаков, контурная коробчатая диаграмма является естественным расширением классической коробчатой диаграммы, которая в особых случаях сводится обратно к традиционной функциональной коробчатой диаграмме.
Установить/контурировать глубину полосы
[ редактировать ]Установите глубину полосы (введено в [1] ), обозначаемый как sBD, представляет собой метод установления упорядочения набора множеств по центру наружу. Как и в случае с другой глубиной полосы, методы упорядочивания данных при установке глубины полосы вычисляют вероятность того, что выборка находится в полосе, образованной j других выборок из распределения. Будем говорить, что множество S ∈ E является элементом полосы совокупности j других множеств S 1 , ..., S j ∈ E , если оно ограничено их объединением и пересечением. То есть:
Заданная глубина полос представляет собой сумму вероятностей попадания в полосы, образованные разным количеством образцов (2,..., J ).
Показано, что заданная глубина полосы является обобщением глубины функциональной полосы. Глубина полосы набора имеет модифицированную форму, полученную из расслабленной формы подмножества, которая требует включения только процента одного набора в другой.
Глубина контурной полосы (cBD) является прямым применением sBD, где наборы получены из пороговых входных функций, F ( x ) > q . Таким образом, ансамбль скалярных входных функций и порогового значения дает начало набору контуров, а сортировка cBD дает упорядочивание по глубине данных (вероятность от наибольшей к наименьшей дает глубину от наибольшей к наименьшей) этих контуров. . Опираясь на формулировку множества, контурные коробчатые диаграммы избегают явного соответствия точек на разных контурах.
Построение контурной диаграммы
[ редактировать ]В классической блочной диаграмме сама ячейка представляет собой средние 50% данных. Поскольку порядок данных на контурной диаграмме расположен от центра наружу, 50% центральная область определяется полосой, ограниченной 50% самых глубоких или самых центральных наблюдений. Граница 50%-ной центральной области определяется как конверт, представляющий блок в классической коробчатой диаграмме. Таким образом, эта 50% центральная область является аналогом интерквартильного размаха (IQR) и дает полезный индикатор разброса центральных 50% кривых. Это надежный диапазон для интерпретации, поскольку на центральную область 50% не влияют выбросы или экстремальные значения, и она дает менее предвзятую визуализацию разброса кривых. Наблюдение в рамке указывает медиану или самое центральное наблюдение, которое также является надежной статистикой для измерения центральности.
«Усы» коробчатой диаграммы — это вертикальные линии графика, выходящие из рамки и обозначающие максимальный конверт набора данных, за исключением выбросов. В контурных коробчатых диаграммах это формируется путем рассмотрения разницы объединения и пересечения, образованных всеми не внешними выборками. Выбросы определяются как имеющие значение cBD, которое меньше некоторого множителя (менее одного), умноженного на cBD 50% ранжированных образцов.
Примеры
[ редактировать ]Следующий пример представляет собой ансамбль данных двумерного моделирования Навье-Стокса несжимаемой среды, состоящий из 40 элементов, где каждый член ансамбля представляет собой моделирование с числом Рейнольдса и скоростью на входе, выбранными случайным образом. Значения скорости на входе случайным образом выбираются из нормального распределения со средним значением 1 и стандартным отклонением ±0,01 (в безразмерных единицах); аналогично числа Рейнольдса генерируются на основе нормального распределения со средним значением 130 и стандартным отклонением ±3.
- Набор контуров, возникающих в результате различных значений параметров двумерного моделирования жидкости (обтекание цилиндра, слева направо)
- Контурные коробчатые диаграммы дают медиану, статистику порядка и выбросы (отображаемые в виде линейной интегральной свертки, визуализирующей поток).
- Средние значения и стандартное отклонение ±1 полей дают результаты, которые не являются геометрически правильными (согласуются с отсутствием моделирования) и дают неверную оценку возможных положений контуров (изображенных на линейной интегральной сверточной визуализации потока).
Приведенный ниже пример взят из совокупности общедоступных данных Национального управления океанических и атмосферных исследований (NOAA) [1]. Данные ансамбля формируются посредством различных прогонов имитационной модели с различными возмущениями начальных условий для учета ошибок в начальных условиях и/или параметризации модели. Ансамбль состоит из изоконтур температурного поля (изозначение -15С) на высоте 500 мб.
- Ансамбль изоконтур с веб-сайта NOAA, показанный как «сюжет спагетти».
- Контурные диаграммы ансамбля погодных данных дают медиану, статистику порядка и выбросы.
- Средние значения и стандартное отклонение ±1 температурных полей связаны с ансамблем прогнозов погоды NOAA.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Перейти обратно: а б Уитакер, Росс Т.; Махса Мирзаргар; Роберт М. Кирби (2013). «Контурные коробчатые диаграммы: метод характеристики неопределенности в наборах функций из ансамблей моделирования». Транзакции IEEE по визуализации и компьютерной графике . 19 (12): 2713–2722. CiteSeerX 10.1.1.420.6659 . дои : 10.1109/TVCG.2013.143 . ПМИД 24051838 . S2CID 2332058 .
- ^ Гайндман, Роб Дж.; Хан Линь (2010). «Радужные диаграммы, мешочные диаграммы и коробчатые диаграммы для функциональных данных» (PDF) . Журнал вычислительной и графической статистики . 19 (1): 29–45. дои : 10.1198/jcgs.2009.08158 . S2CID 6549436 .
- ^ Сан, Ю.; М.Г. Гентон (2011). «Функциональные коробчатые диаграммы». Журнал вычислительной и графической статистики . 20 (2): 316–334. дои : 10.1198/jcgs.2011.09224 . S2CID 51740751 .