Радиолокационная карта


Радарная карта -это графический метод отображения многомерных данных в виде двумерной диаграммы из трех или более количественных переменных, представленных на осях, начиная с той точки. Относительное положение и угол осей обычно неинформативно, но различная эвристика, такая как алгоритмы, которые графики как максимальная площадь, могут применяться для сортировки переменных (оси) в относительные положения, которые выявляют отдельные корреляции, компромиссы, офф,, компромисс, компромиссы, коммерческие и множество других сравнительных мер. [ 1 ]
Радарная диаграмма также известна как веб -диаграмма , диаграмма пауков , график паука , веб -диаграмма паука , звездная карта , [ 2 ] Звездный участок , паучья диаграмма , нерегулярный многоугольник , полярная диаграмма или диаграмма Кивиата . [ 3 ] [ 4 ] Он эквивалентен параллельным координатам , с осями, расположенными радиально.
Обзор
[ редактировать ]Радарная диаграмма представляет собой диаграмму и/или график , который состоит из последовательности эквиагольных спиц, называемых RADII, каждый из которых выступает, представляющий одну из переменных. Длина данных спица пропорциональна величине переменной для точки данных относительно максимальной величины переменной во всех точках данных. Линия нарисована, соединяющая значения данных для каждого выступления. Это придает сюжету звездный вид и происхождение одного из популярных названий для этого сюжета. Звездный сюжет можно использовать для ответа на следующие вопросы: [ 5 ]
- Какие наблюдения наиболее похожи, то есть есть ли кластеры наблюдений? (Радарные диаграммы используются для изучения относительных значений для одной точки данных (например, точка 3 большая для переменных 2 и 4, небольшие для переменных 1, 3, 5 и 6) и для размещения аналогичных точек или разнородных точек.) [ 5 ]
- Есть ли выбросы?
Радарные диаграммы - это полезный способ отобразить многомерные наблюдения с произвольным количеством переменных. [ 6 ] Каждая звезда представляет одно наблюдение. Как правило, радиолокационные диаграммы генерируются в формате с несколькими пластами с множеством звезд на каждой странице, и каждая звезда, представляющая одно наблюдение. [ 5 ] Звездный сюжет был впервые использован Георгом фон Майром в 1877 году. [ 7 ] [ 8 ] Радарные диаграммы отличаются от графиков глифы тем, что все переменные используются для построения настроенной звездной фигуры. Там нет разделения на передний план и фоновые переменные . Вместо этого фигуры в форме звезды обычно расположены в прямоугольной массиве на странице. Несколько проще увидеть шаблоны в данных, если наблюдения расположены в каком-то невозможном порядке (если переменные присваиваются лучам звезды в каком-то значимом порядке). [ 9 ]
Приложения
[ редактировать ]
Радарные диаграммы можно использовать в спорте, чтобы наметить сильные и слабые стороны игроков [ 10 ] Расчет различной статистики, связанной с игроком, который может отслеживать вдоль центральной оси диаграммы. Примеры включают в себя выстрелы баскетболистов, подборы, передачи и т. Д. Или ватин или статистику бейсболиста. Это создает централизованную визуализацию сильных и слабых сторон игрока, и, если они перекрываются со статистикой других игроков или средних значений лиги, может показать, где игрок превосходит и где они могут улучшить. [ 11 ] Эти понимания сильных сторон и слабостей игроков могут оказаться решающими для развития игроков, поскольку это позволяет тренерам и тренерам регулировать тренировочный полк игрока, чтобы улучшить свои слабости. Результаты радиолокационной диаграммы также могут быть полезны в ситуационной игре. Если показывается, что тесто плохо ударилось о левшах, то его команда знает, что ограничить его появление тарелок против левша кувшины, в то время как противоборствующая команда может попытаться вызвать ситуацию, когда тесто вынуждено ударить по кувшину.

Другое применение радиолокационных диаграмм - это управление улучшением качества для отображения метрик производительности различных объектов, включая компьютерные программы, [ 12 ] Компьютеры, телефоны, транспортные средства и многое другое. Программист часто использует аналитику для проверки производительности своих программ по сравнению с другими. Примером этого, когда радиолокационные диаграммы могут быть полезны, является анализ производительности различных алгоритмов сортировки. Программист может собрать несколько различных алгоритмов сортировки, таких как выбор, пузырь и быстрый под различными размерами данных. Другое применение производительности измеряет производительность аналогичных автомобилей друг против друга. Потребитель мог смотреть на такие переменные, как максимальная скорость автомобилей, мили на галлон, мощность и крутящий момент. Затем после использования радиолокационной таблицы для визуализации данных они могли бы решить, какой автомобиль лучше для них, основываясь на результатах.

Радарные диаграммы могут использоваться в науках о жизни, чтобы показать сильные стороны и слабость лекарств и других лекарств. [ 13 ] Используя пример двух антидепрессантов, исследователь может ранжировать переменные, такие как эффективность, побочные эффекты, стоимость и т. Д. В масштабе от одного до десяти. Затем они могли бы график результатов, используя радиолокационную диаграмму, чтобы увидеть распространение переменных и найти, как различные, такие как один антидепрессант, более дешевый и быстрее, но не имеет большого облегчения с течением времени. Между тем, другой антидепрессант обеспечивает более сильное облегчение и со временем поддерживает лучше, но стоит дороже. Другое приложение для жизни в области жизни - анализ пациентов. Радарные диаграммы могут быть использованы для графика переменных жизни, влияющих на благополучие человека, а затем анализироваться, чтобы помочь им. Более конкретный пример - в случае спортсменов, чьи различные оздоровительные привычки, такие как сон, диета и стресс, контролируются, чтобы убедиться, что они остаются в пиковом физическом состоянии. [ 14 ] Если какие -либо области будут показывать погружение, врачи и тренеры могут вмешаться, чтобы помочь спортсмену и улучшить их здоровье.
Ограничения
[ редактировать ]Радарные диаграммы в первую очередь подходят для поразительного демонстрации выбросов и общности , или когда одна диаграмма больше в каждой переменной, чем другая, и в первую очередь используется для порядковых измерений - где каждая переменная соответствует «лучшему» в некоторых отношениях и всех переменных в одном и том же масштабе Полем
И наоборот, радиолокационные диаграммы подвергались критике как плохо подходящие для принятия решений на компромисс-когда одна диаграмма больше, чем другая по некоторым переменным, но меньше на других. [ 15 ]
Кроме того, трудно визуально сравнивать длины разных спиц, потому что радиальные расстояния трудно судить, хотя концентрические круги помогают в качестве линий сетки. Вместо этого можно использовать простой линейный график, особенно для временных рядов. [ 16 ]
Радарные диаграммы могут в некоторой степени искажать данные, особенно когда заполняются области, потому что содержащаяся площадь становится пропорциональной квадрату линейных мер. Например, в диаграмме с 5 переменными, которые варьируются от 1 до 100, область, содержащаяся в полигоне, ограниченной 5 точками, когда все меры составляют 90, более на 10% больше, чем такая же для диаграммы со всеми значениями 82.
Радарные диаграммы также могут стать трудно визуально сравнивать между разными образцами на графике, когда их значения близки, поскольку их линии или области кровоточат друг в друге, как показано на рисунке 5.
Искусственная структура
[ редактировать ]Радарные диаграммы налагают несколько структур на данные, которые часто являются искусственными:
- Связательность соседей - радиолокационные диаграммы часто используются, когда соседние переменные не связаны, создавая ложные связи.
- Циклическая структура - первая и последняя переменные размещаются рядом друг с другом.
- Длина - переменные часто наиболее естественно порядковыми: лучше или хуже, хотя степень разницы может быть искусственной.
- Площадь - область масштабируется как квадрат значений, преувеличивая эффект большого количества. Например, 2, 2 занимают в 4 раза превышают 1, 1. Это общая проблема с графиками областей, и область трудно судить - см. «Иерархия Кливленда». [ 17 ] [ 18 ]
Например, чередующиеся данные 9, 1, 9, 1, 9, 1 дают радиолокационную диаграмму (которая входит и выходит (которая входит и выходит), в то же время переупорядочивая данные как 9, 9, 9, 1, 1, вместо этого дает два различных клинья (сектора).
В некоторых случаях существует естественная структура, и радиолокационные диаграммы могут быть хорошо подходят. Например, для диаграмм данных, которые варьируются в течение 24-часового цикла, почасовые данные естественным образом связаны с его соседом и имеют циклическую структуру, поэтому они могут быть естественным образом отображаться как радиолокационная таблица. [ 16 ] [ 19 ] [ 20 ]
Одним из наборов руководящих принципов об использовании радиолокационных диаграмм (или, скорее, тесно связанного «График полярной области»): [ 20 ]
- Вы не против читать сложенные области вместо положения вдоль общего масштаба (см. Иерархию Кливленда),
- Набор данных действительно циклический, а не линейный, и
- Есть две серии для сравнения, одна меньше, чем другая
Размер набора данных
[ редактировать ]с малым и умеренным Радарные диаграммы полезны для многомерных наборов данных . Их основная слабость заключается в том, что их эффективность ограничивается наборами данных с менее чем несколькими сотнями баллов. После этого они, как правило, являются ошеломляющими. [ 5 ]
Кроме того, при использовании радиолокационных диаграмм с несколькими размерами или образцами радиолокационная диаграмма может стать загроможденной и труднее интерпретировать по мере роста количества образцов.
Например, возьмите таблицу статистики Batting, сравнивая MLB 2021 MVP Shohei Ohtani, против статистики среднего назначенных нападающих лиг и некоторых игроков Зала славы. Эта статистика представляет собой процент попаданий, хоум -ранов, ударов и т. Д. На летучих мышах игрока. Для получения дополнительной информации о том, что представляет каждая статистика, используемая в таблице, вы можете ссылаться на эту ссылку MLB. [ 21 ] Мы будем использовать эту таблицу ниже для создания радиолокационных диаграмм, сравнивающих статистику ватина MVP 2021 года с средними значениями лиги для назначенных нападающих и обычных баттеров, пытаясь визуализировать показатели производительности и визуально прийти к выводу, что Shohei Out выполнил среднего игрока. Затем мы включим дополнительные образцы в радарную диаграмму, используя игроков Зала Славы Джеки Робинсон, Джима Тома и Фрэнка Томаса, чтобы сравнить Shohei с несколькими величайшими рисунками всех времен. Эта радиолокационная диаграмма может не только дать нам интуицию того, как Шохей сравнивает с лучшими историческими игроками, но также будет служить целью, показывая ограничения наличия слишком большого количества образцов на радарной таблице.
Цель | НЕТ | ОБП | СЛГ | Опс | HR% | ТАК% | BB% |
---|---|---|---|---|---|---|---|
MLB | 0.244 | 0.317 | 0.411 | 0.728 | 0.037 | 0.232 | 0.087 |
DH | 0.239 | 0.316 | 0.434 | 0.75 | 0.047 | 0.256 | 0.093 |
Шохей Отани | 0.257 | 0.372 | 0.592 | 0.965 | 0.086 | 0.296 | 0.15 |
Джеки Робинсон | 0.313 | 0.41 | 0.477 | 0.887 | 0.0282 | 0.0582 | 0.151 |
Джим Том | 0.276 | 0.402 | 0.554 | 0.956 | 0.072 | 0.302 | 0.207 |
Фрэнк Томас | 0.301 | 0.419 | 0.555 | 0.974 | 0.063 | 0.17 | 0.203 |
На рисунке 10 мы видим, как можно легко интерпретировать радиолокационную диаграмму, когда количество спиц и образцов относительно невелико. Когда мы сравниваем больше образцов на рисунке 11, даже без заполнения области на радиолокационной таблице, становится очевидным, насколько сложно стать интерпретацию или принятие решений компромисса.
Пример
[ редактировать ]

Таблица справа [ 5 ] Содержит звездные сюжеты из 15 автомобилей . Список переменных для образца звездного сюжета:
- Цена
- Пробег (миль на галлон)
- 1978 г. Ремонт (1 = худший, 5 = лучший)
- 1977 Ремонт (1 = худший, 5 = лучший)
- Заповедник
- Задняя комната сиденья
- Багажник пространство
- Масса
- Длина
Мы можем посмотреть на эти участки индивидуально, или мы можем использовать их для определения кластеров автомобилей с аналогичными функциями. Например, мы можем взглянуть на звездный сюжет Cadillac Seville (последний на изображении) и увидеть, что это один из самых дорогих автомобилей, становится ниже среднего (но не в худшем) пробеге бензина, имеет среднее значение Ремонт записи и имеет среднюю частоту и размер среднего до среднего. Затем мы можем сравнить модели Cadillac (последние три участка) с моделями AMC (первые три участка). Это сравнение показывает различные закономерности. Модели AMC, как правило, являются недорогими, имеют пробег ниже среднего и малы как по высоту, так и по весу и в разместной. Модели Cadillac стоят дорого, имеют плохой пробег бензина и имеют большие по размеру и вместимость. [ 5 ]
Альтернативы
[ редактировать ]Можно использовать линейные графики для временных рядов и других данных, [ 16 ] в форме параллельных координат .
Для графического качественного сравнения двухмерных табличных данных в нескольких переменных общей альтернативой являются шарики Harvey , которые широко используются потребительскими отчетами . [ 22 ] Сравнение в шариках Harvey (и радиолокационных диаграммах) может значительно помочь, упорядочив алгоритмический заказ, чтобы добавить порядок. [ 23 ]
Отличный способ визуализации структур в многомерных данных предлагается с помощью анализа основных компонентов (PCA).
Другой альтернативой является использование небольших встроенных барных схем, которые можно сравнить с Sparklines . [ 23 ]
Хотя радарные и полярные диаграммы часто описываются как одинаковые типы графиков, [ 4 ] Некоторые источники имеют значение между ними и даже считают радарную диаграмму вариацией полярной диаграммы, которая не отображает данные с точки зрения полярной координаты. [ 24 ]
Смотрите также
[ редактировать ]- Индикатор положения плана
- Сюжет (графика)
- Полярная область диаграмма
- Параллельные координаты
- Радиальное дерево
Ссылки
[ редактировать ] Эта статья включает в себя материалы общественного достояния из Национального института стандартов и технологий
- ^ Портер, Майкл М; Niksiar, Pooya (2018). «Многомерная механика: картирование производительности природных биологических систем с использованием пересеченных радиолокационных диаграмм» . Plos один . 13 (9): E0204309. BIBCODE : 2018PLOSO..1304309P . doi : 10.1371/journal.pone.0204309 . PMC 6161877 . PMID 30265707 .
- ^ Нэнси Р. Тэгю (2005) Качественный набор инструментов . Страница 437.
- ^ Коленс, Кеннет В. (1973). «Эмпиритик программного обеспечения» . Обзор оценки эффективности ACM Sigmetrics . 2 (2): 31–36. doi : 10.1145/1113644.1113647 . S2CID 18600391 .
Доктор Филип Дж. Кивиат предложил на недавнем семинаре NBS/ACM об измерении производительности, что круглый график с использованием Radii в качестве переменных осей может быть полезной формой. […] Я рекомендую, чтобы их называли «графиками Кивиат» или «Графиками Кивиата», чтобы понять его понимание их важности.
- ^ Подпрыгнуть до: а беременный «Найдите разрывы контента, используя радиолокационные диаграммы» . Семинары по контент -стратегии. 3 марта 2015 . Получено 17 декабря 2015 года .
- ^ Подпрыгнуть до: а беременный в дюймовый и фон Nist/sematech (2003). Звездный сюжет в: Электронная книга статистических методов . 6/01/2003 (дата создана)
- ^ Чемберс, Джон, Уильям Кливленд, победил Кляйнер и Пол Тьюки, (1983). Графические методы анализа данных . Уодсворт. С. 158–162
- ^ Mayr, Georg Von (1877), Закон в общественной жизни (на немецком языке), Мюнхен: Олденбург, OL 23294909M , с.78. Линейные диаграммы в кругах: линейные диаграммы в кругах.
- ^ Michael Friendly (2008). «Вехи в истории тематической картографии, статистической графики и визуализации данных» архивировали 2018-09-26 на машине Wayback .
- ^ Michael Friendly (1991). «Статистическая графика для многомерных данных» . Документ, представленный на конференции SAS Sugi 16, апрель, 1991.
- ^ Графики пауков: диаграмма баскетбольной статистики
- ^ Видя данные. «Имеет смысл визуализации данных» . Видя данные.
- ^ Рон Басу (2004). Реализация качества: практическое руководство по инструментам и методам . с.131.
- ^ Центр перевода знаний моделей. «Эффективное использование радиолокационных диаграмм» (PDF) . Центр перевода знаний моделей.
- ^ Джон Магуайр. «Деко-нормализованный паук и радиолокационные графики» . Kitman Labs.
- ^ Вы не пауковой человек, так почему вы используете радарные карты? Чанду, 18 сентября 2008 г.
- ^ Подпрыгнуть до: а беременный в Пельтье, Джон (2008-08-14). «Рок вокруг часов - технический блог Пельтье» . Peltiertech.com . Получено 2013-09-11 .
- ^ Кливленд, Уильям; МакГилл, Роберт (1984). «Графическое восприятие: теория, эксперименты и применение к разработке графических методов». Журнал Американской статистической ассоциации . 79 (387): 531–554. JSTOR 2288400 . Резюме иерархии Кливленда
- ^ Cleveland & McGill 1984 ( суммировано )
- ^ «Ссылка на часы в блоге Excel Charts» . Excelcharts.com. 2008-08-15 . Получено 2013-09-11 .
- ^ Подпрыгнуть до: а беременный Часы это
- ^ «Стандартная статистика» . www.mlb.com . Получено 2022-04-26 .
- ^ «Качественное сравнение» . Блог поддержки аналитики . 11 декабря 2007 года. Архивировано с оригинала 2012-04-08.
- ^ Подпрыгнуть до: а беременный «Информация океан: переупорядоченные таблицы II: Бертин против пауков» . I-ocean.blogspot.com. 2008-09-24 . Получено 2013-09-11 .
- ^ «Полярные графики (отчет -строитель и SSRS)» . Microsoft Developer Network . Получено 17 декабря 2015 года .
Внешние ссылки
[ редактировать ]
- Звездный сюжет - NIST /SEMATECH E-Handbook of Statistics Methods