Jump to content

График рассеяния

График рассеяния
Один из семи основных инструментов качества
Впервые описан Джон Гершель [1]
Цель Определить тип связи (если таковая имеется) между двумя количественными переменными.
Время ожидания между извержениями и продолжительность извержения гейзера Old Faithful в Йеллоустонском национальном парке , штат Вайоминг , США. На этой диаграмме показано, что обычно существует два типа извержений: кратковременные и кратковременные и длительные и длительные.
Трехмерная диаграмма рассеяния позволяет визуализировать многомерные данные. Эта диаграмма рассеяния принимает несколько скалярных переменных и использует их для разных осей в фазовом пространстве. Различные переменные объединяются для формирования координат в фазовом пространстве, они отображаются с помощью глифов и окрашиваются с использованием другой скалярной переменной. [2]

Диаграмма рассеяния , также называемая диаграммой рассеяния , диаграммой рассеяния , диаграммой рассеяния , диаграммой рассеяния или диаграммой рассеяния , [3] — это тип графика или математической диаграммы, использующий декартовы координаты для отображения значений обычно двух переменных для набора данных. Если точки закодированы (цвет/форма/размер), может отображаться одна дополнительная переменная.Данные отображаются в виде набора точек, каждая из которых имеет значение одной переменной, определяющей положение на горизонтальной оси, и значение другой переменной, определяющей положение на вертикальной оси . [4]

Обзор [ править ]

Диаграмму рассеяния можно использовать либо в том случае, когда одна непрерывная переменная находится под контролем экспериментатора, а другая зависит от нее, либо когда обе непрерывные переменные независимы. Если существует параметр , который систематически увеличивается и/или уменьшается за счет другого, он называется параметром управления или независимой переменной и обычно отображается по горизонтальной оси. Измеряемая или зависимая переменная обычно отображается вдоль вертикальной оси. Если зависимой переменной не существует, любой тип переменной может быть нанесен на любую ось, а диаграмма рассеяния будет иллюстрировать только степень корреляции (не причинно-следственную связь ) между двумя переменными. [ нужна ссылка ]

Диаграмма рассеяния может указывать на различные виды корреляций между переменными с определенным доверительным интервалом . Например, вес и рост будут находиться на оси Y , а рост — на X. оси Корреляции могут быть положительными (растущими), отрицательными (падающими) или нулевыми (некоррелированными). Если рисунок точек имеет наклон от нижнего левого угла к верхнему правому, это указывает на положительную корреляцию между изучаемыми переменными. Если рисунок точек имеет наклон от верхнего левого угла к нижнему правому, это указывает на отрицательную корреляцию. Линия наилучшего соответствия (также называемая «линией тренда») может быть проведена для изучения взаимосвязи между переменными. Уравнение корреляции между переменными можно определить с помощью установленных процедур наилучшего соответствия. Для линейной корреляции наиболее подходящая процедура известна как линейная регрессия и гарантированно генерирует правильное решение за конечное время. Никакая универсальная процедура наилучшего соответствия не может гарантировать правильное решение для произвольных отношений. Диаграмма рассеяния также очень полезна, когда мы хотим увидеть, как два сопоставимых набора данных согласуются, чтобы показать нелинейные отношения между переменными. Возможность сделать это можно улучшить, добавив плавную линию, например ЛЕСС . [5] Более того, если данные представлены в виде смешанной модели простых отношений, эти отношения будут визуально очевидны как наложенные шаблоны. [ нужна ссылка ]

Диаграмма разброса — один из семи основных инструментов контроля качества . [6]

Точечные диаграммы могут быть построены в виде пузырьковых , маркерных и/или линейных диаграмм . [7]

Пример [ править ]

Например, чтобы продемонстрировать связь между емкостью легких человека и тем, как долго этот человек может задерживать дыхание, исследователь должен выбрать группу людей для изучения, затем измерить емкость легких каждого из них (первая переменная) и то, как долго этот человек сможет задерживать дыхание. задержать дыхание (вторая переменная). Затем исследователь наносил данные на диаграмму рассеяния, откладывая «объем легких» по горизонтальной оси и «время задержки дыхания» по вертикальной оси. [ нужна ссылка ]

Человек с объемом легких 400 кл , задержавший дыхание на 21,7 с , будет представлен на диаграмме рассеяния одной точкой в ​​точке (400, 21,7) в декартовых координатах . Диаграмма рассеяния всех людей, участвовавших в исследовании, позволит исследователю получить визуальное сравнение двух переменных в наборе данных и поможет определить, какой тип взаимосвязи может существовать между двумя переменными. [ нужна ссылка ]

Матрицы точечной диаграммы [ править ]

Для набора переменных данных (размерностей) X 1 , X 2 , ... , X k матрица точечной диаграммы показывает все попарные диаграммы рассеяния переменных в одном представлении с несколькими диаграммами рассеяния в матричном формате. Для k переменных матрица диаграммы рассеяния будет содержать k строк и k столбцов. График, расположенный на пересечении строки и j -го столбца, представляет собой график переменных X i в сравнении с X j . [8] Это означает, что каждая строка и столбец имеют одно измерение, а каждая ячейка отображает диаграмму рассеяния в двух измерениях. [ нужна ссылка ]

Обобщенная матрица диаграммы рассеяния [9] предлагает ряд отображений парных комбинаций категориальных и количественных переменных. , Мозаичный график диаграмма колебаний или многогранная гистограмма могут использоваться для отображения двух категориальных переменных. Остальные графики используются для одной категориальной и одной количественной переменных.

Визуализация 3D-данных вместе с соответствующей матрицей диаграммы рассеяния

См. также [ править ]

Ссылки [ править ]

  1. ^ Дружелюбный, Майкл; Денис, Дэн (2005). «Раннее возникновение и развитие диаграммы рассеяния». Журнал истории поведенческих наук . 41 (2): 103–130. дои : 10.1002/jhbs.20078 . ПМИД   15812820 .
  2. ^ Визуализации, созданные с помощью VisIt на сайте wci.llnl.gov. Последнее обновление: 8 ноября 2007 г.
  3. ^ Джаррелл, Стивен Б. (1994). Базовая статистика (Специальное предварительное издание). Дубьюк, Айова: Wm. Паб C. Brown. п. 492. ИСБН  978-0-697-21595-6 . Когда мы ищем взаимосвязь между двумя количественными переменными, часто помогает стандартный график доступных пар данных (X,Y), называемый диаграммой разброса ...
  4. ^ Уттс, Джессика М. Видя статистику насквозь, 3-е издание, Томсон Брукс/Коул, 2005, стр. 166-167. ISBN   0-534-39402-7
  5. ^ Кливленд, Уильям (1993). Визуализация данных . Мюррей Хилл, Саммит Нью-Джерси, Нью-Джерси: At & T Bell Laboratories, опубликовано Hobart Press. ISBN  978-0963488404 .
  6. ^ Нэнси Р. Тейг (2004). «Семь основных инструментов качества» . Набор инструментов качества . Милуоки, Висконсин : Американское общество качества . п. 15 . Проверено 5 февраля 2010 г.
  7. ^ «Точечная диаграмма – Документация по диаграммам AnyChart JavaScript» . AnyChart. Архивировано из оригинала 1 февраля 2016 года . Проверено 3 февраля 2016 г.
  8. ^ Матрица точечной диаграммы на сайте itl.nist.gov.
  9. ^ Эмерсон, Джон В.; Грин, Уолтон А.; Шерке, Баррет; Кроули, Джейсон (2013). «Обобщенный парный сюжет». Журнал вычислительной и графической статистики . 22 (1): 79–91. дои : 10.1080/10618600.2012.694762 . S2CID   28344569 .

Дальнейшее чтение [ править ]

  • Каттанео, Матиас Д.; Крамп, Ричард К.; Фаррелл, Макс Х.; Фэн, Инцзе (2024). « О Бинскаттере ». Американский экономический обзор . 114 (5): 1488–1514.

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: a77ac03ddc9064307e9deca2651437b2__1714483260
URL1:https://arc.ask3.ru/arc/aa/a7/b2/a77ac03ddc9064307e9deca2651437b2.html
Заголовок, (Title) документа по адресу, URL1:
Scatter plot - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)