Точечный график (статистика)
или Точечная диаграмма точечный график — это статистическая диаграмма, состоящая из точек данных, нанесенных в довольно простом масштабе, обычно с использованием закрашенных кругов. Существуют две распространенные, но очень разные версии точечной диаграммы. Первый использовался в нарисованных от руки (докомпьютерной эпохи) графиках для изображения распределений, начиная с 1884 года. [1] Другая версия описана Уильямом С. Кливлендом как альтернатива гистограмме, в которой точки используются для изображения количественных значений (например, количества), связанных с категориальными переменными. [2]
Из распределения
[ редактировать ]Точечный график как представление распределения состоит из группы точек данных, нанесенных в простом масштабе. Точечные графики используются для непрерывных , количественных , одномерных данных. Точки данных могут быть помечены, если их немного.
Точечные графики являются одними из самых простых статистических графиков и подходят для наборов данных небольшого и среднего размера. Они полезны для выделения кластеров и пробелов, а также выбросов . Другое их преимущество — сохранение числовой информации. При работе с большими наборами данных (около 20–30 или более точек данных) связанная с ними диаграмма , коробчатая диаграмма или гистограмма может быть более эффективной, поскольку после этой точки точечные диаграммы могут стать слишком загроможденными. Точечные графики можно отличить от гистограмм тем, что точки расположены неравномерно по горизонтальной оси.
Хотя сюжет кажется простым, его вычисление и лежащая в его основе статистическая теория непросты. Алгоритм вычисления точечной диаграммы тесно связан с оценкой плотности ядра . Размер, выбранный для точек, влияет на внешний вид графика. Выбор размера точки эквивалентен выбору полосы пропускания для оценки плотности ядра.
В языке программирования R этот тип графика также называется ленточной диаграммой. [3] или стрипплот . [4]
Кливлендские точечные диаграммы
[ редактировать ]Точечный график может также относиться к графикам точек, каждая из которых принадлежит одной из нескольких категорий. Они являются альтернативой гистограммам или круговым диаграммам и выглядят как горизонтальная гистограмма, где столбцы заменены точками со значениями, связанными с каждой категорией. По сравнению с (вертикальными) гистограммами и круговыми диаграммами, Кливленд утверждает, что точечные графики позволяют читателям более точно интерпретировать график, упрощая чтение меток, уменьшая количество чернил, не содержащих данных (или загроможденность графика), и поддерживая поиск в таблице.
Точечная диаграмма в картографии процесса
[ редактировать ]Термин «точечная диаграмма» также используется в области картирования процессов. Это упрощенная блок-схема процесса, в которой столбцы — это задачи, строки — это роли, а точки, вставленные на пересечении задач и ролей, представляют собой последовательность шагов. Другими словами, это обширная таблица RACI с дополнительной информацией о последовательности шагов процесса.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Уилкинсон, Лиланд (1999). «Точечные графики». Американский статистик . 53 (3). Американская статистическая ассоциация: 276–281. дои : 10.2307/2686111 . JSTOR 2686111 .
- ^ Кливленд, Уильям С. (1993). Визуализация данных . Хобарт Пресс. hdl : 2027/mdp.39015026891187 . ISBN 0-9634884-0-6 .
- ^ Питер Далгаард . Вводная статистика с R . Спрингер. ISBN 0-387-95475-9 .
- ^ Пол Мюррелл (2005). Р Графика . Чепмен и Холл/CRC. ISBN 1-58488-486-Х .
Другие ссылки
[ редактировать ]- Уайлд, К. и Себер, Г. (2000) Случайные встречи: первый курс анализа данных и выводов Джон Уайли и сыновья. ISBN 0-471-32936-3