Сюжет
Заговор с мешком , или заговор со звездопадом , [1] [2] — это метод робастной статистики для визуализации двух- или трехмерных статистических данных, аналогичный одномерной ящичной диаграмме . Представленный в 1999 году Руссеу и др., Bagplot позволяет визуализировать местоположение, разброс, асимметрию и выбросы набора данных. [3]
Строительство
[ редактировать ]Bagplot состоит из трех вложенных многоугольников , называемых «мешком», «забором» и «петлей».
- Внутренний многоугольник, называемый мешком , строится на основе глубины Тьюки — наименьшего количества наблюдений, которое может содержаться в полуплоскости , которая также содержит данную точку. [4] Он содержит не более 50% точек данных.
- Самый внешний из трех полигонов, называемый забором, не рисуется как часть графика, а используется для его построения. Он образуется путем надувания мешка в определенный коэффициент (обычно в 3). Наблюдения за пределами забора помечаются как выбросы . [5]
- Наблюдения, которые не отмечены как выбросы, окружены петлей — выпуклой оболочкой наблюдений внутри забора. [6]
Символ звездочки (*) рядом с центром графика используется для обозначения медианы глубины, точки с максимально возможной глубиной Тьюки. Наблюдения между мешком и забором отмечены отрезками линий на линии, ведущей к медиане глубины, соединяющей их с мешком.
Трехмерная версия состоит из внутренней и внешней сумки. [7] Внешнюю сумку необходимо нарисовать прозрачными цветами, чтобы внутренняя сумка оставалась видимой.
Характеристики
[ редактировать ]Bagplot инвариантен относительно аффинных преобразований плоскости и устойчив к выбросам. [8]
Ссылки
[ редактировать ]- ^ Руссиу, Питер Дж.; Руц И.; Тьюки Дж.В. (1999). «Бэг-сюжет: двумерный коробчатый сюжет». Американский статистик . 53 (4): 382–387. дои : 10.1080/00031305.1999.10474494 .
- ^ Рональд К. Пирсон (1 апреля 2005 г.). Анализ несовершенных данных: борьба с загрязнениями и неполными записями . СИАМ. стр. 204–. ISBN 978-0-89871-582-8 .
- ^ Доминик Хотон ; Джонатан Хотон (18 сентября 2011 г.). Аналитика уровня жизни: развитие через призму данных обследований домохозяйств . Спрингер. стр. 14–. ISBN 978-1-4614-0385-2 .
- ^ Софи Дабо-Ньянг; Фредерик Феррати (21 мая 2008 г.). Функциональная и операторская статистика . Спрингер. стр. 204–. ISBN 978-3-7908-2062-1 .
- ^ Джон К. Гауэр; Сугнет Гарднер Люббе; Ниль Дж. Ле Ру (23 февраля 2011 г.). Понимание бисюжетов . Джон Уайли и сыновья. стр. 59–. ISBN 978-1-119-97290-7 .
- ^ Прабханджан Нараяначар Таттар (24 июля 2013 г.). Разработка статистических приложений на R на примере. Руководство для начинающих . Packt Publishing Ltd., стр. 203–. ISBN 978-1-84951-945-8 .
- ^ Круппа, Йохен Дж.; Юнг К. (2017). «Автоматическая идентификация многогрупповых выбросов в молекулярных данных с высокой пропускной способностью с использованием диаграмм мешков и гемплотов» . БМК Биоинформатика . 18 : 232. дои : 10.1186/s12859-017-1645-5 . ПМК 5414140 . ПМИД 28464790 .
- ^ Раджив Раман; Роберт Седжвик; Маттиас Ф. Столлманн (1 января 2006 г.). Труды восьмого семинара по алгоритмической разработке и экспериментам и третьего семинара по аналитической алгоритмике и комбинаторике . СИАМ. стр. 62–. ISBN 978-0-89871-610-8 .