Бисюжет



Биплоты — это тип исследовательского графика, используемый в статистике , обобщение простой диаграммы рассеяния с двумя переменными .Двойной график накладывает график оценок на график загрузки .Биграфический график позволяет информацию как об образцах , так и о переменных матрицы данных графически отображать . Выборки отображаются в виде точек, а переменные — в виде векторов, линейных осей или нелинейных траекторий. В случае категориальных переменных точки уровня категории могут использоваться для представления уровней категориальной переменной. Обобщенный . биграфик отображает информацию как о непрерывных, так и о категориальных переменных
Введение и история [ править ]
![]() | Этот раздел может потребовать очистки Википедии , чтобы соответствовать стандартам качества . Конкретная проблема: трудно следовать, в основном содержит оглавление двух разных книг. ( Ноябрь 2020 г. ) |
Бисюжет был представлен К. Рубеном Габриэлем (1971). [1] Гауэр и Хэнд (1996) написали монографию о побочных сюжетах. Ян и Канг (2003) описали различные методы, которые можно использовать для визуализации и интерпретации бисюжета. Книга Гринакра (2010) [2] представляет собой практическое ориентированное на пользователя руководство по биграфикам, а также сценариям на языке программирования R с открытым исходным кодом для создания биплотов, связанных с анализом главных компонентов (PCA), многомерным масштабированием (MDS), анализом логарифмических отношений (LRA) — также известным как спектральное отображение [3] [4] - дискриминантный анализ (DA) и различные формы анализа соответствий : простой анализ соответствий (CA), анализ множественных соответствий (MCA) и анализ канонических соответствий (CCA) (Greenacre 2016). [5] ). Книга Гауэра, Люббе и Ле Ру (2011) направлена на популяризацию биплотов как полезного и надежного метода визуализации многомерных данных, когда исследователи хотят рассмотреть, например, анализ главных компонентов (PCA), анализ канонических переменных (CVA). или различные виды анализа корреспонденции.
Строительство [ править ]
Двойной график строится с использованием разложения по сингулярным значениям (SVD) для получения низкоранговой аппроксимации преобразованной версии матрицы данных X , n строк которой являются выборками (также называемыми случаями или объектами), а p столбцов являются переменными. Преобразованная матрица данных Y получается из исходной матрицы X путем центрирования и, при необходимости, стандартизации столбцов (переменных). Используя SVD, мы можем написать Y = Σ k =1,... p d k u k v k Т ;, где uk — - мерные n векторы-столбцы, v k — p -мерные векторы-столбцы, а d k — невозрастающая последовательность неотрицательных скаляров . Двойной график формируется из двух диаграмм рассеяния, которые имеют общий набор осей и имеют интерпретацию скалярного произведения между наборами . Первая диаграмма рассеяния формируется из точек ( d 1 а ты 1 я , d 2 а ты 2 я ), для я знак равно 1,..., п . Второй график формируется из точек ( d 1 1-а в 1 j , d 2 1-а v 2 j ), для j = 1,..., p . Это биграфик, образованный двумя доминирующими членами SVD, который затем можно представить в двухмерном виде. Типичный выбор α — 1 (чтобы дать интерпретацию расстояния для отображения строки) и 0 (чтобы дать интерпретацию расстояния для отображения столбца), а в некоторых редких случаях α = 1/2 для получения симметрично масштабированного биграфика (который дает никакой интерпретации расстояния для строк или столбцов, а только интерпретация скалярного произведения). Набор точек, изображающих переменные, можно нарисовать в виде стрелок от начала координат, чтобы усилить идею о том, что они представляют собой оси двухграфических графиков, на которые можно проецировать выборки для аппроксимации исходных данных.
Ссылки [ править ]
- ^ 'Габриэль, КР (1971). Графическое отображение матриц с применением двухграфических графиков для анализа главных компонентов. Биометрика , 58 (3), 453–467.
- ^ Гринакр, М. (2010). Биплоты на практике . Фонд BBVA, Бильбао, Испания. Доступно бесплатно на http://www.multivariatestatistics.org.
- ^ Леви, Пол Дж. (2005). «Спектральное картографирование, личный и исторический отчет о приключениях в области многомерного анализа данных». Хемометрика и интеллектуальные лабораторные системы . 77 (1–2): 215–223. дои : 10.1016/j.chemolab.2004.07.010 .
- ^ Дэвид Ливингстон (2009). Практическое руководство по анализу научных данных. Чичестер, John Wiley & Sons Ltd, 233–238. ISBN 978-0-470-85153-1
- ^ Гринакр, М. (2016) Анализ корреспонденции на практике. Третье издание . Чепмен и Холл / CRC Press. ISBN 978-84-923846-8-6
Источники [ править ]
- Габриэль, КР (1971). «Двухграфическое отображение матриц с применением к анализу главных компонентов». Биометрика . 58 (3): 453–467. дои : 10.1093/biomet/58.3.453 .
- Гауэр Дж. К., Люббе С. и Ле Ру Н. (2010). Понимание бисюжетов . Уайли . ISBN 978-0-470-01255-0
- Гауэр, Дж.С. и Хэнд, DJ (1996). Бисюжеты . Чепмен и Холл , Лондон, Великобритания. ISBN 0-412-71630-5
- Ян В. и Канг М.С. (2003). Анализ биграфика GGE . CRC Press , Бока-Ратон, Флорида. ISBN 0-8493-1338-4
- Деми-младший, Висенте-Виллардон, Дж.Л., Галиндо-Виллардон, член парламента и Самбрано, А.Ю. (2008). Идентификация молекулярных маркеров, связанных с классификацией генотипов с помощью внешних логистических биплотов . Биоинформатика . 24 (24): 2832–2838