Квадрат отношений
В статистике квадрат отношений таблицы индивидов x — это графическое представление, используемое при факторном анализе переменных . Это представление дополняет классические представления, обеспечиваемые анализом главных компонентов (PCA) или анализом множественного соответствия (MCA), а именно представления отдельных лиц, количественных переменных (корреляционный круг) и категорий качественных переменных (в центроиде людей, которые ими обладают). ). Это особенно важно при факторном анализе смешанных данных (FAMD) и множественном факторном анализе (MFA).
Определение квадрата отношений в системе MCA
[ редактировать ]Основная цель квадрата отношений — представить сами переменные, а не их категории, что тем более ценно, поскольку переменных много. Для этого рассчитываем для каждой качественной переменной и каждый фактор ( , классифицировать фактор, – вектор координат особей по оси рангов ; в ПКА, называется главной компонентой ранга ), квадрат корреляционного отношения между и переменная , обычно обозначается:
Таким образом, каждой факториальной плоскости можно сопоставить представление самих качественных переменных.
Их координаты находятся между 0 и 1, переменные появляются в квадрате, вершинами которого являются точки (0,0), (0,1), (1,0) и (1,1).
Пример в MCA
[ редактировать ]Шесть человек ( описываются тремя переменными имеющие соответственно 3, 2 и 3 категории. Пример: индивидуум имеет категорию из , из и из .
-а | -д | -ф | |
-б | -д | -ф | |
-с | -д | -г | |
-а | -и | -г | |
-б | -и | -час | |
-с | -и | -час |
Применительно к этим данным функция MCA, включенная в пакет R FactoMineR, предоставляет классический график на рисунке 1.
Квадрат отношений (рис. 2) облегчает чтение классической факториальной плоскости. Это указывает на то, что:
- Первый фактор связан с тремя переменными, но особенно (которые имеют очень высокую координату по первой оси), а затем .
- Второй фактор связан только с и (и не для который имеет координату по оси 2, равную 0) и то сильным и равным образом.
Все это видно на классической графике, но не так четко. Роль квадрата отношений заключается в первую очередь в том, чтобы помочь в чтении обычного изображения. Это ценно, когда переменных много и они имеют множество координат.
Расширения
[ редактировать ]Это представление может быть дополнено представлениями количественных переменных, координатами которых являются квадраты коэффициентов корреляции (а не коэффициентов корреляции). Таким образом, второе преимущество квадрата отношений заключается в возможности представлять одновременно количественные и качественные переменные. [1]
таблицы Квадрат отношений может быть построен на основе любого факторного анализа отдельных лиц x переменных . В частности, он используется (или должен использоваться) систематически:
- в анализе множественных соответствий (MCA); [2]
- в анализе главных компонент (PCA), когда имеется много дополнительных переменных;
- в факторном анализе смешанных данных (FAMD).
Расширение этого рисунка на группы переменных (как представить группу переменных одной точкой?) используется в многофакторном анализе (MFA).
История
[ редактировать ]Идея представления точками самих качественных переменных (а не категорий) принадлежит Бриджит Эскофье. [3] Графика в том виде, в котором она используется сейчас, была представлена Брижит Эскофье и Жеромом Пажем в рамках многофакторного анализа. [4]
Заключение
[ редактировать ]В MCA квадрат отношений дает синтетическое представление о связях между смешанными переменными, что тем более ценно, поскольку существует множество переменных, имеющих множество категорий. Это представление может быть полезно в любом факторном анализе, когда имеется множество смешанных переменных, активных и/или дополнительных.
Ссылки
[ редактировать ]- ^ Несколько примеров с двумя типами переменных приведены в книге Паже Жерома (2014). Многофакторный анализ на примере использования R. Чепмен и Холл / CRC The R Series, Лондон, 272 стр.
- ^ Хассон Ф., Ле С. и Пажес Дж. (2009). Исследовательский многомерный анализ на примере с использованием Р. Чепмена и Холла/CRC The R Series, Лондон. ISBN 978-2-7535-0938-2
- ^ Эскофье Бриджит (1979). Представление переменных в анализе множественных соответствий. Журнал прикладной статистики . полет. XXVII, № 4, стр. 37–47. http://archive.numdam.org/ARCHIVE/RSA/RSA_1979__27_4/RSA_1979__27_4_37_0/RSA_1979__27_4_37_0.pdf
- ^ Эскофье Б. и Пажес Дж. (1988, 1-е изд., 2008, 4-е изд.) Простой и множественный факторный анализ; цели, методы и интерпретация . Дюно, Париж, 318 стр. ISBN 978-2-10-051932-3
Внешние ссылки
[ редактировать ]- Программное обеспечение FactoMineR AR, предназначенное для разведочного анализа данных.