Jump to content

Многофакторный анализ

Многофакторный анализ (MFA) — это факторный метод. [1] посвящен изучению таблиц, в которых группа особей описывается набором переменных (количественных и/или качественных), структурированных по группам. Это многомерный метод из области ординации , используемый для упрощения многомерных структур данных . MFA обрабатывает все задействованные таблицы одинаково (симметричный анализ). Его можно рассматривать как расширение:

Вводный пример

[ редактировать ]

Зачем вводить несколько активных групп переменных в один и тот же факторный анализ?

данные

Рассмотрим случай количественных переменных, то есть в рамках PCA. Пример данных экологических исследований служит полезной иллюстрацией. Для 72 станций предусмотрены два типа измерений:

  1. Коэффициент обилия-доминирования 50 видов растений (коэффициент от 0 = растение отсутствует, до 9 = вид занимает более трех четвертей поверхности). Весь набор из 50 коэффициентов определяет флористический профиль станции.
  2. Одиннадцать педологических измерений ( Pedology = почвоведение): гранулометрические, физические, химические и т. д. Совокупность этих одиннадцати измерений определяет почвенный профиль станции.

Возможны три анализа:

  1. PCA флоры (почвоведение как дополнение): этот анализ фокусируется на изменчивости флористических профилей. Две станции являются близкими друг к другу, если они имеют сходный флористический профиль. На втором этапе основные параметры этой изменчивости (т.е. основные компоненты) связываются с педологическими переменными, введенными в качестве дополнительных.
  2. PCA почвоведения (дополнительная флора): этот анализ фокусируется на изменчивости почвенных профилей. Две станции считаются близкими, если они имеют одинаковый профиль почвы. Тогда основные размеры этой изменчивости (т.е. основные компоненты) связаны с обилием растений.
  3. PCA двух групп переменных как активный: возможно изучение изменчивости станций как с точки зрения флоры, так и с точки зрения почвы. При таком подходе две станции должны находиться рядом, если они имеют схожую флору и схожие почвы.

Баланс между группами переменных

[ редактировать ]

Методология

[ редактировать ]

Третий анализ вводного примера неявно предполагает баланс между флорой и почвой. Однако в этом примере сам факт того, что флора представлена ​​50 переменными, а почва - 11 переменными, означает, что на PCA с 61 активной переменной будет в основном влиять флора, по крайней мере, на первой оси). Это нежелательно: нет причин желать, чтобы одна группа играла более важную роль в анализе.

Ядро MFA основано на факторном анализе (PCA в случае количественных переменных, MCA в случае качественных переменных), в котором переменные взвешиваются. Эти веса идентичны для переменных одной и той же группы (и варьируются от одной группы к другой). Они таковы, что максимальная осевая инерция группы равна 1: другими словами, применяя PCA (или, где применимо, MCA) к одной группе с этим весом, мы получаем первое собственное значение, равное 1. получить это свойство, MFA назначает каждой переменной группы вес, равный обратному значению первого собственного значения анализа (PCA или MCA в зависимости от типа переменной) группы .

Формально, отметив первое собственное значение факторного анализа одной группы , МИД присваивает вес для каждой переменной группы .

Балансировка максимальной осевой инерции, а не полной инерции (= количества переменных в стандартном PCA) дает MFA несколько важных свойств для пользователя. Более конкретно, его интерес проявляется в следующем примере.

Пусть две группы переменных определены на одном и том же наборе индивидов.

  1. Группа 1 состоит из двух некоррелированных переменных A и B.
  2. Группа 2 состоит из двух переменных {C1, C2}, идентичных одной и той же переменной C, не коррелирующей с первыми двумя.

Этот пример не является полностью нереалистичным. Часто приходится одновременно анализировать многомерные и (вполне) одномерные группы.

Каждая группа, имеющая одинаковое количество переменных, имеет одинаковую общую инерцию.

В данном примере первая ось ППШ практически совпадает с С. Действительно, в пространстве переменных существуют две переменные в направлении С: группа 2, вся ее инерция сосредоточена в одном направлении, влияет преимущественно на первую ось . Со своей стороны, группа 1, состоящая из двух ортогональных переменных (= некоррелированных), имеет инерцию, равномерно распределенную в плоскости (плоскости, порожденной двумя переменными) и почти не весит на первой оси.

Численный пример

Таблица 1. МИД. Тестовые данные. А и Б (группа 1) некоррелированы. С1 и С2 (группа 2) идентичны.
1 1 1 1
2 3 4 4
3 5 2 2
4 5 2 2
5 3 4 4
6 1 2 2
Таблица 2. Данные испытаний. Разложение инерции в PCA и MFA применительно к данным таблицы 1.
СПС
Инерция 2.14 (100%) 1
группа 1 0.24(11%) 1
группа 2 1.91(89%) 0
МИД
Инерция 1.28(100%) 1
группа 1 0.64(50%) 1
группа 2 0.64(50%) 0

В таблице 2 суммированы инерции первых двух осей PCA и MFA, примененные к таблице 1.

Переменные группы 2 обеспечивают 88,95% инерции оси 1 PCA. Первая ось ( ) почти совпадает с C: корреляция между C и составляет 0,976;

Первая ось МФА (по данным табл. 1) показывает баланс между двумя группами переменных: вклад каждой группы в инерцию этой оси строго равен 50%.

Между тем вторая ось зависит только от группы 1. Это естественно, поскольку эта группа двумерна, тогда как вторая группа, будучи одномерной, может быть тесно связана только с одной осью (здесь с первой осью).

Вывод о балансе между группами

[ редактировать ]

Введение в факторный анализ нескольких активных групп переменных неявно предполагает баланс между этими группами.

Этот баланс должен учитывать, что многомерная группа естественным образом влияет на большее количество осей, чем одномерная группа (которая может не быть тесно связана с одной осью).

Эту роль играет утяжеление МФА, при котором максимальная осевая инерция каждой группы равна 1.

Примеры применения

[ редактировать ]

Опрос Анкеты всегда структурированы по разным темам. Каждая тема представляет собой группу переменных, например вопросы о мнениях и вопросы о поведении. Таким образом, в этом примере мы можем захотеть провести факторный анализ, в котором два человека близки, если они оба выразили одинаковые мнения и одинаковое поведение.

Сенсорный анализ Один и тот же набор продуктов оценивался группой экспертов и группой потребителей. Для его оценки каждое жюри использует список дескрипторов (кислый, горький и т. д.). Каждый судья оценивает каждый дескриптор каждого продукта по шкале интенсивности, варьирующейся, например, от 0 = нулевой или очень низкий балл до 10 = очень высокий уровень. В таблице, связанной с жюри, на пересечении строки и столбец , — средний балл, присвоенный продукту для дескриптора .

Индивидуумы — это продукты. Каждое жюри представляет собой группу переменных. Мы хотим добиться факторного анализа, при котором два продукта будут похожи, если оба жюри оценили их одинаково.

Многомерный временной ряд переменные измеряются на лица. Эти измерения производятся при даты. Существует множество способов анализа такого набора данных. Один из способов, предложенных MFA, состоит в том, чтобы рассматривать каждый день как группу переменных при анализе таблиц (каждая таблица соответствует одной дате), сопоставленных по строкам (таким образом, анализируемая таблица имеет ряды и х столбцы).

Вывод : эти примеры показывают, что на практике переменные очень часто объединяются в группы.

Графика от МИД

[ редактировать ]

Помимо взвешивания переменных, интерес к MFA заключается в ряде графиков и индикаторов, полезных при анализе таблицы, столбцы которой организованы в группы.

Графика, общая для всех простых факторных анализов (PCA, MCA).

[ редактировать ]

Ядром MFA является взвешенный факторный анализ: MFA сначала предоставляет классические результаты факторного анализа.

1. Представления об индивидуумах , в которых два индивидуума близки друг к другу, если они демонстрируют схожие значения для многих переменных в разных группах переменных; на практике пользователь, в частности, изучает первую факториальную плоскость.

2. Представления количественных переменных как в PCA (корреляционном круге).

Рисунок 1. МИД. Тестовые данные. Представление индивидов на первом плане.
Рисунок 2. МИД. Тестовые данные. Представление переменных на первой плоскости.

В примере:

  • Первая ось в основном противостоит особям 1 и 5 (рис. 1).
  • Четыре переменные имеют положительную координату (рис. 2): первая ось представляет собой размерный эффект. Таким образом, человек 1 имеет низкие значения для всех переменных, а человек 5 имеет высокие значения для всех переменных.

3. Индикаторы, помогающие интерпретировать : прогнозируемая инерция, вклад и качество представительства. В примере вклад особей 1 и 5 в инерцию первой оси составляет 45,7% + 31,5% = 77,2%, что оправдывает интерпретацию, ориентированную на эти две точки.

4. Представления категорий качественных переменных, как в MCA (категория лежит в центре тяжести индивидов, которые ею обладают). В примере нет качественных переменных.

Графика, специфичная для этого типа нескольких таблиц

[ редактировать ]

5. Наложенные изображения людей, «видимых» каждой группой. Индивид, рассматриваемый с точки зрения одной группы, называется частичным индивидом (аналогично индивидуум, рассматриваемый с точки зрения всех переменных, называется средним индивидом, поскольку он лежит в центре тяжести своих частичных точек). Частичное облако собирает люди с точки зрения одной группы (т.е. ): то есть облако, проанализированное в отдельном факторном анализе (PCA или MCA) группы. . Наложенное представление , предоставляемая МФА , по своей цели аналогична той , которая предоставляется анализом Прокруста .

Рисунок 3. МИД. Тестовые данные. Наложенное изображение средней и частичной облачности.

В примере (рис. 3) особь 1 характеризуется малыми размерами (т.е. малыми значениями) как по группе 1, так и по группе 2 (частичные точки особи 1 имеют отрицательную координату и расположены близко друг к другу). Напротив, для индивида 5 более характерны высокие значения переменных группы 2, чем для переменных группы 1 (у индивидуума 5 неполная точка группы 2 лежит дальше от начала координат, чем частичная точка группы 1). Такое прочтение графика можно проверить непосредственно в данных.

6. Представления групп переменных как таковые. На этих графиках каждая группа переменных представлена ​​одной точкой. Две группы переменных близки друг к другу, когда они определяют одну и ту же структуру у индивидов. Крайний случай: две группы переменных, которые определяют гомотетические облака особей. совпадают. Координата группы вдоль оси равен вкладу группы к инерции МИДа, размерности ранга . Этот вклад можно интерпретировать как показатель взаимоотношений (между группой и ось отсюда и название «квадрат отношения», данное этому типу представления). Это представление также существует в других факторных методах (в частности, MCA и FAMD), и в этом случае каждая группа переменных сводится к одной переменной.

Рисунок 4. МИД. Тестовые данные. Представление групп переменных.

В примере (рис. 4) это представление показывает, что первая ось связана с двумя группами переменных, а вторая ось связана с первой группой. Это согласуется с представлением переменных (рис. 2). На практике такое представление особенно ценно, когда группы многочисленны и включают много переменных.

Другая сетка для чтения . Обе группы переменных имеют общий эффект размера (первая ось) и различаются по оси 2, поскольку эта ось специфична для группы 1 (он противопоставляет переменные A и B).

7. Представления факторов отдельных анализов разных групп. Эти факторы представлены как дополнительные количественные переменные (корреляционный круг).

Рисунок 5. МИД. Тестовые данные. Представление главных компонентов отдельных PCA каждой группы.

В примере (рис. 5) первая ось MFA относительно сильно коррелирует (r = 0,80) с первым компонентом группы 2. Эта группа, состоящая из двух одинаковых переменных, обладает только одним главным компонентом (путается с переменная). Группа 1 состоит из двух ортогональных переменных: любое направление подпространства, порожденное этими двумя переменными, имеет одинаковую инерцию (равную 1). Таким образом, существует неопределенность в выборе основных компонентов и нет оснований интересоваться каким-то одним из них конкретно. Однако два компонента, предоставляемые программой, хорошо представлены: плоскость MFA близка к плоскости, охватываемой двумя переменными группы 1.

Заключение

[ редактировать ]

Числовой пример иллюстрирует выходные данные MFA. Помимо балансировки групп переменных и помимо обычных графиков PCA (MCA в случае качественных переменных), MFA обеспечивает результаты, специфичные для групповой структуры набора переменных, то есть, в частности:

  • Наложенное представление отдельных лиц для детального анализа данных;
  • Представление групп переменных, дающее синтетический образ, становится все более ценным, поскольку эти данные включают множество групп;
  • Представление факторов из отдельных анализов.

Небольшой размер и простота примера позволяют легко проверить правила интерпретации. Но этот метод будет более ценным, если набор данных большой и сложный. Доступны другие методы, подходящие для этого типа данных. Прокрустов анализ сравнивается с МФА в. [2]

MFA был разработан Брижит Эскофье и Жеромом Пажем в 1980-х годах. Оно лежит в основе двух книг, написанных этими авторами: [3] и. [4] MFA и его расширения (иерархический MFA, MFA на таблицах сопряженности и т. д.) являются темой исследования лаборатории прикладной математики Agrocampus ( LMA² ), которая опубликовала книгу, в которой представлены основные методы исследовательского многомерного анализа. [5]

Программное обеспечение

[ редактировать ]

MFA доступен в двух пакетах R ( FactoMineR и ADE4 ) и во многих пакетах программного обеспечения, включая SPAD, Uniwin, XLSTAT и т. д. Также имеется функция SAS. [ постоянная мертвая ссылка ] . Графики в этой статье взяты из пакета R FactoMineR.

  1. ^ Гринакр, Майкл; Блазиус, Йорг (23 июня 2006 г.). Анализ множественных соответствий и родственные методы . ЦРК Пресс. стр. 352–. ISBN  9781420011319 . Проверено 11 июня 2014 г.
  2. ^ Пажес Жером (2014). Многофакторный анализ на примере с использованием Р. Чепмена и Холла/CRC The R Series, Лондон. 272р
  3. ^ Там же
  4. ^ Эскофье Бриджит и Паже Жером (2008). Одно- и многофакторный анализ; цели, методы и интерпретация. Дюно, Париж. 318 стр. ISBN   978-2-10-051932-3
  5. ^ Хассон Ф., Ле С. и Пажес Дж. (2009). Исследовательский многомерный анализ на примере с использованием Р. Чепмена и Холла/CRC The R Series, Лондон. ISBN   978-2-7535-0938-2
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 86856c61db30f6bdf5bb66afd072068d__1706031180
URL1:https://arc.ask3.ru/arc/aa/86/8d/86856c61db30f6bdf5bb66afd072068d.html
Заголовок, (Title) документа по адресу, URL1:
Multiple factor analysis - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)