Факторный анализ
Эта статья нуждается в дополнительных цитатах для проверки . ( август 2023 г. ) |
Факторный анализ — это статистический метод, используемый для описания изменчивости наблюдаемых коррелирующих переменных с точки зрения потенциально меньшего числа ненаблюдаемых переменных, называемых факторами . Например, возможно, что вариации шести наблюдаемых переменных в основном отражают вариации двух ненаблюдаемых (основных) переменных. Факторный анализ ищет такие совместные вариации в ответ на ненаблюдаемые скрытые переменные . Наблюдаемые переменные моделируются как линейные комбинации потенциальных факторов плюс « ошибочные » члены, поэтому факторный анализ можно рассматривать как частный случай моделей ошибок в переменных . [1]
Проще говоря, факторная нагрузка переменной определяет степень, в которой переменная связана с данным фактором. [2]
Общее обоснование методов факторного анализа заключается в том, что информация, полученная о взаимозависимости между наблюдаемыми переменными, может быть использована позже для сокращения набора переменных в наборе данных. Факторный анализ обычно используется в психометрии , личности психологии , биологии, маркетинге , управлении продуктами , исследованиях операций , финансах и машинном обучении . Это может помочь справиться с наборами данных, в которых имеется большое количество наблюдаемых переменных, которые, как считается, отражают меньшее количество основных/скрытых переменных. Это один из наиболее часто используемых методов взаимозависимости, который используется, когда соответствующий набор переменных демонстрирует систематическую взаимозависимость, и цель состоит в том, чтобы выяснить скрытые факторы, которые создают общность.
Статистическая модель
[ редактировать ]Определение
[ редактировать ]Модель пытается объяснить ряд наблюдения в каждом из личности с набором общие факторы ( ), где на единицу приходится меньше факторов, чем наблюдений на единицу ( ). У каждого человека есть своих общих факторов, и они связаны с наблюдениями через матрицу факторной нагрузки ( ), для одного наблюдения, согласно
где
- это ценность е наблюдение й человек,
- является средним значением наблюдения для это наблюдение,
- это нагрузка на е наблюдение й фактор,
- это ценность фактор й человек, и
- это ненаблюдаемая стохастическая ошибка со средним нулем и конечной дисперсией.
В матричной записи
где матрица наблюдения , загрузка матрицы , факторная матрица , матрица ошибок и средняя матрица посредством чего этот элемент просто .
Также мы наложим следующие предположения на :
- и независимы.
- ; где это ожидание
- где — ковариационная матрица , чтобы убедиться, что факторы некоррелированы, и является единичной матрицей .
Предполагать . Затем
и поэтому из условий 1 и 2, наложенных на выше, и , давая
или, установив ,
Заметим, что для любой ортогональной матрицы , если мы установим и , критерии фактора и факторной нагрузки остаются в силе. Следовательно, набор факторов и факторных нагрузок уникален только с точностью до ортогонального преобразования .
Пример
[ редактировать ]Предположим, у психолога есть гипотеза о том, что существует два вида интеллекта : «вербальный интеллект» и «математический интеллект», ни один из которых непосредственно не наблюдается. [примечание 1] Подтверждение гипотезы ищется в экзаменационных баллах 1000 студентов по каждой из 10 различных академических областей. Если каждый учащийся выбирается случайным образом из большой выборки , то 10 баллов каждого учащегося являются случайными величинами. Гипотеза психолога может гласить, что для каждой из 10 академических областей средний балл по группе всех студентов, которые разделяют некоторую общую пару значений вербального и математического «интеллекта», в несколько раз равен их уровню вербального интеллекта плюс еще раз в константу. их уровень математического интеллекта, т. е. он представляет собой линейную комбинацию этих двух «факторов». Числа для конкретного субъекта, на которые умножаются два вида интеллекта для получения ожидаемого балла, согласно гипотезе, одинаковы для всех пар уровней интеллекта и называются «факторной нагрузкой» для этого субъекта. [ нужны разъяснения ] Например, гипотеза может заключаться в том, что прогнозируемые средние способности студента в области астрономии равны
- {10 × вербальный интеллект учащегося} + {6 × математический интеллект учащегося}.
Числа 10 и 6 — это факторные нагрузки, связанные с астрономией. Другие учебные предметы могут иметь другие факторные нагрузки.
Предполагается, что два студента имеют одинаковую степень вербального и математического интеллекта, но могут иметь разные измеренные способности к астрономии, поскольку индивидуальные способности отличаются от средних способностей (предсказанных выше), а также из-за самой ошибки измерения. Такие различия составляют то, что в совокупности называется «ошибкой» — статистическим термином, который означает величину, на которую измеренный человек отличается от того, что является средним или прогнозируемым на основе его или ее уровня интеллекта (см. ошибки и остатки в статистике). ).
Наблюдаемые данные, которые используются в факторном анализе, будут представлять собой 10 баллов каждого из 1000 студентов, всего 10 000 чисел. Факторные нагрузки и уровни двух видов интеллекта каждого учащегося должны быть выведены из данных.
Математическая модель того же примера
[ редактировать ]Далее матрицы будут обозначаться индексированными переменными. «Предметные» индексы будут обозначаться буквами. , и , со значениями, начиная с к что равно в приведенном выше примере. Индексы «Фактора» будут обозначаться буквами. , и , со значениями, начиная с к что равно в приведенном выше примере. Индексы «экземпляра» или «образца» обозначаются буквами. , и , со значениями, начиная с к . В приведенном выше примере, если образец студенты приняли участие в экзамены, балл учащегося за экзамен сдает . Цель факторного анализа – охарактеризовать корреляции между переменными. из которых представляют собой конкретный экземпляр или набор наблюдений. Чтобы переменные были равноправными, их нормализуют в стандартные баллы. :
где выборочное среднее:
а выборочная дисперсия определяется выражением:
Модель факторного анализа для этой конкретной выборки выглядит следующим образом:
или, более кратко:
где
- это «вербальный интеллект» ученика,
- это «математический интеллект» ученика,
- являются факторными нагрузками для этот предмет, для .
В матричной записи имеем
Заметьте, что, удвоив шкалу, по которой «вербальный интеллект» (первый компонент в каждом столбце таблицы) — измеряется, и одновременное уменьшение вдвое факторной нагрузки вербального интеллекта не имеет никакого значения для модели. Таким образом, нельзя потерять общности, если предположить, что стандартное отклонение факторов вербального интеллекта равно . То же самое и с математическим интеллектом. Более того, по тем же причинам не теряется общность, если предположить, что эти два фактора не коррелируют друг с другом. Другими словами:
где – это дельта Кронекера ( когда и когда ). Предполагается, что ошибки не зависят от факторов:
Обратите внимание: поскольку любое вращение решения также является решением, интерпретация факторов затрудняется. См. недостатки ниже. В этом конкретном примере, если мы заранее не знаем, что два типа интеллекта не коррелируют, мы не можем интерпретировать эти два фактора как два разных типа интеллекта. Даже если они не коррелируют, мы не можем без внешнего аргумента сказать, какой фактор соответствует вербальному интеллекту, а какой — математическому.
Значения нагрузок , средние значения , и дисперсии «ошибок» необходимо оценить с учетом наблюдаемых данных и (предположение об уровнях факторов фиксировано для данного ). «Основная теорема» может быть выведена из приведенных выше условий:
Термин слева — это -член корреляционной матрицы (a матрица, полученная как произведение матрица стандартизированных наблюдений с ее транспонированием) наблюдаемых данных и ее диагональные элементы будут с. Второй член справа будет диагональной матрицей с членами меньше единицы. Первый член справа представляет собой «приведенную корреляционную матрицу» и будет равен корреляционной матрице, за исключением ее диагональных значений, которые будут меньше единицы. Эти диагональные элементы сокращенной корреляционной матрицы называются «общинами» (которые представляют собой долю дисперсии наблюдаемой переменной, объясняемую факторами):
Пример данных не будет точно подчиняться приведенному выше фундаментальному уравнению из-за ошибок выборки, неадекватности модели и т. д. Целью любого анализа приведенной выше модели является нахождение факторов и нагрузки которые дают «наилучшее соответствие» данным. В факторном анализе наилучшее соответствие определяется как минимум среднеквадратической ошибки недиагональных остатков корреляционной матрицы: [3]
Это эквивалентно минимизации недиагональных компонентов ковариации ошибок, которые в уравнениях модели имеют ожидаемые значения, равные нулю. Это следует противопоставить анализу главных компонент, который стремится минимизировать среднеквадратическую ошибку всех остатков. [3] До появления высокоскоростных компьютеров значительные усилия были направлены на поиск приближенных решений проблемы, особенно при оценке сообществ другими способами, что затем значительно упрощает задачу, давая известную сокращенную корреляционную матрицу. Затем это использовалось для оценки факторов и нагрузок. С появлением высокоскоростных компьютеров задача минимизации может решаться итеративно с достаточной скоростью, а сообщества вычисляются в процессе, а не заранее. Алгоритм MinRes особенно подходит для решения этой проблемы, но вряд ли является единственным итеративным средством поиска решения.
Если факторам решения разрешено коррелировать (например, при «облиминном» вращении), то соответствующая математическая модель использует асимметричные координаты, а не ортогональные координаты.
Геометрическая интерпретация
[ редактировать ]Параметрам и переменным факторного анализа можно дать геометрическую интерпретацию. Данные ( ), факторы ( ) и ошибки ( ) можно рассматривать как векторы в -мерное евклидово пространство (выборочное пространство), представленное как , и соответственно. Поскольку данные стандартизированы, векторы данных имеют единичную длину ( ). Векторы факторов определяют -мерное линейное подпространство (т.е. гиперплоскость) в этом пространстве, на которое векторы данных проецируются ортогонально. Это следует из модельного уравнения
и независимость факторов и ошибок: . В приведенном выше примере гиперплоскость — это просто двумерная плоскость, определяемая двумя фактор-векторами. Проекция векторов данных на гиперплоскость определяется выражением
а ошибки представляют собой векторы от этой проецируемой точки к точке данных и перпендикулярны гиперплоскости. Цель факторного анализа — найти гиперплоскость, которая в некотором смысле «наилучшим образом соответствует» данным, поэтому не имеет значения, как выбираются векторы факторов, определяющие эту гиперплоскость, если они независимы и лежат в гиперплоскость. Мы можем указать их как ортогональные, так и нормальные ( ) без потери общности. После того, как подходящий набор факторов будет найден, их также можно произвольно повернуть внутри гиперплоскости, так что любое вращение векторов факторов будет определять одну и ту же гиперплоскость и также будет решением. В результате в приведенном выше примере, в котором подходящая гиперплоскость является двумерной, если мы заранее не знаем, что два типа интеллекта не коррелируют, то мы не можем интерпретировать эти два фактора как два разных типа интеллекта. Даже если они некоррелированы, мы не можем без внешнего аргумента сказать, какой фактор соответствует вербальному интеллекту, а какой — математическому, или являются ли эти факторы линейными комбинациями того и другого.
Векторы данных имеют единичную длину. Записи корреляционной матрицы для данных имеют вид . Матрицу корреляции можно геометрически интерпретировать как косинус угла между двумя векторами данных. и . Диагональные элементы явно будут s, а недиагональные элементы будут иметь абсолютные значения, меньшие или равные единице. «Приведенная корреляционная матрица» определяется как
- .
Цель факторного анализа состоит в том, чтобы выбрать подгоночную гиперплоскость так, чтобы приведенная корреляционная матрица как можно точнее воспроизводила корреляционную матрицу, за исключением диагональных элементов корреляционной матрицы, которые, как известно, имеют единичное значение. Другими словами, цель состоит в том, чтобы как можно точнее воспроизвести взаимные корреляции в данных. В частности, для аппроксимирующей гиперплоскости среднеквадратическая ошибка недиагональных компонентов
должен быть минимизирован, и это достигается путем минимизации его по отношению к набору ортонормированных фактор-векторов. Видно, что
Член справа — это просто ковариация ошибок. В модели ковариация ошибок определяется как диагональная матрица, и поэтому описанная выше задача минимизации фактически дает «наилучшее соответствие» модели: она дает выборочную оценку ковариации ошибок, которая имеет недиагональные компоненты. минимизирована в среднеквадратическом смысле. Видно, что, поскольку являются ортогональными проекциями векторов данных, их длина будет меньше или равна длине проецируемого вектора данных, которая равна единице. Квадраты этих длин представляют собой не что иное, как диагональные элементы приведенной корреляционной матрицы. Эти диагональные элементы сокращенной корреляционной матрицы известны как «сообщества»:
Большие значения общностей будут указывать на то, что подходящая гиперплоскость достаточно точно воспроизводит корреляционную матрицу. Средние значения факторов также должны быть равны нулю, из чего следует, что средние значения ошибок также будут равны нулю.
Практическая реализация
[ редактировать ]Этот раздел нуждается в дополнительных цитатах для проверки . ( Апрель 2012 г. ) |
Виды факторного анализа
[ редактировать ]Исследовательский факторный анализ
[ редактировать ]Исследовательский факторный анализ (EFA) используется для выявления сложных взаимосвязей между элементами и группировки элементов, которые являются частью единых концепций. [4] Исследователь не делает априорных предположений о взаимосвязях между факторами. [4]
Подтверждающий факторный анализ
[ редактировать ]Подтверждающий факторный анализ (CFA) — это более сложный подход, который проверяет гипотезу о том, что элементы связаны с конкретными факторами. [4] CFA использует моделирование структурными уравнениями для тестирования модели измерения, при этом нагрузка на факторы позволяет оценить взаимосвязь между наблюдаемыми переменными и ненаблюдаемыми переменными. [4] Подходы к моделированию структурными уравнениями могут учитывать ошибки измерения и являются менее ограничительными, чем оценка методом наименьших квадратов . [4] Гипотетические модели проверяются на реальных данных, и анализ должен продемонстрировать нагрузку наблюдаемых переменных на скрытые переменные (факторы), а также корреляцию между скрытыми переменными. [4]
Виды извлечения факторов
[ редактировать ]Анализ главных компонентов (PCA) — это широко используемый метод извлечения факторов, который является первым этапом EFA. [4] Веса факторов рассчитываются для извлечения максимально возможной дисперсии, при этом последовательный факторинг продолжается до тех пор, пока не останется никакой значимой дисперсии. [4] Затем факторную модель необходимо повернуть для анализа. [4]
Канонический факторный анализ, также называемый каноническим факторингом Рао, представляет собой другой метод расчета той же модели, что и PCA, который использует метод главной оси. Канонический факторный анализ ищет факторы, которые имеют самую высокую каноническую корреляцию с наблюдаемыми переменными. На канонический факторный анализ не влияет произвольное масштабирование данных.
Анализ общих факторов, также называемый анализом главных факторов (PFA) или факторингом по главной оси (PAF), ищет наименьшее количество факторов, которые могут объяснить общую дисперсию (корреляцию) набора переменных.
Факторинг изображений основан на матрице корреляции прогнозируемых переменных, а не фактических переменных, где каждая переменная прогнозируется на основе других с использованием множественной регрессии .
Альфа-факторинг основан на максимизации надежности факторов при условии, что переменные выбираются случайным образом из совокупности переменных. Все остальные методы предполагают выборку случаев и фиксирование переменных.
Модель факторной регрессии представляет собой комбинаторную модель факторной модели и модели регрессии; или, альтернативно, ее можно рассматривать как гибридную факторную модель, [5] факторы которого частично известны.
Терминология
[ редактировать ]- Факторные нагрузки
- Общность — это квадрат стандартизированной внешней загрузки предмета. По аналогии с r-квадратом Пирсона , квадрат факторной нагрузки представляет собой процент дисперсии индикаторной переменной, объясняемой фактором. Чтобы получить процент дисперсии всех переменных, учитываемых каждым фактором, сложите сумму квадратов факторных нагрузок для этого фактора (столбца) и разделите на количество переменных. фактора (Обратите внимание, что количество переменных равно сумме их дисперсий, поскольку дисперсия стандартизованной переменной равна 1.) Это то же самое, что разделить собственное значение на количество переменных. При интерпретации, согласно одному эмпирическому правилу подтверждающего факторного анализа, факторные нагрузки должны составлять 0,7 или выше, чтобы подтвердить, что независимые переменные, определенные априори, представлены конкретным фактором, на том основании, что уровень 0,7 соответствует примерно половине отклонение показателя, объясняемое фактором. Однако стандарт 0,7 является высоким, и реальные данные вполне могут не соответствовать этому критерию, поэтому некоторые исследователи, особенно в исследовательских целях, будут использовать более низкий уровень, например 0,4 для центрального фактора и 0,25 для центрального фактора. другие факторы. В любом случае факторные нагрузки следует интерпретировать в свете теории, а не произвольных пороговых уровней. При наклонном вращении можно исследовать как матрицу шаблонов, так и матрицу структур. Структурная матрица представляет собой просто матрицу факторной нагрузки, как при ортогональном вращении, представляющую дисперсию измеряемой переменной, объясняемую фактором как на основе уникальных, так и на общих вкладах. Матрица шаблонов, напротив, содержит коэффициенты , которые просто представляют уникальные вклады. Чем больше факторов, тем, как правило, ниже коэффициенты шаблона, поскольку в объяснении дисперсии будет больше общих вкладов. В случае наклонного вращения исследователь рассматривает как структуру, так и коэффициенты шаблона при присвоении метки фактору. Принципы наклонного вращения могут быть выведены как из перекрестной энтропии, так и из ее двойной энтропии. [6]
- Сообщество
- Сумма квадратов факторных нагрузок для всех факторов для данной переменной (строки) представляет собой дисперсию этой переменной, учитываемую всеми факторами. Общность измеряет процент дисперсии данной переменной, объясняемой всеми факторами вместе, и может интерпретироваться как надежность индикатора в контексте постулируемых факторов.
- Ложные решения
- Если общность превышает 1,0, существует ложное решение, которое может отражать слишком маленькую выборку или выбор для извлечения слишком большого или слишком малого количества факторов.
- Уникальность переменной
- Изменчивость переменной минус ее общность.
- Собственные значения/характеристические корни
- Собственные значения измеряют величину изменений в общей выборке, обусловленную каждым фактором. Отношение собственных значений – это отношение объясняющей значимости факторов по отношению к переменным. Если фактор имеет низкое собственное значение, то он мало способствует объяснению дисперсий переменных и может игнорироваться как менее важный, чем факторы с более высокими собственными значениями.
- Извлечение сумм квадратов нагрузок
- Начальные собственные значения и собственные значения после извлечения (перечисленные в SPSS как «Суммы извлечения квадратов нагрузок») одинаковы для извлечения PCA, но для других методов извлечения собственные значения после извлечения будут ниже, чем их исходные аналоги. SPSS также печатает «Суммы вращения квадратов нагрузок», и даже для PCA эти собственные значения будут отличаться от начальных и извлеченных собственных значений, хотя их общая сумма будет одинаковой.
- Факторные оценки
- Оценки компонентов (в PCA)
Баллы каждого случая (строки) по каждому фактору (столбцу). Чтобы вычислить оценку фактора для данного случая для данного фактора, нужно взять стандартизированную оценку случая по каждой переменной, умножить на соответствующие нагрузки переменной для данного фактора и суммировать эти произведения. Вычисление оценок факторов позволяет искать выбросы факторов. Кроме того, оценки факторов могут использоваться в качестве переменных при последующем моделировании.
Критерии определения количества факторов
[ редактировать ]Исследователи хотят избежать таких субъективных или произвольных критериев сохранения факторов, как «это имело для меня смысл». Для решения этой проблемы был разработан ряд объективных методов, позволяющих пользователям определить подходящий диапазон решений для исследования. [7] Однако эти разные методы часто расходятся друг с другом относительно количества факторов, которые следует сохранить. Например, параллельный анализ может предложить 5 факторов, тогда как MAP Велисера предлагает 6, поэтому исследователь может запросить как 5-, так и 6-факторные решения и обсудить каждое с точки зрения их связи с внешними данными и теорией.
Современные критерии
[ редактировать ]Параллельный анализ Хорна (ПА): [8] Метод моделирования, основанный на методе Монте-Карло, который сравнивает наблюдаемые собственные значения с значениями, полученными на основе некоррелированных нормальных переменных. Фактор или компонент сохраняется, если соответствующее собственное значение превышает 95-й процентиль распределения собственных значений, полученных на основе случайных данных. PA является одним из наиболее часто рекомендуемых правил для определения количества сохраняемых компонентов. [7] [9] но многие программы не включают эту опцию (заметным исключением является R ). [10] Однако Форман предоставил как теоретические, так и эмпирические доказательства того, что его применение может оказаться неподходящим во многих случаях, поскольку на его эффективность существенно влияют размер выборки , различение элементов и тип коэффициента корреляции . [11]
Тест Велицера (1976) MAP [12] как описано Кортни (2013) [13] «включает в себя полный анализ главных компонентов с последующим исследованием ряда матриц частных корреляций» (стр. 397 (хотя обратите внимание, что эта цитата не встречается в Velicer (1976), а номер цитируемой страницы находится за пределами страниц цитаты). Квадрат корреляции для шага «0» (см. рисунок 4) представляет собой средний квадрат недиагональной корреляции для нечастной корреляционной матрицы. На шаге 1 первый главный компонент и связанные с ним элементы разделяются. Затем на этапе 1 вычисляется недиагональная корреляция для последующей корреляционной матрицы. На этапе 2 первые два главных компонента разделяются на части и снова вычисляется результирующая среднеквадратическая недиагональная корреляция. Вычисления выполняются для k минус один. шаг (k представляет общее количество переменных в матрице. После этого все среднеквадратические корреляции для каждого шага выстраиваются в ряд, и номер шага в анализе, который привел к наименьшему среднеквадратичной частичной корреляции, определяет количество компонентов или). факторы, которые необходимо сохранить. [12] С помощью этого метода компоненты сохраняются до тех пор, пока дисперсия в корреляционной матрице представляет собой систематическую дисперсию, а не дисперсию остатков или ошибок. Хотя методологически метод MAP похож на анализ главных компонентов, было показано, что метод MAP довольно хорошо работает при определении количества факторов, которые необходимо сохранить в множественных исследованиях моделирования. [7] [14] [15] [16] Эта процедура доступна через пользовательский интерфейс SPSS. [13] а также пакет psych для языка программирования R. [17] [18]
Старые методы
[ редактировать ]Критерий Кайзера: Правило Кайзера состоит в том, чтобы отбросить все компоненты с собственными значениями ниже 1,0 – это собственное значение, равное информации, учитываемой средним отдельным элементом. [19] Критерий Кайзера используется по умолчанию в SPSS и большинстве статистических программ , но его не рекомендуется использовать в качестве единственного критерия отсечения для оценки количества факторов, поскольку он имеет тенденцию к чрезмерному извлечению факторов. [20] Была создана разновидность этого метода, в которой исследователь рассчитывает доверительные интервалы для каждого собственного значения и сохраняет только те факторы, весь доверительный интервал которых превышает 1,0. [14] [21]
Сюжет : [22] Тест осыпи Кеттелла отображает компоненты по оси X, а соответствующие собственные значения по оси Y. — При движении вправо, к более поздним компонентам, собственные значения падают. Когда падение прекращается и кривая поворачивает в сторону менее крутого падения, тест осыпи Кеттелла требует отбросить все дальнейшие компоненты после того, который начинается с колена. Это правило иногда критикуют за то, что оно допускает « фальсификацию », контролируемую исследователями. То есть, поскольку выбор «локтя» может быть субъективным, поскольку кривая имеет несколько колен или представляет собой плавную кривую, у исследователя может возникнуть соблазн установить пороговое значение на количестве факторов, требуемых его исследовательской программой. [ нужна ссылка ]
Критерии объяснения дисперсии: некоторые исследователи просто используют правило сохранения достаточного количества факторов, чтобы объяснить 90% (иногда 80%) вариации. Если целью исследователя является экономия (объяснение дисперсии с помощью как можно меньшего количества факторов), критерий может составлять всего 50%.
Байесовские методы
[ редактировать ]Поместив априорное распределение по количеству скрытых факторов и затем применив теорему Байеса, байесовские модели могут вернуть распределение вероятностей по количеству скрытых факторов. Это было смоделировано с использованием процесса индийского шведского стола . [23] но его можно смоделировать проще, поместив любой дискретный априор (например, отрицательное биномиальное распределение ) на количество компонентов.
Методы ротации
[ редактировать ]Результат PCA максимизирует дисперсию, учитываемую сначала первым фактором, затем вторым фактором и т. д. Недостаток этой процедуры заключается в том, что большинство элементов загружаются на ранние факторы, в то время как очень немногие элементы загружаются на более поздние переменные. Это затрудняет интерпретацию факторов путем чтения списка вопросов и нагрузок, поскольку каждый вопрос сильно коррелирует с несколькими первыми компонентами, в то время как очень немногие вопросы сильно коррелируют с несколькими последними компонентами.
Вращение служит для облегчения интерпретации вывода. Выбирая другую основу для одних и тех же главных компонентов, то есть выбирая разные факторы для выражения одной и той же структуры корреляции, можно создать переменные, которые легче интерпретировать.
Вращения могут быть ортогональными или наклонными; наклонные вращения позволяют факторам коррелировать. [24] Эта повышенная гибкость означает, что возможно большее количество ротаций, некоторые из которых могут быть лучше для достижения указанной цели. Однако это также может затруднить интерпретацию факторов, поскольку некоторая информация «учитывается дважды» и включается несколько раз в разные компоненты; некоторые факторы могут даже оказаться почти дублирующими друг друга.
Ортогональные методы
[ редактировать ]Существуют два широких класса ортогональных вращений: те, которые ищут разреженные строки (где каждая строка представляет собой случай, т.е. субъект), и те, которые ищут разреженные столбцы (где каждый столбец является переменной).
- Простые факторы: эти ротации пытаются объяснить все факторы, используя только несколько важных переменных. Такого эффекта можно добиться, используя Varimax (наиболее распространенное вращение).
- Простые переменные: эти ротации пытаются объяснить все переменные, используя лишь несколько важных факторов. Этого эффекта можно достичь, используя либо Quartimax , либо невращающиеся компоненты PCA.
- И то, и другое: эти ротации пытаются найти компромисс между обеими вышеперечисленными целями, но в процессе могут быть достигнуты неудовлетворительные результаты для обеих задач; как таковые они непопулярны по сравнению с вышеупомянутыми методами. Эквамакс – одна из таких ротаций.
Проблемы с ротацией факторов
[ редактировать ]Может быть сложно интерпретировать факторную структуру, когда каждая переменная нагружает несколько факторов. Небольшие изменения в данных иногда могут нарушить баланс критерия ротации факторов, в результате чего будет получена совершенно другая ротация факторов. Это может затруднить сравнение результатов различных экспериментов. Эта проблема иллюстрируется сравнением различных исследований мировых культурных различий. В каждом исследовании использовались разные меры культурных переменных и были получены по-разному повернутые результаты факторного анализа. Авторы каждого исследования считали, что открыли что-то новое, и изобретали новые названия обнаруженным факторам. Более позднее сравнение исследований показало, что результаты были довольно схожими при сравнении неротированных результатов. Обычная практика ротации факторов скрыла сходство между результатами различных исследований. [25]
Факторный анализ высшего порядка
[ редактировать ]Эта статья может сбивать с толку или быть непонятной читателям . ( Март 2010 г. ) |
Факторный анализ высшего порядка — это статистический метод, состоящий из повторяющихся этапов факторного анализа — наклонного вращения — факторного анализа повернутых факторов. Его достоинство состоит в том, что он дает возможность исследователю увидеть иерархическую структуру изучаемых явлений. Чтобы интерпретировать результаты, нужно действовать либо путем последующего умножения матрицы шаблонов первичных факторов на матрицы шаблонов факторов более высокого порядка (Горсач, 1983) и, возможно, применения вращения Варимакса к результату (Томпсон, 1990), либо с помощью метода Шмид- Решение Леймана (SLS, Schmid & Leiman, 1957, также известное как преобразование Шмида-Леймана), которое приписывает изменение от первичных факторов факторам второго порядка.
Исследовательский факторный анализ (EFA) в сравнении с анализом главных компонентов (PCA)
[ редактировать ]Факторный анализ связан с анализом главных компонентов (PCA), но они не идентичны. [26] В этой области возникли серьезные разногласия по поводу различий между этими двумя методами. PCA можно рассматривать как более базовую версию исследовательского факторного анализа (EFA), которая была разработана еще до появления высокоскоростных компьютеров. И PCA, и факторный анализ направлены на уменьшение размерности набора данных, но подходы, используемые для этого, различны для этих двух методов. Факторный анализ явно разработан с целью выявить определенные ненаблюдаемые факторы из наблюдаемых переменных, тогда как PCA напрямую не решает эту цель; в лучшем случае PCA обеспечивает приближение к требуемым коэффициентам. [27] С точки зрения исследовательского анализа, собственные значения PCA представляют собой завышенные нагрузки компонентов, т. е. содержат дисперсию ошибок. [28] [29] [30] [31] [32] [33]
Хотя в некоторых областях статистики ОДВ и PCA рассматриваются как синонимичные методы, это подвергается критике. [34] [35] Факторный анализ «имеет дело с предположением о базовой причинной структуре : [он] предполагает, что ковариация наблюдаемых переменных обусловлена присутствием одной или нескольких скрытых переменных (факторов), которые оказывают причинное влияние на эти наблюдаемые переменные». [36] Напротив, PCA не предполагает и не зависит от такой основной причинной связи. Исследователи утверждают, что различия между этими двумя методами могут означать, что существует объективная выгода от предпочтения одного метода другому, исходя из аналитической цели. Если факторная модель сформулирована неправильно или предположения не выполняются, то факторный анализ даст ошибочные результаты. Факторный анализ успешно использовался там, где адекватное понимание системы позволяет правильно сформулировать первоначальную модель. PCA использует математическое преобразование исходных данных без каких-либо предположений о форме ковариационной матрицы. Целью PCA является определение линейных комбинаций исходных переменных и выбор нескольких из них, которые можно использовать для суммирования набора данных без потери большой информации. [37]
Аргументы, противопоставляющие PCA и EFA
[ редактировать ]Фабригар и др. (1999) [34] рассмотреть ряд причин, по которым можно предположить, что PCA не эквивалентен факторному анализу:
- Иногда предполагается, что PCA вычислительно быстрее и требует меньше ресурсов, чем факторный анализ. Фабригар и др. предполагают, что легкодоступные компьютерные ресурсы сделали эту практическую проблему неактуальной.
- PCA и факторный анализ могут дать аналогичные результаты. Этот вопрос также рассматривается Фабригаром и др.; в некоторых случаях, когда общность невелика (например, 0,4), два метода дают разные результаты. Фактически, Фабригар и др. утверждают, что в тех случаях, когда данные соответствуют предположениям модели общего фактора, результаты PCA являются неточными.
- Есть определенные случаи, когда факторный анализ приводит к «случаям Хейвуда». К ним относятся ситуации, когда 100% или более дисперсии измеряемой переменной, по оценкам, учитываются моделью. Фабригар и др. предполагают, что эти случаи действительно информативны для исследователя, указывая на неправильно заданную модель или нарушение модели общего фактора. Отсутствие дел Хейвуда в подходе PCA может означать, что такие проблемы остаются незамеченными.
- Исследователи получают дополнительную информацию от подхода PCA, например, оценку человека по определенному компоненту; такая информация не получается из факторного анализа. Однако, как отмечают Фабригар и др. утверждают, что типичная цель факторного анализа – т.е. определение факторов, обуславливающих структуру корреляций между измеряемыми переменными – не требует знания оценок факторов, и, таким образом, это преимущество сводится на нет. Также возможно вычислить оценки факторов на основе факторного анализа.
Дисперсия против ковариации
[ редактировать ]Факторный анализ учитывает случайную ошибку , присущую измерению, тогда как PCA этого не делает. Этот момент иллюстрируется Брауном (2009): [38] который указал, что в отношении корреляционных матриц, задействованных в расчетах:
«В PCA 1,00 ставятся по диагонали, что означает, что должна быть учтена вся дисперсия в матрице (включая дисперсию, уникальную для каждой переменной, дисперсию, общую для всех переменных, и дисперсию ошибок). Таким образом, это будет по определению , включают всю дисперсию переменных. Напротив, в EFA общности расположены по диагонали, что означает, что учитывается только дисперсия, общая с другими переменными (исключая дисперсию, уникальную для каждой переменной, и дисперсию ошибки). следовательно, по определению будет включать только дисперсию, которая является общей для всех переменных».
- Браун (2009), Анализ основных компонентов и исследовательский факторный анализ. Определения, различия и выбор.
По этой причине Браун (2009) рекомендует использовать факторный анализ, когда существуют теоретические идеи о взаимосвязях между переменными, тогда как PCA следует использовать, если целью исследователя является изучение закономерностей в своих данных.
Различия в процедуре и результатах
[ редактировать ]Различия между PCA и факторным анализом (FA) дополнительно иллюстрируются Suhr (2009): [35]
- PCA приводит к получению главных компонентов, которые объясняют максимальную величину дисперсии наблюдаемых переменных; FA учитывает общие отклонения в данных.
- PCA вставляет единицы по диагоналям корреляционной матрицы; FA корректирует диагонали корреляционной матрицы с учетом уникальных коэффициентов.
- PCA минимизирует сумму квадратов перпендикулярных расстояний к оси компонента; FA оценивает факторы, влияющие на реакцию наблюдаемых переменных.
- Оценки компонентов в PCA представляют собой линейную комбинацию наблюдаемых переменных, взвешенных по собственным векторам ; наблюдаемые переменные в FA представляют собой линейные комбинации основных и уникальных факторов.
- В PCA полученные компоненты неинтерпретируемы, т.е. они не представляют собой лежащие в основе «конструкции»; в FA базовые конструкции могут быть помечены и легко интерпретированы при наличии точной спецификации модели.
В психометрии
[ редактировать ]История
[ редактировать ]Чарльз Спирмен был первым психологом, обсудившим анализ общих факторов. [39] и сделал это в своей статье 1904 года. [40] В нем содержалось мало подробностей о его методах и речь шла об однофакторных моделях. [41] Он обнаружил, что результаты школьников по широкому кругу, казалось бы, несвязанных между собой предметов положительно коррелируют, что привело его к предположению, что одна общая умственная способность, или g , лежит в основе и формирует когнитивные способности человека.
Первоначальное развитие общего факторного анализа с множеством факторов было дано Луи Терстоном в двух статьях в начале 1930-х годов: [42] [43] резюмировал в своей книге 1935 года «Вектор разума» . [44] Терстоун представил несколько важных концепций факторного анализа, включая общность, уникальность и ротацию. [45] Он выступал за «простую структуру» и разработал методы ротации, которые можно было использовать как способ достижения такой структуры. [39]
В методологии Q , Уильям Стивенсон ученик Спирмена, различал R -факторный анализ, ориентированный на изучение межиндивидуальных различий, и Q -факторный анализ, ориентированный на субъективные внутрииндивидуальные различия. [46] [47]
Рэймонд Кеттелл был ярым сторонником факторного анализа и психометрии и использовал многофакторную теорию Терстоуна для объяснения интеллекта. Кеттелл также разработал тест осыпи и коэффициенты подобия.
Приложения в психологии
[ редактировать ]Факторный анализ используется для выявления «факторов», объясняющих различные результаты различных тестов. Например, исследования интеллекта показали, что люди, получившие высокие баллы по тесту на вербальные способности, также хорошо справляются с другими тестами, требующими вербальных способностей. Исследователи объяснили это тем, что использовали факторный анализ для выделения одного фактора, часто называемого вербальным интеллектом, который отражает степень способности человека решать проблемы, связанные с вербальными навыками. [ нужна ссылка ]
Факторный анализ в психологии чаще всего связан с исследованиями интеллекта. Однако он также использовался для поиска факторов в широком диапазоне областей, таких как личность, отношения, убеждения и т. д. Он связан с психометрией , поскольку может оценить достоверность инструмента, определяя, действительно ли этот инструмент измеряет постулируемые факторы. [ нужна ссылка ]
Преимущества
[ редактировать ]- Сокращение количества переменных за счет объединения двух или более переменных в один фактор. Например, результаты бега, метания мяча, ударов мячом, прыжков и поднятия тяжестей можно объединить в один фактор, например, общие спортивные способности. Обычно в матрице «элемент по людям» факторы выбираются путем группировки связанных элементов. В методе Q-факторного анализа матрица транспонируется, и факторы создаются путем группировки связанных людей. Например, либералы, либертарианцы, консерваторы и социалисты могут образоваться в отдельные группы.
- Идентификация групп взаимосвязанных переменных, чтобы увидеть, как они связаны друг с другом. Например, Кэрролл использовал факторный анализ для построения своей теории трех слоев . Он обнаружил, что фактор, называемый «широким зрительным восприятием», связан с тем, насколько хорошо человек справляется со зрительными задачами. Он также обнаружил фактор «широкого слухового восприятия», связанный с возможностями слухового восприятия. Кроме того, он обнаружил глобальный фактор, называемый «g» или общий интеллект, который относится как к «широкому зрительному восприятию», так и к «широкому слуховому восприятию». Это означает, что человек с высоким показателем «g», скорее всего, будет обладать как высокими способностями «зрительного восприятия», так и высокими способностями «слухового восприятия», и поэтому этот «g», следовательно, объясняет большую часть того, почему кто-то хорош или плох в обоих случаях. эти домены.
Недостатки
[ редактировать ]- «...каждая ориентация одинаково приемлема математически. Но разные факторные теории оказались различающимися как с точки зрения ориентации факториальных осей для данного решения, так и с точки зрения чего-либо еще, так что подгонка модели не оказалась полезной в различение теорий». (Штернберг, 1977 г. [48] ). Это означает, что все ротации представляют собой различные базовые процессы, но все ротации являются одинаково действительными результатами оптимизации стандартного факторного анализа. Следовательно, невозможно выбрать правильную ротацию, используя только факторный анализ.
- Факторный анализ может быть настолько хорош, насколько позволяют данные. В психологии, где исследователям часто приходится полагаться на менее валидные и надежные показатели, такие как самоотчеты, это может быть проблематичным.
- Интерпретация факторного анализа основана на использовании «эвристики», которая представляет собой «удобное, даже если не абсолютно верное решение». [49] Одни и те же данные, факторизованные одним и тем же способом, могут быть интерпретированы более чем одной раз, и факторный анализ не может выявить причинно-следственную связь.
В межкультурных исследованиях
[ редактировать ]Факторный анализ – часто используемый метод в кросс-культурных исследованиях. Оно служит цели извлечения культурных измерений . Наиболее известные модели культурных измерений разработаны Гертом Хофстеде , Рональдом Инглхартом , Кристианом Вельцелем , Шаломом Шварцем и Майклом Минковым. Популярной визуализацией является культурная карта мира Инглхарта и Вельцеля . [25]
В политологии
[ редактировать ]В исследовании начала 1965 года политические системы по всему миру изучаются с помощью факторного анализа для построения соответствующих теоретических моделей и исследований, сравнения политических систем и создания типологических категорий. [50] Для этих целей в этом исследовании определены семь основных политических измерений, которые связаны с широким спектром политического поведения: эти измерения: доступ, дифференциация, консенсус, секционализм, легитимация, интерес и теория и исследования лидерства.
Другие политологи исследуют измерение внутренней политической эффективности, используя четыре новых вопроса, добавленных в Национальное исследование выборов 1988 года. Здесь используется факторный анализ, чтобы обнаружить, что эти вопросы измеряют единую концепцию, отличную от внешней эффективности и политического доверия, и что эти четыре вопроса обеспечивают наилучшую меру внутренней политической эффективности на тот момент времени. [51]
В маркетинге
[ редактировать ]Основные шаги:
- Определите основные атрибуты, которые потребители используют для оценки продуктов в этой категории.
- Используйте методы количественного маркетингового исследования (например, опросы ), чтобы собрать данные о выборке потенциальных клиентов, касающиеся их оценок всех свойств продукта.
- Введите данные в статистическую программу и запустите процедуру факторного анализа. Компьютер выдаст набор основных атрибутов (или факторов).
- Используйте эти факторы для построения карт восприятия и других устройств позиционирования продукта .
Сбор информации
[ редактировать ]Этап сбора данных обычно выполняется специалистами по маркетинговым исследованиям. В вопросах опроса респонденту предлагается оценить образец продукта или описания концепций продукта по ряду характеристик. Выбирается от пяти до двадцати атрибутов. Они могут включать такие вещи, как простота использования, вес, точность, долговечность, красочность, цена или размер. Выбранные атрибуты будут различаться в зависимости от изучаемого продукта. Тот же вопрос задается обо всех продуктах в исследовании. Данные для нескольких продуктов кодируются и вводятся в статистические программы, такие как R , SPSS , SAS , Stata , STATISTICA , JMP и SYSTAT.
Анализ
[ редактировать ]Анализ позволит выделить основные факторы, которые объясняют данные, используя матрицу ассоциаций. [52] Факторный анализ – это метод взаимозависимости. Рассмотрена полная совокупность взаимозависимых отношений. Не существует спецификации зависимых переменных, независимых переменных или причинно-следственной связи. Факторный анализ предполагает, что все рейтинговые данные по различным атрибутам можно свести к нескольким важным параметрам. Такое сокращение возможно, поскольку некоторые атрибуты могут быть связаны друг с другом. Рейтинг, присвоенный какому-либо одному атрибуту, частично является результатом влияния других атрибутов. Статистический алгоритм деконструирует рейтинг (называемый исходной оценкой) на различные компоненты и реконструирует частичные оценки в оценки основных факторов. Степень корреляции между исходной исходной оценкой и окончательной оценкой фактора называется факторной нагрузкой .
Преимущества
[ редактировать ]- Можно использовать как объективные, так и субъективные атрибуты при условии, что субъективные атрибуты можно преобразовать в баллы.
- Факторный анализ может выявить скрытые измерения или конструкции, которые не может выявить прямой анализ.
- Это легко и недорого.
Недостатки
[ редактировать ]- Полезность зависит от способности исследователей собрать достаточный набор атрибутов продукта. Если важные атрибуты исключены или проигнорированы, ценность процедуры снижается.
- Если наборы наблюдаемых переменных очень похожи друг на друга и отличаются от других элементов, факторный анализ присвоит им один фактор. Это может скрыть факторы, представляющие более интересные отношения. [ нужны разъяснения ]
- Именование факторов может потребовать знания теории, поскольку кажущиеся несходными атрибуты могут сильно коррелировать по неизвестным причинам.
В физических и биологических науках
[ редактировать ]Факторный анализ также широко используется в физических науках, таких как геохимия , гидрохимия , [53] астрофизика и космология , а также биологические науки, такие как экология , молекулярная биология , нейробиология и биохимия .
При управлении качеством подземных вод важно связать пространственное распределение различных химических веществ.параметры для различных возможных источников, которые имеют разные химические характеристики. Например, сульфидная шахта, скорее всего, будет связана с высоким уровнем кислотности, растворенными сульфатами и переходными металлами. Эти сигнатуры могут быть идентифицированы как факторы с помощью факторного анализа в R-режиме, а расположение возможных источников может быть предложено путем контурирования оценок факторов. [54]
В геохимии разным минеральным ассоциациям и, следовательно, минерализации могут соответствовать разные факторы. [55]
В микроматричном анализе
[ редактировать ]Факторный анализ можно использовать для обобщения олигонуклеотидов данных микрочипов ДНК высокой плотности на уровне зонда для Affymetrix GeneChips. В этом случае латентная переменная соответствует концентрации РНК в образце. [56]
Выполнение
[ редактировать ]Факторный анализ был реализован в нескольких программах статистического анализа с 1980-х годов:
- БМДП
- JMP (статистическое программное обеспечение)
- Mplus (статистическое программное обеспечение)]
- Python : модуль scikit-learn [57]
- R (с базовой функцией factanal или функцией fa в пакете psych ). Ротации реализованы в пакете GPArotation R.
- SAS (с использованием PROC FACTOR или PROC CALIS)
- СПСС [58]
- Был
Автономный
[ редактировать ]- Фактор [1] - бесплатное программное обеспечение для факторного анализа, разработанное Университетом Ровира и Виргили.
См. также
[ редактировать ]Примечания
[ редактировать ]- ^ В этом примере «вербальный интеллект» и «математический интеллект» являются скрытыми переменными. Тот факт, что за ними не наблюдают напрямую, делает их скрытыми.
Ссылки
[ редактировать ]- ^ Йорескуг, Карл Г. (1983). «Факторный анализ как модель ошибок в переменных». Принципы современных психологических измерений . Хиллсдейл: Эрлбаум. стр. 185–196. ISBN 0-89859-277-1 .
- ^ Бандалос, Дебора Л. (2017). Теория измерения и ее приложения в социальных науках . Гилфорд Пресс.
- ^ Jump up to: а б с Харман, Гарри Х. (1976). Современный факторный анализ . Издательство Чикагского университета. стр. 175, 176. ISBN. 978-0-226-31652-9 .
- ^ Jump up to: а б с д и ж г час я Полит Д.Ф. Бек CT (2012). Исследования в области сестринского дела: получение и оценка данных для сестринского дела, 9-е изд . Филадельфия, США: Wolters Klower Health, Lippincott Williams & Wilkins.
- ^ Мэн, Дж. (2011). «Раскройте совместную регуляцию генов с помощью микроРНК и факторов транскрипции при глиобластоме, используя модель неотрицательного гибридного фактора» . Международная конференция по акустике, речи и обработке сигналов . Архивировано из оригинала 23 ноября 2011 г.
- ^ Лиу, К.-Ю.; Музыкус, БР (2008). «Кросс-энтропийная аппроксимация структурированных гауссовских ковариационных матриц» (PDF) . Транзакции IEEE по обработке сигналов . 56 (7): 3362–3367. Бибкод : 2008ITSP...56.3362L . дои : 10.1109/TSP.2008.917878 . S2CID 15255630 .
- ^ Jump up to: а б с Цвик, Уильям Р.; Велисер, Уэйн Ф. (1986). «Сравнение пяти правил определения количества сохраняемых компонентов». Психологический вестник . 99 (3): 432–442. дои : 10.1037/0033-2909.99.3.432 .
- ^ Хорн, Джон Л. (июнь 1965 г.). «Обоснование и проверка количества факторов в факторном анализе». Психометрика . 30 (2): 179–185. дои : 10.1007/BF02289447 . ПМИД 14306381 . S2CID 19663974 .
- ^ Добрибан, Эдгар (2 октября 2017 г.). «Методы перестановок для факторного анализа и PCA». arXiv : 1710.00479v2 [ math.ST ].
- ^ * Ледесма, РД; Валеро-Мора, П. (2007). «Определение количества факторов, которые необходимо сохранить в EFA: простая в использовании компьютерная программа для проведения параллельного анализа» . Практическая оценка исследований и оценок . 12 (2): 1–11.
- ^ Тран, США, и Форман, АК (2009). Выполнение параллельного анализа при получении одномерности при наличии двоичных данных. Образовательные и психологические измерения, 69, 50-61.
- ^ Jump up to: а б Велисер, ВФ (1976). «Определение количества компонент из матрицы частных корреляций». Психометрика . 41 (3): 321–327. дои : 10.1007/bf02293557 . S2CID 122907389 .
- ^ Jump up to: а б Кортни, MGR (2013). Определение количества факторов, которые следует сохранить в EFA: использование SPSS R-Menu v2.0 для более обоснованных оценок. Практическая оценка, исследования и оценка, 18(8). Доступно онлайн: http://pareonline.net/getvn.asp?v=18&n=8. Архивировано 17 марта 2015 г. в Wayback Machine.
- ^ Jump up to: а б Варн, RT; Ларсен, Р. (2014). «Оценка предлагаемой модификации правила Гутмана для определения количества факторов в исследовательском факторном анализе». Моделирование психологических тестов и оценок . 56 : 104–123.
- ^ Руссио, Джон; Рош, Б. (2012). «Определение количества факторов, которые следует сохранить в исследовательском факторном анализе, с использованием сравнительных данных известной факторной структуры». Психологическая оценка . 24 (2): 282–292. дои : 10.1037/a0025697 . ПМИД 21966933 .
- ^ Гарридо, Л.Э., Абад, Ф.Дж., и Понсода, В. (2012). Новый взгляд на параллельный анализ Хорна с порядковыми переменными. Психологические методы. Предварительная онлайн-публикация. два : 10.1037/a0030005
- ^ Ревелл, Уильям (2007). «Определение количества факторов: на примере НЕО-ПИ-Р» (PDF) .
{{cite journal}}
: Для цитирования журнала требуется|journal=
( помощь ) - ^ Ревелл, Уильям (8 января 2020 г.). «Психика: процедуры психологических, психометрических и личностных исследований» .
- ^ Кайзер, Генри Ф. (апрель 1960 г.). «Применение электронных компьютеров для факторного анализа». Образовательные и психологические измерения . 20 (1): 141–151. дои : 10.1177/001316446002000116 . S2CID 146138712 .
- ^ Бандалос, ДЛ; Бем-Кауфман, MR (2008). «Четыре распространённых заблуждения в исследовательском факторном анализе» . В Лансе, Чарльз Э.; Ванденберг, Роберт Дж. (ред.). Статистические и методологические мифы и городские легенды: доктрина, истина и басня в организационных и социальных науках . Тейлор и Фрэнсис. стр. 61–87. ISBN 978-0-8058-6237-9 .
- ^ Ларсен, Р.; Варн, RT (2010). «Оценка доверительных интервалов для собственных значений в исследовательском факторном анализе» . Методы исследования поведения . 42 (3): 871–876. дои : 10.3758/BRM.42.3.871 . ПМИД 20805609 .
- ^ Кеттелл, Раймонд (1966). «Тест осыпи на количество факторов». Многомерное поведенческое исследование . 1 (2): 245–76. дои : 10.1207/s15327906mbr0102_10 . ПМИД 26828106 .
- ^ Алпайдин (2020). Введение в машинное обучение (5-е изд.). стр. 528–9.
- ^ «Методы ротации факторов» . Обмен стеками . Проверено 7 ноября 2022 г.
- ^ Jump up to: а б Туман, А (2022). «Двумерные модели культурных различий: статистический и теоретический анализ» (PDF) . Межкультурные исследования . 57 (2–3): 115–165. дои : 10.1177/10693971221135703 . S2CID 253153619 .
- ^ Варфоломей, диджей; Стил, Ф.; Гэлбрейт, Дж.; Мустаки, И. (2008). Анализ многомерных данных социальных наук . Статистика в серии социальных и поведенческих наук (2-е изд.). Тейлор и Фрэнсис. ISBN 978-1584889601 .
- ^ Jolliffe IT Анализ главных компонентов , Серия: Серия Springer по статистике, 2-е изд., Спрингер, Нью-Йорк, 2002, XXIX, 487 стр. 28 ил. ISBN 978-0-387-95442-4
- ^ Кеттелл, РБ (1952). Факторный анализ . Нью-Йорк: Харпер.
- ^ Фрухтер, Б. (1954). Введение в факторный анализ . Ван Ностранд.
- ^ Кеттелл, РБ (1978). Использование факторного анализа в поведенческих науках и науках о жизни . Нью-Йорк: Пленум.
- ^ Чайлд, Д. (2006). Основы факторного анализа, 3-е издание . Блумсбери Академик Пресс.
- ^ Горсач, Р.Л. (1983). Факторный анализ, 2-е издание . Хиллсдейл, Нью-Джерси: Эрлбаум.
- ^ Макдональд, Р.П. (1985). Факторный анализ и родственные методы . Хиллсдейл, Нью-Джерси: Эрлбаум.
- ^ Jump up to: а б Фабригар; и др. (1999). «Оценка использования исследовательского факторного анализа в психологических исследованиях» (PDF) . Психологические методы.
- ^ Jump up to: а б Зур, Дайан (2009). «Анализ главных компонентов против исследовательского факторного анализа» (PDF) . СУГИ 30 Труды . Проверено 5 апреля 2012 г.
- ^ Статистика САС. «Анализ основных компонентов» (PDF) . Учебник по поддержке SAS .
- ^ Меглен, Р.Р. (1991). «Исследование больших баз данных: хемометрический подход с использованием анализа главных компонентов». Журнал хемометрики . 5 (3): 163–179. дои : 10.1002/cem.1180050305 . S2CID 120886184 .
- ^ Браун, доктор юридических наук (январь 2009 г.). «Анализ основных компонентов и исследовательский факторный анализ – определения, различия и выбор» (PDF) . Сикэн: Информационный бюллетень SIG о тестировании и оценке JALT . Проверено 16 апреля 2012 г.
- ^ Jump up to: а б Мулайк, Стэнли А. (2010). Основы факторного анализа. Второе издание . Бока-Ратон, Флорида: CRC Press. п. 6. ISBN 978-1-4200-9961-4 .
- ^ Спирмен, Чарльз (1904). «Общий интеллект объективно определен и измерен». Американский журнал психологии . 15 (2): 201–293. дои : 10.2307/1412107 . JSTOR 1412107 .
- ^ Варфоломей, диджей (1995). «Спирмен и возникновение и развитие факторного анализа». Британский журнал математической и статистической психологии . 48 (2): 211–220. дои : 10.1111/j.2044-8317.1995.tb01060.x .
- ^ Терстон, Луи (1931). «Многофакторный анализ». Психологический обзор . 38 (5): 406–427. дои : 10.1037/h0069792 .
- ^ Терстон, Луи (1934). «Векторы разума». Психологический обзор . 41 : 1–32. дои : 10.1037/h0075959 .
- ^ Терстон, LL (1935). Векторы разума. Многофакторный анализ для выделения основных признаков . Чикаго, Иллинойс: Издательство Чикагского университета.
- ^ Бок, Роберт (2007). «Переосмысление Терстоуна». В Кудеке, Роберт; МакКаллум, Роберт С. (ред.). Факторный анализ на 100 . Махва, Нью-Джерси: Lawrence Erlbaum Associates. п. 37. ИСБН 978-0-8058-6212-6 .
- ^ Маккеун, Брюс (21 июня 2013 г.). Q-методология . Публикации SAGE. ISBN 9781452242194 . OCLC 841672556 .
- ^ Стивенсон, В. (август 1935 г.). «Техника факторного анализа» . Природа . 136 (3434): 297. Бибкод : 1935Natur.136..297S . дои : 10.1038/136297b0 . ISSN 0028-0836 . S2CID 26952603 .
- ^ Штернберг, Р.Дж. (1977). Метафоры разума: концепции природы интеллекта . Нью-Йорк: Издательство Кембриджского университета. стр. 85–111. [ нужна проверка ]
- ^ «Факторный анализ» . Архивировано из оригинала 18 августа 2004 года . Проверено 22 июля 2004 г.
- ^ Грегг, Филип М.; Бэнкс, Артур С. (1965). «Размеры политических систем: Факторный анализ межполитического исследования». Американский обзор политической науки . 59 (3): 602–614. дои : 10.2307/1953171 . JSTOR 1953171 . S2CID 145459216 .
- ^ Ниеми, Ричард Г.; Крейг, Стивен С.; Маттеи, Франко (декабрь 1991 г.). «Измерение внутренней политической эффективности в исследовании национальных выборов 1988 года» . Американский обзор политической науки . 85 (4): 1407–1413. дои : 10.2307/1963953 . ISSN 0003-0554 . JSTOR 1963953 . S2CID 146641381 .
- ^ Риттер, Н. (2012). Сравнение безраспределительных и нераспределительных методов факторного анализа. Доклад, представленный на конференции Юго-Западной ассоциации исследований в области образования (SERA) 2012 г., Новый Орлеан, Луизиана (ED529153).
- ^ Суббарао, К.; Суббарао, Невада; Чанду, С.Н. (декабрь 1996 г.). «Характеристика загрязнения подземных вод с помощью факторного анализа». Экологическая геология . 28 (4): 175–180. Бибкод : 1996EnGeo..28..175S . дои : 10.1007/s002540050091 . S2CID 129655232 .
- ^ Любовь, Д.; Халльбауэр, Дания; Амос, А.; Гранова, РК (2004). «Факторный анализ как инструмент управления качеством подземных вод: два тематических исследования в Южной Африке». Физика и химия Земли . 29 (15–18): 1135–43. Бибкод : 2004PCE....29.1135L . дои : 10.1016/j.pce.2004.09.027 .
- ^ Бартон, ES; Халлбауэр, ДК (1996). «Микроэлементы и изотопный состав U-Pb типов пирита на протерозойском Черном рифе, Трансваальская толща, Южная Африка: влияние на генезис и возраст». Химическая геология . 133 (1–4): 173–199. дои : 10.1016/S0009-2541(96)00075-7 .
- ^ Хохрейтер, Зепп; Клеверт, Джорк-Арне; Обермайер, Клаус (2006). «Новый метод суммирования данных уровня зонда affymetrix» . Биоинформатика . 22 (8): 943–9. doi : 10.1093/биоинформатика/btl033 . ПМИД 16473874 .
- ^ «sklearn.decomposition.FactorAnaанализ — документация scikit-learn 0.23.2» . scikit-learn.org .
- ^ Маккаллум, Роберт (июнь 1983 г.). «Сравнение программ факторного анализа в SPSS, BMDP и SAS». Психометрика . 48 (2): 223–231. дои : 10.1007/BF02294017 . S2CID 120770421 .
Дальнейшее чтение
[ редактировать ]- Чайлд, Деннис (2006), Основы факторного анализа (3-е изд.), Continuum International , ISBN 978-0-8264-8000-2 .
- Фабригар, ЛР; Вегенер, Д.Т.; МакКаллум, RC; Страхан, EJ (сентябрь 1999 г.). «Оценка использования исследовательского факторного анализа в психологических исследованиях». Психологические методы . 4 (3): 272–299. дои : 10.1037/1082-989X.4.3.272 .
- Б.Т. Грей (1997) Факторный анализ высшего порядка (доклад конференции)
- Дженнрич, Роберт И., «Вращение к простым нагрузкам с использованием функции потерь компонентов: наклонный случай», Psychometrika , Vol. 71, № 1, стр. 173–191, март 2006 г.
- Кац, Джеффри Оуэн и Рольф, Ф. Джеймс. Основная функциональная плоскость продукта: наклонное вращение к простой структуре. Многомерное поведенческое исследование , апрель 1975 г., Vol. 10, стр. 219–232.
- Кац, Джеффри Оуэн и Рольф, Ф. Джеймс. Functionplane: новый подход к простому вращению структуры. Психометрика , март 1974 г., Том. 39, № 1, стр. 37–51.
- Кац, Джеффри Оуэн и Рольф, Ф. Джеймс. Функционально-точечный кластерный анализ. Систематическая зоология , сентябрь 1973 г., Vol. 22, № 3, стр. 295–301.
- Мулайк, С.А. (2010), Основы факторного анализа , Чепмен и Холл .
- Проповедник, К.Дж.; МакКаллум, RC (2003). «Ремонт машины для анализа электрических факторов Тома Свифта» (PDF) . Понимание статистики . 2 (1): 13–43. дои : 10.1207/S15328031US0201_02 . hdl : 1808/1492 .
- Дж. Шмид и Дж. М. Лейман (1957). Разработка иерархических факторных решений. Психометрика , 22(1), 53–61.
- Томпсон, Б. (2004), Исследовательский и подтверждающий факторный анализ: понимание концепций и приложений , Вашингтон, округ Колумбия: Американская психологическая ассоциация , ISBN 978-1591470939 .
- Ханс-Георг Вольф, Катя Прейзинг (2005) Исследование элементов и факторной структуры более высокого порядка с помощью решения Шмида-Леймана: Синтаксические коды для SPSS и SAS. Методы исследования поведения, инструменты и компьютеры , 37 (1), 48-58
Внешние ссылки
[ редактировать ]- Руководство для начинающих по факторному анализу
- Исследовательский факторный анализ. Рукопись книги Такера Л. и МакКаллума Р. (1993). Получено 8 июня 2006 г. из: [2] Архивировано 23 мая 2013 г. в Wayback Machine.
- Гарсон, Дж. Дэвид, «Факторный анализ», из Statnotes: Topics in Multivariate Analysis . Получено 13 апреля 2009 г. из StatNotes: Topics in Multivariate Analysis, от Дж. Дэвида Гарсона из Университета штата Северная Каролина, Программа государственного управления.
- Факторный анализ на 100 — материалы конференции
- FARMS — Факторный анализ для надежного суммирования микрочипов, пакет R