Канонический анализ
Эта статья может сбивать с толку или быть непонятной читателям . В частности, в статье говорится, к чему «принадлежит» канонический анализ, а не что он собой представляет. В частности, даже не упоминается разница с другими методами. ( июнь 2016 г. ) |
В статистике канонический анализ (от древнегреческого : κανων брусок, мерный стержень , линейка) принадлежит к семейству регрессионных методов анализа данных. Регрессионный анализ количественно определяет взаимосвязь между переменной-предиктором и переменной-критерием с помощью коэффициента корреляции r и коэффициента детерминации r. 2 и стандартный коэффициент регрессии β . Множественный регрессионный анализ выражает связь между набором переменных-предикторов и одной критериальной переменной посредством множественной корреляции R и множественного коэффициента детерминации R. 2 и набор стандартных весов частичной регрессии β 1 , β 2 и т. д. Анализ канонических переменных фиксирует взаимосвязь между набором переменных-предикторов и набором переменных-критериев посредством канонических корреляций ρ 1 , ρ 2 , ... и множествами канонических весов C и D.
Канонический анализ
[ редактировать ]Канонический анализ принадлежит к группе методов, которые включают решение характеристического уравнения для его скрытых корней и векторов. Он описывает формальные структуры в гиперпространстве , инвариантные относительно вращения их координат. В этом типе решения вращение оставляет многие оптимизирующие свойства сохраненными, при условии, что оно происходит определенным образом и в подпространстве соответствующего гиперпространства. Этот поворот от структуры максимальной межмерной корреляции к другой, более простой и более значимой структуре увеличивает интерпретируемость канонических весов C и D. В этом канонический анализ отличается от Гарольда Хотеллинга канонического вариатного анализа (1936) (также называемого каноническим анализом). корреляционный анализ ), предназначенный для получения максимальных (канонических) корреляций между каноническими переменными предиктора и критерия. Разница между каноническим анализом переменных и каноническим анализом аналогична разнице между анализом главных компонентов. и факторный анализ , каждый из которых имеет свой характерный набор общих черт, собственных значений и собственных векторов .
Канонический анализ (простой)
[ редактировать ]Канонический анализ — это многомерный метод, который направлен на определение связей между группами переменных в наборе данных. Набор данных разделен на две группы X и Y на основе некоторых общих характеристик. Цель канонического анализа состоит в том, чтобы найти связь между и Y , т.е. может ли некоторая форма X представлять Y. X Он работает путем нахождения линейной комбинации переменных X , т. е. X 1 , X 2 и т. д., и линейной комбинации переменных Y , т. е. Y 1 , Y 2 и т. д., которые наиболее сильно коррелируют. Эта комбинация известна как «первые канонические варианты», которые обычно обозначаются U 1 и V 1 , причем пара U 1 и V 1 называется «канонической функцией». Следующие канонические функции U 2 и V 2 затем ограничиваются так, что они не коррелируют с U 1 и V 1 . Все масштабируется так, что дисперсия равна 1.
Можно также построить отношения, которые согласуются с ограничениями, вытекающими из теории, или согласуются со здравым смыслом/интуицией. Такие модели называются моделями максимальной корреляции. (Тофалис, 1999)
Математически канонический анализ максимизирует U ′ X ′ YV при условии, что U ′ X ′ XU = I и V ′ Y ′ YV = I , где X и Y — матрицы данных (например, строка и столбец для признака).
См. также
[ редактировать ]Ссылки
[ редактировать ]- Хотеллинг, Х. (1936). «Отношения между двумя наборами переменных». Биометрика . 28 (3–4): 321–377. дои : 10.1093/biomet/28.3-4.321 . JSTOR 2333955 .
- Крус, диджей; и др. (1976). «Ротация в каноническом анализе». Образовательные и психологические измерения . 36 (3): 725–730. дои : 10.1177/001316447603600320 .
- Лян, К.Х.; Крус, диджей; Уэбб, Дж. М. (1995). «K-кратная перекрестная проверка в каноническом анализе». Многомерное поведенческое исследование . 30 (4): 539–545. дои : 10.1207/s15327906mbr3004_4 . ПМИД 26790047 .
- Тофаллис, К. (1999). «Построение модели с множеством зависимых переменных и ограничений». JR Стат. Соц. Д. 48 (3): 1–8. arXiv : 1109.0725 . дои : 10.1111/1467-9884.00195 . ССНР 1353202 .