Коэффициент множественной корреляции
Эта статья включает список общих ссылок , но в ней отсутствуют достаточные соответствующие встроенные цитаты . ( Ноябрь 2010 г. ) |
В статистике коэффициент множественной корреляции является мерой того, насколько хорошо данную переменную можно предсказать с помощью линейной функции набора других переменных. Это корреляция между значениями переменной и лучшими прогнозами, которые можно вычислить линейно на основе прогнозирующих переменных. [1]
Коэффициент множественной корреляции принимает значения от 0 до 1. Более высокие значения указывают на более высокую предсказуемость зависимой переменной по сравнению с независимыми переменными , при этом значение 1 указывает на то, что прогнозы точно верны, а значение 0 указывает на отсутствие линейной комбинации независимые переменные являются лучшим предиктором, чем фиксированное среднее значение зависимой переменной. [2]
Коэффициент корреляции (r) | Направление и сила корреляции |
1 | Абсолютно позитивный |
0.8 | Сильно положительный |
0.5 | Умеренно позитивный |
0.2 | Слабо положительный |
0 | Нет ассоциации |
-0.2 | Слабо отрицательный |
-0.5 | Умеренно отрицательный |
-0.8 | Резко отрицательный |
-1 | Совершенно отрицательный |
Коэффициент множественной корреляции известен как квадратный корень из коэффициента детерминации , но при определенных предположениях, что перехват включен и что используются наилучшие возможные линейные предикторы, тогда как коэффициент детерминации определяется для более общих случаев, включая те, которые относятся к нелинейному прогнозированию, и те, в которых прогнозируемые значения не были получены в результате процедуры подбора модели.
Определение
[ редактировать ]Коэффициент множественной корреляции, обозначаемый R , представляет собой скаляр , который определяется как коэффициент корреляции Пирсона между прогнозируемыми и фактическими значениями зависимой переменной в модели линейной регрессии, включающей точку пересечения .
Вычисление
[ редактировать ]Квадрат коэффициента множественной корреляции можно вычислить с помощью вектора корреляций между переменными-предикторами (независимые переменные) и целевая переменная (зависимая переменная) и корреляционная матрица корреляций между переменными-предикторами. Это дано
где это транспонирование , и является обратной матрицей
Если все переменные-предикторы некоррелированы, матрица - единичная матрица и просто равно , сумма квадратов корреляций с зависимой переменной. Если переменные-предикторы коррелируют между собой, обратная корреляционная матрица приходится на это.
Квадрат коэффициента множественной корреляции также можно рассчитать как долю дисперсии зависимой переменной, объясняемую независимыми переменными, которая, в свою очередь, равна 1 минус необъяснимая доля. Необъяснимую долю можно вычислить как сумму квадратов остатков — то есть сумму квадратов ошибок прогнозирования — деленную на сумму квадратов отклонений значений зависимой переменной от ее ожидаемого значения .
Характеристики
[ редактировать ]Если между собой связаны более двух переменных, значение коэффициента множественной корреляции зависит от выбора зависимой переменной: регрессии на и вообще будет по-другому чем произойдет регресс на и . Например, предположим, что в конкретной выборке переменная с не коррелирует обоими и , пока и линейно связаны друг с другом. Тогда регрессия на и даст нуля, а регрессия на и даст строго положительный результат . Это следует из того, что корреляция с лучшим предсказателем, основанным на и во всех случаях не менее велика, чем корреляция с лучшим предсказателем, основанным на в одиночку, а в данном случае с не имея никакой объяснительной силы, он будет именно таким же большим.
Ссылки
[ редактировать ]Дальнейшее чтение
[ редактировать ]- Эллисон, Пол Д. (1998). Множественная регрессия: учебник для начинающих . Лондон: Публикации Sage. ISBN 9780761985334
- Коэн, Джейкоб и др. (2002). Прикладная множественная регрессия: корреляционный анализ для поведенческих наук . ISBN 0805822232
- Краун, Уильям Х. (1998). Статистические модели для социальных и поведенческих наук: множественная регрессия и модели с ограниченно-зависимыми переменными . ISBN 0275953165
- Эдвардс, Аллен Луи (1985). Множественная регрессия и дисперсионный и ковариационный анализ . ISBN 0716710811
- Кейт, Тимоти (2006). Множественная регрессия и не только . Бостон: Pearson Education.
- Фред Н. Керлингер, Элазар Дж. Педазур (1973). Множественная регрессия в поведенческих исследованиях. Нью-Йорк: Холт Райнхарт Уинстон. ISBN 9780030862113
- Стэнтон, Джеффри М. (2001). «Гальтон, Пирсон и горох: краткая история линейной регрессии для преподавателей статистики» , Журнал статистического образования , 9 (3).