Коэффициент корреляции
Коэффициент корреляции — это численная мера некоторого типа линейной корреляции , то есть статистической взаимосвязи между двумя переменными . [а] Переменные могут быть двумя столбцами заданного набора данных наблюдений, часто называемыми выборкой , или двумя компонентами многомерной случайной величины с известным распределением . [ нужна ссылка ]
Существует несколько типов коэффициента корреляции, каждый из которых имеет свое определение и собственный диапазон применимости и характеристик. Все они принимают значения в диапазоне от -1 до +1, где ±1 указывает на самую сильную возможную корреляцию, а 0 указывает на отсутствие корреляции. [2] Как инструменты анализа, коэффициенты корреляции создают определенные проблемы, включая склонность некоторых типов к искажению выбросами и возможность неправильного использования для вывода о причинно-следственной связи между переменными (подробнее см. Корреляция не подразумевает причинно-следственную связь ). [3]
Типы
[ редактировать ]Существует несколько различных показателей степени корреляции данных, в зависимости от типа данных: в основном, являются ли данные измерительными, порядковыми или категориальными .
Пирсон
[ редактировать ]Коэффициент корреляции момента произведения Пирсона , также известный как r , R или Пирсона r , является мерой силы и направления линейной зависимости между двумя переменными, которая определяется как ковариация переменных, разделенная на произведение их стандарта. отклонения. [4] Это самый известный и наиболее часто используемый тип коэффициента корреляции. Когда термин «коэффициент корреляции» используется без дополнительных уточнений, он обычно относится к коэффициенту корреляции момента произведения Пирсона.
Внутриклассный
[ редактировать ]Внутриклассовая корреляция (ICC) — это описательная статистика, которую можно использовать, когда количественные измерения проводятся на единицах, организованных в группы; он описывает, насколько сильно единицы в одной группе похожи друг на друга.
Классифицировать
[ редактировать ]Ранговая корреляция — это мера взаимосвязи между рейтингами двух переменных или двумя рейтингами одной и той же переменной:
- Коэффициент ранговой корреляции Спирмена — это мера того, насколько хорошо связь между двумя переменными может быть описана монотонной функцией.
- Коэффициент ранговой корреляции тау Кендалла — это мера доли рангов, которые совпадают между двумя наборами данных.
- Гамма Гудмана и Краскала представляет собой меру силы связи данных, представленных в перекрестных таблицах, когда обе переменные измеряются на порядковом уровне.
Тетрахорический и полихорический
[ редактировать ]Коэффициент полихорической корреляции измеряет связь между двумя упорядоченно-категориальными переменными. Технически это определяется как оценка коэффициента корреляции Пирсона, которую можно получить, если:
- Эти две переменные измерялись в непрерывной шкале, а не как переменные упорядоченной категории.
- Две непрерывные переменные имели двумерное нормальное распределение .
Когда обе переменные являются дихотомическими, а не упорядоченно-категориальными, коэффициент полихорической корреляции называется коэффициентом тетрахорической корреляции.
См. также
[ редактировать ]- Ослабление корреляции
- Коэффициент детерминации
- Корреляция и зависимость
- Коэффициент корреляции
- Корреляция расстояний
- Степень соответствия : любая из нескольких мер, которые измеряют, насколько хорошо статистическая модель соответствует наблюдениям путем суммирования несоответствия между наблюдаемыми значениями и значениями, ожидаемыми в рамках модели.
- Множественная корреляция
- Частичная корреляция
Примечания
[ редактировать ]- ^ Коэффициент корреляции: статистика, используемая для того, чтобы показать, как баллы по одному показателю соотносятся с баллами по второму показателю для той же группы людей. Высокое значение (приближающееся к +1,00) означает сильную прямую связь, значения около 0,50 считаются умеренными, а значения ниже 0,30 считаются слабой взаимосвязью. Низкое отрицательное значение (приближающееся к -1,00) также представляет собой сильную обратную зависимость, а значения около 0,00 указывают на слабую взаимосвязь или вообще на нее. [1]
Ссылки
[ редактировать ]- ^ «коэффициент корреляции» . NCME.org . Национальный совет по измерению в образовании . Архивировано из оригинала 22 июля 2017 года . Проверено 17 апреля 2014 г.
- ^ Тейлор, Джон Р. (1997). Введение в анализ ошибок: исследование неопределенностей в физических измерениях (PDF) (2-е изд.). Саусалито, Калифорния: Университетские научные книги. п. 217. ИСБН 0-935702-75-Х . Архивировано из оригинала (PDF) 15 февраля 2019 года . Проверено 14 февраля 2019 г.
- ^ Бодди, Ричард; Смит, Гордон (2009). Статистические методы на практике: Для ученых и технологов . Чичестер, Великобритания: Wiley. стр. 95–96. ISBN 978-0-470-74664-6 .
- ^ Вайсштейн, Эрик В. «Статистическая корреляция» . mathworld.wolfram.com . Проверено 22 августа 2020 г.