Коэффициент корреляции
В статистике Юла Y , также известный как коэффициент коллигации , является мерой связи между двумя двоичными переменными. Эта мера была разработана Джорджем Удным Юлом в 1912 году. [1] [2] и его не следует путать с коэффициентом Юла для измерения асимметрии на основе квартилей .
Формула
[ редактировать ]Для таблицы 2×2 для двоичных переменных U и V с частотами или пропорциями
V = 0 V = 1 У = 0 а б У = 1 с д
Юла Y определяется как
Юла Y тесно связан с отношением шансов OR = ad /( bc ), как видно из следующей формулы:
Юла Y варьируется от −1 до +1. −1 отражает полную отрицательную корреляцию , +1 отражает идеальную положительную связь, а 0 отражает отсутствие связи вообще. Они соответствуют значениям более распространенной корреляции Пирсона .
Юла Y также связан с аналогичным Юла Q , который также может быть выражен через отношение шансов. Q и Y связаны соотношением:
Интерпретация
[ редактировать ]Юла Y дает долю идеальной ассоциации в расчете на единицу (умноженная на 100, она представляет эту долю в более привычном процентном выражении). Действительно, формула преобразует исходную таблицу 2×2 в перекрестно-симметричную таблицу, где b = c = 1 и a = d = √ OR .
Для крестообразно-симметричной таблицы с частотами или пропорциями a = d и b = c очень легко увидеть, что ее можно разделить на две таблицы. В таких таблицах связь можно совершенно четко измерить, разделив ( a – b ) на ( a + b ). В преобразованных таблицах b необходимо заменить на 1, а a на √ OR . Преобразованная таблица имеет ту же степень связи (тот же ИЛИ), что и исходная неперекрестно-симметричная таблица. Следовательно, связь в асимметричных таблицах можно измерить Y Юла , интерпретируя ее точно так же, как и в симметричных таблицах. Конечно, Y Юла и ( a − b )/( a + b ) дают один и тот же результат в перекрестно-симметричных таблицах, представляя ассоциацию в виде дроби в обоих случаях.
Юла Y измеряет ассоциацию существенным, интуитивно понятным способом и, следовательно, является мерой предпочтения измерять ассоциацию. [ нужна ссылка ]
Примеры
[ редактировать ]Следующая крестообразно-симметричная таблица
V = 0 V = 1 У = 0 40 10 У = 1 10 40
можно разделить на две таблицы:
V = 0 V = 1 У = 0 10 10 У = 1 10 10
и
V = 0 V = 1 У = 0 30 0 У = 1 0 30
Очевидно, что степень ассоциации равна 0,6 на единицу (60%).
Следующая асимметричная таблица может быть преобразована в таблицу с равной степенью ассоциации (отношения шансов обеих таблиц равны).
V = 0 V = 1 У = 0 3 1 У = 1 3 9
Ниже следует преобразованная таблица:
V = 0 V = 1 У = 0 3 1 У = 1 1 3
Отношения шансов обеих таблиц равны 9. Y = (3 − 1)/(3 + 1) = 0,5 (50%)
Ссылки
[ редактировать ]- ^ Юле, Г. Удный (1912). «О методах измерения связи между двумя атрибутами» . Журнал Королевского статистического общества . 75 (6): 579–652. дои : 10.2307/2340126 . JSTOR 2340126 .
- ^ Мишель Г. Соете. Новая теория измерения связи между двумя двоичными переменными в медицинских науках: связь может быть выражена в долях (на единицу, процент, промилле....) идеальной ассоциации (2013), электронная статья, BoekBoek.be