Гамма Гудмана и Краскала
В статистике , т. е гамма Гудмана и Краскала является мерой ранговой корреляции . сходства порядка данных при ранжировании по каждой из величин. Он измеряет силу связи данных перекрестной таблицы , когда обе переменные измеряются на порядковом уровне . Он не делает никаких корректировок ни по размеру стола, ни по ничьим. Значения варьируются от −1 (100 % отрицательная ассоциация или полная инверсия) до +1 (100 % положительная ассоциация или полное согласие). Нулевое значение указывает на отсутствие ассоциации.
Эта статистика (которая отличается от лямбды Гудмана и Краскала ) названа в честь Лео Гудмана и Уильяма Краскала , которые предложили ее в серии статей с 1954 по 1972 год. [1] [2] [3] [4]
Определение
[ редактировать ]Оценка гаммы G зависит от двух величин:
- N s — количество пар случаев, ранжированных в одинаковом порядке по обеим переменным (количество согласованных пар ),
- N d — количество пар случаев, ранжированных в обратном порядке по обеим переменным (количество перевернутых пар),
где «связи» (случаи, когда любая из двух переменных в паре равна) отбрасываются.Затем
Эту статистику можно рассматривать как оценку максимального правдоподобия для теоретической величины. , где
и где P s и P d — вероятности того, что случайно выбранная пара наблюдений расположится в том же или противоположном порядке соответственно при ранжировании по обеим переменным.
Критические значения для гамма-статистики иногда находятся с использованием аппроксимации, при которой преобразованное значение t статистики относится к t-распределению Стьюдента , где [ нужна ссылка ]
и где n — количество наблюдений (а не количество пар):
Вопрос Йоля
[ редактировать ]Особым случаем гаммы Гудмана и Краскала является коэффициент Юла Q , также известный как коэффициент ассоциации Юла . [5] что характерно для матриц 2×2. Рассмотрим следующую таблицу непредвиденных обстоятельств событий, где каждое значение представляет собой счетчик частоты события:
Да | Нет | Итоги | |
---|---|---|---|
Позитивный | а | б | а + б |
Отрицательный | с | д | в + д |
Итоги | а + с | б + д | н |
Вопрос Йоля задается следующим образом:
Хотя она рассчитывается тем же способом, что и гамма Гудмана и Краскала, она имеет несколько более широкую интерпретацию, поскольку различие между номинальными и порядковыми шкалами становится вопросом произвольного обозначения дихотомических различий. Таким образом, является ли Q положительным или отрицательным, зависит только от того, какие пары аналитик считает согласованными, но в остальном он симметричен.
Q варьируется от −1 до +1. −1 отражает полную отрицательную ассоциацию, +1 отражает полную положительную ассоциацию, а 0 отражает отсутствие ассоциации вообще. Знак зависит от того, какие пары аналитик изначально считал конкордантными, но на величину этот выбор не влияет.
С точки зрения отношения шансов Юла OR, Q определяется выражением
Юла и поэтому Q и Юла Y связаны соотношением
См. также
[ редактировать ]- Коэффициент ранговой корреляции Кендалла Тау
- Лямбда Гудмана и Краскала
- Y Юла , также известный как коэффициент коллигации.
Ссылки
[ редактировать ]- ^ Гудман, Лео А.; Краскал, Уильям Х. (1954). «Меры объединения перекрестных классификаций». Журнал Американской статистической ассоциации . 49 (268): 732–764. дои : 10.2307/2281536 . JSTOR 2281536 .
- ^ Гудман, Лео А.; Краскал, Уильям Х. (1959). «Меры объединения перекрестных классификаций. II: Дальнейшее обсуждение и ссылки». Журнал Американской статистической ассоциации . 54 (285): 123–163. дои : 10.1080/01621459.1959.10501503 . JSTOR 2282143 .
- ^ Гудман, Лео А.; Краскал, Уильям Х. (1963). «Меры связи для перекрестных классификаций III: приблизительная теория выборки». Журнал Американской статистической ассоциации . 58 (302): 310–364. дои : 10.1080/01621459.1963.10500850 . JSTOR 2283271 .
- ^ Гудман, Лео А.; Краскал, Уильям Х. (1972). «Меры ассоциации для перекрестных классификаций, IV: упрощение асимптотических дисперсий». Журнал Американской статистической ассоциации . 67 (338): 415–421. дои : 10.1080/01621459.1972.10482401 . JSTOR 2284396 .
- ^ Юл, Г. У. (1912). «О методах измерения связи между двумя признаками» . Журнал Королевского статистического общества . 49 (6): 579–652. дои : 10.2307/2340126 . JSTOR 2340126 .
Дальнейшее чтение
[ редактировать ]- Шескин, DJ (2007) Справочник по параметрическим и непараметрическим статистическим процедурам . Чепмен и Холл/CRC, ISBN 9781584888147