Лямбда Гудмана и Краскала
В вероятностей и статистике теории лямбда Гудмана и Краскала ( ) является мерой пропорционального уменьшения ошибки при анализе перекрестных таблиц . Для любой выборки с номинальной независимой переменной и зависимой переменной (или тех, которые можно рассматривать номинально), она указывает степень, в которой модальные категории и частоты для каждого значения независимой переменной отличаются от общей модальной категории и частоты, т.е. для всех значений независимой переменной вместе взятых. определяется уравнением
где
- - общая покадровая частота, и
- представляет собой сумму покадровых частот для каждого значения независимой переменной.
Значения лямбды варьируются от нуля (нет связи между независимыми и зависимыми переменными) до единицы ( идеальная связь ).
Слабые стороны
[ редактировать ]Хотя лямбда Гудмана и Краскала представляет собой простой способ оценить связь между переменными, она дает значение 0 (нет связи) всякий раз, когда две переменные находятся в согласовании , то есть когда модальная категория одинакова для всех значений независимой переменной. , даже если модальные частоты или проценты различаются. В качестве примера рассмотрим приведенную ниже таблицу, в которой описана вымышленная выборка из 350 человек, классифицированных по семейному статусу и кровяному давлению. Предположим, что статус родства является независимой переменной, а артериальное давление — зависимой переменной, т.е. задается вопрос: «Можно ли лучше предсказать артериальное давление, если известен статус родства?»
Статус отношений | Общий | |||
---|---|---|---|---|
Неженатый | Женатый | |||
Артериальное давление | Нормальный | 80% (120) |
51% (102) |
63.4% (222) |
Высокий | 20% (30) |
49% (98) |
36.6% (128) | |
Общий | 42.9% (150) |
57.1% (200) |
100% (350) |
Для этого образца
Причина в том, что прогнозируемое номинальное артериальное давление на самом деле является «Нормальным» в обоих столбцах (оба верхних числа выше соответствующего нижнего числа). Таким образом, рассмотрение статуса отношений не изменит прогноза о том, что у людей нормальное кровяное давление, хотя данные показывают, что брак увеличивает вероятность высокого кровяного давления.
Если вопрос изменить, например, спросив: «Каков прогнозируемый статус отношений на основе артериального давления?» будет иметь ненулевое значение.
То есть:
См. также
[ редактировать ]Ссылки
[ редактировать ]- Гудман Л.А., Краскал В.Х. (1954) «Меры связи для перекрестных классификаций» . Часть I. Журнал Американской статистической ассоциации , 49, 732–764. JSTOR 281536
- Гудман, Л.А., Краскал, В.Х. (1959) «Меры ассоциации для перекрестных классификаций. II: дальнейшее обсуждение и ссылки» [ постоянная мертвая ссылка ] . Журнал Американской статистической ассоциации , 52, 123–163. JSTOR 2282143
- Гудман, Л.А., Краскал, В.Х. (1963) «Показатели ассоциации для перекрестных классификаций III: теория приближенной выборки», Журнал Американской статистической ассоциации , 58, 310–364. JSTOR 2283271 дои : 10.1080/01621459.1963.10500850