Тау Клечки
Тау Клеки ( τ ) — это статистика, которая используется для проверки того, улучшает ли данный классификационный анализ классификацию по группам по сравнению со случайным распределением по различным рассматриваемым группам. [ 1 ] Максимальное значение τ составляет 1,0, что указывает на отсутствие ошибок в прогнозе. Нулевое значение указывает на отсутствие улучшения по сравнению со случайным назначением.
Распределение τ в настоящее время неизвестно, и оно используется скорее как описательная, чем как аналитическая статистика.
Обоснование использования
[ редактировать ]Клечки τ был разработан для использования в дискриминантном анализе . Чистая точность дискриминантного анализа представляет собой сумму правильных предсказаний, деленную на общее количество случаев. Клечка отметила, что, хотя процент точно предсказанных случаев является наиболее интуитивным показателем дискриминации, величину этого процента следует оценивать по отношению к ожидаемому проценту правильных классификаций, сделанных путем случайного распределения. Пропорциональное уменьшение статистики ошибок ( τ ) можно рассчитать, давая стандартную меру улучшения по сравнению со случайным назначением независимо от количества групп.
Математическая формулировка
[ редактировать ]τ определяется как [ нужна ссылка ]
где n corr — количество правильно классифицированных случаев, n i — количество случаев в i й группа, N — общее количество случаев, T — количество групп, а pi — вероятность того, что случай будет случайно отнесен к этой группе ( pi = 1/ T ).
Использование
[ редактировать ]Помимо использования в дискриминантном анализе [ 2 ] [ 3 ] [ 4 ] [ 5 ] он использовался в множественном регрессионном анализе, [ 6 ] probit regression , [ 7 ] логистическая регрессия [ 8 ] [ 9 ] и анализ изображений . [ 10 ]
Ссылки
[ редактировать ]- ^ Клечка, WR (1980) Дискриминантный анализ. Sage Publications, Беверли-Хиллз
- ^ Мерфи AMC (2002) Пяточная кость: оценка пола доисторических новозеландских полинезийских останков скелета. Судебно-медицинская экспертиза Int 129(3) 205–208
- ^ Мерфи AMC (1986)Определение пола с помощью дискриминантного функционального анализа новозеландских полинезийских грудных поясов: применение в судебной медицине. Дж Анат 149, 249-268
- ^ Тейлор Дж. В., Дибеннардо Р. (1984) Анализ дискриминантной функции центральной части безымянного. Am J Phys Anthropol 64 (3) 315–320
- ^ Стромберг М.Р. (1986)Систематика и охрана быстрой лисицы Vulpes velox в Северной Америке. Биологическая охрана 35 (2) 97–110
- ^ Клозеа М.Е. и Дэвис-Колли Р.Дж. (1990)Химический состав воды основного стока в реках Новой Зеландии 2. Влияние факторов окружающей среды. Новая Зеландия J Морская пресная вода Res 24(3) 343-356
- ^ Кхемани Р.С., Шапиро Д.М. (1993) Эмпирический анализ канадской политики слияний. Ж Промышленная Экономика 41 (2) 161-177
- ^ Датталоа П (1995) Сравнение дискриминантного анализа и логистической регрессии. J Социальная служба Res 19 (3-4): 121-144
- ^ Biggerstaff MA (1992) Оценка устного экзамена при лицензировании клинических социальных работников в Вирджинии. Практика социальной работы 2 (2) 184-197 дои : 10.1177/104973159200200205
- ^ Цзян С., Лю Д. (2011) О мерах с поправкой на случайность для оценки точности классификации изображений дистанционного зондирования. Ежегодная конференция ASPRS 2011 Милуоки, Висконсин