Jump to content

Автоматическое обнаружение взаимодействия по хи-квадрату

Автоматическое обнаружение взаимодействия по хи-квадрату ( CHAID ) [1] [2] [3] — это метод дерева решений , основанный на скорректированном тестировании значимости ( коррекция Бонферрони , тест Холма-Бонферрони ). Методика была разработана в Южной Африке в 1975 году и опубликована в 1980 году Гордоном В. Кассом, защитившим докторскую диссертацию по этой теме. CHAID можно использовать для прогнозирования (аналогично регрессионному анализу , эта версия CHAID изначально известна как XAID), а также для классификации и для обнаружения взаимодействия между переменными. CHAID основан на формальном расширении AID (автоматическое обнаружение взаимодействия). [4] и THAID (автоматическое обнаружение взаимодействия THeta) [5] [6] процедуры 1960-х и 1970-х годов, которые, в свою очередь, были продолжением более ранних исследований, в том числе проведенных Белсоном в Великобритании в 1950-х годах. [7] История более ранних методов контролируемого дерева вместе с подробным описанием исходного алгоритма CHAID и исчерпывающего расширения CHAID Биггса, Де Виля и Суена. [2] можно найти в Ритчарде . [3]

На практике CHAID часто используется в контексте прямого маркетинга для выбора групп потребителей, чтобы предсказать, как их реакция на одни переменные влияет на другие переменные, хотя другие ранние применения были в области медицинских и психиатрических исследований.

Как и другие деревья решений, преимущества CHAID заключаются в том, что его результаты очень наглядны и легко интерпретируются. Поскольку по умолчанию он использует многофакторное разделение, для эффективной работы ему необходимы довольно большие размеры выборки, поскольку при небольших размерах выборки группы респондентов могут быстро стать слишком маленькими для надежного анализа.

Одним из важных преимуществ CHAID перед такими альтернативами, как множественная регрессия, является то, что он непараметрический.

См. также

[ редактировать ]
  1. ^ Касс, Г.В. (1980). «Исследовательский метод исследования больших объемов категориальных данных» . Прикладная статистика . 29 (2): 119–127. дои : 10.2307/2986296 . JSTOR   2986296 .
  2. ^ Jump up to: а б Биггс, Дэвид; Де Виль, Барри; Суен, Эд (1991). «Метод выбора многопутевых разбиений для деревьев классификации и решений» . Журнал прикладной статистики . 18 (1): 49–62. дои : 10.1080/02664769100000005 . ISSN   0266-4763 .
  3. ^ Jump up to: а б Ритчард, Гилберт (2013). «CHAID и ранее контролируемые древовидные методы» . Современные проблемы исследовательского анализа данных в поведенческих науках, МакАрдл, Дж. Дж. И Г. Ритчард (ред.) . Нью-Йорк: Рутледж: 48–74.
  4. ^ Морган, Джеймс Н.; Сонквист, Джон А. (1963). «Проблемы анализа данных опросов и предложение» . Журнал Американской статистической ассоциации . 58 (302): 415–434. дои : 10.1080/01621459.1963.10500855 . ISSN   0162-1459 .
  5. ^ Мессенджер, Роберт; Манделл, Льюис (1972). «Методика модального поиска для прогнозного многомерного анализа номинальной шкалы» . Журнал Американской статистической ассоциации . 67 (340): 768–772. дои : 10.1080/01621459.1972.10481290 . ISSN   0162-1459 .
  6. ^ Морган, Джеймс Н. (1973). THAID, программа последовательного анализа для анализа переменных, зависящих от номинальной шкалы . Роберт С. Мессенджер. Анн-Арбор, Мичиган, ISBN  0-87944-137-2 . OCLC   666930 . {{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )
  7. ^ Белсон, Уильям А. (1959). «Сопоставление и прогнозирование на основе принципа биологической классификации» . Прикладная статистика . 8 (2): 65–75. дои : 10.2307/2985543 . JSTOR   2985543 .

Дальнейшее чтение

[ редактировать ]
  • Пресс, Лоуренс И.; Роджерс, Майлз С.; И Шур, Джеральд Х.; Интерактивная методика анализа многомерных данных , Поведенческая наука, Vol. 14 (1969), стр. 364–370.
  • Хокинс, Дуглас М.; и Касс, Гордон В.; Автоматическое обнаружение взаимодействия , Хокинс, Дуглас М. (редактор), «Темы прикладного многомерного анализа» , издательство Кембриджского университета, Кембридж, 1982, стр. 269–302.
  • Хутон, Томас М.; Хейли, Роберт В.; Калвер, Дэвид Х.; Уайт, Джон В.; Морган, В. Мид; и Кэрролл, Рэймонд Дж.; Совместная ассоциация множественных факторов риска с возникновением нозокомиальных инфекций , Американский медицинский журнал, Vol. 70, (1981), стр. 960–970.
  • Бринк, Сюзанна; и Ван Шалквик, Дирк Дж.; Сывороточный ферритин и средний объем эритроцитов как предикторы запасов железа в костном мозге , South African Medical Journal, Vol. 61, (1982), стр. 432–434.
  • Маккензи, Дин П.; МакГорри, Патрик Д.; Уоллес, Крис С.; Лоу, Ли Х.; Кополов, Дэвид Л.; и Сингх, Брюс С.; Построение минимального дерева диагностических решений , Информационные методы в медицине, Vol. 32 (1993), стр. 161–166.
  • Магидсон, Джей; Подход CHAID к моделированию сегментации: автоматическое обнаружение взаимодействия по хи-квадрату , Багоцци, Ричард П. (редактор); Передовые методы маркетинговых исследований , Блэквелл, Оксфорд, Великобритания, 1994, стр. 118–159.
  • Хокинс, Дуглас М.; Янг, СС; и Росинко А.; Анализ большого набора данных «структура-активность» с использованием рекурсивного секционирования , Количественные отношения «структура-активность», Vol. 16, (1997), стр. 296–302.

Программное обеспечение

[ редактировать ]
  • Лучман, Дж. Н.; CHAID: модуль Stata для автоматического обнаружения взаимодействия по хи-квадрату . Доступен для бесплатной загрузки или введите в Stata: ssc install chaid.
  • Лучман, Дж. Н.; CHAIDFOREST: модуль Stata для проведения случайной классификации ансамблей лесов на основе автоматического обнаружения взаимодействия хи-квадрат (CHAID) в качестве базового обучаемого . Доступен для бесплатной загрузки или введите в Stata: ssc install chaidforest.
  • IBM SPSS Decision Trees выращивает исчерпывающие деревья CHAID, а также несколько других типов деревьев, таких как CART.
  • Пакет R CHAID доступен на R-Forge.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 1056807c70130cb7dc64069885665439__1719760860
URL1:https://arc.ask3.ru/arc/aa/10/39/1056807c70130cb7dc64069885665439.html
Заголовок, (Title) документа по адресу, URL1:
Chi-square automatic interaction detection - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)