Jump to content

Конфигурационный частотный анализ

Конфигурационный частотный анализ (CFA) — это метод исследовательского анализа данных , предложенный Густавом А. Линертом в 1969 году. [1] Целью конфигурационного частотного анализа является обнаружение закономерностей в данных, которые встречаются значительно чаще (такие закономерности называются Типами ) или значительно реже (такие закономерности называются Антитипами ), чем ожидалось случайно. Таким образом, идея CFA состоит в том, чтобы с помощью идентифицированных типов и антитипов дать некоторое представление о структуре данных. Типы интерпретируются как понятия, которые представляют собой набор значений переменных. Антитипы интерпретируются как шаблоны значений переменных, которые, как правило, не встречаются вместе.

Основная идея алгоритма CFA

[ редактировать ]

Поясним основную идею CFA на простом примере. Предположим, что у нас есть набор данных, который описывает для каждого из n пациентов, проявляют ли они определенные симптомы s 1 , ..., s m . Для простоты мы предполагаем, что симптом проявляется или нет, т.е. у нас есть дихотомический набор данных.

, каждая запись в наборе данных представляет собой m -кортеж ( x 1 , ..., x m ), где каждый xi Таким образом равен либо 0 (у пациента нет симптома i ), либо 1 (у пациента проявляется симптом i ).Каждый такой m -кортеж называется конфигурацией . Пусть C — множество всех возможных конфигураций, т. е. множество всех возможных m -кортежей на {0,1}. м . набор данных можно описать путем перечисления наблюдаемых частот f ( c ) всех возможных конфигураций в C. Таким образом ,

Основная идея CFA состоит в том, чтобы оценить частоту каждой конфигурации в предположении, что m симптомов статистически независимы . Пусть e ( c ) будет этой предполагаемой частотой в предположении независимости.

Пусть p i (1) — вероятность того, что у члена исследуемой популяции проявляется симптом s i, а p i (0) — вероятность того, что у члена исследуемой популяции не проявляется симптом s i . Предполагая, что все симптомы независимы, мы можем вычислить ожидаемую относительную частоту конфигурации = ( c 1 , ..., cm c ) по формуле:

Теперь f ( c ) и e ( c ) можно сравнить с помощью статистического теста (типичными тестами, применяемыми в CFA, являются критерий хи-квадрат Пирсона , биномиальный тест или гипергеометрический тест Лемахера).

Если статистический тест предполагает для данного Если разница между f ( c ) и e ( c ) значительна, то c называется типом , если f ( c ) > e ( c ), и антитипом, если f ( c ) < e ( c ). ) нет существенной разницы Если между f ( c ) и e ( c , то c не является ни типом, ни антитипом. Таким образом, каждая конфигурация c может иметь в принципе три различных состояния. Это может быть тип, прообраз или не классифицированный.

Типы и антитипы определяются симметрично. Но в практических приложениях исследователи в основном заинтересованы в обнаружении типов. Например, клинические исследования обычно направлены на выявление комбинаций симптомов, которые являются индикаторами заболевания. По определению, это комбинации симптомов, которые случайно встречаются чаще, чем ожидалось, т.е. типы.

Контроль альфа-уровня

[ редактировать ]

Поскольку в CFA тест значимости применяется параллельно для каждой конфигурации c, существует высокий риск совершить ошибку типа I (т. е. обнаружить тип или антитип, когда нулевая гипотеза верна). В настоящее время наиболее популярным методом контроля этого является использование поправки Бонферрони для α -уровня. [2] Существует ряд альтернативных методов контроля уровня α . Одна альтернатива, метод Холма-Бонферрони, предложенный Стуре Холмом , учитывает количество тестов, уже завершенных на момент i -го теста. выполнения [3] Таким образом, в этом методе альфа-уровень не является постоянным для всех тестов.

Алгоритм в недихотомическом случае

[ редактировать ]

В нашем примере выше мы для простоты предположили, что симптомы дихотомичны. Однако это не является необходимым ограничением. CFA также может применяться к симптомам (или более общим атрибутам объекта), которые не являются дихотомическими, но имеют конечное число степеней. В этом случае конфигурация представляет собой элемент C = S 1 x ... x S m , где Si - множество возможных степеней симптома s i . [2] [4] [5] [6]

Случайная модель

[ редактировать ]

Предположение о независимости симптомов можно заменить другим методом расчета ожидаемых частот e ( c ) конфигураций. Такой метод называется случайной моделью .

В большинстве случаев применения CFA в качестве модели шансов используется предположение о том, что все симптомы независимы. CFA, использующий эту случайную модель, называется CFA первого порядка . Это классический метод CFA, который во многих публикациях даже считается единственным методом CFA. Примером альтернативной модели шансов является предположение, что все конфигурации имеют одинаковую вероятность. CFA, использующий эту случайную модель, называется CFA нулевого порядка .

  1. ^ Линерт, Г.А. (1969). «Конфигурационный частотный анализ как метод классификации в клинической психологии». В Ирле, М. (ред.). Отчет о 26-м конгрессе Немецкого психологического общества в Тюбингене 1968 года . Геттинген: Хогрефе. стр. 244–253.
  2. ^ Jump up to: а б Краут, Дж.; Линерт, Г.А. (1973). КФА. Конфигурационный частотный анализ и его применение в психологии и медицине [ CFA. Конфигурационный частотный анализ и его применение в психологии и медицине . Фрайбург: Альбер.
  3. ^ Холм, С. (1979). «Простая процедура последовательного браковочного множественного теста». Скандинавский статистический журнал . 6 (2): 65–70. JSTOR   4615733 .
  4. ^ фон Эйе, А. (1990). Введение в конфигурационный частотный анализ: поиск типов и антитипов в кросс-классификациях . Кембридж, Великобритания: Издательство Кембриджского университета. ISBN  0521380901 .
  5. ^ Лауч, Э.; Вебер, С. (1990). Частотный анализ конфигурации (KFA) . Берлин: люди и знания.
  6. ^ Краут, Дж. (1993). в конфигурационный частотный анализ (CFA ) . Введение Вайнхайм: Бельц, Издательский союз психологии. ISBN  3621271821 .

Дальнейшее чтение

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: b516ae92105afd658611ac8e4833accb__1702869120
URL1:https://arc.ask3.ru/arc/aa/b5/cb/b516ae92105afd658611ac8e4833accb.html
Заголовок, (Title) документа по адресу, URL1:
Configural frequency analysis - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)