Анализ пути (статистика)
В статистике . анализ путей используется для описания направленных зависимостей между набором переменных Сюда входят модели, эквивалентные любой форме множественного регрессионного анализа , факторного анализа , канонического корреляционного анализа , дискриминантного анализа , а также более общие семейства моделей многомерного дисперсионного и ковариационного анализа ( MANOVA , ANOVA , ANCOVA ).
Помимо того, что траекторный анализ рассматривается как форма множественной регрессии, фокусирующейся на причинно-следственной связи, его можно рассматривать как частный случай моделирования структурными уравнениями (SEM) , в котором для каждой из переменных в причинно-следственной модели используются только отдельные индикаторы. . То есть анализ пути представляет собой SEM со структурной моделью, но без модели измерения. Другие термины, используемые для обозначения путевого анализа, включают причинное моделирование и анализ ковариационных структур.
считает, что анализ пути Джудея Перл является прямым предком методов причинного вывода . [1]
История [ править ]
Анализ путей был разработан примерно в 1918 году генетиком Сьюэллом Райтом , который более подробно писал о нем в 1920-х годах. [2] С тех пор он был применен к широкому спектру сложных областей моделирования, включая биологию , психологию , социологию и эконометрику . [3]
Моделирование пути [ править ]
Обычно траекторные модели состоят из независимых и зависимых переменных, графически изображаемых прямоугольниками или прямоугольниками. Переменные, являющиеся независимыми переменными и не зависимыми переменными, называются «экзогенными». Графически эти блоки экзогенных переменных расположены на внешних краях модели и из них выходят только однонаправленные стрелки. Никакие однонаправленные стрелки не указывают на экзогенные переменные. Переменные, которые являются исключительно зависимыми переменными или являются одновременно независимыми и зависимыми переменными, называются «эндогенными». Графически эндогенные переменные имеют по крайней мере одну однонаправленную стрелку, указывающую на них.
В приведенной ниже модели две экзогенные переменные (Ex 1 и Ex 2 ) моделируются как коррелирующие, как показано двунаправленной стрелкой. Обе эти переменные оказывают прямое и косвенное (через En 1 ) влияние на En 2 (две зависимые или «эндогенные» переменные/фактора). В большинстве моделей реального мира на эндогенные переменные также могут влиять переменные и факторы, возникающие извне модели (внешние эффекты, включая ошибку измерения). Эти эффекты обозначены буквой «e» или ошибками в модели.
Используя те же переменные, возможны альтернативные модели. Например, можно предположить, что Пример 1 оказывает лишь косвенное влияние на En 2 , удаляя стрелку от Ex 1 к En 2 ; и вероятность или «соответствие» этих двух моделей можно сравнить статистически.
Правила отслеживания пути [ править ]
Чтобы правильно вычислить взаимосвязь между любыми двумя прямоугольниками на диаграмме, Райт (1934) предложил простой набор правил отслеживания пути: [4] для расчета корреляции между двумя переменными. Корреляция равна сумме вкладов всех путей, которыми связаны две переменные. Сила каждого из этих способствующих путей рассчитывается как произведение коэффициентов пути на этом пути.
Правила отслеживания пути:
- Вы можете проследить стрелку назад вверх, а затем вперед по следующей стрелке или вперед от одной переменной к другой, но никогда вперед, а затем назад. Другой способ понять это правило состоит в том, что вы никогда не можете перейти из одного наконечника стрелы в другой: орел-решка или решка-орел, а не орел-орел.
- Вы можете пройти через каждую переменную только один раз в данной цепочке путей.
- В каждую цепочку путей может быть включено не более одной двунаправленной стрелки.
Опять же, ожидаемая корреляция, обусловленная каждой цепочкой, прослеживаемой между двумя переменными, представляет собой произведение стандартизированных коэффициентов пути, а общая ожидаемая корреляция между двумя переменными представляет собой сумму этих вносящих вклад цепочек путей.
NB : Правила Райта предполагают модель без петель обратной связи: ориентированный граф модели не должен содержать циклов , т. е. это ориентированный ациклический граф , который широко изучался в рамках причинного анализа Джуди Перла .
Трассировка пути в нестандартизированных моделях [ править ]
Если смоделированные переменные не были стандартизированы, дополнительное правило позволяет рассчитать ожидаемые ковариации, пока не существует путей, соединяющих зависимые переменные с другими зависимыми переменными.
Самый простой случай получается, когда все остаточные дисперсии моделируются явно. В этом случае, в дополнение к трем правилам, приведенным выше, рассчитайте ожидаемые ковариации по формуле:
- Вычислите произведение коэффициентов в каждом маршруте между интересующими переменными, отслеживая назад, меняя направление двунаправленной стрелки, а затем отслеживая вперед.
- Суммируйте все различные маршруты, где пути считаются отдельными, если они содержат разные коэффициенты или встречаются с этими коэффициентами в другом порядке.
Если остаточные отклонения не включены явно или в качестве более общего решения при любом изменении направления, встречающемся на маршруте (за исключением двусторонних стрелок), включите отклонение переменной в точке изменения. То есть, прослеживая путь от зависимой переменной к независимой переменной, включите дисперсию независимой переменной, за исключением случаев, когда это нарушает правило 1 выше (прохождение через соседние стрелки: т. е. когда независимая переменная также соединяется с двойной трехсторонняя стрелка, соединяющая ее с другой независимой переменной). При получении дисперсий (что необходимо в том случае, если они не моделируются явно) путь от зависимой переменной в независимую и обратно учитывается только один раз.
См. также [ править ]
- Байесовская сеть
- Причинность
- Диаграмма причинно-следственной петли
- Скрытая модель Маркова
- Модель скрытой переменной
- Коэффициент пути
- Модель структурного уравнения (SEM)
Ссылки [ править ]
- ^ Перл, Иудея (май 2018 г.). Книга Почему . Нью-Йорк: Основные книги. п. 6. ISBN 978-0-465-09760-9 .
- ^ Райт, С. (1921). «Корреляция и причинно-следственная связь». J. Сельскохозяйственные исследования . 20 : 557–585.
- ^ Додж, Ю. (2003) Оксфордский словарь статистических терминов. ОУП. ISBN 0-19-920613-9
- ^ Райт, С. (1934). «Метод коэффициентов пути» . Анналы математической статистики . 5 (3): 161–215. дои : 10.1214/aoms/1177732676 .