Причинность Грейнджер

Когда временной ряд X по Грейнджеру вызывает временной ряд Y , закономерности в X примерно повторяются в Y через некоторое время (два примера обозначены стрелками). значения X можно использовать для прогнозирования будущих значений Y. Таким образом, прошлые

Тест причинности Грейнджера — это проверка статистической гипотезы , позволяющая определить, ли один временной ряд полезен для прогнозирования другого, впервые предложенный в 1969 году. [1] Обычно регрессии отражают «простые» корреляции , но Клайв Грейнджер утверждал, что причинность в экономике можно проверить, измеряя способность прогнозировать будущие значения временного ряда, используя предыдущие значения другого временного ряда. Поскольку вопрос об «истинной причинности» является глубоко философским и из-за ошибки post hoc ergo propter hoc, заключающейся в предположении, что одна вещь, предшествующая другой, может использоваться в качестве доказательства причинной связи, специалисты по эконометрике утверждают, что тест Грейнджера обнаруживает только «прогнозируемую причинность». . [2] Использование только термина «причинность» является неправильным, поскольку причинность по Грейнджеру лучше описать как «приоритет». [3] или, как позже заявил сам Грейнджер в 1977 году, «связанный со временем». [4] Вместо того, чтобы проверять, является ли X причиной Y, причинность Грейнджера проверяет, предсказывает ли X Y. [5]

Временной ряд X называется причиной Y по Грейнджеру , если можно показать, обычно с помощью серии t-тестов и F-тестов для лагированных значений ( X а также включая лагированные значения Y ), что эти значения X обеспечивают статистически значимая информация о будущих значениях Y .

Грейнджер также подчеркнула, что некоторые исследования, использующие тест «причинности Грейнджера» в областях, не относящихся к экономике, привели к «смехотворным» выводам. [6] «Конечно, появилось много нелепых статей», — сказал он в своей Нобелевской лекции. [7] Тем не менее, он остается популярным методом анализа причинно-следственных связей во временных рядах из-за своей вычислительной простоты. [8] [9] Первоначальное определение причинности Грейнджера не учитывает скрытые мешающие эффекты и не отражает мгновенные и нелинейные причинные связи, хотя для решения этих проблем было предложено несколько расширений. [8]

Интуиция [ править ]

Мы говорим, что переменная X , которая развивается с течением времени по Грейнджеру, вызывает развитие другой переменной Y , если предсказания значения Y, основанные на ее собственных прошлых значениях и прошлых значениях X, лучше, чем предсказания Y, основанные только на Y. собственных значениях прошлые ценности.

Основополагающие принципы [ править ]

Грейнджер определил причинно-следственную связь, основываясь на двух принципах: [8] [10]

  1. Причина возникает раньше своего следствия.
  2. Причина обладает уникальной информацией о будущих значениях своего следствия.

Учитывая эти два предположения о причинности, Грейнджер предложил проверить следующую гипотезу для выявления причинного эффекта на :

где относится к вероятности, — произвольное непустое множество, и и соответственно обозначают информацию, доступную на момент времени во всей вселенной и в модифицированной вселенной, в которой исключено. Если принять приведенную выше гипотезу, то мы говорим, что Грейнджер-причины . [8] [10]

Метод [ править ]

Если временной ряд представляет собой стационарный процесс , тест проводится с использованием значений уровня двух (или более) переменных. Если переменные нестационарны, то тест проводится с использованием первых (или более высоких) разностей. Количество включенных лагов обычно выбирается с использованием информационного критерия, такого как информационный критерий Акаике или информационный критерий Шварца . Любое конкретное лагированное значение одной из переменных сохраняется в регрессии, если (1) оно значимо согласно t-критерию и (2) оно и другие лагированные значения переменной совместно добавляют объяснительную силу модели в соответствии с F-тест. Тогда нулевая гипотеза об отсутствии причинности по Грейнджеру не отвергается тогда и только тогда, когда в регрессии не сохранились лаговые значения объясняющей переменной.

На практике может оказаться, что ни одна переменная Грейнджер не является причиной другой или что каждая из двух переменных Грейнджер не является причиной другой.

Математическое утверждение [ править ]

Пусть y и x — стационарные временные ряды. Чтобы проверить нулевую гипотезу о том, что x не является причиной y по Грейнджеру сначала нужно найти правильные лаговые значения y для включения в одномерную авторегрессию y , :

Затем авторегрессия дополняется включением запаздывающих значений x :

В этой регрессии сохраняются все лагированные значения x , которые индивидуально значимы в соответствии с их t-статистикой, при условии, что вместе они добавляют объяснительную силу к регрессии в соответствии с F-тестом (нулевая гипотеза которого не является объяснительной силой, добавленной совместно x ' с). В обозначениях приведенной выше расширенной регрессии p — самая короткая, а q — самая длинная длина лага, для которой лагированное значение x является значимым.

Нулевая гипотеза о том, что x не является причиной y по Грейнджеру, не отвергается тогда и только тогда, когда запаздывающие значения x в регрессии не сохраняются .

Многомерный анализ [ править ]

Многомерный анализ причинно-следственных связей Грейнджера обычно выполняется путем подгонки векторной авторегрессионной модели (VAR) к временному ряду. В частности, пусть для быть -мерный многомерный временной ряд. Причинность Грейнджера определяется путем подбора модели VAR с время отстает следующим образом:

где представляет собой белый гауссовский случайный вектор, а это матрица для каждого . Временной ряд называется причиной Грейнджера другого временного ряда , если хотя бы один из элементов для значительно больше нуля (по абсолютной величине). [11]

Непараметрический тест [ править ]

Вышеупомянутые линейные методы подходят для проверки причинности Грейнджера в среднем. Однако они не способны обнаружить причинность Грейнджера в более высоких моментах, например, в дисперсии. Непараметрические тесты причинности Грейнджера предназначены для решения этой проблемы. [12] Определение причинности Грейнджера в этих тестах является общим и не предполагает каких-либо допущений моделирования, таких как модель линейной авторегрессии. Непараметрические тесты причинности Грейнджера можно использовать в качестве диагностических инструментов для построения более качественных параметрических моделей, включая моменты более высокого порядка и/или нелинейность. [13]

Ограничения [ править ]

Как следует из названия, причинность Грейнджера не обязательно является истинной причинностью. Фактически, тесты причинно-следственной связи Грейнджера соответствуют только юмовскому определению причинности , которое идентифицирует причинно-следственные отношения с постоянными соединениями. [14] Если и X, и Y управляются общим третьим процессом с разными задержками, альтернативную гипотезу причинности Грейнджера все равно можно не отвергнуть. Однако манипуляция одной из переменных не изменит другую. Действительно, тесты причинно-следственной связи Грейнджера предназначены для обработки пар переменных и могут давать ошибочные результаты, когда истинная связь включает три или более переменных. При этом утверждалось, что при вероятностном взгляде на причинность причинность Грейнджера можно считать истинной причинностью в этом смысле, особенно если принять во внимание понятие Райхенбаха о «отсеивании» вероятностной причинности. [15] Другими возможными источниками ошибочных результатов испытаний являются: (1) недостаточно частая или слишком частая выборка, (2) нелинейная причинно-следственная связь, (3) нестационарность и нелинейность временных рядов и (4) существование рациональных ожиданий. [14] Аналогичный тест, включающий большее количество переменных, можно применить с помощью векторной авторегрессии .

Валидность теста причинности Грейнджера подвергается сомнению в академической литературе. [16] в статье, в которой утверждается, что «даже самое фундаментальное требование, лежащее в основе любого возможного определения причинности, не удовлетворяется тестом причинности Грейнджера... любое определение причинности должно относиться к предсказанию будущего на основе прошлого... мы обнаруживаем, что Грейнджер также позволяет «предсказывать» прошлое по будущему».

Расширения [ править ]

Был разработан метод причинности Грейнджера, который не чувствителен к отклонениям от предположения о нормальном распределении члена ошибки. [17] Этот метод особенно полезен в финансовой экономике, поскольку многие финансовые переменные не имеют нормального распределения. [18] Недавно в литературе было предложено тестирование асимметричной причинности, чтобы отделить причинное влияние положительных изменений от отрицательных. [19] Также доступно расширение тестирования (не)причинности Грейнджера на панельные данные. [20] Модифицированный тест причинности Грейнджера, основанный на моделях целочисленных временных рядов типа GARCH (обобщенная авторегрессионная условная гетероскедастичность), доступен во многих областях. [21] [22]

во времени Изменяющаяся Грейнджера причинность

Расширение причинно-следственной связи Грейнджера за счет включения ее динамической, изменяющейся во времени природы позволяет более детально понять, как причинно-следственные связи в данных временных рядов развиваются с течением времени. [23] В методологии используются рекурсивные методы, такие как окна прямого расширения (FE), прокрутки (RO) и рекурсивного развития (RE), чтобы преодолеть ограничения традиционных тестов причинности Грейнджера и понять изменения в причинно-следственных связях в разные периоды. [24] Центральным аспектом этой методологии является команда tvgc в Stata. [23] Эмпирические приложения, такие как данные о комиссиях за транзакции и экономических подсистемах Ethereum, подчеркивают динамичный характер экономических отношений с течением времени. [25]

В нейробиологии [ править ]

Давнее убеждение о функциях нервной системы утверждало, что разные области мозга отвечают за конкретные задачи; что структурная связность, локальная для определенной области, каким-то образом диктовала функцию этой части. Объединив работы, выполненные на протяжении многих лет, произошел переход к иному, сетецентрическому подходу к описанию потока информации в мозгу. Объяснение функций начинает включать концепцию сетей, существующих на разных уровнях и в разных местах мозга. [26] Поведение этих сетей можно описать недетерминированными процессами, которые развиваются во времени. То есть, при одном и том же входном стимуле вы не получите одинаковый результат от сети. Динамика этих сетей управляется вероятностями, поэтому мы рассматриваем их как стохастические (случайные) процессы , чтобы мы могли уловить такого рода динамику между различными областями мозга.

В прошлом исследовались различные методы получения некоторой меры информационного потока на основе активизирующей активности нейрона и окружающего его ансамбля, но они ограничены в выводах, которые можно сделать, и дают мало информации о направленном потоке информации. , размер его эффекта и то, как он может меняться со временем. [27] Недавно причинно-следственная связь Грейнджера была применена для решения некоторых из этих проблем. [28] Проще говоря, мы исследуем, как лучше всего предсказать будущее нейрона: используя либо весь ансамбль, либо весь ансамбль, за исключением определенного целевого нейрона. Если прогноз ухудшается из-за исключения целевого нейрона, то мы говорим, что он имеет «g-причинную» связь с текущим нейроном.

Расширения для точечных моделей процессов [ править ]

Предыдущие методы причинно-следственной связи Грейнджера могли работать только с непрерывными данными, поэтому анализ записей нейронных импульсов включал преобразования, которые в конечном итоге изменяли стохастические свойства данных, косвенно изменяя достоверность выводов, которые можно было из них сделать. Однако в 2011 году была предложена новая универсальная модель причинно-следственной связи Грейнджера, которая могла напрямую работать с любой модальностью, включая поезда нейронных импульсов. [27]

Данные нейронных импульсов можно смоделировать как точечный процесс . Временной точечный процесс — это стохастический временной ряд бинарных событий, происходящих в непрерывном времени. В каждый момент времени он может принимать только два значения, указывающих, произошло ли событие на самом деле. Этот тип двоичного представления информации подходит для активности нейронных популяций , поскольку потенциал действия отдельного нейрона имеет типичную форму волны. Таким образом, фактическая информация, выдаваемая нейроном, — это возникновение «спайка», а также время между последовательными спайками. Используя этот подход, можно абстрагировать поток информации в нейронной сети как просто время всплесков для каждого нейрона в течение периода наблюдения. Точечный процесс может быть представлен либо временем самих пиков, временем ожидания между пиками, используя процесс подсчета, либо, если время достаточно дискретизировано, чтобы гарантировать, что в каждом окне может произойти только одно событие, то то есть один временной интервал может содержать только одно событие в виде набора единиц и нулей, что очень похоже на двоичный код. [ нужна ссылка ]

Одним из простейших типов моделей нейронных импульсов является процесс Пуассона . Однако это ограничено тем, что не имеет памяти. Он не учитывает историю скачков при расчете текущей вероятности выстрела. Нейроны, однако, демонстрируют фундаментальную (биофизическую) зависимость от истории посредством относительных и абсолютных рефрактерных периодов. Чтобы решить эту проблему, функция условной интенсивности, используется которая представляет вероятность всплеска нейрона, обусловленную его собственной историей. Функция условной интенсивности выражает мгновенную вероятность срабатывания и неявно определяет полную вероятностную модель точечного процесса. Он определяет вероятность в единицу времени. Таким образом, если эта единица времени выбрана достаточно маленькой, чтобы гарантировать, что в этом временном окне может возникнуть только один всплеск, тогда наша функция условной интенсивности полностью определяет вероятность того, что данный нейрон сработает в определенное время. [ нужна ссылка ]

В вычислительной технике [ править ]

Пакеты программного обеспечения были разработаны для измерения «причинности Грейнджера» на Python и R :

См. также [ править ]

  • Критерии Брэдфорда Хилла - Критерии измерения причины и следствия
  • Энтропия передачи – измерение количества направленной (асимметричной по времени) передачи информации.
  • Постулат Коха - Четыре критерия, показывающие причинно-следственную связь между микроорганизмом-возбудителем и заболеванием.

Ссылки [ править ]

  1. ^ Грейнджер, CWJ (1969). «Исследование причинно-следственных связей с помощью эконометрических моделей и кросс-спектральных методов». Эконометрика . 37 (3): 424–438. дои : 10.2307/1912791 . JSTOR   1912791 .
  2. ^ Диболд, Фрэнсис X. (2007). Элементы прогнозирования (PDF) (4-е изд.). Томсон Юго-Западный. стр. 230–231. ISBN  978-0324359046 .
  3. ^ Лимер, Эдвард Э. (1985). «Векторная авторегрессия для причинного вывода?». Серия конференций Карнеги-Рочестер по государственной политике . 22 : 283. дои : 10.1016/0167-2231(85)90035-1 .
  4. ^ Грейнджер, CWJ; Ньюболд, Пол (1977). Прогнозирование экономических временных рядов . Нью-Йорк: Академическая пресса. п. 225. ИСБН  0122951506 .
  5. ^ Гамильтон, Джеймс Д. (1994). Анализ временных рядов (PDF) . Издательство Принстонского университета. стр. 306–308. ISBN  0-691-04289-6 .
  6. ^ Турман, Уолтер (1988). «Куры, яйца и причинно-следственная связь, или что было первым?» (PDF) . Американский журнал экономики сельского хозяйства . 70 (2): 237–238. дои : 10.2307/1242062 . JSTOR   1242062 . Проверено 2 апреля 2022 г.
  7. ^ Грейнджер, Клайв У.Дж. (2004). «Анализ временных рядов, коинтеграция и приложения» (PDF) . Американский экономический обзор . 94 (3): 421–425. CiteSeerX   10.1.1.370.6488 . дои : 10.1257/0002828041464669 . S2CID   154709108 . Проверено 12 июня 2019 г.
  8. ^ Jump up to: а б с д Эйхлер, Майкл (2012). «Причинно-следственный вывод в анализе временных рядов» (PDF) . В Берзуини, Карло (ред.). Причинность: статистические перспективы и приложения (3-е изд.). Хобокен, Нью-Джерси: Уайли. стр. 327–352. ISBN  978-0470665565 .
  9. ^ Сет, Анил (2007). «Причинность Грейнджер» . Схоларпедия . 2 (7): 1667. Бибкод : 2007SchpJ...2.1667S . doi : 10.4249/scholarpedia.1667 .
  10. ^ Jump up to: а б Грейнджер, CWJ (1980). «Тестирование причинности: личная точка зрения». Журнал экономической динамики и контроля . 2 : 329–352. дои : 10.1016/0165-1889(80)90069-X .
  11. ^ Люткеполь, Хельмут (2005). Новое введение в анализ множественных временных рядов (3-е изд.). Берлин: Шпрингер. стр. 41–51 . ISBN  978-3540262398 .
  12. ^ Дикс, Сис; Панченко, Валентин (2006). «Новые статистические и практические рекомендации по непараметрическому тестированию причинности Грейнджера» (PDF) . Журнал экономической динамики и контроля . 30 (9): 1647–1669. дои : 10.1016/j.jedc.2005.08.008 .
  13. ^ Фрэнсис, Билл Б.; Мугуэ, Мбоджа; Панченко, Валентин (2010). «Существует ли симметричная нелинейная причинно-следственная связь между крупными и малыми фирмами?» (PDF) . Журнал эмпирических финансов . 17 (1): 23–28. дои : 10.1016/j.jempfin.2009.08.003 .
  14. ^ Jump up to: а б Мариуш, Мазиарж (20 мая 2015 г.). «Обзор ошибки Грейнджер-причинности» . Журнал философской экономики . VIII. (2). ISSN   1843-2298 .
  15. ^ Маннино, Майкл; Бресслер, Стивен Л. (2015). «Основные взгляды на причинность в крупномасштабных мозговых сетях». Обзоры физики жизни . 15 : 107–23. Бибкод : 2015PhLRv..15..107M . дои : 10.1016/j.plrev.2015.09.002 . ПМИД   26429630 .
  16. ^ Грассманн, Грета (2020). «Новые соображения о достоверности теста причинности Винера-Грейнджера» . Гелион . 6 (10): e05208. дои : 10.1016/j.heliyon.2020.e05208 . ПМЦ   7578691 . ПМИД   33102842 .
  17. ^ Хакер, Р. Скотт; Хатеми-дж, А. (2006). «Тесты причинности между интегрированными переменными с использованием асимптотических и бутстреп-распределений: теория и применение» . Прикладная экономика . 38 (13): 1489–1500. дои : 10.1080/00036840500405763 . S2CID   121999615 .
  18. ^ Мандельброт, Бенуа (1963). «Изменение некоторых спекулятивных цен». Журнал бизнеса . 36 (4): 394–419. дои : 10.1086/294632 .
  19. ^ Хатеми-дж, А. (2012). «Асимметричные тесты причинности с приложением» . Эмпирическая экономика . 43 : 447–456. дои : 10.1007/s00181-011-0484-x . S2CID   153562476 .
  20. ^ Думитреску, Э.-И.; Херлин, К. (2012). «Тестирование непричинности Грейнджера в гетерогенных панелях». Экономическое моделирование . 29 (4): 1450–1460. CiteSeerX   10.1.1.395.568 . дои : 10.1016/j.econmod.2012.02.014 . S2CID   9227921 .
  21. ^ Чен, Кэти В.С.; Се, Ин-Хен; Су, Хун-Чье; Ву, Цзя Цзин (01 февраля 2018 г.). «Тест причинно-следственной связи мелких частиц в окружающей среде и человеческого гриппа на Тайване: различия в возрастных группах и географическая неоднородность» . Интернационал окружающей среды . 111 : 354–361. дои : 10.1016/j.envint.2017.10.011 . ISSN   0160-4120 . ПМИД   29173968 .
  22. ^ Чен, Кэти В.С.; Ли, Санёль (2017). «Байесовский тест причинности для целочисленных моделей временных рядов с применением к данным о климате и преступности». Журнал Королевского статистического общества, серия C (прикладная статистика) . 66 (4): 797–814. дои : 10.1111/rssc.12200 . hdl : 10.1111/rssc.12200 . ISSN   1467-9876 . S2CID   125296454 .
  23. ^ Jump up to: а б Баум, Кристофер Ф.; Херн, Стэн; Отеро, Хесус (30 июня 2022 г.). «Проверка изменяющейся во времени причинности Грейнджер» . Журнал Stata: Содействие распространению информации по статистике и статистическим данным . 22 (2): 355–378. дои : 10.1177/1536867X221106403 . ISSN   1536-867X . S2CID   250221497 .
  24. ^ Шоджайе, Али; Фокс, Эмили Б. (07 марта 2022 г.). «Причинность Грейнджер: обзор и последние достижения» . Ежегодный обзор статистики и ее применения . 9 (1): 289–319. arXiv : 2105.02675 . Бибкод : 2022AnRSA...9..289S . doi : 10.1146/annurev-statistics-040120-010930 . ISSN   2326-8298 . ПМЦ   10571505 . ПМИД   37840549 .
  25. ^ Анте, Леннарт; Саггу, Аман (4 января 2024 г.). «Изменяющиеся во времени двунаправленные причинно-следственные связи между комиссиями за транзакции и экономической активностью подсистем, использующих сеть блокчейна Ethereum» . Журнал риска и финансового менеджмента . 17 (1): 19. дои : 10.3390/jrfm17010019 . ISSN   1911-8074 .
  26. ^ Найт, RT (2007). «Нейронаука: разоблачение френологии нейронными сетями». Наука . 316 (5831): 1578–9. дои : 10.1126/science.1144677 . ПМИД   17569852 . S2CID   15065228 .
  27. ^ Jump up to: а б Ким, Сангюн; Путрино, Дэвид; Гош, Сумья; Браун, Эмери Н. (2011). «Мера причинности Грейнджера для моделей точечных процессов ансамблевой активности нейронов» . PLOS Вычислительная биология . 7 (3): e1001110. Бибкод : 2011PLSCB...7E1110K . дои : 10.1371/journal.pcbi.1001110 . ПМК   3063721 . ПМИД   21455283 .
  28. ^ Бресслер, Стивен Л; Сет, Анил К. (2011). «Причинность Винера – Грейнджера: хорошо зарекомендовавшая себя методология». НейроИмидж . 58 (2): 323–9. doi : 10.1016/j.neuroimage.2010.02.059 . ПМИД   20202481 . S2CID   36616970 .

Дальнейшее чтение [ править ]