Тестирование суррогатных данных
Тестирование суррогатных данных [1] (или метод суррогатных данных ) представляет собой статистическое доказательство методом от противного , аналогичное тестам перестановки. [2] и параметрическая загрузка . Он используется для обнаружения нелинейности во временном ряду . [3] Этот метод предполагает определение нулевой гипотезы. описание линейного процесса , а затем создание нескольких суррогатных наборов данных в соответствии с используя Монте-Карло методы . Затем вычисляется дискриминационная статистика для исходного временного ряда и всего суррогатного набора. Если значение статистики для исходного ряда значительно отличается от значения для суррогатного набора, нулевая гипотеза отклоняется и предполагается нелинейность. [3]
Конкретный метод тестирования суррогатных данных, который будет использоваться, напрямую связан с нулевой гипотезой. Обычно это похоже на следующее: Данные представляют собой реализацию стационарной линейной системы, выход которой, возможно, измеряется монотонно возрастающей, возможно, нелинейной (но статической) функцией . [1] Здесь линейное означает, что каждое значение линейно зависит от прошлых значений или от настоящих и прошлых значений некоторого независимого одинаково распределенного (iid) процесса, обычно также гауссовского. Это эквивалентно тому, что процесс относится к типу ARMA . В случае потоков (непрерывных отображений) линейность системы означает, что она может быть выражена линейным дифференциальным уравнением. В этой гипотезе статическая функция измерения — это функция, которая зависит только от текущего значения своего аргумента, а не от прошлых.
Методы
[ редактировать ]Было предложено множество алгоритмов для генерации суррогатных данных. Обычно их разделяют на две группы: [4]
- Типичные реализации : ряды данных генерируются как выходные данные хорошо подобранной модели к исходным данным.
- Ограниченные реализации : ряды данных создаются непосредственно из исходных данных, как правило, путем их подходящего преобразования.
Последние методы суррогатных данных не зависят ни от конкретной модели, ни от каких-либо параметров, поэтому являются непараметрическими методами. Эти методы суррогатных данных обычно основаны на сохранении линейной структуры исходного ряда (например, путем сохранения автокорреляционной функции или, что эквивалентно, периодограммы , оценки спектра выборки). [5] Среди методов ограниченной реализации наиболее широко используются (и поэтому их можно назвать классическими методами ):
- Алгоритм 0 или RS (для случайного перемешивания ): [1] [6] Новые данные создаются просто случайными перестановками исходного ряда. Эта концепция также используется в тестах на перестановку . Перестановки гарантируют то же распределение амплитуд, что и исходный ряд, но уничтожают любую временную корреляцию, которая могла присутствовать в исходных данных. Этот метод связан с нулевой гипотезой о том, что данные представляют собой некоррелированный иид-шум (возможно, гауссовский и измеренный статической нелинейной функцией).
- Алгоритм 1, или RP (для случайных фаз ; также известный как FT, для преобразования Фурье ): [1] [7] Чтобы сохранить линейную корреляцию (периограмму) ряда, суррогатные данные создаются путем обратного преобразования Фурье модулей преобразования Фурье исходных данных с новыми (равномерно случайными) фазами. Если суррогаты должны быть реальными, фазы Фурье должны быть антисимметричны относительно центрального значения данных.
- Алгоритм 2, или AAFT (для преобразования Фурье с корректировкой по амплитуде ): [1] [4] Этот метод имеет примерно преимущества двух предыдущих: он пытается сохранить как линейную структуру, так и амплитудное распределение. Этот метод состоит из следующих шагов:
- Масштабирование данных к распределению Гаусса ( Gaussianization ).
- Выполнение RP-преобразования новых данных.
- Наконец, делаем преобразование, обратное первому ( дегауссианизация ).
- Недостаток этого метода состоит именно в том, что последний шаг несколько меняет линейную структуру.
- Итерационный алгоритм 2, или IAAFT (для итеративного преобразования Фурье с корректировкой амплитуды ): [8] Этот алгоритм является итеративной версией AAFT. Шаги повторяются до тех пор, пока автокорреляционная функция не станет достаточно похожей на исходную или пока не прекратится изменение амплитуд.
Было предложено множество других методов суррогатных данных, некоторые из которых основаны на оптимизации для достижения автокорреляции, близкой к исходной. [9] [10] [11] некоторые основаны на вейвлет-преобразовании [12] [13] [14] а некоторые способны работать с некоторыми типами нестационарных данных. [15] [16] [17]
Вышеупомянутые методы называются линейными суррогатными методами, поскольку они основаны на линейном процессе и направлены на линейную нулевую гипотезу. [9] Вообще говоря, эти методы полезны для данных, показывающих нерегулярные колебания (краткосрочные изменчивости), и данных с таким поведением в реальном мире предостаточно. Однако мы часто наблюдаем данные с явной периодичностью, например, годовое количество солнечных пятен, электрокардиограмму (ЭКГ) и так далее. Временные ряды с сильной периодичностью явно не согласуются с линейными нулевыми гипотезами. Для решения этого случая были предложены некоторые алгоритмы и нулевые гипотезы. [18] [19] [20]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б с д и Дж. Тейлер; С. Юбанк; А. Лонгтин; Б. Галдрикян; Дж. Дойн Фармер (1992). «Тестирование нелинейности временных рядов: метод суррогатных данных» (PDF) . Физика Д. 58 (1–4): 77–94. Бибкод : 1992PhyD...58...77T . дои : 10.1016/0167-2789(92)90102-С .
- ^ Мур, Джейсон Х. «Начальная настройка, тестирование перестановок и метод суррогатных данных». Физика в медицине и биологии 44.6 (1999): L11
- ^ Jump up to: а б Андреас Галка (2000). Темы нелинейного анализа временных рядов: последствия для анализа ЭЭГ . Ривер Эдж, Нью-Джерси: World Scientific. стр. 222–223. ISBN 9789810241483 .
- ^ Jump up to: а б Дж. Тейлер; Д. Причард (1996). «Метод Монте-Карло с ограниченной реализацией для проверки гипотез». Физика Д. 94 (4): 221–235. arXiv : комп-газ/9603001 . Бибкод : 1996PhyD...94..221T . дои : 10.1016/0167-2789(96)00050-4 . S2CID 12568769 .
- ^ А. Галка; Т. Одзаки (2001). «Тестирование нелинейности многомерных временных рядов из непрерывной динамики». Физика Д. 158 (1–4): 32–44. Бибкод : 2001PhyD..158...32G . CiteSeerX 10.1.1.379.7641 . дои : 10.1016/s0167-2789(01)00318-9 .
- ^ Дж. А. Шейнкман; Б. ЛеБарон (1989). «Нелинейная динамика и доходность акций» . Журнал бизнеса . 62 (3): 311. дои : 10.1086/296465 .
- ^ А. Р. Осборн; А. Д. Кирван младший; А. Провансаль; Л. Бергамаско (1986). «Поиск хаотического поведения в крупных и мезомасштабных движениях в Тихом океане». Физика Д. 23 (1–3): 75–83. Бибкод : 1986PhyD...23...75O . дои : 10.1016/0167-2789(86)90113-2 .
- ^ Т. Шрайбер; А. Шмитц (1996). «Улучшенные суррогатные данные для тестов на нелинейность». Физ. Преподобный Летт . 77 (4): 635–638. arXiv : чао-дин/9909041 . Бибкод : 1996PhRvL..77..635S . дои : 10.1103/PhysRevLett.77.635 . ПМИД 10062864 . S2CID 13193081 .
- ^ Jump up to: а б Т. Шрайбер; А. Шмитц (2000). «Суррогатный временной ряд». Физика Д. 142 (3–4): 346–382. arXiv : чао-дин/9909037 . Бибкод : 2000PhyD..142..346S . дои : 10.1016/S0167-2789(00)00043-9 . S2CID 13889229 .
- ^ Т. Шрайбер (1998). «Ограниченная рандомизация данных временных рядов». Физ. Преподобный Летт . 80 (4): 2105–2108. arXiv : чао-дин/9909042 . Бибкод : 1998PhRvL..80.2105S . doi : 10.1103/PhysRevLett.80.2105 . S2CID 42976448 .
- ^ Р. Энгберт (2002). «Тестирование нелинейности: роль суррогатных данных». Хаос, солитоны и фракталы . 13 (1): 79–84. Бибкод : 2002CSF....13...79E . дои : 10.1016/S0960-0779(00)00236-8 .
- ^ М. Брейкспир; М. Браммер; П.А. Робинсон (2003). «Построение многомерных суррогатных наборов из нелинейных данных с использованием вейвлет-преобразования». Физика Д. 182 (1): 1–22. Бибкод : 2003PhyD..182....1B . дои : 10.1016/S0167-2789(03)00136-2 .
- ^ Си Джей Кейлок (2006). «Ограниченный суррогатный временной ряд с сохранением структуры среднего и дисперсии». Физ. Преподобный Е. 73 (3): 036707. Бибкод : 2006PhRvE..73c6707K . дои : 10.1103/PhysRevE.73.036707 . ПМИД 16605698 .
- ^ Си Джей Кейлок (2007). «Метод генерации суррогатных данных на основе вейвлетов». Физика Д. 225 (2): 219–228. Бибкод : 2007PhyD..225..219K . дои : 10.1016/j.physd.2006.10.012 .
- ^ Т. Накамура; М. Смолл (2005). «Суррогатные данные с небольшим перемешиванием: проверка динамики колебаний данных с учетом тенденций». Физ. Преподобный Е. 72 (5): 056216. Бибкод : 2005PhRvE..72e6216N . дои : 10.1103/PhysRevE.72.056216 . hdl : 10397/4826 . ПМИД 16383736 .
- ^ Т. Накамура; М. Смолл; Ю. Хирата (2006). «Тестирование нелинейности нерегулярных колебаний с долгосрочными тенденциями». Физ. Преподобный Е. 74 (2): 026205. Бибкод : 2006PhRvE..74b6205N . дои : 10.1103/PhysRevE.74.026205 . hdl : 10397/7633 . ПМИД 17025523 .
- ^ Дж. Х. Лусио; Р. Вальдес; Л.Р. Родригес (2012). «Усовершенствования методов суррогатных данных для нестационарных временных рядов». Физ. Преподобный Е. 85 (5): 056202. Бибкод : 2012PhRvE..85e6202L . дои : 10.1103/PhysRevE.85.056202 . ПМИД 23004838 .
- ^ Дж. Тейлер (1995). «О доказательствах низкоразмерного хаоса в эпилептической электроэнцефалограмме» . Буквы по физике А. 196 (5–6): 335–341. Бибкод : 1995PhLA..196..335T . дои : 10.1016/0375-9601(94)00856-К .
- ^ М. Смолл; Д. Ю; Р.Г. Харрисон (2001). «Суррогатный тест для данных псевдопериодических временных рядов» . Физ. Преподобный Летт . 87 (18): 188101. Бибкод : 2001PhRvL..87r8101S . doi : 10.1103/PhysRevLett.87.188101 . hdl : 10397/4856 .
- ^ С. Ло; Т. Накамура; М. Смолл (2005). «Суррогатный тест для различения хаотических и псевдопериодических временных рядов» . Физ. Преподобный Е. 71 (2): 026230. arXiv : nlin/0404054 . Бибкод : 2005PhRvE..71b6230L . дои : 10.1103/PhysRevE.71.026230 . hdl : 10397/4828 . ПМИД 15783410 . S2CID 35512941 .