Jump to content

Метод Бокса – Дженкинса

При анализе временных рядов используется метод Бокса -Дженкинса . [ 1 ] названный в честь статистиков Джорджа Бокса и Гвилима Дженкинса , применяет модели авторегрессионного скользящего среднего (ARMA) или авторегрессионного интегрированного скользящего среднего (ARIMA), чтобы найти наилучшее соответствие модели временного ряда прошлым значениям временного ряда .

Подход к моделированию

[ редактировать ]

Исходная модель использует итерационный трехэтапный подход моделирования:

  1. Идентификация модели и выбор модели : проверка стационарности переменных , выявление сезонности в зависимом ряде (при необходимости сезонное дифференцирование) и использование графиков функций автокорреляции (ACF) и частичной автокорреляции (PACF) зависимого временного ряда для решить, какой компонент авторегрессии или скользящего среднего (если таковой имеется) следует использовать в модели.
  2. Оценка параметров с использованием вычислительных алгоритмов для получения коэффициентов, которые лучше всего соответствуют выбранной модели ARIMA. Наиболее распространенные методы используют оценку максимального правдоподобия или нелинейную оценку методом наименьших квадратов .
  3. Проверка статистической модели путем проверки соответствия оцененной модели характеристикам стационарного одномерного процесса. В частности, остатки должны быть независимыми друг от друга и постоянными по среднему значению и дисперсии во времени. (Построение графика среднего значения и дисперсии остатков во времени и выполнение теста Люнга-Бокса или построение графика автокорреляции и частичной автокорреляции остатков полезны для выявления ошибок спецификации.) Если оценка неадекватна, мы должны вернуться к первому шагу и попытаться построить лучшая модель.

Данные, которые они использовали, были получены из газовой печи. Эти данные хорошо известны как данные газовых печей Бокса и Дженкинса для сравнительного анализа прогнозных моделей.

Коммандер и Купман (2007, §10.4) [ 2 ] утверждают, что подход Бокса-Дженкинса фундаментально проблематичен. Проблема возникает потому, что «в экономической и социальной областях реальные ряды никогда не являются стационарными, сколько бы различий ни было сделано». Таким образом, перед исследователем возникает вопрос: насколько близко к стационарному является достаточно близким? Как отмечают авторы: «На этот вопрос сложно ответить». Авторы далее утверждают, что вместо использования Бокса-Дженкинса лучше использовать методы пространства состояний, поскольку тогда стационарность временного ряда не требуется.

Идентификация модели Бокса – Дженкинса

[ редактировать ]

Стационарность и сезонность

[ редактировать ]

Первым шагом в разработке модели Бокса-Дженкинса является определение того, ли временной ряд является стационарным и существует ли какая-либо значительная сезонность , которую необходимо смоделировать.

Обнаружение стационарности

[ редактировать ]

Стационарность можно оценить по графику последовательности прогонов . График последовательности запуска должен показывать постоянное местоположение и масштаб . Это также можно обнаружить по графику автокорреляции . В частности, на нестационарность часто указывает график автокорреляции с очень медленным затуханием. Можно также использовать тест Дикки-Фуллера или расширенный тест Дикки-Фуллера .

Обнаружение сезонности

[ редактировать ]

Сезонность (или периодичность) обычно можно оценить по графику автокорреляции, графику сезонных подсерий или спектральному графику .

Дифференцирование для достижения стационарности

[ редактировать ]

Бокс и Дженкинс рекомендуют использовать дифференциальный подход для достижения стационарности. Однако подбор кривой и вычитание подобранных значений из исходных данных также можно использовать в контексте моделей Бокса – Дженкинса.

Сезонная разница

[ редактировать ]

На этапе идентификации модели цель состоит в том, чтобы обнаружить сезонность, если она существует, и определить порядок сезонной авторегрессии и сезонного скользящего среднего. Для многих рядов период известен, и достаточно одного термина сезонности. Например, для ежемесячных данных обычно включают либо сезонный термин AR 12, либо сезонный термин MA 12. Для моделей Бокса – Дженкинса сезонность перед подгонкой модели не удаляется явным образом. Вместо этого в спецификацию модели включаются порядок сезонных условий в программу оценки ARIMA . Однако может оказаться полезным применить к данным сезонную разницу и восстановить графики автокорреляции и частичной автокорреляции. Это может помочь в идентификации несезонной составляющей модели. В некоторых случаях сезонные различия могут устранить большую часть или весь эффект сезонности.

Определите p и q

[ редактировать ]

После того как стационарность и сезонность решены, следующим шагом будет определение порядка (т. е. p и q ) членов авторегрессии и скользящего среднего. У разных авторов разные подходы к определению p и q . Брокуэлл и Дэвис (1991) [ 3 ] заявить, что «нашим основным критерием выбора модели [среди моделей ARMA(p,q)] будет AICc», то есть информационный критерий Акаике с коррекцией. Другие авторы используют график автокорреляции и график частичной автокорреляции, описанные ниже.

Графики автокорреляции и частичной автокорреляции

[ редактировать ]

Выборочный график автокорреляции и выборочный график частичной автокорреляции сравниваются с теоретическим поведением этих графиков, когда порядок известен.

В частности, для процесса AR(1) выборочная автокорреляционная функция должна иметь экспоненциально убывающий вид. Однако процессы AR более высокого порядка часто представляют собой смесь экспоненциально убывающих и затухающих синусоидальных составляющих.

Для процессов авторегрессии более высокого порядка выборочную автокорреляцию необходимо дополнить графиком частичной автокорреляции. Частичная автокорреляция процесса AR( p ) становится нулевой при задержке p + 1 и больше, поэтому мы проверяем выборочную функцию частичной автокорреляции, чтобы увидеть, есть ли свидетельства отклонения от нуля. Обычно это определяется путем размещения 95% доверительного интервала на выборочном графике частичной автокорреляции (большинство программ, генерирующих выборочные графики автокорреляции, также строят этот доверительный интервал). Если программа не создает доверительный интервал, это приблизительно , где N обозначает размер выборки.

Автокорреляционная функция процесса MA( q ) становится нулевой при задержке q + 1 и больше, поэтому мы исследуем выборочную автокорреляционную функцию, чтобы увидеть, где она по существу становится нулевой. Мы делаем это, помещая 95% доверительный интервал для выборочной автокорреляционной функции на выборочный график автокорреляции. Большинство программ, которые могут генерировать график автокорреляции, также могут генерировать этот доверительный интервал.

Выборочная функция частичной автокорреляции обычно не помогает определить порядок процесса скользящего среднего.

В следующей таблице показано, как можно использовать образец автокорреляционной функции для идентификации модели.

Форма Указанная модель
Экспоненциальный, спадающий до нуля Авторегрессионная модель . Используйте график частичной автокорреляции, чтобы определить порядок авторегрессионной модели.
Чередование положительного и отрицательного, спадающее до нуля Авторегрессионная модель. Используйте график частичной автокорреляции, чтобы определить порядок.
Один или несколько пиков, остальные практически равны нулю (или близки к нулю) Модель скользящего среднего , порядок определяется тем, где график становится нулевым.
Распад, начинающийся после нескольких лагов смешанной авторегрессии и скользящего среднего ( ARMA Модель ).
Все ноль или близко к нулю Данные по сути случайны.
Высокие значения через фиксированные промежутки времени Включите сезонный авторегрессионный член.
Нет распада до нуля (или он распадается крайне медленно) Серия не является стационарной.

Гайндман и Атанасопулос предлагают следующее: [ 4 ]

Данные могут соответствовать модели ARIMA( p , d ,0), если графики ACF и PACF разностных данных показывают следующие закономерности:
  • АКФ является экспоненциально затухающей или синусоидальной;
  • наблюдается значительный всплеск при задержке p в PACF , но не за пределами задержки p .
Данные могут соответствовать модели ARIMA(0, d , q ), если графики ACF и PACF разностных данных показывают следующие закономерности:
  • PACF является экспоненциально затухающей или синусоидальной;
  • существует значительный всплеск при задержке q в ACF, но не за пределами задержки q .

На практике выборочные автокорреляционные и частичные автокорреляционные функции являются случайными величинами и не дают такой же картины, как теоретические функции. Это усложняет идентификацию модели. В частности, особенно сложно идентифицировать смешанные модели. Хотя опыт полезен, разработка хороших моделей с использованием этих выборочных участков может потребовать большого количества проб и ошибок.

Оценка модели Бокса – Дженкинса

[ редактировать ]

Оценка параметров моделей Бокса – Дженкинса включает численную аппроксимацию решений нелинейных уравнений. По этой причине обычно используется статистическое программное обеспечение, разработанное для реализации этого подхода – практически все современные статистические пакеты имеют такую ​​возможность. Основными подходами к подбору моделей Бокса – Дженкинса являются нелинейный метод наименьших квадратов и оценка максимального правдоподобия. Оценка максимального правдоподобия обычно является предпочтительным методом. Уравнения правдоподобия для полной модели Бокса – Дженкинса сложны и здесь не включены. См. математические подробности (Brockwell and Davis, 1991).

Диагностика модели Бокса – Дженкинса

[ редактировать ]

Предположения об устойчивом одномерном процессе

[ редактировать ]

Диагностика модели для моделей Бокса – Дженкинса аналогична проверке модели для нелинейной аппроксимации методом наименьших квадратов.

То есть предполагается, что член ошибки A t соответствует предположениям о стационарном одномерном процессе. Остатки должны представлять собой белый шум (или независимые, если их распределения нормальны), полученные из фиксированного распределения с постоянным средним значением и дисперсией. Если модель Бокса-Дженкинса является хорошей моделью данных, остатки должны удовлетворять этим предположениям.

Если эти предположения не выполняются, необходимо подобрать более подходящую модель. То есть вернитесь к этапу идентификации модели и попытайтесь разработать лучшую модель. Будем надеяться, что анализ остатков может дать некоторые подсказки относительно более подходящей модели.

Один из способов оценить, соответствуют ли остатки модели Бокса-Дженкинса предположениям, состоит в создании статистических графиков (включая график автокорреляции) остатков. Можно также посмотреть на значение статистики Бокса-Люнга .

  1. ^ Бокс, Джордж; Дженкинс, Гвилим (1970). Анализ временных рядов: прогнозирование и контроль . Сан-Франциско: Холден-Дэй.
  2. ^ Командир, JJF; Купман, С.Дж. (2007). Введение в анализ пространственно-временных рядов состояний . Издательство Оксфордского университета .
  3. ^ Брокуэлл, Питер Дж.; Дэвис, Ричард А. (1991). Временные ряды: теория и методы . Спрингер-Верлаг. п. 273. Бибкод : 1991цстм.книга.....Б .
  4. ^ Гайндман, Роб Дж; Атанасопулос, Джордж. Прогнозирование: принципы и практика . Проверено 18 мая 2015 г.

Дальнейшее чтение

[ редактировать ]
  • Беверидж, С.; Оикл, К. (1994), «Сравнение Бокса-Дженкинса и объективных методов определения порядка несезонной модели ARMA», Journal of Forecasting , 13 (5): 419–434, doi : 10.1002/for.3980130502
  • Панкрац, Алан (1983), Прогнозирование с помощью одномерных моделей Box – Дженкинса: концепции и примеры , John Wiley & Sons
[ редактировать ]

Общественное достояние Эта статья включает общедоступные материалы Национального института стандартов и технологий.

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 2fe65ad97cb07ce4fafb1d2f323ec273__1713350700
URL1:https://arc.ask3.ru/arc/aa/2f/73/2fe65ad97cb07ce4fafb1d2f323ec273.html
Заголовок, (Title) документа по адресу, URL1:
Box–Jenkins method - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)