Jump to content

Скользящая средняя

Сглаживание шумного синуса (синяя кривая) с скользящей средней (красная кривая).


В статистике скользящее среднее ( среднее среднее значение или среднее значение для бега или среднее для движения [ 1 ] или среднее значение ) - это расчет для анализа точек данных путем создания ряда средних значений различных выборов полного набора данных. Вариации включают в себя: простые , кумулятивные или взвешенные формы.

Математически, скользящее среднее - это тип свертки . Таким образом, при обработке сигнала он рассматривается как нижний фильтр изданного импульсного отклика . Поскольку функция ящика описывает его коэффициенты фильтра, она называется фильтром ящика . Иногда за ним следует снижение .

Учитывая серию чисел и фиксированный размер подмножества, первый элемент скользящего среднего получается путем получения среднего значения первоначального фиксированного подмножества чисел. Затем подмножество изменяется путем «смещения вперед»; то есть, исключая первое число серии и включение следующего значения в подмножество.

Среднее среднее обычно используется с данными временных рядов для сглаживания краткосрочных колебаний и выделения долгосрочных тенденций или циклов. Порог между краткосрочным и долгосрочным зависит от применения, и параметры скользящей средней будут установлены соответствующим образом. Он также используется в экономике для изучения валового внутреннего продукта, занятости или других макроэкономических временных рядов. При использовании с данными, не являющимися временными сериями, скользящие средние фильтры с более высокими частотными компонентами без какого-либо конкретного соединения со временем, хотя обычно подразумевается какой-либо вид упорядочения. Просмотрено, это можно рассматривать как сглаживание данных.

Простая скользящая средняя

[ редактировать ]

В финансовых приложениях простая скользящая средняя ( SMA ) является невзвешенным средним из предыдущего точки данных. Однако в науке и технике среднее значение обычно берется из равного числа данных по обе стороны от центрального значения. Это гарантирует, что различия в среднем знакомы с вариациями в данных, а не сдвинуты во времени. Примером простого одинаково взвешенного среднего значения является среднее значение за последним записи набора данных, содержащих записи. Пусть эти точки данных будут Полем Это может быть закрытие цен на акции. Среднее за последнее точки данных (дни в этом примере) обозначены как и рассчитывается как:

При расчете следующего среднего с той же шириной выборки Диапазон от к рассматривается. Новое значение входит в сумму и самое старое значение выпадает. Это упрощает расчеты, повторно используя предыдущее среднее значение . Это означает, что фильтр скользящего среднего может быть рассчитано довольно дешево на данных в реальном времени с помощью FIFO / Circular Buffer и только 3 арифметических этапов.

Во время начального заполнения FIFO / кругового буфера окно отбора проб равно размеру данных, таким образом и средний расчет выполняется как кумулятивная скользящая средняя .

Выбранный период ( ) зависит от типа представляющего интерес движения, такого как короткое, промежуточное или долгосрочное.

Если используемые данные не сосредоточены вокруг среднего значения, простое скользящее среднее отстает позади последней даты на половину ширины выборки. SMA также может быть непропорционально влиять на то, что старые выпадающие данные или новые данные. Одна из характеристик SMA заключается в том, что если данные имеют периодические колебания, то применение SMA этого периода устранит это изменение (среднее значение всегда содержащее одно Полный цикл). Но совершенно обычный цикл редко встречается. [ 2 ]

Для ряда приложений выгодно избегать изменений, вызванного использованием только «прошлых» данных. Следовательно, центральное скользящее среднее может быть вычислено, используя данные, одинаково расположенные по обе стороны от точки в серии, где рассчитывается среднее значение. [ 3 ] Это требует использования нечетного количества точек в окне образца.

Основным недостатком SMA является то, что он позволяет через значительное количество сигнала короче длины окна. Хуже того, это на самом деле инвертирует это. [ Цитация необходима ] Это может привести к неожиданным артефактам, таким как пики в сглаженном результате, в котором появляются впадины в данных. Это также приводит к тому, что результат будет менее гладким, чем ожидалось, поскольку некоторые из более высоких частот не удалены должным образом.

Его частотная характеристика-это тип фильтра низкого уровня, называемый SINC-в частоте .

Непрерывное скользящее среднее

[ редактировать ]

Непрерывное скользящее среднее определяется со следующим интегралом. А среда вокруг Определяет интенсивность сглаживания графика функции.

Непрерывное скользящее среднее функции определяется как:

Больше разглаживает исходный график функции (синий) более. Приведенные ниже анимации показывают скользящее среднее как анимация в зависимости от разных значений для Полем Фракция используется, потому что ширина интервала для интеграла.

Совокупный средний

[ редактировать ]

В совокупном среднем ( CA ) данные поступают в упорядоченном потоке данных, и пользователь хотел бы увеличить среднее значение всех данных до текущей даты. Например, инвестор может понадобиться средней цены всех транзакций акций для конкретных акций до текущего времени. Поскольку каждая новая транзакция происходит, средняя цена во время транзакции может быть рассчитана для всех транзакций до этой точки с использованием совокупного среднего, как правило, одинаково взвешенное среднее значение последовательности n значений до текущего времени:

Метод грубой силы для расчета этого заключается в том, чтобы хранить все данные и рассчитать сумму и делить на количество точек каждый раз, когда появлялся новый батам. Тем не менее, можно просто обновить совокупное среднее как новое значение, становится доступным, используя формулу

Таким образом, текущее кумулятивное среднее для нового батама равен предыдущему совокупному среднему среднему, плюс новейший датум, все это разделено на количество полученных точек, n +1. Когда все данные поступят ( n = N ), то совокупное среднее будет равным окончательному среднему. Также можно сохранить общее количество данных, а также количество точек и делить общее количество на количество очков, чтобы получить CA каждый раз, когда появляется новая база данных.

Вывод совокупной средней формулы является простым. С использованием и аналогично n + 1 , видно, что

Решение этого уравнения для приводит к

Взвешенная скользящая средняя

[ редактировать ]

Взвешенное среднее - это среднее значение, которое имеет умножительные коэффициенты, чтобы дать различные веса для данных в разных положениях в окне выборки. Математически, взвешенное скользящее среднее - это свертка данных с фиксированной функцией взвешивания. Одним из приложений является удаление пикселизации из цифрового графического изображения. [ Цитация необходима ]

В финансовой сфере, и более конкретно в анализе финансовых данных, взвешенная скользящая средняя (WMA) имеет специфическое значение веса, которое уменьшается в арифметическом прогрессировании. [ 4 ] В n -днеотном WMA последний день имеет вес и второй последний и т. д., до одного.

WMA Weights n = 15

Знаменатель - это треугольный номер , равный В более общем случае знаменатель всегда будет суммой индивидуальных весов.

При расчете WMA по последовательным значениям разница между числителями и является Полем Если мы обозначим сумму к , затем

График справа показывает, как уменьшаются веса, от наивысшего веса для самых последних данных, до нуля. Его можно сравнить с весами в экспоненциальном скользящем среднем, которое следует.

Экспоненциальное скользящее среднее

[ редактировать ]

Экспоненциальное скользящее среднее (EMA) , также известное как экспоненциально взвешенное скользящее среднее (EWMA) , [ 5 ] первого порядка является фильтром бесконечного импульсного отклика , который применяет весовые коэффициенты, которые уменьшаются в геометрической прогрессии . Взвешивание для каждой более старой базы данных уменьшается в геометрической прогрессии, никогда не достигая нуля. Эта формулировка согласно Хантеру (1986). [ 6 ]

Другие веса

[ редактировать ]

Другие системы взвешивания используются время от времени - например, при торговле акциями, взвешивание объема будет взвешивать каждый период времени пропорционально его объему торгов.

Еще одним весом, используемым акциями, является 15-балльная скользящая средняя Спенсер. [ 7 ] (Центральное скользящее среднее). Его симметричные коэффициенты веса составляют [-3, -6, −5, 3, 21, 46, 67, 74, 67, 46, 21, 3, −5, −6, −3], которые факторы как [1, 1, 1, 1] × [1, 1, 1, 1] × [1, 1, 1, 1, 1] × [−3, 3, 4, 3, −3] / 320 и Листья образцы любого квадратичного или кубического полинома без изменений. [ 8 ] [ 9 ]

За пределами мира финансов взвешенные средства имеют много форм и применений. Каждая функция взвешивания или «ядро» имеет свои характеристики. В инженерии и науке частота и фазовый отклик фильтра часто имеют основное значение для понимания желаемых и нежелательных искажений, которые применяется конкретный фильтр к данным.

Средство не только «сглаживает» данные. Среднее значение-это форма фильтра низкого уровня. Эффекты используемого конкретного фильтра должны быть поняты, чтобы сделать соответствующий выбор. На этом моменте французская версия этой статьи обсуждает спектральные эффекты 3 видов средств (кумулятивные, экспоненциальные, гауссовые).

Перемещение медианы

[ редактировать ]

С статистической точки зрения скользящее среднее, когда используется для оценки основной тенденции во временных рядах, подвержены редким событиям, таким как быстрые шоки или другие аномалии. Более надежная оценка этой тенденции - простая медиана в N -моментах времени: где медиана находится, например, сортировка значений внутри скобков и поиск значения в середине. Для больших значений N , медиана может быть эффективно вычислена путем обновления индексируемого скиплиста . [ 10 ]

Статистически, скользящее среднее оптимальное для восстановления базовой тенденции временных рядов, когда колебания о тенденции обычно распределяются . Тем не менее, нормальное распределение не дает высокой вероятности очень больших отклонений от тенденции, которая объясняет, почему такие отклонения будут иметь непропорционально большое влияние на оценку тенденции. Можно показать, что, если вместо этого предполагается, что колебания распределены Лаплас , то перемещение медиана статистически оптимально. [ 11 ] Для данной дисперсии распределение Лапласа приводит к более высокой вероятности на редких событиях, чем нормальное, что объясняет, почему движущаяся медиана переносит шоки лучше, чем среднее движение.

Когда простая медиана выше является центральной, сглаживание идентична срединному фильтру , в котором есть приложения, например, обработка сигнала изображения. Медиана движения является более надежной альтернативой скользящей средней, когда дело доходит до оценки базовой тенденции во временных рядах. В то время как скользящая средняя является оптимальной для восстановления тенденции, если колебания вокруг этой тенденции обычно распределены, она подвержена воздействию редких событий, таких как быстрые шоки или аномалии. Напротив, движущаяся медиана, которая обнаруживается путем сортировки значений внутри временного окна и поиска значения в середине, более устойчива к влиянию таких редких событий. Это связано с тем, что для данной дисперсии распределение Лапласа, которое предполагает движущаяся медиана, ставит более высокую вероятность редких событий, чем нормальное распределение, которое предполагает скользящая средняя. В результате, перемещающаяся медиана обеспечивает более надежную и стабильную оценку основной тенденции, даже когда временные ряды влияют большие отклонения от этой тенденции. Кроме того, среднее сглаживание движения идентична срединному фильтру, который имеет различные применения в обработке сигнала изображения.

Модель регрессии скользящего среднего

[ редактировать ]

В модели регрессии скользящей средней предполагается, что интересующей переменной является взвешенное скользящее среднее небрежных терминов самостоятельной ошибки; Веса в скользящей средней представляют собой параметры, которые должны быть оценены.

Эти две концепции часто сбиваются с толку из -за их имени, но хотя они имеют много сходств, они представляют собой различные методы и используются в очень разных контекстах.

Смотрите также

[ редактировать ]
  1. ^ Гидрологическая изменчивость поймы реки Космондес (Booth et al., Устье Сан -Франциско и наука о водоснабжении, том 4, выпуск 2, 2006)
  2. ^ Статистический анализ , Ya-lun Chou, Holt International, 1975, ISBN   0-03-089422-0 , раздел 17,9.
  3. ^ Вывод и свойства простого центрального скользящего среднего приведены полностью в фильтре Савицки -Голая .
  4. ^ «Уверяющие скользящие средние: основы» . Инвесопедия.
  5. ^ «Работа с шумом измерения - в среднем фильтр» . Архивировано из оригинала 2010-03-29 . Получено 2010-10-26 .
  6. ^ NIST/SEMATECH E-Handbook статистических методов: единое экспоненциальное сглаживание в Национальном институте стандартов и технологий
  7. ^ Среднее скользящее среднее Спенсер-от Wolfram Mathworld
  8. ^ Роб Дж Хиндман. « Средние скольжения ». 2009-11-08. Доступ 2020-08-20.
  9. ^ Aditya Guntuboyina. « Статистика 153 (временные ряды): лекция третья ». 2012-01-24. Доступ 2024-01-07.
  10. ^ «Эффективная медиана с использованием индексабируемого Skiplist« рецепты Python «ActiveState Code» .
  11. ^ Гр Арсе, «Нелинейная обработка сигналов: статистический подход», Wiley: Нью -Джерси, США, 2005.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 1285953088b671c6411949f3b52881fb__1726751160
URL1:https://arc.ask3.ru/arc/aa/12/fb/1285953088b671c6411949f3b52881fb.html
Заголовок, (Title) документа по адресу, URL1:
Moving average - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)