Средняя абсолютная масштабированная ошибка
В статистике средняя абсолютная масштабированная ошибка ( MASE является мерой точности прогнозов ) . Это средняя абсолютная ошибка прогнозных значений, деленная на среднюю абсолютную ошибку одношагового наивного прогноза в выборке. Он был предложен в 2005 году статистиком Робом Дж. Хайндманом и профессором наук о принятии решений Энн Б. Келер, которые описали его как «общеприменимый метод измерения точности прогноза без проблем, наблюдаемых при других измерениях». [ 1 ] Средняя абсолютная масштабированная ошибка имеет выгодные свойства по сравнению с другими методами расчета ошибок прогноза , такими как среднеквадратичное отклонение , и поэтому рекомендуется для определения сравнительной точности прогнозов. [ 2 ]
Обоснование
[ редактировать ]Средняя абсолютная масштабированная ошибка имеет следующие желательные свойства: [ 3 ]
- Масштабная инвариантность : средняя абсолютная масштабированная ошибка не зависит от масштаба данных, поэтому ее можно использовать для сравнения прогнозов по наборам данных в разных масштабах.
- Предсказуемое поведение, как : Показатели процентной точности прогноза, такие как средняя абсолютная процентная ошибка (MAPE), основаны на разделении , искажая распределение MAPE для значений близкое или равное 0. Это особенно проблематично для наборов данных, шкалы которых не имеют значимого 0, например, температура в градусах Цельсия или Фаренгейта, а также для наборов данных о непостоянном спросе, где встречается часто.
- Симметрия: средняя абсолютная масштабированная ошибка в равной степени наказывает как положительные, так и отрицательные ошибки прогноза, а также одинаково наказывает ошибки в больших и малых прогнозах. Напротив, MAPE и медианная абсолютная процентная ошибка (MdAPE) не соответствуют обоим этим критериям, тогда как «симметричные» sMAPE и sMdAPE [ 4 ] не соответствует второму критерию.
- Интерпретируемость: среднюю абсолютную масштабированную ошибку можно легко интерпретировать, поскольку значения, превышающие единицу, указывают на то, что одношаговые прогнозы в выборке, полученные с помощью наивного метода, работают лучше, чем рассматриваемые значения прогноза.
- Асимптотическая нормальность MASE: тест Дибольда-Мариано для одношаговых прогнозов используется для проверки статистической значимости разницы между двумя наборами прогнозов. [ 5 ] [ 6 ] [ 7 ] Для проверки гипотезы с помощью статистики теста Дибольда-Мариано желательно: , где — значение тестовой статистики. Эмпирически было показано, что статистика DM для MASE аппроксимирует это распределение, в то время как средняя относительная абсолютная ошибка (MRAE), MAPE и sMAPE - нет. [ 2 ]
Несезонный временной ряд
[ редактировать ]Для несезонного временного ряда: [ 8 ] средняя абсолютная масштабированная ошибка оценивается как
где числитель e j — ошибка прогноза для данного периода (где J — количество прогнозов), определяемая как фактическое значение ( Y j ) минус значение прогноза ( F j ) для этого периода: e j = Y j − F j , а знаменатель представляет собой среднюю абсолютную ошибку одношагового « метода наивного прогнозирования » на обучающем наборе (здесь определяемого как t = 1..T ), [ 8 ] который использует фактическое значение предыдущего периода в качестве прогноза: F t = Y t −1 [ 9 ]
Сезонный временной ряд
[ редактировать ]Для сезонного временного ряда средняя абсолютная масштабированная ошибка оценивается аналогично методу для несезонных временных рядов:
Основное отличие от метода для несезонных временных рядов заключается в том, что знаменатель представляет собой среднюю абсолютную ошибку одношагового « метода сезонного наивного прогнозирования » на обучающем наборе. [ 8 ] который использует фактическое значение предыдущего сезона в качестве прогноза: F t = Y t −m , [ 9 ] где m – сезонный период.
Эта немасштабируемая метрика ошибок «может использоваться для сравнения методов прогнозирования в одной серии, а также для сравнения точности прогнозов между сериями. Эта метрика хорошо подходит для серий с непостоянным спросом (набор данных, содержащий большое количество нулей), поскольку она никогда не дает бесконечных или неопределенных значений [ 1 ] за исключением несущественного случая, когда все исторические данные равны. [ 3 ]
При сравнении методов прогнозирования предпочтительным является метод с наименьшим значением MASE.
Данные вне временных рядов
[ редактировать ]Для данных, не являющихся временными рядами, среднее значение данных ( ) можно использовать в качестве «базового» прогноза. [ 10 ]
В этом случае MASE — это средняя абсолютная ошибка, деленная на среднее абсолютное отклонение .
См. также
[ редактировать ]- Среднеквадратическая ошибка
- Средняя абсолютная ошибка
- Средняя абсолютная процентная ошибка
- Среднеквадратичное отклонение
- Тестовый набор
- Доля дисперсии необъяснима
Ссылки
[ редактировать ]- ^ Jump up to: а б Гайндман, Р.Дж. (2006). «Другой взгляд на показатели точности прогнозов», FORESIGHT, выпуск 4, июнь 2006 г., стр. 46 [1]
- ^ Jump up to: а б Франсес, Филип Ганс (01 января 2016 г.). «Примечание о средней абсолютной масштабированной ошибке» . Международный журнал прогнозирования . 32 (1): 20–22. doi : 10.1016/j.ijforecast.2015.03.008 . hdl : 1765/78815 .
- ^ Jump up to: а б с Гайндман, Р.Дж. и Келер А.Б. (2006). «Еще один взгляд на показатели точности прогнозов». Международный журнал прогнозирования, том 22, выпуск 4, страницы 679–688. doi : 10.1016/j.ijforecast.2006.03.001
- ^ Макридакис, Спирос (1 декабря 1993 г.). «Меры точности: теоретические и практические проблемы». Международный журнал прогнозирования . 9 (4): 527–529. дои : 10.1016/0169-2070(93)90079-3 . S2CID 153403127 .
- ^ Диболд, Фрэнсис X.; Мариано, Роберто С. (1995). «Сравнение точности прогнозирования». Журнал деловой и экономической статистики . 13 (3): 253–263. дои : 10.1080/07350015.1995.10524599 .
- ^ Диболд, Фрэнсис X.; Мариано, Роберто С. (2002). «Сравнение точности прогнозирования» (PDF) . Журнал деловой и экономической статистики . 20 (1): 134–144. дои : 10.1198/073500102753410444 . S2CID 12090811 .
- ^ Диболд, Фрэнсис X. (2015). «Сравнение точности прогнозирования, двадцать лет спустя: личный взгляд на использование и злоупотребление тестами Диболда – Мариано» (PDF) . Журнал деловой и экономической статистики . 33 (1): 1. дои : 10.1080/07350015.2014.983236 .
- ^ Jump up to: а б с д «2.5 Оценка точности прогноза | OTexts» . www.otexts.org . Проверено 15 мая 2016 г.
- ^ Jump up to: а б Гайндман, Роб и др., Прогнозирование с экспоненциальным сглаживанием: подход к пространству состояний , Берлин: Springer-Verlag, 2008. ISBN 978-3-540-71916-8 .
- ^ Гайндман, Роб. «Альтернатива MAPE, когда данные не являются временными рядами» . Крест проверен . Проверено 11 октября 2022 г.