Среднеквадратичное отклонение

Из Википедии, бесплатной энциклопедии

Среднеквадратичное отклонение ( RMSD ) или среднеквадратическая ошибка ( RMSE ) — это либо одна из двух тесно связанных и часто используемых мер различий между истинными или прогнозируемыми значениями, с одной стороны, и наблюдаемыми значениями или оценкой, с другой.

СКО выборки [ править ]

СКО выборки представляет собой среднее квадратическое разностей между наблюдаемыми значениями и прогнозируемыми. Эти отклонения называются остатками, когда вычисления выполняются над выборкой данных, которая использовалась для оценки (и, следовательно, всегда относятся к оценке), и называются ошибками (или ошибками прогнозирования), когда вычисляются вне выборки (т. полный набор, ссылаясь на истинное значение, а не на оценку). RMSD служит для агрегирования величин ошибок прогнозов для различных точек данных в единую меру прогнозирующей способности. RMSD — это мера точности , позволяющая сравнивать ошибки прогнозирования различных моделей для конкретного набора данных, а не между наборами данных, поскольку она зависит от масштаба. [1]

СКО всегда неотрицательно, а значение 0 (почти никогда не достигаемое на практике) будет указывать на идеальное соответствие данным. В общем, более низкое RMSD лучше, чем более высокое. Однако сравнения различных типов данных будут недействительными, поскольку мера зависит от масштаба используемых чисел.

RMSD — это квадратный корень из среднего квадрата ошибок. Влияние каждой ошибки на RMSD пропорционально размеру квадрата ошибки; таким образом, более крупные ошибки оказывают непропорционально большое влияние на RMSD. Следовательно, RMSD чувствителен к выбросам . [2] [3]

Formulas[editФормулы

Оценщик [ править ]

СКО оценщика по оцениваемому параметру определяется как квадратный корень среднеквадратической ошибки :

Для несмещенной оценки среднеквадратичное отклонение представляет собой квадратный корень дисперсии , известный как стандартное отклонение .

Образцы [ править ]

Если X 1 , ..., X n является выборкой совокупности с истинным средним значением , то среднеквадратическое отклонение выборки равно

.

СКО прогнозируемых значений для времени t регрессии зависимой переменной с переменными, наблюдаемыми в течение T раз, вычисляется для T различных прогнозов как квадратный корень из среднего значения квадратов отклонений:

(Для регрессий по данным поперечного сечения индекс t заменяется на i , а T заменяется на n .)

В некоторых дисциплинах RMSD используется для сравнения различий между двумя вещами, которые могут различаться, ни одна из которых не принимается в качестве «стандарта». Например, при измерении средней разницы между двумя временными рядами и , формула становится

Нормализация [ править ]

Нормализация RMSD облегчает сравнение наборов данных или моделей разных масштабов. Хотя в литературе нет последовательных способов нормализации, обычно выбирают среднее значение или диапазон (определяемый как максимальное значение минус минимальное значение) измеренных данных: [4]

или .

Это значение обычно называют нормализованным среднеквадратическим отклонением или ошибкой (NRMSD или NRMSE) и часто выражают в процентах, где более низкие значения указывают на меньшую остаточную дисперсию. Это также называется коэффициентом вариации или процентом RMS . Во многих случаях, особенно для небольших выборок, диапазон выборки, вероятно, будет зависеть от размера выборки, что затруднит сравнения.

Другой возможный метод сделать RMSD более полезным показателем сравнения — разделить RMSD на межквартильный размах (IQR). При делении RMSD на IQR нормализованное значение становится менее чувствительным к экстремальным значениям целевой переменной.

где

с и где CDF −1 функция квантиля .

При нормализации по среднему значению измерений термин коэффициент вариации СКО, CV(RMSD) . во избежание двусмысленности можно использовать [5] Это аналогично коэффициенту вариации, в котором RMSD заменяет стандартное отклонение .

Средняя абсолютная ошибка [ править ]

Некоторые исследователи [ ВОЗ? ] рекомендовали [ где? ] использование средней абсолютной ошибки (MAE) вместо среднеквадратического отклонения. MAE обладает преимуществами в интерпретируемости по сравнению с RMSD. MAE — среднее абсолютных значений ошибок. MAE принципиально легче понять, чем квадратный корень из среднего квадрата ошибок. Более того, каждая ошибка влияет на MAE прямо пропорционально абсолютному значению ошибки, чего нельзя сказать о RMSD. [2]

Приложения [ править ]

См. также [ править ]

Ссылки [ править ]

  1. ^ Гайндман, Роб Дж.; Келер, Энн Б. (2006). «Еще один взгляд на показатели точности прогнозов». Международный журнал прогнозирования . 22 (4): 679–688. CiteSeerX   10.1.1.154.9771 . doi : 10.1016/j.ijforecast.2006.03.001 . S2CID   15947215 .
  2. ^ Перейти обратно: а б Понтиус, Роберт; Тонттех, Олуфунмилайо; Чен, Хао (2008). «Компоненты информации для сравнения нескольких разрешений между картами, имеющими общую реальную переменную» (PDF) . Экологическая статистика . 15 (2): 111–142. Бибкод : 2008EnvES..15..111P . дои : 10.1007/s10651-007-0043-y . S2CID   21427573 .
  3. ^ Уиллмотт, Корт; Мацуура, Кендзи (2006). «Об использовании размерных мер погрешности для оценки эффективности пространственных интерполяторов». Международный журнал географической информатики . 20 (1): 89–102. Бибкод : 2006IJGIS..20...89W . дои : 10.1080/13658810500286976 . S2CID   15407960 .
  4. ^ «Программа исследования прибрежных заливов (CIRP) Wiki — Статистика» . Проверено 4 февраля 2015 г.
  5. ^ «Часто задаваемые вопросы: Что такое коэффициент вариации?» . Проверено 19 февраля 2019 г.
  6. ^ Армстронг, Дж. Скотт; Коллопи, Фред (1992). «Меры ошибок для обобщения методов прогнозирования: эмпирические сравнения» (PDF) . Международный журнал прогнозирования . 8 (1): 69–80. CiteSeerX   10.1.1.423.508 . дои : 10.1016/0169-2070(92)90008-w . S2CID   11034360 .
  7. ^ Андерсон, член парламента; Весснер, WW (1992). Прикладное моделирование подземных вод: моделирование потока и адвективного переноса (2-е изд.). Академическая пресса.
  8. ^ Ансамблевая модель нейронной сети
  9. ^ ANSI / BPI-2400-S-2012: Стандартная практика стандартизированной квалификации прогнозов энергосбережения во всем доме путем калибровки по истории использования энергии
  10. ^ https://kalman-filter.com/root-mean-square-error