Jump to content

Среднеквадратичное отклонение

(Перенаправлено с RMSE )

Среднеквадратичное отклонение ( RMSD ) или среднеквадратическая ошибка ( RMSE ) — это либо одна из двух тесно связанных и часто используемых мер различий между истинными или прогнозируемыми значениями, с одной стороны, и наблюдаемыми значениями или оценкой , с другой.

СКО выборки

[ редактировать ]

СКО выборки представляет собой среднее квадратическое разностей между наблюдаемыми значениями и прогнозируемыми. Эти отклонения называются остатками , когда вычисления выполняются над выборкой данных, которая использовалась для оценки (и, следовательно, всегда относятся к оценке), и называются ошибками (или ошибками прогнозирования), когда вычисляются вне выборки (т. полный набор, ссылаясь на истинное значение, а не на оценку). RMSD служит для агрегирования величин ошибок прогнозов для различных точек данных в единую меру прогнозирующей способности. RMSD — это мера точности , позволяющая сравнивать ошибки прогнозирования различных моделей для конкретного набора данных, а не между наборами данных, поскольку она зависит от масштаба. [1]

СКО всегда неотрицательно, а значение 0 (практически никогда не достигаемое на практике) указывает на идеальное соответствие данным. В общем, более низкое RMSD лучше, чем более высокое. Однако сравнения различных типов данных будут недействительными, поскольку мера зависит от масштаба используемых чисел.

RMSD — это квадратный корень из среднего квадрата ошибок. Влияние каждой ошибки на RMSD пропорционально размеру квадрата ошибки; таким образом, более крупные ошибки оказывают непропорционально большое влияние на RMSD. Следовательно, RMSD чувствителен к выбросам . [2] [3]

СКО оценщика по оцениваемому параметру определяется как квадратный корень среднеквадратической ошибки :

Для несмещенной оценки среднеквадратичное отклонение представляет собой квадратный корень дисперсии , известный как стандартное отклонение .

Если X 1 , ..., X n является выборкой совокупности с истинным средним значением , то среднеквадратическое отклонение выборки равно

.

СКО прогнозируемых значений для времени t зависимой регрессии переменной с переменными, наблюдаемыми в течение T раз, вычисляется для T различных прогнозов как квадратный корень из среднего значения квадратов отклонений:

(Для регрессий по данным поперечного сечения индекс t заменяется на i, а T заменяется на n .)

В некоторых дисциплинах RMSD используется для сравнения различий между двумя вещами, которые могут различаться, ни одна из которых не принимается в качестве «стандарта». Например, при измерении средней разницы между двумя временными рядами и ,формула становится

Нормализация

[ редактировать ]

Нормализация RMSD облегчает сравнение наборов данных или моделей разных масштабов. Хотя в литературе нет последовательных способов нормализации, обычно выбирают среднее значение или диапазон (определяемый как максимальное значение минус минимальное значение) измеренных данных: [4]

или .

Это значение обычно называют нормализованным среднеквадратическим отклонением или ошибкой (NRMSD или NRMSE) и часто выражают в процентах, где более низкие значения указывают на меньшую остаточную дисперсию. Это также называется коэффициентом вариации или процентом RMS . Во многих случаях, особенно для небольших выборок, диапазон выборки, вероятно, будет зависеть от размера выборки, что затруднит сравнения.

Другой возможный метод сделать RMSD более полезным показателем сравнения — разделить RMSD на межквартильный размах (IQR). При делении RMSD на IQR нормализованное значение становится менее чувствительным к экстремальным значениям целевой переменной.

где

с и где CDF −1 функция квантиля .

При нормализации по среднему значению измерений термин коэффициент вариации СКО, CV(RMSD) . во избежание двусмысленности можно использовать [5] Это аналогично коэффициенту вариации , в котором RMSD заменяет стандартное отклонение .

Средняя абсолютная ошибка

[ редактировать ]

Некоторые исследователи [ ВОЗ? ] рекомендовали [ где? ] использование средней абсолютной ошибки (MAE) вместо среднеквадратического отклонения. MAE обладает преимуществами в интерпретируемости перед RMSD. MAE — среднее абсолютных значений ошибок. MAE принципиально легче понять, чем квадратный корень из среднего квадрата ошибок. Более того, каждая ошибка влияет на MAE прямо пропорционально абсолютному значению ошибки, чего нельзя сказать о RMSD. [2]

Приложения

[ редактировать ]

См. также

[ редактировать ]
  1. ^ Гайндман, Роб Дж.; Келер, Энн Б. (2006). «Еще один взгляд на показатели точности прогнозов». Международный журнал прогнозирования . 22 (4): 679–688. CiteSeerX   10.1.1.154.9771 . doi : 10.1016/j.ijforecast.2006.03.001 . S2CID   15947215 .
  2. ^ Jump up to: а б Понтиус, Роберт; Тонттех, Олуфунмилайо; Чен, Хао (2008). «Компоненты информации для сравнения нескольких разрешений между картами, имеющими общую реальную переменную» (PDF) . Экологическая статистика . 15 (2): 111–142. Бибкод : 2008EnvES..15..111P . дои : 10.1007/s10651-007-0043-y . S2CID   21427573 .
  3. ^ Уиллмотт, Корт; Мацуура, Кендзи (2006). «Об использовании размерных мер погрешности для оценки эффективности пространственных интерполяторов». Международный журнал географической информатики . 20 (1): 89–102. Бибкод : 2006IJGIS..20...89W . дои : 10.1080/13658810500286976 . S2CID   15407960 .
  4. ^ «Программа исследования прибрежных заливов (CIRP) Wiki — Статистика» . Проверено 4 февраля 2015 г.
  5. ^ «Часто задаваемые вопросы: Что такое коэффициент вариации?» . Проверено 19 февраля 2019 г.
  6. ^ Армстронг, Дж. Скотт; Коллопи, Фред (1992). «Меры ошибок для обобщения методов прогнозирования: эмпирические сравнения» (PDF) . Международный журнал прогнозирования . 8 (1): 69–80. CiteSeerX   10.1.1.423.508 . дои : 10.1016/0169-2070(92)90008-w . S2CID   11034360 .
  7. ^ Андерсон, член парламента; Весснер, WW (1992). Прикладное моделирование подземных вод: моделирование потока и адвективного переноса (2-е изд.). Академическая пресса.
  8. ^ Ансамблевая модель нейронной сети
  9. ^ ANSI / BPI-2400-S-2012: Стандартная практика стандартизированной квалификации прогнозов энергосбережения во всем доме путем калибровки по истории использования энергии
  10. ^ https://kalman-filter.com/root-mean-square-error
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: d6ff1e51b107a01f9005e50cdec934a6__1714751280
URL1:https://arc.ask3.ru/arc/aa/d6/a6/d6ff1e51b107a01f9005e50cdec934a6.html
Заголовок, (Title) документа по адресу, URL1:
Root mean square deviation - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)