Среднеквадратичное отклонение
Статистика |
---|
Среднеквадратичное отклонение ( RMSD ) или среднеквадратическая ошибка ( RMSE ) — это либо одна из двух тесно связанных и часто используемых мер различий между истинными или прогнозируемыми значениями, с одной стороны, и наблюдаемыми значениями или оценкой , с другой.
СКО выборки [ править ]
СКО выборки представляет собой среднее квадратическое разностей между наблюдаемыми значениями и прогнозируемыми. Эти отклонения называются остатками , когда вычисления выполняются над выборкой данных, которая использовалась для оценки (и, следовательно, всегда относятся к оценке), и называются ошибками (или ошибками прогнозирования), когда вычисляются вне выборки (т. полный набор, ссылаясь на истинное значение, а не на оценку). RMSD служит для агрегирования величин ошибок прогнозов для различных точек данных в единую меру прогнозирующей способности. RMSD — это мера точности , позволяющая сравнивать ошибки прогнозирования различных моделей для конкретного набора данных, а не между наборами данных, поскольку она зависит от масштаба. [1]
СКО всегда неотрицательно, а значение 0 (практически никогда не достигаемое на практике) указывает на идеальное соответствие данным. В общем, более низкое RMSD лучше, чем более высокое. Однако сравнения различных типов данных будут недействительными, поскольку мера зависит от масштаба используемых чисел.
RMSD — это квадратный корень из среднего квадрата ошибок. Влияние каждой ошибки на RMSD пропорционально размеру квадрата ошибки; таким образом, более крупные ошибки оказывают непропорционально большое влияние на RMSD. Следовательно, RMSD чувствителен к выбросам . [2] [3]
Формулы [ править ]
Оценщик [ править ]
СКО оценщика по оцениваемому параметру определяется как квадратный корень среднеквадратической ошибки :
Для несмещенной оценки среднеквадратичное отклонение представляет собой квадратный корень дисперсии , известный как стандартное отклонение .
Образцы [ править ]
Если X 1 , ..., X n является выборкой совокупности с истинным средним значением , то среднеквадратическое отклонение выборки равно
- .
СКО прогнозируемых значений для времени t зависимой регрессии переменной с переменными, наблюдаемыми в течение T раз, вычисляется для T различных прогнозов как квадратный корень из среднего значения квадратов отклонений:
(Для регрессий на данных поперечного сечения индекс t заменяется на i, а T заменяется на n .)
В некоторых дисциплинах RMSD используется для сравнения различий между двумя вещами, которые могут различаться, ни одна из которых не принимается в качестве «стандарта». Например, при измерении средней разницы между двумя временными рядами и ,формула становится
Нормализация [ править ]
Нормализация RMSD облегчает сравнение наборов данных или моделей разных масштабов. Хотя в литературе нет последовательных способов нормализации, обычно выбирают среднее значение или диапазон (определяемый как максимальное значение минус минимальное значение) измеренных данных: [4]
- или .
Это значение обычно называют нормализованным среднеквадратическим отклонением или ошибкой (NRMSD или NRMSE) и часто выражают в процентах, где более низкие значения указывают на меньшую остаточную дисперсию. Это также называется коэффициентом вариации или процентом RMS . Во многих случаях, особенно для небольших выборок, диапазон выборки, вероятно, будет зависеть от размера выборки, что затруднит сравнения.
Другой возможный способ сделать СКО более полезным показателем сравнения — разделить СКО на межквартильный размах (IQR). При делении RMSD на IQR нормализованное значение становится менее чувствительным к экстремальным значениям целевой переменной.
- где
с и где CDF −1 — функция квантиля .
При нормализации по среднему значению измерений термин коэффициент вариации СКО, CV(RMSD) . во избежание двусмысленности можно использовать [5] Это аналогично коэффициенту вариации , в котором RMSD заменяет стандартное отклонение .
Средняя абсолютная ошибка [ править ]
Некоторые исследователи [ ВОЗ? ] рекомендовали [ где? ] использование средней абсолютной ошибки (MAE) вместо среднеквадратического отклонения. MAE обладает преимуществами в интерпретируемости перед RMSD. MAE – среднее абсолютных значений ошибок. MAE принципиально легче понять, чем квадратный корень из среднего квадрата ошибок. Более того, каждая ошибка влияет на MAE прямо пропорционально абсолютному значению ошибки, чего нельзя сказать о RMSD. [2]
Приложения [ править ]
- В метеорологии — чтобы увидеть, насколько эффективно математическая модель предсказывает поведение атмосферы .
- В биоинформатике среднеквадратичное отклонение положений атомов является мерой среднего расстояния между атомами наложенных друг на друга белков .
- При разработке лекарств на основе структуры RMSD является мерой разницы между кристаллической конформацией конформации лиганда и предсказанием стыковки .
- В экономике RMSD используется для определения того, соответствует ли экономическая модель экономическим показателям . Некоторые эксперты утверждают, что RMSD менее надежен, чем относительная абсолютная ошибка. [6]
- В экспериментальной психологии RMSD используется для оценки того, насколько хорошо математические или вычислительные модели поведения объясняют эмпирически наблюдаемое поведение.
- В ГИС RMSD является одной из мер, используемых для оценки точности пространственного анализа и дистанционного зондирования.
- В гидрогеологии RMSD и NRMSD используются для оценки калибровки модели подземных вод. [7]
- В области визуализации RMSD является частью пикового отношения сигнал/шум , меры, используемой для оценки того, насколько хорошо работает метод восстановления изображения по сравнению с исходным изображением.
- В вычислительной нейробиологии RMSD используется для оценки того, насколько хорошо система изучает данную модель. [8]
- В спектроскопии ядерного магнитного резонанса белков RMSD используется как мера оценки качества полученного пучка структур.
- Заявки на премию Netflix оценивались с использованием RMSD на основе нераскрытых «истинных» значений набора тестовых данных.
- При моделировании энергопотребления зданий RMSE и CV(RMSE) используются для калибровки моделей для измерения характеристик зданий . [9]
- В рентгеновской кристаллографии RMSD (и RMSZ) используется для измерения отклонения внутренних координат молекул от значений библиотеки ограничений.
- В теории управления RMSE используется как мера качества для оценки эффективности работы государственного наблюдателя . [10]
- В гидродинамике нормализованное среднеквадратичное отклонение (NRMSD), коэффициент вариации (CV) и процентное среднеквадратичное значение используются для количественной оценки однородности поведения потока, такой как профиль скорости, распределение температуры или концентрация газовых частиц. Значение сравнивается с отраслевыми стандартами для оптимизации конструкции потокового и термического оборудования и процессов.
См. также [ править ]
- Среднеквадратичное значение
- Средняя абсолютная ошибка
- Среднее абсолютное отклонение
- Среднее знаковое отклонение
- Среднеквадратичное отклонение
- Квадратные отклонения
- Ошибки и остатки в статистике
- Коэффициент вариации
Ссылки [ править ]
- ^ Гайндман, Роб Дж.; Келер, Энн Б. (2006). «Еще один взгляд на показатели точности прогнозов». Международный журнал прогнозирования . 22 (4): 679–688. CiteSeerX 10.1.1.154.9771 . doi : 10.1016/j.ijforecast.2006.03.001 . S2CID 15947215 .
- ^ Jump up to: Перейти обратно: а б Понтиус, Роберт; Тонттех, Олуфунмилайо; Чен, Хао (2008). «Компоненты информации для сравнения нескольких разрешений между картами, имеющими общую реальную переменную» (PDF) . Экологическая статистика . 15 (2): 111–142. Бибкод : 2008EnvES..15..111P . дои : 10.1007/s10651-007-0043-y . S2CID 21427573 .
- ^ Уиллмотт, Корт; Мацуура, Кендзи (2006). «Об использовании размерных мер погрешности для оценки эффективности пространственных интерполяторов». Международный журнал географической информатики . 20 (1): 89–102. Бибкод : 2006IJGIS..20...89W . дои : 10.1080/13658810500286976 . S2CID 15407960 .
- ^ «Программа исследования прибрежных заливов (CIRP) Wiki — Статистика» . Проверено 4 февраля 2015 г.
- ^ «Часто задаваемые вопросы: Что такое коэффициент вариации?» . Проверено 19 февраля 2019 г.
- ^ Армстронг, Дж. Скотт; Коллопи, Фред (1992). «Меры ошибок для обобщения методов прогнозирования: эмпирические сравнения» (PDF) . Международный журнал прогнозирования . 8 (1): 69–80. CiteSeerX 10.1.1.423.508 . дои : 10.1016/0169-2070(92)90008-w . S2CID 11034360 .
- ^ Андерсон, член парламента; Весснер, WW (1992). Прикладное моделирование подземных вод: моделирование потока и адвективного переноса (2-е изд.). Академическая пресса.
- ^ Ансамблевая модель нейронной сети
- ^ ANSI / BPI-2400-S-2012: Стандартная практика стандартизированной квалификации прогнозов энергосбережения во всем доме путем калибровки по истории использования энергии
- ^ https://kalman-filter.com/root-mean-square-error