Средняя абсолютная ошибка
В статистике между парными наблюдениями , средняя абсолютная ошибка ( MAE ) — это мера ошибок выражающими одно и то же явление. Примеры Y и X включают сравнение прогнозируемого и наблюдаемого, последующего времени и начального времени, а также сравнения одного метода измерения с альтернативным методом измерения. MAE рассчитывается как сумма абсолютных ошибок (т. е. Манхэттенского расстояния ), деленная на размер выборки : [1] Таким образом, это среднее арифметическое абсолютных ошибок. , где это предсказание и истинная ценность. Альтернативные формулировки могут включать относительные частоты в качестве весовых коэффициентов. Средняя абсолютная ошибка использует тот же масштаб, что и измеряемые данные. Это известно как мера точности, зависящая от масштаба, и поэтому ее нельзя использовать для сравнения прогнозируемых значений, использующих разные масштабы. [2] Средняя абсолютная ошибка — это распространенная мера ошибки прогноза при анализе временных рядов . [3] иногда используется в путанице с более стандартным определением среднего абсолютного отклонения . Такая же путаница существует и в более широком смысле.
Разногласия по количеству и разногласия по распределению
[ редактировать ]В дистанционном зондировании MAE иногда выражается как сумма двух компонентов: несогласия по количеству и несогласия по распределению. Количественное расхождение представляет собой абсолютное значение средней ошибки: [4] Разногласия в распределении — это MAE минус разногласия по количеству.
Также можно определить типы различий, взглянув на сюжет. Количественная разница существует, когда среднее значение X не равно среднему значению Y. Разница в распределении существует тогда и только тогда, когда точки находятся по обе стороны от идентификационной линии. [4] [5]
Сопутствующие меры
[ редактировать ]Средняя абсолютная ошибка — это один из многих способов сравнения прогнозов с их конечными результатами. Хорошо зарекомендовавшими себя альтернативами являются средняя абсолютная масштабированная ошибка (MASE), средняя абсолютная логарифмическая ошибка (MALE) и среднеквадратическая ошибка . Все они суммируют результаты таким образом, чтобы не принимать во внимание направления завышения или занижения прогнозов; мерой, которая действительно уделяет этому внимание, является средняя знаковая разность .
Если модель прогнозирования должна быть подобрана с использованием выбранной меры производительности, в том смысле, что метод наименьших квадратов связан со среднеквадратичной ошибкой , эквивалентом средней абсолютной ошибки являются наименьшие абсолютные отклонения .
MAE не идентично среднеквадратичной ошибке (RMSE), хотя некоторые исследователи сообщают и интерпретируют ее именно так. MAE концептуально проще и его легче интерпретировать, чем RMSE: это просто среднее абсолютное расстояние по вертикали или горизонтали между каждой точкой диаграммы рассеяния и линией Y=X. Другими словами, MAE — это средняя абсолютная разница между X и Y. Более того, каждая ошибка вносит свой вклад в MAE пропорционально абсолютному значению ошибки. В этом отличие от RMSE, который предполагает возведение разностей в квадрат, так что несколько больших различий увеличивают RMSE в большей степени, чем MAE. [4]
Свойство оптимальности
[ редактировать ]Средняя абсолютная ошибка действительной переменной c по отношению к случайной величине X равна , что распределение вероятностей X таково, что вышеуказанное ожидание существует, тогда m является медианой X При условии тогда и только тогда, когда m является минимизатором средней абсолютной ошибки по отношению к X . [6] В частности, m является выборочной медианой тогда и только тогда, когда m минимизирует среднее арифметическое абсолютных отклонений. [7]
В более общем смысле медиана определяется как минимум как обсуждалось в разделе «Многомерная медиана» (и, в частности, в разделе «Пространственная медиана» ). Это основанное на оптимизации определение медианы полезно при статистическом анализе данных, например, при k кластеризации -медиан .
Доказательство оптимальности
[ редактировать ]Утверждение: классификатор, минимизирующий является .
Доказательство:
Функции потерь для классификации : отношению к дает Дифференциация по Это означает Следовательно,
См. также
[ редактировать ]- Наименьшие абсолютные отклонения
- Расстояние Манхэттен
- Средняя абсолютная процентная ошибка
- Средняя процентная ошибка
- Симметричная средняя абсолютная процентная ошибка
Ссылки
[ редактировать ]- ^ Уиллмотт, Корт Дж.; Мацуура, Кендзи (19 декабря 2005 г.). «Преимущества средней абсолютной ошибки (MAE) перед среднеквадратичной ошибкой (RMSE) при оценке средней производительности модели» . Климатические исследования . 30 : 79–82. дои : 10.3354/cr030079 .
- ^ «2.5 Оценка точности прогноза | OTexts» . www.otexts.org . Проверено 18 мая 2016 г.
- ^ Гайндман Р. и Келер А. (2005). «Другой взгляд на показатели точности прогнозов» [1]
- ^ Перейти обратно: а б с Понтиус-младший, Роберт Гилмор; Тонттех, Олуфунмилайо; Чен, Хао (2008). «Компоненты информации для сравнения нескольких разрешений между картами, имеющими общую реальную переменную» (PDF) . Экологическая и экологическая статистика . 15 (2): 111–142. дои : 10.1007/s10651-007-0043-y . S2CID 21427573 .
- ^ Уиллмотт, CJ; Мацуура, К. (январь 2006 г.). «Об использовании размерных мер погрешности для оценки эффективности пространственных интерполяторов». Международный журнал географической информатики . 20 : 89–102. дои : 10.1080/13658810500286976 . S2CID 15407960 .
- ^ Строк, Дэниел (2011). Теория вероятностей . Издательство Кембриджского университета. стр. 43 . ISBN 978-0-521-13250-3 .
- ^ ДеГрут, Моррис Х. (1970). Оптимальные статистические решения . McGraw-Hill Book Co., Нью-Йорк-Лондон-Сидней. п. 232. ИСБН 9780471680291 . МР 0356303 .