Среднее абсолютное отклонение
Среднее абсолютное отклонение AAD ) набора данных — это среднее значение абсолютных . отклонений от центральной точки ( Это сводная статистика статистической дисперсии или изменчивости. В общей форме центральной точкой может быть среднее значение , медиана , мода или результат любой другой меры центральной тенденции или любого эталонного значения, связанного с данным набором данных. AAD включает в себя среднее абсолютное отклонение и медианное абсолютное отклонение (оба обозначаются сокращенно MAD ).
Меры дисперсии
[ редактировать ]Некоторые меры статистической дисперсии определяются с точки зрения абсолютного отклонения.Термин «среднее абсолютное отклонение» не определяет однозначно меру статистической дисперсии , поскольку существует несколько показателей, которые можно использовать для измерения абсолютных отклонений, а также есть несколько показателей центральной тенденции , которые также можно использовать. Таким образом, для однозначной идентификации абсолютного отклонения необходимо указать как меру отклонения, так и меру центральной тенденции. В статистической литературе еще не приняты стандартные обозначения, поскольку как среднее абсолютное отклонение от среднего, так и медианное абсолютное отклонение от медианы обозначаются в литературе инициалами «MAD», что может привести к путанице, поскольку они обычно имеют значения, существенно отличающиеся друг от друга.
Среднее абсолютное отклонение вокруг центральной точки
[ редактировать ]Среднее абсолютное отклонение набора { x 1 , x 2 , ..., x n } равно
Выбор меры центральной тенденции, , оказывает заметное влияние на значение среднего отклонения. Например, для набора данных {2, 2, 3, 4, 14}:
Мера центральной тенденции | Среднее абсолютное отклонение |
---|---|
Среднее арифметическое = 5 | |
Медиана = 3 | |
Режим = 2 |
Среднее абсолютное отклонение от среднего значения
[ редактировать ]Среднее абсолютное отклонение (MAD), также называемое «средним отклонением» или иногда «средним абсолютным отклонением», представляет собой среднее значение абсолютных отклонений данных от среднего значения данных: среднее (абсолютное) расстояние от среднего значения. «Среднее абсолютное отклонение» может относиться либо к этому использованию, либо к общей форме относительно указанной центральной точки (см. Выше).
Было предложено использовать MAD вместо стандартного отклонения, поскольку оно лучше соответствует реальной жизни. [1] Поскольку MAD является более простой мерой изменчивости, чем стандартное отклонение , он может быть полезен в школьном обучении. [2] [3]
Точность прогноза этого метода очень тесно связана с методом среднеквадратичной ошибки (MSE), который представляет собой всего лишь среднеквадратическую ошибку прогнозов. Хотя эти методы очень тесно связаны, MAD используется чаще, поскольку его легче вычислить (избегая необходимости возведения в квадрат). [4] и легче понять. [5]
Для нормального распределения отношение среднего абсолютного отклонения от среднего значения к стандартному отклонению равно . Таким образом, если X является нормально распределенной случайной величиной с ожидаемым значением 0, то см. Geary (1935): [6] Другими словами, для нормального распределения среднее абсолютное отклонение примерно в 0,8 раза превышает стандартное отклонение.Однако измерения внутри выборки дают значения отношения среднего среднего отклонения / стандартного отклонения для данной гауссовой выборки n со следующими границами: , с уклоном на малые n . [7]
Среднее абсолютное отклонение от среднего меньше или равно стандартному отклонению ; один из способов доказать это основан на неравенстве Йенсена .
Неравенство Йенсена , где φ — выпуклая функция, отсюда следует, что что:
Поскольку обе части положительны, а квадратный корень является монотонно возрастающей функцией в положительной области:
Общий случай этого утверждения см. в неравенстве Гёльдера .
Среднее абсолютное отклонение от медианы
[ редактировать ]Медиана — это точка , относительно которой среднее отклонение минимально. Медиана MAD предлагает прямую меру масштаба случайной величины вокруг ее медианы.
Это оценка максимального правдоподобия параметра масштаба. Лапласа распределения .
Поскольку медиана минимизирует среднее абсолютное расстояние, мы имеем .Среднее абсолютное отклонение от медианы меньше или равно среднему абсолютному отклонению от среднего значения. Фактически, среднее абсолютное отклонение от медианы всегда меньше или равно среднему абсолютному отклонению от любого другого фиксированного числа.
Используя общую функцию дисперсии, Хабиб (2011) определил MAD относительно медианы как где индикаторная функция
Это представление позволяет получить медианные коэффициенты корреляции MAD. [ нужна ссылка ]
Медианное абсолютное отклонение вокруг центральной точки
[ редактировать ]Хотя в принципе в качестве центральной точки медианного абсолютного отклонения можно принять среднее значение или любую другую центральную точку, чаще всего медианное вместо этого берется значение.
Медианное абсолютное отклонение вокруг медианы
[ редактировать ]Медианное абсолютное отклонение (также MAD) — это медиана абсолютного отклонения от медианы . Это надежная оценка дисперсии .
Для примера {2, 2, 3, 4, 14}: 3 — это медиана, поэтому абсолютные отклонения от медианы равны {1, 1, 0, 1, 11} (переупорядочены как {0, 1, 1, 1). , 11}) с медианой 1, в данном случае на нее не влияет значение выброса 14, поэтому медианное абсолютное отклонение равно 1.
При симметричном распределении медианное абсолютное отклонение равно половине межквартильного размаха .
Максимальное абсолютное отклонение
[ редактировать ]Максимальное абсолютное отклонение вокруг произвольной точки — это максимальное из абсолютных отклонений выборки от этой точки. Хотя максимальное абсолютное отклонение не является строго мерой центральной тенденции, его можно найти с помощью формулы для среднего абсолютного отклонения, как указано выше: , где это выборочный максимум .
Минимизация
[ редактировать ]Меры статистической дисперсии, полученные на основе абсолютного отклонения, характеризуют различные меры центральной тенденции как минимизирующие дисперсию:Медиана — это мера центральной тенденции, наиболее связанной с абсолютным отклонением. Некоторые параметры местоположения можно сравнить следующим образом:
- л 2 нормальная статистика: среднее значение минимизирует среднеквадратическую ошибку
- л 1 нормальная статистика: медиана минимизирует среднее абсолютное отклонение,
- л ∞ нормальная статистика: средний диапазон минимизирует максимальное абсолютное отклонение
- обрезанный L ∞ нормальная статистика: например, средний шарнир (среднее значение первого и третьего квартилей ), который минимизирует медианное абсолютное отклонение всего распределения, также минимизирует максимальное абсолютное отклонение распределения после того, как верхние и нижние 25% были обрезаны.
Оценка
[ редактировать ]Этот раздел нуждается в расширении . Вы можете помочь, добавив к нему . ( март 2009 г. ) |
Среднее абсолютное отклонение выборки представляет собой смещенную оценку среднего абсолютного отклонения генеральной совокупности.Чтобы абсолютное отклонение было несмещенной оценкой, ожидаемое значение (среднее) всех абсолютных отклонений выборки должно равняться абсолютному отклонению генеральной совокупности. Однако это не так. Для популяции 1,2,3 как абсолютное отклонение популяции от медианы, так и абсолютное отклонение популяции от среднего значения составляют 2/3. Среднее значение всех абсолютных отклонений выборки от среднего размера 3, которое можно получить из генеральной совокупности, составляет 44/81, тогда как среднее значение всех абсолютных отклонений выборки от медианы составляет 4/9. Следовательно, абсолютное отклонение является смещенной оценкой.
Однако этот аргумент основан на понятии несмещенности к среднему. Каждая мера местоположения имеет свою собственную форму несмещенности (см. статью о смещенной оценке ). Соответствующей формой беспристрастности здесь является медианная несмещенность.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Талеб, Нассим Николас (2014). «Какая научная идея готова уйти на пенсию?» . Край . Архивировано из оригинала 16 января 2014 г. Проверено 16 января 2014 г.
{{cite web}}
: CS1 maint: bot: исходный статус URL неизвестен ( ссылка ) - ^ Кадер, Гэри (март 1999 г.). «Средства и MADS» . Преподавание математики в средней школе . 4 (6): 398–403. Архивировано из оригинала 18 мая 2013 г. Проверено 20 февраля 2013 г.
- ^ Франклин, Кристина, Гэри Кейдер, Дениз Мьюборн, Джерри Морено, Рокси Пек , Майк Перри и Ричард Шеффер (2007). Руководство по оценке и обучению в области статистического образования (PDF) . Американская статистическая ассоциация. ISBN 978-0-9791747-1-1 . Архивировано (PDF) из оригинала 7 марта 2013 г. Проверено 20 февраля 2013 г.
{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Намиас, Стивен; Олсен, Тава Леннон (2015), Анализ производства и операций (7-е изд.), Waveland Press, стр. 62, ISBN 9781478628248 MAD
часто является предпочтительным методом измерения ошибки прогноза, поскольку он не требует возведения в квадрат.
- ^ Штадтлер, Хартмут; Килджер, Кристоф; Мейр, Герберт, ред. (2014), Управление цепочками поставок и перспективное планирование: концепции, модели, программное обеспечение и тематические исследования , Тексты Springer по бизнесу и экономике (5-е изд.), Springer, стр. 143, ISBN 9783642553097 ,
значение MAD легче интерпретировать
. - ^ Гири, RC (1935). Отношение среднего отклонения к стандартному отклонению как критерий нормальности. Биометрика, 27(3/4), 310–332.
- ^ См. также статьи Гири за 1936 и 1946 годы: Geary, RC (1936). Моменты отношения среднего отклонения к стандартному отклонению для нормальных образцов. Биометрика, 28 (3/4), 295–307 и Гири, RC (1947). Проверка на нормальность. Биометрика, 34(3/4), 209–242.