Средняя абсолютная разница
![]() | Эта статья включает список общих ссылок , но в ней отсутствуют достаточные соответствующие встроенные цитаты . ( Ноябрь 2010 г. ) |
Средняя абсолютная разница (одномерная) — это мера статистической дисперсии, равная средней абсолютной разнице двух независимых значений, полученных из распределения вероятностей . Соответствующей статистикой является относительная средняя абсолютная разница , которая представляет собой среднюю абсолютную разницу, деленную на среднее арифметическое и равную удвоенному коэффициенту Джини .Средняя абсолютная разница также известна как абсолютная средняя разница (не путать с абсолютным значением средней знаковой разницы ) и Джини средняя разница (GMD). [1] Средняя абсолютная разница иногда обозначается Δ или MD.
Определение
[ редактировать ]Средняя абсолютная разность определяется как «среднее» или «среднее», формально ожидаемое значение абсолютной разницы двух случайных величин X и Y, независимо и одинаково распределенных с одним и тем же (неизвестным) распределением, которое в дальнейшем Q. называется
Расчет
[ редактировать ]В частности, в дискретном случае
- Для случайной выборки размера n генеральной совокупности, равномерно распределенной в соответствии с Q , по закону общего ожидания (эмпирическая) средняя абсолютная разность последовательности значений выборки y i , i = 1 до n, может быть рассчитана как среднее арифметическое абсолютной величины всех возможных разностей:
- если Q имеет дискретную функцию вероятности f ( y ), где y i , i = от 1 до n , являются значениями с ненулевыми вероятностями:
В непрерывном случае
- если Q имеет функцию плотности вероятности f ( x ):
Альтернативная форма уравнения имеет вид:
- если Q имеет кумулятивную функцию распределения F ( x ) с функцией квантиля Q ( F ), то, поскольку f(x)=dF(x)/dx и Q(F(x))=x , отсюда следует, что:
Относительная средняя абсолютная разница
[ редактировать ]Когда распределение вероятностей имеет конечное и ненулевое среднее арифметическое AM, относительная средняя абсолютная разность, иногда обозначаемая Δ или RMD, определяется выражением
Относительная средняя абсолютная разница количественно определяет среднюю абсолютную разницу по сравнению с размером среднего и является безразмерной величиной. Относительная средняя абсолютная разница равна удвоенному коэффициенту Джини , который определяется с помощью кривой Лоренца . Эта взаимосвязь дает взаимодополняющие взгляды как на относительную среднюю абсолютную разницу, так и на коэффициент Джини, включая альтернативные способы расчета их значений.
Характеристики
[ редактировать ]Средняя абсолютная разница инвариантна к переводам и отрицанию и изменяется пропорционально положительному масштабированию. То есть, если X — случайная величина, а c — константа:
- MD( X + c ) = MD( X ),
- MD(- X ) = MD( X ), и
- MD( c Икс ) знак равно | с | МД( Х ).
Относительная средняя абсолютная разность инвариантна к положительному масштабированию, коммутирует с отрицанием и изменяется при переводе пропорционально соотношению исходных и переведенных средних арифметических значений. То есть, если X — случайная величина, а c — константа:
- RMD( X + c ) = RMD( X ) · среднее( X )/(среднее ( X ) + c ) = RMD( X ) / (1 + c / среднее ( X )) для c ≠ −mean( X ),
- RMD(- X ) = −RMD( X ), и
- RMD( c X ) = RMD( X ) для c > 0.
Если случайная величина имеет положительное среднее значение, то ее относительная средняя абсолютная разность всегда будет больше или равна нулю. Если, кроме того, случайная величина может принимать только значения, большие или равные нулю, то ее относительная средняя абсолютная разность будет меньше 2.
По сравнению со стандартным отклонением
[ редактировать ]Средняя абсолютная разница в два раза превышает L-шкалу (второй L-момент ), а стандартное отклонение представляет собой квадратный корень из дисперсии относительно среднего значения (второй условный центральный момент). Различия между L-моментами и условными моментами впервые видны при сравнении средней абсолютной разницы и стандартного отклонения (первый L-момент и первый условный момент являются средними).
И стандартное отклонение , и средняя абсолютная разница измеряют дисперсию — насколько разбросаны значения совокупности или вероятности распределения. Средняя абсолютная разница не определяется с точки зрения конкретной меры центральной тенденции, тогда как стандартное отклонение определяется с точки зрения отклонения от среднего арифметического. Поскольку стандартное отклонение возводит в квадрат свои различия, оно имеет тенденцию придавать больший вес большим различиям и меньший вес меньшим различиям по сравнению со средней абсолютной разницей. Когда среднее арифметическое конечно, средняя абсолютная разность также будет конечной, даже если стандартное отклонение бесконечно. См. примеры для некоторых конкретных сравнений.
Недавно введенное стандартное отклонение расстояния играет аналогичную роль, что и средняя абсолютная разница, но стандартное отклонение расстояния работает с центральными расстояниями. См. также Электронную статистику .
Примеры оценщиков
[ редактировать ]Для случайной выборки S из случайной величины X , состоящей из n значений y i , статистика
является последовательной и несмещенной оценкой MD( X ). Статистика:
является последовательной оценкой RMD( X ), но, как правило, не является несмещенной .
Доверительные интервалы для RMD( X ) можно рассчитать с использованием методов бутстреп-выборки.
В общем, не существует несмещенной оценки для RMD( X ), отчасти из-за сложности нахождения несмещенной оценки для умножения на обратную среднюю величину. Например, даже если известно, что выборка взята из случайной величины X ( p ) для неизвестного p , а X ( p ) − 1 имеет распределение Бернулли , так что Pr( X ( p ) = 1) = 1 − p и Pr( X ( p ) = 2) = p , тогда
- RMD( Икс ( п )) знак равно 2 п (1 - п )/(1 + п ) .
Но ожидаемое значение любой оценки R ( S ) RMD( X ( p )) будет иметь вид: [ нужна ссылка ]
где r i - константы. Таким образом, E( R ( S )) никогда не может равняться RMD( X ( p )) для всех p от 0 до 1.
Примеры
[ редактировать ]Распределение | Параметры | Иметь в виду | Стандартное отклонение | Средняя абсолютная разница | Относительная средняя абсолютная разница |
---|---|---|---|---|---|
Непрерывная форма | |||||
Нормальный | ; | неопределенный | |||
Экспоненциальный | |||||
Парето | ; | ||||
Гамма | ; | † | † | ||
Гамма | ; | ||||
Гамма | ; | ||||
Гамма | ; | ||||
Гамма | ; | ||||
Бернулли | |||||
Студенческая т , 2 дф | | неопределенный |
- † это бета-функция
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Ицхаки, Шломо (2003). «Средняя разница Джини: лучшая мера изменчивости ненормальных распределений» (PDF) . Метрон Международный статистический журнал . 61 (2). Спрингер Верлаг: 285–316.
Источники
[ редактировать ]- Сюй, Куан (январь 2004 г.). «Как изменилась литература об индексе Джини за последние 80 лет?» (PDF) . Факультет экономики Университета Далхаузи . Проверено 1 июня 2006 г.
{{cite journal}}
: Для цитирования журнала требуется|journal=
( помощь ) - Джини, Коррадо (1912). Изменчивость и мутабельность . Болонья: типография Паоло Куппини. Бибкод : 1912vamu.book.....G .
- Джини, Коррадо (1921). «Измерение неравенства и доходов» . Экономический журнал . 31 (121): 124–126. дои : 10.2307/2223319 . JSTOR 2223319 .
- Чакраварти, СР (1990). Цифры этического социального индекса . Нью-Йорк: Springer-Verlag.
- Миллс, Джеффри А.; Зандвакили, Суруше (1997). «Статистический вывод с помощью начальной загрузки для измерения показателей неравенства». Журнал прикладной эконометрики . 12 (2): 133–150. CiteSeerX 10.1.1.172.5003 . doi : 10.1002/(SICI)1099-1255(199703)12:2<133::AID-JAE433>3.0.CO;2-H .
- Ломницкий, ЗА (1952). «Стандартная ошибка средней разницы Джини» . Анналы математической статистики . 23 (4): 635–637. дои : 10.1214/aoms/1177729346 .
- Наир, США (1936). «Стандартная ошибка средней разницы Джини». Биометрика . 28 (3–4): 428–436. дои : 10.1093/biomet/28.3-4.428 .
- Ицхаки, Шломо (2003). «Средняя разница Джини: лучшая мера изменчивости ненормальных распределений» (PDF) . Метрон – Международный статистический журнал . 61 : 285–316.