Статистическая дисперсия
Эта статья нуждается в дополнительных цитатах для проверки . ( декабрь 2010 г. ) |
В статистике распределение дисперсия (также называемая изменчивостью , разбросом или распространением ) — это степень, до которой растягивается или сжимается. [1] Распространенными примерами показателей статистической дисперсии являются дисперсия , стандартное отклонение и межквартильный размах . Например, когда дисперсия данных в наборе велика, данные сильно разбросаны. С другой стороны, когда дисперсия мала, данные в наборе кластеризуются.
Дисперсия противопоставляется местоположению или центральной тенденции , и вместе они являются наиболее используемыми свойствами распределений.
Меры статистической дисперсии
[ редактировать ]Мерой статистической дисперсии является неотрицательное действительное число , которое равно нулю, если все данные одинаковы, и увеличивается по мере того, как данные становятся более разнообразными.
Большинство мер дисперсии имеют те же единицы , что и величина измеряемая . Другими словами, если измерения производятся в метрах или секундах, то и дисперсия является такой же. Примеры мер дисперсии включают в себя:
- Стандартное отклонение
- Межквартильный размах (IQR)
- Диапазон
- Средняя абсолютная разница (также известная как средняя абсолютная разница Джини)
- Медианное абсолютное отклонение (MAD)
- Среднее абсолютное отклонение (или просто среднее отклонение)
- Стандартное отклонение расстояния
Они часто используются (вместе с масштабными коэффициентами ) в качестве оценок параметров масштаба , и в этом качестве они называются оценками масштаба. Надежные меры масштаба – это те, на которые не влияет небольшое количество выбросов , и включают IQR и MAD.
Все вышеперечисленные меры статистической дисперсии обладают тем полезным свойством, что они не зависят от местоположения и линейны по масштабу . Это означает, что если случайная величина имеет дисперсию то линейное преобразование серьезно и должен иметь дисперсию , где это абсолютное значение , то есть игнорирует предшествующий отрицательный знак .
Остальные меры дисперсии безразмерны . Другими словами, у них нет единиц измерения, даже если у самой переменной есть единицы. К ним относятся:
- Коэффициент вариации
- Квартильный коэффициент дисперсии
- Относительная средняя разница , равная удвоенному коэффициенту Джини.
- Энтропия : Хотя энтропия дискретной переменной не зависит от местоположения и масштаба и, следовательно, не является мерой дисперсии в вышеуказанном смысле, энтропия непрерывной переменной инвариантна к местоположению и аддитивна по масштабу: если - энтропия непрерывной переменной и , затем .
Существуют и другие меры дисперсии:
- Дисперсия (квадрат стандартного отклонения) – не зависит от местоположения, но не является линейной по масштабу.
- Отношение дисперсии к среднему — в основном используется для данных подсчета термин «коэффициент дисперсии» , когда используется и когда это отношение безразмерное , поскольку данные подсчета сами по себе безразмерны, а не иначе.
Некоторые меры дисперсии имеют специализированные цели. Дисперсия Аллана может использоваться в приложениях, где шум нарушает сходимость. [2] Дисперсия Адамара может использоваться для противодействия чувствительности к линейному дрейфу частоты. [3]
Для категориальных переменных дисперсию реже измеряют одним числом; см. качественное изменение . Одной из мер, которая делает это, является дискретная энтропия .
Источники
[ редактировать ]В физических науках такая изменчивость может быть результатом случайных ошибок измерения: измерения с помощью приборов часто не являются совершенно точными, то есть воспроизводимыми , и существует дополнительная межэкспертная вариабельность в интерпретации и сообщении результатов измерений. Можно предположить, что измеряемая величина стабильна и что различия между измерениями обусловлены ошибкой наблюдения . Система большого числа частиц характеризуется средними значениями относительно небольшого числа макроскопических величин, таких как температура, энергия и плотность. Стандартное отклонение — важная мера в теории флуктуаций, которая объясняет многие физические явления, в том числе почему небо голубое. [4]
В биологических науках измеряемая величина редко бывает неизменной и стабильной, а наблюдаемые вариации могут быть, кроме того, присущи этому явлению: они могут быть следствием межиндивидуальной изменчивости , то есть отдельных членов популяции, отличающихся друг от друга. Также это может быть связано с внутрииндивидуальной изменчивостью , то есть у одного и того же испытуемого различаются тесты, взятые в разное время или в других различающихся условиях. Подобные типы изменчивости наблюдаются и в сфере производимой продукции; даже там дотошный ученый находит вариации.
Частичное упорядочение дисперсии
[ редактировать ]( Разброс с сохранением среднего значения MPS) — это переход от одного распределения вероятностей A к другому распределению вероятностей B, где B формируется путем расширения одной или нескольких частей функции плотности вероятности A, при этом среднее значение (ожидаемое значение) остается неизменным. [5] Концепция разброса, сохраняющего среднее значение, обеспечивает частичное упорядочение распределений вероятностей в соответствии с их дисперсиями: из двух распределений вероятностей одно может быть оценено как имеющее большую дисперсию, чем другое, или, альтернативно, ни одно из них не может быть оценено как имеющее большую дисперсию.
См. также
[ редактировать ]- Средний
- Круговая дисперсия
- Матрица дисперсии
- Функция плотности вероятности
- Качественная вариация
- Неопределенность измерения
- Точность (статистика)
- Надежные меры масштаба
- Сводная статистика
Ссылки
[ редактировать ]- ^ Электронный справочник NIST/SEMATECH по статистическим методам. «1.3.6.4. Местоположение и масштабные параметры» . www.itl.nist.gov . Министерство торговли США.
- ^ «Отклонение Аллана - Обзор Дэвида В. Аллана» . www.allanstime.com . Проверено 16 сентября 2021 г.
- ^ «Вариация Адамара» . www.wriley.com . Проверено 16 сентября 2021 г.
- ^ МакКуорри, Дональд А. (1976). Статистическая механика . Нью-Йорк: Харпер и Роу. ISBN 0-06-044366-9 .
- ^ Ротшильд, Майкл; Стиглиц, Джозеф (1970). «Повышающийся риск I: определение». Журнал экономической теории . 2 (3): 225–243. дои : 10.1016/0022-0531(70)90038-4 .