Индекс дисперсии
В теории вероятностей и статистике показатель дисперсии , [1] индекс дисперсии, коэффициент дисперсии, относительная дисперсия или отношение дисперсии к среднему (VMR) , как и коэффициент вариации , является нормализованной мерой дисперсии распределения вероятностей : это мера, используемая для количественной оценки того, является ли набор наблюдаемые явления сгруппированы или рассредоточены по сравнению со стандартной статистической моделью.
Он определяется как отношение дисперсии к середине ,
Он также известен как фактор Фано , хотя этот термин иногда зарезервирован для оконных данных (среднее значение и дисперсия вычисляются по подгруппе), где индекс дисперсии используется в особом случае, когда окно бесконечно. Часто выполняются оконные данные: VMR часто вычисляется для различных интервалов времени или небольших областей в пространстве, которые можно назвать «окнами», а полученная статистика называется фактором Фано.
Оно определяется только тогда, когда среднее значение не равно нулю и обычно используется только для положительной статистики, такой как данные подсчета или время между событиями, или когда предполагается, что базовое распределение является экспоненциальным распределением или распределением Пуассона .
Терминология
[ редактировать ]В этом контексте набор наблюдаемых данных может состоять из времени возникновения заранее определенных событий, таких как землетрясения в данном регионе с заданной магнитудой, или из местоположений в географическом пространстве растений данного вида. Детали таких событий сначала преобразуются в количество событий или происшествий в каждом наборе временных или пространственных областей одинакового размера.
Вышеупомянутое определяет индекс дисперсии для counts . [2] Другое определение применяется к индексу дисперсии для интервалов , [3] где рассматриваемые величины представляют собой длину временных интервалов между событиями. Обычно используется термин «индекс дисперсии», который означает индекс дисперсии для подсчетов.
Интерпретация
[ редактировать ]Некоторые распределения, особенно распределение Пуассона , имеют одинаковую дисперсию и среднее значение, что дает им VMR = 1. Геометрическое распределение и отрицательное биномиальное распределение имеют VMR > 1, тогда как биномиальное распределение имеет VMR < 1, а постоянная случайная величина имеет VMR = 0. В результате получается следующая таблица:
Распределение | ВМР | |
---|---|---|
постоянная случайная величина | ВМР = 0 | не рассредоточен |
биномиальное распределение | 0 < ВМР < 1 | недостаточно рассеянный |
Распределение Пуассона | ВМР = 1 | |
отрицательное биномиальное распределение | ВМР > 1 | чрезмерно рассеянный |
Это можно считать аналогом классификации конических сечений по эксцентриситету ; Подробности см . в разделе «Кумулянты конкретных распределений вероятностей» .
Актуальность индекса дисперсии заключается в том, что он имеет значение 1, когда распределение вероятностей числа появлений в интервале является распределением Пуассона . Таким образом, эту меру можно использовать для оценки того, можно ли смоделировать наблюдаемые данные с использованием процесса Пуассона . Когда коэффициент дисперсии меньше 1, набор данных называется «недостаточно дисперсным»: это условие может относиться к закономерностям возникновения, которые являются более регулярными, чем случайность, связанная с процессом Пуассона. Например, регулярные, периодические события будут недостаточно распределены. Если индекс дисперсии больше 1, набор данных называется чрезмерно дисперсным .
Оценка индекса дисперсии на основе выборки может использоваться для построения формальной статистической проверки гипотезы адекватности модели, согласно которой ряд подсчетов соответствует распределению Пуассона. [4] [5] С точки зрения количества интервалов, чрезмерная дисперсия соответствует большему количеству интервалов с низким количеством и большим количеством интервалов с большим количеством по сравнению с распределением Пуассона: напротив, недостаточная дисперсия характеризуется наличием большего количества интервалов с количеством, близким к среднее значение по сравнению с распределением Пуассона.
VMR также является хорошим показателем степени случайности данного явления. Например, этот метод обычно используется в управлении валютой.
Пример
[ редактировать ]Для беспорядочно диффундирующих частиц ( броуновское движение ) распределение числа частиц внутри данного объема является пуассоновским, т.е. VMR=1. Следовательно, чтобы оценить, обусловлена ли данная пространственная структура (при условии, что у вас есть способ ее измерения) исключительно диффузией или же в ней задействовано какое-то взаимодействие между частицами: разделите пространство на участки, квадраты или единицы выборки (SU), посчитайте количество особей в каждом патче или SU и вычислите VMR. VMR значительно выше 1 означает кластерное распределение, где случайного блуждания недостаточно, чтобы подавить потенциал притяжения между частицами.
История
[ редактировать ]Первым, кто обсудил использование теста для обнаружения отклонений от распределения Пуассона или биномиального распределения, по-видимому, был Лексис в 1877 году. Одним из разработанных им тестов было соотношение Лексиса .
Этот индекс впервые был использован в ботанике Клэпхэмом в 1936 году.
Хоэл изучил первые четыре момента его распространения. [6] Он обнаружил, что приближение к χ 2 статистика разумна, если µ > 5.
Асимметричные распределения
[ редактировать ]Для сильно асимметричных распределений может оказаться более целесообразным использовать линейную функцию потерь, а не квадратичную. Аналогичным коэффициентом дисперсии в данном случае является отношение среднего абсолютного отклонения от медианы к медиане данных: [7] или, в символах:
где n — размер выборки, m — медиана выборки и сумма, взятая по всей выборке. Айова , Нью-Йорк и Южная Дакота используют этот линейный коэффициент дисперсии для оценки налоговых сборов. [8] [9] [10]
Для теста с двумя выборками, в котором размеры выборки велики, обе выборки имеют одинаковую медиану и различаются дисперсией вокруг нее, доверительный интервал для линейного коэффициента дисперсии ограничен снизу
где t j — среднее абсолютное отклонение j й выборка, а z α — длина доверительного интервала для нормального распределения достоверности α (например, для α = 0,05, z α = 1,96). [7]
См. также
[ редактировать ]Подобные соотношения
[ редактировать ]- Коэффициент вариации ,
- Стандартизированный момент ,
- фактор Фано , (оконный ВМР)
- соотношение сигнал/шум , (при обработке сигналов )
Примечания
[ редактировать ]- ^ Кокс и Льюис (1966)
- ^ Кокс и Льюис (1966), стр.72
- ^ Кокс и Льюис (1966), стр. 71
- ^ Кокс и Льюис (1966), стр. 158
- ^ Upton & Cook (2006), по индексу дисперсии.
- ^ Хоэл, П.Г. (1943). «Об показателях дисперсии» . Анналы математической статистики . 14 (2): 155–162. дои : 10.1214/aoms/1177731457 . JSTOR 2235818 .
- ^ Jump up to: а б Бонетт, Д.Г.; Зайер, Э. (2006). «Доверительный интервал для коэффициента дисперсии в ненормальных распределениях». Биометрический журнал . 48 (1): 144–148. дои : 10.1002/bimj.200410148 . ПМИД 16544819 . S2CID 33665632 .
- ^ «Определения статистических расчетов для массовой оценки» (PDF) . Айова.gov . Архивировано из оригинала (PDF) 11 ноября 2010 года.
Медианное соотношение: соотношение, расположенное посередине между самым высоким и самым низким соотношением, когда отдельные коэффициенты для класса недвижимости ранжируются в порядке возрастания или убывания. Медианное соотношение чаще всего используется для определения уровня оценки того или иного класса недвижимости.
- ^ «Оценочный капитал в Нью-Йорке: результаты исследования рыночной стоимости 2010 года» . Архивировано из оригинала 6 ноября 2012 года.
- ^ «Краткое описание процесса оценки» (PDF) . state.sd.us . Департамент доходов Южной Дакоты – Отдел налогов на имущество/специальных налогов. Архивировано из оригинала (PDF) 10 мая 2009 года.
Ссылки
[ редактировать ]- Кокс, доктор медицинских наук; Льюис, PAW (1966). Статистический анализ серии событий . Лондон: Метуэн.
- Аптон, Г.; Кук, И. (2006). Оксфордский статистический словарь (2-е изд.). Издательство Оксфордского университета. ISBN 978-0-19-954145-4 .