Jump to content

Index of dispersion

(Redirected from Relative variance)

In probability theory and statistics, the index of dispersion,[1] dispersion index, coefficient of dispersion, relative variance, or variance-to-mean ratio (VMR), like the coefficient of variation, is a normalized measure of the dispersion of a probability distribution: it is a measure used to quantify whether a set of observed occurrences are clustered or dispersed compared to a standard statistical model.

It is defined as the ratio of the variance to the mean ,

It is also known as the Fano factor, though this term is sometimes reserved for windowed data (the mean and variance are computed over a subpopulation), where the index of dispersion is used in the special case where the window is infinite. Windowing data is frequently done: the VMR is frequently computed over various intervals in time or small regions in space, which may be called "windows", and the resulting statistic called the Fano factor.

It is only defined when the mean is non-zero, and is generally only used for positive statistics, such as count data or time between events, or where the underlying distribution is assumed to be the exponential distribution or Poisson distribution.

Terminology

[edit]

In this context, the observed dataset may consist of the times of occurrence of predefined events, such as earthquakes in a given region over a given magnitude, or of the locations in geographical space of plants of a given species. Details of such occurrences are first converted into counts of the numbers of events or occurrences in each of a set of equal-sized time- or space-regions.

The above defines a dispersion index for counts.[2] A different definition applies for a dispersion index for intervals,[3] where the quantities treated are the lengths of the time-intervals between the events. Common usage is that "index of dispersion" means the dispersion index for counts.

Interpretation

[edit]

Some distributions, most notably the Poisson distribution, have equal variance and mean, giving them a VMR = 1. The geometric distribution and the negative binomial distribution have VMR > 1, while the binomial distribution has VMR < 1, and the constant random variable has VMR = 0. This yields the following table:

DistributionVMR
constant random variableVMR = 0not dispersed
binomial distribution0 < VMR < 1under-dispersed
Poisson distributionVMR = 1
negative binomial distributionVMR > 1over-dispersed

This can be considered analogous to the classification of conic sections by eccentricity; see Cumulants of particular probability distributions for details.

The relevance of the index of dispersion is that it has a value of 1 when the probability distribution of the number of occurrences in an interval is a Poisson distribution. Thus the measure can be used to assess whether observed data can be modeled using a Poisson process. When the coefficient of dispersion is less than 1, a dataset is said to be "under-dispersed": this condition can relate to patterns of occurrence that are more regular than the randomness associated with a Poisson process. For instance, regular, periodic events will be under-dispersed. If the index of dispersion is larger than 1, a dataset is said to be over-dispersed.

A sample-based estimate of the dispersion index can be used to construct a formal statistical hypothesis test for the adequacy of the model that a series of counts follow a Poisson distribution.[4][5] In terms of the interval-counts, over-dispersion corresponds to there being more intervals with low counts and more intervals with high counts, compared to a Poisson distribution: in contrast, under-dispersion is characterised by there being more intervals having counts close to the mean count, compared to a Poisson distribution.

The VMR is also a good measure of the degree of randomness of a given phenomenon. For example, this technique is commonly used in currency management.

Example

[edit]

For randomly diffusing particles (Brownian motion), the distribution of the number of particle inside a given volume is poissonian, i.e. VMR=1. Therefore, to assess if a given spatial pattern (assuming you have a way to measure it) is due purely to diffusion or if some particle-particle interaction is involved : divide the space into patches, Quadrats or Sample Units (SU), count the number of individuals in each patch or SU, and compute the VMR. VMRs significantly higher than 1 denote a clustered distribution, where random walk is not enough to smother the attractive inter-particle potential.

History

[edit]

The first to discuss the use of a test to detect deviations from a Poisson or binomial distribution appears to have been Lexis in 1877. One of the tests he developed was the Lexis ratio.

This index was first used in botany by Clapham in 1936.

Hoel studied the first four moments of its distribution.[6] He found that the approximation to the χ2 statistic is reasonable if μ > 5.

Skewed distributions

[edit]

For highly skewed distributions, it may be more appropriate to use a linear loss function, as opposed to a quadratic one. The analogous coefficient of dispersion in this case is the ratio of the average absolute deviation from the median to the median of the data,[7] or, in symbols:

where n is the sample size, m is the sample median and the sum taken over the whole sample. Iowa, New York and South Dakota use this linear coefficient of dispersion to estimate dues taxes.[8][9][10]

For a two-sample test in which the sample sizes are large, both samples have the same median, and differ in the dispersion around it, a confidence interval for the linear coefficient of dispersion is bounded inferiorly by

где t j — среднее абсолютное отклонение j й выборка, а z α — длина доверительного интервала для нормального распределения достоверности α (например, для α = 0,05, z α = 1,96). [7]

См. также

[ редактировать ]

Подобные соотношения

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ Кокс и Льюис (1966)
  2. ^ Кокс и Льюис (1966), стр.72
  3. ^ Кокс и Льюис (1966), стр. 71
  4. ^ Кокс и Льюис (1966), стр. 158
  5. ^ Upton & Cook (2006), по индексу дисперсии.
  6. ^ Хоэл, П.Г. (1943). «Об показателях дисперсии» . Анналы математической статистики . 14 (2): 155–162. дои : 10.1214/aoms/1177731457 . JSTOR   2235818 .
  7. ^ Jump up to: а б Бонетт, Д.Г.; Зайер, Э. (2006). «Доверительный интервал для коэффициента дисперсии в ненормальных распределениях». Биометрический журнал . 48 (1): 144–148. дои : 10.1002/bimj.200410148 . ПМИД   16544819 . S2CID   33665632 .
  8. ^ «Определения статистических расчетов для массовой оценки» (PDF) . Айова.gov . Архивировано из оригинала (PDF) 11 ноября 2010 года. Медианное соотношение: соотношение, расположенное посередине между самым высоким и самым низким соотношением, когда отдельные коэффициенты для класса недвижимости ранжируются в порядке возрастания или убывания. Медианное соотношение чаще всего используется для определения уровня оценки того или иного класса недвижимости.
  9. ^ «Оценочный капитал в Нью-Йорке: результаты исследования рыночной стоимости 2010 года» . Архивировано из оригинала 6 ноября 2012 года.
  10. ^ «Краткое описание процесса оценки» (PDF) . state.sd.us . Департамент доходов Южной Дакоты – Отдел налогов на имущество/специальных налогов. Архивировано из оригинала (PDF) 10 мая 2009 года.
  • Кокс, доктор медицинских наук; Льюис, PAW (1966). Статистический анализ серии событий . Лондон: Метуэн.
  • Аптон, Г.; Кук, И. (2006). Оксфордский статистический словарь (2-е изд.). Издательство Оксфордского университета. ISBN  978-0-19-954145-4 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 367739e1cd51c01214c433de8e42c4cf__1709641620
URL1:https://arc.ask3.ru/arc/aa/36/cf/367739e1cd51c01214c433de8e42c4cf.html
Заголовок, (Title) документа по адресу, URL1:
Index of dispersion - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)