Probability distribution
тратить Функция плотности вероятности
Кумулятивная функция распределения
Обозначения χ ( k ) {\displaystyle \chi (k)\;} или χ k {\displaystyle \chi _{k}\!} Параметры k > 0 {\displaystyle k>0\,} (степени свободы) Поддерживать x ∈ [ 0 , ∞ ) {\displaystyle x\in [0,\infty )} PDF 1 2 ( k / 2 ) − 1 Γ ( k / 2 ) x k − 1 e − x 2 / 2 {\displaystyle {\frac {1}{2^{(k/2)-1}\Gamma (k/2)}}\;x^{k-1}e^{-x^{2}/2}} CDF P ( k / 2 , x 2 / 2 ) {\displaystyle P(k/2,x^{2}/2)\,} Иметь в виду μ = 2 Γ ( ( k + 1 ) / 2 ) Γ ( k / 2 ) {\displaystyle \mu ={\sqrt {2}}\,{\frac {\Gamma ((k+1)/2)}{\Gamma (k/2)}}} медиана ≈ k ( 1 − 2 9 k ) 3 {\displaystyle \approx {\sqrt {k{\bigg (}1-{\frac {2}{9k}}{\bigg )}^{3}}}} Режим k − 1 {\displaystyle {\sqrt {k-1}}\,} для k ≥ 1 {\displaystyle k\geq 1} Дисперсия σ 2 = k − μ 2 {\displaystyle \sigma ^{2}=k-\mu ^{2}\,} асимметрия γ 1 = μ σ 3 ( 1 − 2 σ 2 ) {\displaystyle \gamma _{1}={\frac {\mu }{\sigma ^{3}}}\,(1-2\sigma ^{2})} Избыточный эксцесс 2 σ 2 ( 1 − μ σ γ 1 − σ 2 ) {\displaystyle {\frac {2}{\sigma ^{2}}}(1-\mu \sigma \gamma _{1}-\sigma ^{2})} Энтропия ln ( Γ ( k / 2 ) ) + {\displaystyle \ln(\Gamma (k/2))+\,} 1 2 ( k − ln ( 2 ) − ( k − 1 ) ψ 0 ( k / 2 ) ) {\displaystyle {\frac {1}{2}}(k\!-\!\ln(2)\!-\!(k\!-\!1)\psi _{0}(k/2))} МГФ Сложный (см. текст) CF Сложный (см. текст)
В теории вероятностей и статистике распределение хи представляет собой непрерывное распределение вероятностей по неотрицательной действительной линии. Это распределение положительного квадратного корня из суммы квадратов независимых гауссовских случайных величин . Эквивалентно, это распределение евклидова расстояния между многомерной гауссовой случайной величиной и началом координат. Таким образом, это связано с распределением хи-квадрат , описывая распределение положительных квадратных корней переменной, подчиняющейся распределению хи-квадрат.
Если Z 1 , … , Z k {\displaystyle Z_{1},\ldots ,Z_{k}} являются k {\displaystyle k} независимые, нормально распределенные случайные величины со средним значением 0 и стандартным отклонением 1, то статистика
Y = ∑ i = 1 k Z i 2 {\displaystyle Y={\sqrt {\sum _{i=1}^{k}Z_{i}^{2}}}} распределяется в соответствии с распределением ци. Распределение хи имеет один положительный целочисленный параметр. k {\displaystyle k} , который определяет степени свободы (т.е. количество случайных величин Z i {\displaystyle Z_{i}} ).
Наиболее известными примерами являются распределение Рэлея (распределение хи с двумя степенями свободы ) и распределение Максвелла – Больцмана скоростей молекул в идеальном газе (распределение хи с тремя степенями свободы).
Определения [ править ] плотности вероятности Функция Функция плотности вероятности (pdf) хи-распределения равна
f ( x ; k ) = { x k − 1 e − x 2 / 2 2 k / 2 − 1 Γ ( k 2 ) , x ≥ 0 ; 0 , otherwise . {\displaystyle f(x;k)={\begin{cases}{\dfrac {x^{k-1}e^{-x^{2}/2}}{2^{k/2-1}\Gamma \left({\frac {k}{2}}\right)}},&x\geq 0;\\0,&{\text{otherwise}}.\end{cases}}} где Γ ( z ) {\displaystyle \Gamma (z)} это гамма-функция .
распределения Кумулятивная функция Кумулятивная функция распределения определяется выражением:
F ( x ; k ) = P ( k / 2 , x 2 / 2 ) {\displaystyle F(x;k)=P(k/2,x^{2}/2)\,} где P ( k , x ) {\displaystyle P(k,x)} – регуляризованная гамма-функция .
Генерирующие функции [ править ] определяется Создающая момент функция выражением:
M ( t ) = M ( k 2 , 1 2 , t 2 2 ) + t 2 Γ ( ( k + 1 ) / 2 ) Γ ( k / 2 ) M ( k + 1 2 , 3 2 , t 2 2 ) , {\displaystyle M(t)=M\left({\frac {k}{2}},{\frac {1}{2}},{\frac {t^{2}}{2}}\right)+t{\sqrt {2}}\,{\frac {\Gamma ((k+1)/2)}{\Gamma (k/2)}}M\left({\frac {k+1}{2}},{\frac {3}{2}},{\frac {t^{2}}{2}}\right),} где M ( a , b , z ) {\displaystyle M(a,b,z)} Куммера — вырожденная гипергеометрическая функция . Характеристическая функция определяется выражением:
φ ( t ; k ) = M ( k 2 , 1 2 , − t 2 2 ) + i t 2 Γ ( ( k + 1 ) / 2 ) Γ ( k / 2 ) M ( k + 1 2 , 3 2 , − t 2 2 ) . {\displaystyle \varphi (t;k)=M\left({\frac {k}{2}},{\frac {1}{2}},{\frac {-t^{2}}{2}}\right)+it{\sqrt {2}}\,{\frac {\Gamma ((k+1)/2)}{\Gamma (k/2)}}M\left({\frac {k+1}{2}},{\frac {3}{2}},{\frac {-t^{2}}{2}}\right).} Необработанные моменты тогда даются следующим образом:
μ j = ∫ 0 ∞ f ( x ; k ) x j d x = 2 j / 2 Γ ( 1 2 ( k + j ) ) Γ ( 1 2 k ) {\displaystyle \mu _{j}=\int _{0}^{\infty }f(x;k)x^{j}\mathrm {d} x=2^{j/2}\ {\frac {\ \Gamma \left({\tfrac {1}{2}}(k+j)\right)\ }{\Gamma \left({\tfrac {1}{2}}k\right)}}} где Γ ( z ) {\displaystyle \ \Gamma (z)\ } это гамма-функция . Итак, первые несколько сырых моментов таковы:
μ 1 = 2 Γ ( 1 2 ( k + 1 ) ) Γ ( 1 2 k ) {\displaystyle \mu _{1}={\sqrt {2\ }}\ {\frac {\ \Gamma \left({\tfrac {1}{2}}(k+1)\right)\ }{\Gamma \left({\tfrac {1}{2}}k\right)}}} μ 2 = k , {\displaystyle \mu _{2}=k\ ,} μ 3 = 2 2 Γ ( 1 2 ( k + 3 ) ) Γ ( 1 2 k ) = ( k + 1 ) μ 1 , {\displaystyle \mu _{3}=2{\sqrt {2\ }}\ {\frac {\ \Gamma \left({\tfrac {1}{2}}(k+3)\right)\ }{\Gamma \left({\tfrac {1}{2}}k\right)}}=(k+1)\ \mu _{1}\ ,} μ 4 = ( k ) ( k + 2 ) , {\displaystyle \mu _{4}=(k)(k+2)\ ,} μ 5 = 4 2 Γ ( 1 2 ( k + 5 ) ) Γ ( 1 2 k ) = ( k + 1 ) ( k + 3 ) μ 1 , {\displaystyle \mu _{5}=4{\sqrt {2\ }}\ {\frac {\ \Gamma \left({\tfrac {1}{2}}(k\!+\!5)\right)\ }{\Gamma \left({\tfrac {1}{2}}k\right)}}=(k+1)(k+3)\ \mu _{1}\ ,} μ 6 = ( k ) ( k + 2 ) ( k + 4 ) , {\displaystyle \mu _{6}=(k)(k+2)(k+4)\ ,} где самые правые выражения получены с использованием рекуррентного соотношения для гамма-функции:
Γ ( x + 1 ) = x Γ ( x ) . {\displaystyle \Gamma (x+1)=x\ \Gamma (x)~.} Из этих выражений мы можем вывести следующие соотношения:
Иметь в виду: μ = 2 Γ ( 1 2 ( k + 1 ) ) Γ ( 1 2 k ) , {\displaystyle \mu ={\sqrt {2\ }}\ {\frac {\ \Gamma \left({\tfrac {1}{2}}(k+1)\right)\ }{\Gamma \left({\tfrac {1}{2}}k\right)}}\ ,} что близко к k − 1 2 {\displaystyle {\sqrt {k-{\tfrac {1}{2}}\ }}\ } для большого k .
Разница: V = k − μ 2 , {\displaystyle V=k-\mu ^{2}\ ,} который приближается 1 2 {\displaystyle \ {\tfrac {1}{2}}\ } по мере увеличения k .
Асимметрия: γ 1 = μ σ 3 ( 1 − 2 σ 2 ) . {\displaystyle \gamma _{1}={\frac {\mu }{\ \sigma ^{3}\ }}\left(1-2\sigma ^{2}\right)~.}
Эксцесс эксцесса: γ 2 = 2 σ 2 ( 1 − μ σ γ 1 − σ 2 ) . {\displaystyle \gamma _{2}={\frac {2}{\ \sigma ^{2}\ }}\left(1-\mu \ \sigma \ \gamma _{1}-\sigma ^{2}\right)~.}
Энтропия определяется:
S = ln ( Γ ( k / 2 ) ) + 1 2 ( k − ln ( 2 ) − ( k − 1 ) ψ 0 ( k / 2 ) ) {\displaystyle S=\ln(\Gamma (k/2))+{\frac {1}{2}}(k\!-\!\ln(2)\!-\!(k\!-\!1)\psi ^{0}(k/2))} где ψ 0 ( z ) {\displaystyle \psi ^{0}(z)} – полигамма-функция .
Большое n-приближение [ править ] Мы находим большое n=k+1 приближение среднего и дисперсии распределения хи. Это применимо, например, для определения распределения стандартного отклонения выборки из нормально распределенной совокупности, где n — размер выборки.
Среднее значение тогда:
μ = 2 Γ ( n / 2 ) Γ ( ( n − 1 ) / 2 ) {\displaystyle \mu ={\sqrt {2}}\,\,{\frac {\Gamma (n/2)}{\Gamma ((n-1)/2)}}} Используя формулу дублирования Лежандра, запишем:
2 n − 2 Γ ( ( n − 1 ) / 2 ) ⋅ Γ ( n / 2 ) = π Γ ( n − 1 ) {\displaystyle 2^{n-2}\,\Gamma ((n-1)/2)\cdot \Gamma (n/2)={\sqrt {\pi }}\Gamma (n-1)} , так что:
μ = 2 / π 2 n − 2 ( Γ ( n / 2 ) ) 2 Γ ( n − 1 ) {\displaystyle \mu ={\sqrt {2/\pi }}\,2^{n-2}\,{\frac {(\Gamma (n/2))^{2}}{\Gamma (n-1)}}} Используя аппроксимацию Стирлинга для гамма-функции, мы получаем следующее выражение для среднего значения:
μ = 2 / π 2 n − 2 ( 2 π ( n / 2 − 1 ) n / 2 − 1 + 1 / 2 e − ( n / 2 − 1 ) ⋅ [ 1 + 1 12 ( n / 2 − 1 ) + O ( 1 n 2 ) ] ) 2 2 π ( n − 2 ) n − 2 + 1 / 2 e − ( n − 2 ) ⋅ [ 1 + 1 12 ( n − 2 ) + O ( 1 n 2 ) ] {\displaystyle \mu ={\sqrt {2/\pi }}\,2^{n-2}\,{\frac {\left({\sqrt {2\pi }}(n/2-1)^{n/2-1+1/2}e^{-(n/2-1)}\cdot [1+{\frac {1}{12(n/2-1)}}+O({\frac {1}{n^{2}}})]\right)^{2}}{{\sqrt {2\pi }}(n-2)^{n-2+1/2}e^{-(n-2)}\cdot [1+{\frac {1}{12(n-2)}}+O({\frac {1}{n^{2}}})]}}} = ( n − 2 ) 1 / 2 ⋅ [ 1 + 1 4 n + O ( 1 n 2 ) ] = n − 1 ( 1 − 1 n − 1 ) 1 / 2 ⋅ [ 1 + 1 4 n + O ( 1 n 2 ) ] {\displaystyle =(n-2)^{1/2}\,\cdot \left[1+{\frac {1}{4n}}+O({\frac {1}{n^{2}}})\right]={\sqrt {n-1}}\,(1-{\frac {1}{n-1}})^{1/2}\cdot \left[1+{\frac {1}{4n}}+O({\frac {1}{n^{2}}})\right]} = n − 1 ⋅ [ 1 − 1 2 n + O ( 1 n 2 ) ] ⋅ [ 1 + 1 4 n + O ( 1 n 2 ) ] {\displaystyle ={\sqrt {n-1}}\,\cdot \left[1-{\frac {1}{2n}}+O({\frac {1}{n^{2}}})\right]\,\cdot \left[1+{\frac {1}{4n}}+O({\frac {1}{n^{2}}})\right]} = n − 1 ⋅ [ 1 − 1 4 n + O ( 1 n 2 ) ] {\displaystyle ={\sqrt {n-1}}\,\cdot \left[1-{\frac {1}{4n}}+O({\frac {1}{n^{2}}})\right]} Таким образом, дисперсия равна:
V = ( n − 1 ) − μ 2 = ( n − 1 ) ⋅ 1 2 n ⋅ [ 1 + O ( 1 n ) ] {\displaystyle V=(n-1)-\mu ^{2}\,=(n-1)\cdot {\frac {1}{2n}}\,\cdot \left[1+O({\frac {1}{n}})\right]} Связанные дистрибутивы [ править ] Если X ∼ χ k {\displaystyle X\sim \chi _{k}} затем X 2 ∼ χ k 2 {\displaystyle X^{2}\sim \chi _{k}^{2}} ( распределение хи-квадрат ) χ 1 ∼ H N ( 1 ) {\displaystyle \chi _{1}\sim \mathrm {HN} (1)\,} ( полунормальное распределение ), т.е. если X ∼ N ( 0 , 1 ) {\displaystyle X\sim N(0,1)\,} затем | X | ∼ χ 1 {\displaystyle |X|\sim \chi _{1}\,} , и если Y ∼ H N ( σ ) {\displaystyle Y\sim \mathrm {HN} (\sigma )\,} для любого σ > 0 {\displaystyle \sigma >0\,} затем Y σ ∼ χ 1 {\displaystyle {\tfrac {Y}{\sigma }}\sim \chi _{1}\,} χ 2 ∼ R a y l e i g h ( 1 ) {\displaystyle \chi _{2}\sim \mathrm {Rayleigh} (1)\,} ( распределение Рэлея ) и если Y ∼ R a y l e i g h ( σ ) {\displaystyle Y\sim \mathrm {Rayleigh} (\sigma )\,} для любого σ > 0 {\displaystyle \sigma >0\,} затем Y σ ∼ χ 2 {\displaystyle {\tfrac {Y}{\sigma }}\sim \chi _{2}\,} χ 3 ∼ M a x w e l l ( 1 ) {\displaystyle \chi _{3}\sim \mathrm {Maxwell} (1)\,} ( распределение Максвелла ) и если Y ∼ M a x w e l l ( a ) {\displaystyle Y\sim \mathrm {Maxwell} (a)\,} для любого a > 0 {\displaystyle a>0\,} затем Y a ∼ χ 3 {\displaystyle {\tfrac {Y}{a}}\sim \chi _{3}\,} ‖ N i = 1 , … , k ( 0 , 1 ) ‖ 2 ∼ χ k {\displaystyle \|{\boldsymbol {N}}_{i=1,\ldots ,k}{(0,1)}\|_{2}\sim \chi _{k}} , евклидова норма стандартного нормального случайного вектора с k {\displaystyle k} размеров, распределяется в соответствии с распределением ци с k {\displaystyle k} степени свободы Распределение ци является частным случаем обобщенного гамма-распределения , распределения Накагами или нецентрального распределения ци. lim k → ∞ χ k − μ k σ k → d N ( 0 , 1 ) {\displaystyle \lim _{k\to \infty }{\tfrac {\chi _{k}-\mu _{k}}{\sigma _{k}}}{\xrightarrow {d}}\ N(0,1)\,} ( Нормальное распределение ) Среднее значение распределения ци (масштабированное квадратным корнем из n − 1 {\displaystyle n-1} ) дает поправочный коэффициент при несмещенной оценке стандартного отклонения нормального распределения . Различные распределения хи и хи-квадрат Имя Статистика распределение хи-квадрат ∑ i = 1 k ( X i − μ i σ i ) 2 {\displaystyle \sum _{i=1}^{k}\left({\frac {X_{i}-\mu _{i}}{\sigma _{i}}}\right)^{2}} нецентральное распределение хи-квадрат ∑ i = 1 k ( X i σ i ) 2 {\displaystyle \sum _{i=1}^{k}\left({\frac {X_{i}}{\sigma _{i}}}\right)^{2}} распределение ци ∑ i = 1 k ( X i − μ i σ i ) 2 {\displaystyle {\sqrt {\sum _{i=1}^{k}\left({\frac {X_{i}-\mu _{i}}{\sigma _{i}}}\right)^{2}}}} нецентральное распределение ци ∑ i = 1 k ( X i σ i ) 2 {\displaystyle {\sqrt {\sum _{i=1}^{k}\left({\frac {X_{i}}{\sigma _{i}}}\right)^{2}}}}
Марта Л. Абелл, Джеймс П. Бразелтон, Джон Артур Рафтер, Джон А. Рафтер, Статистика в Mathematica (1999), 237f. Ян В. Гуч, Энциклопедический словарь полимеров, том. 1 (2010), Приложение Е, с. 972 . Внешние ссылки [ править ]
скрывать Дискретный одномерный
с конечным поддерживать с бесконечным поддерживать
Непрерывный одномерный
поддерживается на ограниченный интервал поддерживается на полубесконечный интервал поддерживается в целом реальная линия при поддержке чей тип варьируется
Смешанный одномерный
Многомерный (соединение) Направленный Выродиться и единственное число Семьи