Обобщенное распределение хи-квадрат
Функция плотности вероятности | |||
Кумулятивная функция распределения | |||
Обозначения | |||
---|---|---|---|
Параметры | , вектор весов нецентральных компонентов хи-квадрат , вектор степеней свободы нецентральных компонент хи-квадрат , вектор параметров нецентральности компонентов хи-квадрат , шкала нормального члена , компенсировать | ||
Поддерживать | | ||
Иметь в виду | |||
Дисперсия | |||
CF |
В теории вероятностей и статистике обобщенное распределение хи-квадрат (или обобщенное распределение хи-квадрат ) — это распределение квадратичной формы мультинормальной переменной (нормального вектора) или линейной комбинации различных нормальных переменных и квадратов нормальных переменных. Эквивалентно, это также линейная сумма независимых нецентральных переменных хи-квадрат и нормальной переменной . Есть еще несколько подобных обобщений, для которых иногда используется тот же термин; некоторые из них представляют собой частные случаи обсуждаемого здесь семейства, например гамма-распределение .
Определение
[ редактировать ]Обобщенную переменную хи-квадрат можно описать несколькими способами. Один из них — записать его как взвешенную сумму независимых хи-квадрат. нецентральных переменных и стандартная нормальная переменная : [1] [2]
Здесь параметрами являются веса , степени свободы и нецентральность составляющих нецентральных хи-квадратов и коэффициентов и нормального. Некоторые важные частные случаи имеют все веса. одного и того же знака, или имеют центральные компоненты хи-квадрат, или пропускают нормальный член.
Поскольку нецентральная переменная хи-квадрат представляет собой сумму квадратов нормальных переменных с разными средними значениями, обобщенная переменная хи-квадрат также определяется как сумма квадратов независимых нормальных переменных плюс независимая нормальная переменная: то есть квадратичная по нормальным переменным.
Другой эквивалентный способ — сформулировать его как квадратичную форму нормального вектора. : [3] [4]
- .
Здесь это матрица, является вектором, и является скаляром. Они вместе со средним и ковариационная матрица нормального вектора , параметризовать распределение. Параметры первого выражения (в терминах нецентральных хи-квадратов, нормали и константы) можно вычислить через параметры второго выражения (квадратичная форма вектора нормали). [4] Если (и только если) в этой формулировке положительно определена , то все в первой формулировке будет иметь тот же знак.
В самом общем случае приведение к общей стандартной форме можно осуществить, используя представление следующего вида: [5]
где D — диагональная матрица, а x — вектор некоррелированных стандартных нормальных случайных величин.
Вычисление pdf/cdf/обратного cdf/случайных чисел
[ редактировать ]Плотность вероятности, кумулятивное распределение и обратные кумулятивные функции распределения обобщенной переменной хи-квадрат не имеют простых выражений в замкнутой форме. Однако численные алгоритмы [5] [2] [6] [4] и компьютерный код ( Fortran и C , Matlab , R , Python , Julia ) были опубликованы для оценки некоторых из них и для генерации случайных выборок.
Приложения
[ редактировать ]Обобщенный хи-квадрат — это распределение статистических оценок в тех случаях, когда обычная статистическая теория не работает, как в примерах ниже.
При примерке и выборе модели
[ редактировать ]Если прогностическая модель аппроксимируется методом наименьших квадратов , но остатки имеют либо автокорреляцию , либо гетероскедастичность , то альтернативные модели можно сравнивать (при выборе модели ), связывая изменения суммы квадратов с асимптотически действительным обобщенным распределением хи-квадрат. [3]
Классификация нормальных векторов с использованием дискриминантного анализа Гаусса
[ редактировать ]Если является нормальным вектором, его логарифмическая вероятность представляет собой форму квадратичную , и, следовательно, распределяется как обобщенный хи-квадрат. Логарифмическое отношение правдоподобия, которое возникает из-за одного нормального распределения по сравнению с другим, также является квадратичной формой , поэтому распределяется как обобщенный хи-квадрат. [4]
В дискриминантном анализе Гаусса выборки из мультинормальных распределений оптимально разделяются с помощью квадратичного классификатора , границы, которая является квадратичной функцией (например, кривая, определяемая путем установки отношения правдоподобия между двумя гауссианами равным 1). Коэффициенты ошибок классификации разных типов (ложноположительные и ложноотрицательные) являются интегралами нормального распределения в квадратичных областях, определенных этим классификатором. Поскольку это математически эквивалентно интегрированию квадратичной формы нормального вектора, результатом является интеграл от обобщенной переменной хи-квадрат. [4]
В обработке сигналов
[ редактировать ]Следующее приложение возникает в контексте анализа Фурье в обработке сигналов , теории восстановления в теории вероятностей и многоантенных систем в беспроводной связи . Общим фактором этих областей является то, что важна сумма экспоненциально распределенных переменных (или, что то же самое, сумма квадратов величин циркулярно-симметричных центрированных комплексных гауссовских переменных).
Если являются k независимыми циклически -симметричными центрированными комплексными гауссовскими случайными величинами со средним значением 0 и дисперсией , то случайная величина
имеет обобщенное распределение хи-квадрат определенной формы. Отличие от стандартного распределения хи-квадрат состоит в том, что являются сложными и могут иметь разные дисперсии, а отличие от более общего обобщенного распределения хи-квадрат заключается в том, что соответствующая масштабирующая матрица A является диагональной. Если для всех я , тогда , уменьшенный на (т.е. умножается на ), имеет распределение хи-квадрат , , также известный как распределение Эрланга . Если имеют разные значения для всех i , тогда есть pdf [7]
Если среди , предположим, что они разделены на M наборов, каждый из которых представляет определенное значение дисперсии. Обозначим количество повторений в каждой группе. То есть m- й набор содержит переменные, которые имеют дисперсию Он представляет собой произвольную линейную комбинацию независимых -распределенные случайные величины с разными степенями свободы:
PDF-файл является [8]
где
с из набора извсе разделы (с ) определяется как
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Дэвис, РБ (1973) Численное обращение характеристической функции. Биометрика , 60 (2), 415–417
- ^ Jump up to: а б Дэвис, РБ (1980) «Алгоритм AS155: распределение линейной комбинации χ 2 случайные величины», Прикладная статистика , 29, 323–333.
- ^ Jump up to: а б Джонс, Д.А. (1983) «Статистический анализ эмпирических моделей, подобранных путем оптимизации», Биометрика , 70 (1), 67–88.
- ^ Jump up to: а б с д и Дас, Абранил; Уилсон С. Гейслер (2020). «Методы интеграции мультинормальных чисел и вычисления мер классификации». arXiv : 2012.14331 [ stat.ML ].
- ^ Jump up to: а б Шейл Дж., О'Мьюиркхартей И. (1977) «Алгоритм AS106: Распределение неотрицательных квадратичных форм в нормальных переменных», Applied Статистика , 26, 92–98.
- ^ Имхоф, JP (1961). «Вычисление распределения квадратичных форм в нормальных переменных» (PDF) . Биометрика . 48 (3/4): 419–426. дои : 10.2307/2332763 . JSTOR 2332763 .
- ^ Д. Хаммарволл, М. Бенгтссон, Б. Оттерстен (2008) «Получение частичного CSI для пространственно-избирательной передачи с помощью мгновенной обратной связи по нормам канала», IEEE Transactions on Signal Processing , 56, 1188–1204
- ^ Э. Бьорнсон, Д. Хаммарволл, Б. Оттерстен (2009) «Использование обратной связи по нормам квантованного канала посредством условной статистики в произвольно коррелированных системах MIMO» , Транзакции IEEE по обработке сигналов , 57, 4027–4041