Ковариационная матрица

Из Википедии, бесплатной энциклопедии

Двумерная гауссова функция плотности вероятности с центром в точке (0, 0) с ковариационной матрицей, заданной выражением
Точки выборки из двумерного распределения Гаусса со стандартным отклонением 3 примерно в нижнем левом – верхнем правом направлении и 1 в ортогональном направлении. Поскольку компоненты x и y изменяются совместно, дисперсии и не полностью описывают распространение. А необходима ковариационная матрица; направления стрелок соответствуют собственным векторам этой ковариационной матрицы, а их длины — квадратным корням собственных значений .

В теории вероятностей и статистике ковариационная матрица (также известная как матрица автоковариации , матрица дисперсии , матрица дисперсии или матрица дисперсии-ковариации ) представляет собой квадратную матрицу , дающую ковариацию между каждой парой элементов данного случайного вектора .

Интуитивно, ковариационная матрица обобщает понятие дисперсии на несколько измерений. Например, вариации в наборе случайных точек в двумерном пространстве не могут быть полностью охарактеризованы одним числом, равно как и дисперсии в и инструкции содержат всю необходимую информацию; а матрица будет необходима для полной характеристики двумерного изменения.

Любая ковариационная матрица симметрична и положительно полуопределена , а ее главная диагональ содержит дисперсии (т. е. ковариацию каждого элемента с самим собой).

Ковариационная матрица случайного вектора обычно обозначается , или .

Определение [ править ]

В этой статье жирным шрифтом без подписки и используются для обозначения случайных векторов, а римские индексы и используются для обозначения скалярных случайных величин.

Если записи в вектор-столбце

являются случайными величинами , каждая из которых имеет конечную дисперсию и ожидаемое значение , тогда ковариационная матрица матрица, запись - это ковариация [1] : 177 
где оператор обозначает ожидаемое значение (среднее значение) своего аргумента.

Противоречивые номенклатуры и обозначения [ править ]

Номенклатуры различаются. Некоторые статистики, вслед за специалистом по теории вероятностей Уильямом Феллером в его двухтомной книге « Введение в теорию вероятностей и ее приложения» , [2] вызвать матрицу дисперсия вектора случайного , потому что это естественное обобщение одномерной дисперсии на более высокие измерения. Другие называют ее ковариационной матрицей , потому что это матрица ковариаций между скалярными компонентами вектора. .

Обе формы вполне стандартны, и между ними нет никакой двусмысленности. Матрица также часто называют дисперсионно-ковариационной матрицей , поскольку диагональные члены на самом деле являются дисперсиями.

Для сравнения, обозначение матрицы взаимной ковариации между двумя векторами имеет вид

Свойства [ править ]

Связь с матрицей автокорреляции [ править ]

Матрица автоковариации связано с матрицей автокорреляции к

где матрица автокорреляции определяется как .

корреляционной матрицей Связь с

Объектом, тесно связанным с ковариационной матрицей, является матрица коэффициентов корреляции моментов произведения Пирсона между каждой из случайных величин в случайном векторе. , который можно записать как

где – матрица диагональных элементов (т.е. диагональная матрица дисперсий для ).

Эквивалентно, корреляционную матрицу можно рассматривать как ковариационную матрицу стандартизированных случайных величин. для .

Каждый элемент на главной диагонали корреляционной матрицы представляет собой корреляцию случайной величины с самой собой, которая всегда равна 1. Каждый недиагональный элемент находится в диапазоне от -1 до +1 включительно.

ковариационная матрица Обратная

Обратная эта матрица, , если она существует, является обратной матрицей ковариации (или обратной матрицей концентрации), также известной как матрица точности (или матрица концентрации ). [3]

Точно так же, как ковариационная матрица может быть записана как масштабирование корреляционной матрицы с помощью предельных отклонений:

Итак, используя идею частичной корреляции и частичной дисперсии, обратную ковариационную матрицу можно выразить аналогичным образом:

Эта двойственность мотивирует ряд других двойственностей между маргинализацией и обусловленностью гауссовских случайных величин.

Основные свойства [ править ]

Для и , где это -мерная случайная величина, применяются следующие основные свойства: [4]

  1. является положительно-полуопределенным , т.е.
  2. симметричен т.е. ,
  3. Для любой константы (т.е. неслучайной) матрица и постоянный вектор , надо
  4. Если — еще один случайный вектор той же размерности, что и , затем где представляет собой перекрестной ковариации матрицу и .

Блочные матрицы [ править ]

Совместное среднее и совместная ковариационная матрица из и можно записать в блочной форме

где , и .

и могут быть идентифицированы как матрицы дисперсии предельных распределений для и соответственно.

Если и распределены совместно нормально ,

то условное распределение для данный дан кем-то [5]
определяется условным средним
и условная дисперсия

Матрица известна как матрица коэффициентов регрессии , а в линейной алгебре является Шура дополнением в .

Матрица коэффициентов регрессии часто может быть представлена ​​в транспонированной форме: , подходит для последующего умножения вектора-строки независимых переменных вместо предварительного умножения вектор-столбца . В таком виде они соответствуют коэффициентам, полученным путем обращения матрицы нормальных уравнений обыкновенного наименьших квадратов (МНК).

Матрица частичной ковариации [ править ]

Ковариационная матрица со всеми ненулевыми элементами говорит нам, что все отдельные случайные величины взаимосвязаны. Это означает, что переменные не только напрямую коррелируют, но и косвенно коррелируют через другие переменные. Часто такие косвенные синфазные корреляции тривиальны и неинтересны. Их можно подавить, вычислив частичную ковариационную матрицу, то есть часть ковариационной матрицы, которая показывает только интересную часть корреляций.

Если два вектора случайных величин и коррелируются через другой вектор , последние корреляции подавляются в матрице [6]

Частичная ковариационная матрица по сути, это простая ковариационная матрица как будто неинтересные случайные величины держались постоянными.

распределения как параметр Ковариационная матрица

Если вектор-столбец из возможно, коррелированные случайные величины совместно нормально распределены или, в более общем случае, эллиптически распределены , тогда ее функция плотности вероятности может быть выражено через ковариационную матрицу следующее [6]

где и является определяющим фактором .

Ковариационная матрица как линейный оператор [ править ]

Применительно к одному вектору ковариационная матрица отображает линейную комбинацию c случайных величин X в вектор ковариаций с этими переменными: . Рассматриваемый как билинейная форма , он дает ковариацию между двумя линейными комбинациями: . Тогда дисперсия линейной комбинации равна , его ковариантность сама с собой.

Аналогичным образом, (псевдо) обратная ковариационная матрица дает внутренний продукт , что вызывает расстояние Махаланобиса , меру «маловероятности» c . [ нужна цитата ]

Какие матрицы являются ковариационными? [ редактировать ]

Исходя из приведенного выше тождества, пусть быть вектор с действительным знаком, тогда

которая всегда должна быть неотрицательной, поскольку это дисперсия действительной случайной величины, поэтому ковариационная матрица всегда является положительно-полуопределенной матрицей .

Приведенный выше аргумент можно расширить следующим образом:

где последнее неравенство следует из наблюдения, что является скаляром.

И наоборот, каждая симметричная положительно полуопределенная матрица является ковариационной матрицей. Чтобы увидеть это, предположим это симметричная положительно-полуопределенная матрица. Из конечномерного случая спектральной теоремы следует, что имеет неотрицательный симметричный квадратный корень , который можно обозначить через M 1/2 . Позволять быть любым случайная величина со значением вектора-столбца, ковариационная матрица которой представляет собой единичная матрица. Затем

Сложные случайные векторы [ править ]

Дисперсия значением сложной случайной величины с скалярной ожидаемым традиционно определяется с помощью комплексного сопряжения :

где комплексно-сопряженное комплексное число обозначается ; таким образом, дисперсия комплексной случайной величины является действительным числом.

Если — вектор-столбец комплексных случайных величин, то сопряженное транспонирование образуется как транспонированием, так и конъюгированием. В следующем выражении произведение вектора на сопряженное с ним транспонирование дает в называемую ковариационной матрицей : качестве математического ожидания квадратную матрицу, [7] : 293 

Полученная таким образом матрица будет эрмитовой положительно-полуопределенной , [8] с действительными числами на главной диагонали и комплексными числами вне диагонали.

Характеристики
  • Ковариационная матрица является эрмитовой матрицей , т.е. . [1] : 179 
  • Диагональные элементы ковариационной матрицы действительны. [1] : 179 

Матрица псевдоковариации [ править ]

Для комплексных случайных векторов другой вид второго центрального момента — матрица псевдоковариации (также называемая матрицей отношений ) определяется следующим образом:

В отличие от ковариационной матрицы, определенной выше, эрмитова транспозиция заменяется транспозицией в определении. Его диагональные элементы могут иметь комплексное значение; это сложная симметричная матрица .

Оценка [ править ]

Если и являются центрированными матрицами данных размерности и соответственно, т. е. с n столбцами наблюдений за p и q строками переменных, из которых были вычтены средние значения строк, тогда, если средние значения строк были оценены на основе данных, выборочные ковариационные матрицы и можно определить как

или, если средние значения строки были известны априори,

Эти ковариационные матрицы эмпирической выборки являются наиболее простыми и наиболее часто используемыми оценщиками ковариационных матриц, но существуют и другие оценки, в том числе регуляризованные оценки или оценки сжатия, которые могут иметь лучшие свойства.

Приложения [ править ]

Ковариационная матрица является полезным инструментом во многих различных областях. Из него матрицу преобразования можно вывести , называемую преобразованием отбеливания , позволяющую полностью декоррелировать данные. [ нужна цитата ] или, с другой точки зрения, найти оптимальную основу для компактного представления данных. [ нужна цитата ] ( см. в разделе «Фактор Рэлея» формальное доказательство и дополнительные свойства ковариационных матриц ). Это называется анализом главных компонент (PCA) и преобразованием Карунена-Лоэва (KL-преобразованием).

Ковариационная матрица играет ключевую роль в финансовой экономике , особенно в теории портфеля и ее теореме о разделении взаимных фондов , а также в модели ценообразования капитальных активов . Матрица ковариаций доходности различных активов используется для определения, при определенных допущениях, относительных сумм различных активов, которые инвесторы должны (в нормативном анализе ) или, по прогнозам, (в позитивном анализе ) предпочитают держать в контексте диверсификация .

Использование в оптимизации [ править ]

Стратегия эволюции , особое семейство эвристик рандомизированного поиска, в своем механизме фундаментально опирается на ковариационную матрицу. Оператор характеристической мутации извлекает шаг обновления из многомерного нормального распределения, используя развивающуюся ковариационную матрицу. Существует формальное доказательство того, что ковариационная матрица стратегии эволюции адаптируется к обратной матрице Гессе ландшафта поиска, с точностью до скалярного коэффициента и небольших случайных флуктуаций (доказано для стратегии с одним родителем и статической модели, как численность популяции увеличивается, исходя из квадратичного приближения). [9] Интуитивно этот результат подтверждается тем, что оптимальное ковариационное распределение может предлагать этапы мутации, контуры вероятности эквивалентности которых соответствуют наборам уровней ландшафта, и поэтому они максимизируют скорость прогресса.

Ковариационное отображение [ править ]

При ковариационном отображении значения или матрицы отображаются в виде двумерной карты. Когда векторы и являются дискретными случайными функциями , на карте показаны статистические отношения между различными областями случайных функций. Статистически независимые области функций отображаются на карте как равнины нулевого уровня, а положительные или отрицательные корреляции отображаются соответственно в виде холмов или долин.

На практике векторы-столбцы , и приобретаются экспериментально в виде рядов образцы, например

где - е — i дискретное значение в выборке j случайной функции . Ожидаемые значения, необходимые в формуле ковариации, оцениваются с использованием выборочного среднего значения , например
а ковариационная матрица оценивается с помощью выборочной ковариационной матрицы
где угловые скобки обозначают выборочное усреднение, как и раньше, за исключением того, что поправку Бесселя необходимо внести во избежание систематической ошибки . Используя эту оценку, матрицу частичной ковариации можно рассчитать как
где обратная косая черта обозначает левый оператор деления матрицы , который обходит требование инвертировать матрицу и доступен в некоторых вычислительных пакетах, таких как Matlab . [10]

Рисунок 1: Построение карты частичной ковариации молекул N 2 , подвергающихся кулоновскому взрыву, вызванному лазером на свободных электронах. [11] Панели a и b отображают два члена ковариационной матрицы, которая показана на панели c . Панель d отображает синфазные корреляции через флуктуации интенсивности лазера. Панель e отображает матрицу частичной ковариации, в которую исправлены флуктуации интенсивности. Панель f показывает, что 10%-ная чрезмерная коррекция улучшает карту и делает ион-ионные корреляции четко видимыми. Благодаря сохранению импульса эти корреляции выглядят как линии, приблизительно перпендикулярные линии автокорреляции (и периодическим модуляциям, вызываемым звоном детектора).

На рис. 1 показано, как строится карта частичной ковариации на примере эксперимента, проведенного на FLASH лазере на свободных электронах в Гамбурге. [11] Случайная функция представляет собой времяпролетный спектр ионов от кулоновского взрыва молекул азота, многократно ионизированных лазерным импульсом. Поскольку при каждом лазерном импульсе ионизируется всего несколько сотен молекул, спектры одиночных импульсов сильно флуктуируют. Однако сбор обычно такие спектры, , и усредняя их по создает гладкий спектр , который показан красным внизу на рис. 1. Средний спектр обнаруживает несколько ионов азота в виде пиков, уширенных их кинетической энергией, но для нахождения корреляций между стадиями ионизации и импульсами ионов требуется расчет ковариационной карты.

В примере рис. 1 спектры и одинаковы, за исключением того, что диапазон времени пролета отличается. Панель показывает , панель b показывает а панель c показывает их разницу, которая (обратите внимание на изменение цветовой гаммы). К сожалению, эта карта перегружена неинтересными синфазными корреляциями, вызванными колебаниями интенсивности лазера от выстрела к выстрелу. Для подавления таких корреляций интенсивность лазера записывается при каждом выстреле, помещается в и рассчитывается, как показано на панелях d и e . Однако подавление неинтересных корреляций несовершенно, поскольку существуют и другие источники синфазных флуктуаций, кроме интенсивности лазера, и в принципе все эти источники должны контролироваться в векторном режиме. . Тем не менее, на практике часто бывает достаточно сверхкомпенсации частичной ковариационной коррекции, как показано на панели f , где теперь ясно видны интересные корреляции импульсов ионов в виде прямых линий, центрированных на стадиях ионизации атомарного азота.

Двумерная спектроскопия инфракрасная

Двумерная инфракрасная спектроскопия использует корреляционный анализ для получения двумерных спектров конденсированной фазы . Существует две версии этого анализа: синхронная и асинхронная . Математически первое выражается через выборочную ковариационную матрицу, и этот метод эквивалентен ковариационному картированию. [12]

См. также [ править ]

Ссылки [ править ]

  1. ^ Перейти обратно: а б с Пак, Кун Иль (2018). Основы теории вероятности и случайных процессов с приложениями к средствам связи . Спрингер. ISBN  978-3-319-68074-3 .
  2. ^ Уильям Феллер (1971). Введение в теорию вероятностей и ее приложения . Уайли. ISBN  978-0-471-25709-7 . Проверено 10 августа 2012 г.
  3. ^ Вассерман, Ларри (2004). Вся статистика: краткий курс статистических выводов . Спрингер. ISBN  0-387-40272-1 .
  4. ^ Табога, Марко (2010). «Лекции по теории вероятностей и математической статистике» .
  5. ^ Итон, Моррис Л. (1983). Многомерная статистика: векторно-пространственный подход . Джон Уайли и сыновья. стр. 116–117. ISBN  0-471-02776-6 .
  6. ^ Перейти обратно: а б В. Дж. Кржановский «Принципы многомерного анализа» (Oxford University Press, Нью-Йорк, 1988), гл. 14,4; К. В. Мардиа, Дж. Т. Кент и Дж. М. Бибби «Многомерный анализ» (Academic Press, Лондон, 1997), глава 6.5.3; Т. В. Андерсон «Введение в многомерный статистический анализ» (Wiley, Нью-Йорк, 2003), 3-е изд., Главы 2.5.1 и 4.3.1.
  7. ^ Лапидот, Амос (2009). Фонд цифровых коммуникаций . Издательство Кембриджского университета. ISBN  978-0-521-19395-5 .
  8. ^ Брукс, Майк. «Справочное руководство по матрицам» .
  9. ^ Шир, ОМ; А. Иегудаев (2020). «О ковариационно-гессианском отношении в эволюционных стратегиях» . Теоретическая информатика . 801 . Эльзевир: 157–174. arXiv : 1806.03674 . дои : 10.1016/j.tcs.2019.09.002 .
  10. ^ Л. Дж. Фрасински «Методы ковариационного отображения» J. Phys. Летучая мышь. Мол. Опция Физ. 49 152004 (2016), открытый доступ
  11. ^ Перейти обратно: а б Корнилов О, Экстайн М, Розенблатт М, Шульц К.П., Мотомура К., Рузе А, Клей Дж., Фукар Л., Сиано, Любке А., Шаппер Ф., Джонссон П., DMP Holland, Шлатхольтер Т., Марченко Т., Дюстерер С., К. Уеда, MJJ Vrakking и LJ Frasinski «Кулоновский взрыв двухатомных молекул в интенсивных XUV-полях, отображенный с помощью частичной ковариации» J. Phys. Летучая мышь. Мол. Опция Физ. 46 164028 (2013), Открытый доступ
  12. ^ I Нода «Обобщенный метод двумерной корреляции, применимый к инфракрасной, рамановской и другим типам спектроскопии» Прикл. Спектроск. 47 1329–36 (1993)

Дальнейшее чтение [ править ]