Ковариационная матрица
Часть серии по статистике. |
Корреляция и ковариация |
---|
В теории вероятностей и статистике ( ковариационная матрица также известная как матрица автоковариации , матрица дисперсии , матрица дисперсии или матрица дисперсии-ковариации ) представляет собой квадратную матрицу, дающую ковариацию между каждой парой элементов данного случайного вектора .
Интуитивно, ковариационная матрица обобщает понятие дисперсии на несколько измерений. Например, вариации в наборе случайных точек в двумерном пространстве не могут быть полностью охарактеризованы одним числом, равно как и дисперсии в и инструкции содержат всю необходимую информацию; а матрица будет необходима для полной характеристики двумерного изменения.
Любая ковариационная матрица симметрична и положительно полуопределена , а ее главная диагональ содержит дисперсии (т. е. ковариацию каждого элемента с самим собой).
Ковариационная матрица случайного вектора обычно обозначается , или .
Определение
[ редактировать ]В этой статье жирным шрифтом без подписки и используются для обозначения случайных векторов, а римские индексы и используются для обозначения скалярных случайных величин.
Если записи в вектор-столбце являются случайными величинами , каждая из которых имеет конечную дисперсию и ожидаемое значение , тогда ковариационная матрица матрица, запись - это ковариация [1] : 177 где оператор обозначает ожидаемое значение (среднее значение) своего аргумента.
Противоречивые номенклатуры и обозначения
[ редактировать ]Номенклатуры различаются. Некоторые статистики, вслед за специалистом по теории вероятностей Уильямом Феллером в его двухтомной книге «Введение в теорию вероятностей и ее приложения» , [2] вызвать матрицу дисперсия случайного вектора , потому что это естественное обобщение одномерной дисперсии на более высокие измерения. Другие называют ее ковариационной матрицей , потому что это матрица ковариаций между скалярными компонентами вектора. .
Обе формы вполне стандартны, и между ними нет никакой двусмысленности. Матрица также часто называют дисперсионно-ковариационной матрицей , поскольку диагональные члены на самом деле являются дисперсиями.
Для сравнения, обозначение матрицы взаимной ковариации между двумя векторами имеет вид
Характеристики
[ редактировать ]Связь с матрицей автокорреляции
[ редактировать ]Матрица автоковариации связано с матрицей автокорреляции к где матрица автокорреляции определяется как .
Связь с корреляционной матрицей
[ редактировать ]Объектом, тесно связанным с ковариационной матрицей, является матрица коэффициентов корреляции моментов произведения Пирсона между каждой из случайных величин в случайном векторе. , который можно записать как где – матрица диагональных элементов (т.е. диагональная матрица дисперсий для ).
Эквивалентно, корреляционную матрицу можно рассматривать как ковариационную матрицу стандартизированных случайных величин. для .
Каждый элемент на главной диагонали корреляционной матрицы представляет собой корреляцию случайной величины с самой собой, которая всегда равна 1. Каждый недиагональный элемент находится в диапазоне от -1 до +1 включительно.
Обратная ковариационная матрица
[ редактировать ]Обратная эта матрица, , если она существует, является обратной матрицей ковариации (или обратной матрицей концентрации), также известной как матрица точности (или матрица концентрации ). [3]
Точно так же, как ковариационная матрица может быть записана как масштабирование корреляционной матрицы с помощью предельных отклонений:
Итак, используя идею частичной корреляции и частичной дисперсии, обратную ковариационную матрицу можно выразить аналогичным образом: Эта двойственность мотивирует ряд других двойственностей между маргинализацией и обусловленностью гауссовских случайных величин.
Основные свойства
[ редактировать ]Для и , где это -мерная случайная величина, применяются следующие основные свойства: [4]
- является положительно-полуопределенным , т.е.
- симметричен т.е. ,
- Для любой константы (т.е. неслучайной) матрица и постоянный вектор , у одного есть
- Если — еще один случайный вектор той же размерности, что и , затем где представляет собой перекрестной ковариации матрицу и .
Блочные матрицы
[ редактировать ]Совместное среднее и совместная ковариационная матрица из и можно записать в блочной форме где , и .
и могут быть идентифицированы как матрицы дисперсии предельных распределений для и соответственно.
Если и совместно нормально распределены , то условное распределение для данный дается [5] определяется условным средним и условная дисперсия
Матрица известна как матрица коэффициентов регрессии , а в линейной алгебре является Шура дополнением в .
Матрица коэффициентов регрессии часто может быть представлена в транспонированной форме: , подходит для последующего умножения вектора-строки независимых переменных вместо предварительного умножения вектор-столбца . В таком виде они соответствуют коэффициентам, полученным путем обращения матрицы нормальных уравнений обыкновенного наименьших квадратов (МНК).
Частичная ковариационная матрица
[ редактировать ]Ковариационная матрица со всеми ненулевыми элементами говорит нам, что все отдельные случайные величины взаимосвязаны. Это означает, что переменные не только напрямую коррелируют, но и косвенно коррелируют через другие переменные. Часто такие косвенные синфазные корреляции тривиальны и неинтересны. Их можно подавить, вычислив частичную ковариационную матрицу, то есть часть ковариационной матрицы, которая показывает только интересную часть корреляций.
Если два вектора случайных величин и коррелируются через другой вектор , последние корреляции подавляются в матрице [6] Частичная ковариационная матрица по сути, это простая ковариационная матрица как будто неинтересные случайные величины держались постоянными.
Ковариационная матрица как параметр распределения
[ редактировать ]Если вектор-столбец из возможно, коррелированные случайные величины совместно нормально распределены или, в более общем случае, эллиптически распределены , тогда их функция плотности вероятности может быть выражено через ковариационную матрицу следующее [6] где и является определяющим фактором .
Ковариационная матрица как линейный оператор
[ редактировать ]Применительно к одному вектору ковариационная матрица отображает линейную комбинацию c случайных величин X в вектор ковариаций с этими переменными: . Рассматриваемый как билинейная форма , он дает ковариацию между двумя линейными комбинациями: . Тогда дисперсия линейной комбинации равна , его ковариантность сама с собой.
Аналогичным образом, (псевдо) обратная ковариационная матрица дает внутренний продукт , что вызывает расстояние Махаланобиса , меру «маловероятности» c . [ нужна ссылка ]
Какие матрицы являются ковариационными?
[ редактировать ]Исходя из приведенного выше тождества, пусть быть вектор с действительным знаком, тогда которая всегда должна быть неотрицательной, поскольку это дисперсия действительной случайной величины, поэтому ковариационная матрица всегда является положительно-полуопределенной матрицей .
Приведенный выше аргумент можно расширить следующим образом: где последнее неравенство следует из наблюдения, что является скаляром.
И наоборот, каждая симметричная положительно полуопределенная матрица является ковариационной матрицей. Чтобы увидеть это, предположим это симметричная положительно-полуопределенная матрица. Из конечномерного случая спектральной теоремы следует, что имеет неотрицательный симметричный квадратный корень , который можно обозначить через M 1/2 . Позволять быть любым случайная величина со значением вектора-столбца, ковариационная матрица которой представляет собой идентификационная матрица. Затем
Сложные случайные векторы
[ редактировать ]Дисперсия случайной величины с сложной значением скалярной ожидаемым традиционно определяется с помощью комплексного сопряжения : где комплексно-сопряженное комплексное число обозначается ; таким образом, дисперсия комплексной случайной величины является действительным числом.
Если — вектор-столбец комплекснозначных случайных величин, то сопряженное транспонирование образуется как транспонированием, так и конъюгированием. В следующем выражении произведение вектора на сопряженное с ним транспонирование дает в называемую ковариационной матрицей : качестве математического ожидания квадратную матрицу, [7] : 293 Полученная таким образом матрица будет эрмитовой положительно-полуопределенной , [8] с действительными числами на главной диагонали и комплексными числами вне диагонали.
- Характеристики
- Ковариационная матрица является эрмитовой матрицей , т.е. . [1] : 179
- Диагональные элементы ковариационной матрицы действительны. [1] : 179
Псевдоковариационная матрица
[ редактировать ]Для комплексных случайных векторов другой вид второго центрального момента — матрица псевдоковариации (также называемая матрицей отношений ) определяется следующим образом:
В отличие от ковариационной матрицы, определенной выше, эрмитова транспозиция заменяется транспозицией в определении.Его диагональные элементы могут иметь комплексное значение; это сложная симметричная матрица .
Оценка
[ редактировать ]Если и являются центрированными матрицами данных размерности и соответственно, т. е. с n столбцами наблюдений p и q строк переменных, из которых были вычтены средние значения строк, тогда, если средние значения строк были оценены на основе данных, выборочные ковариационные матрицы и можно определить как или, если средние значения строки были известны априори,
Эти эмпирические выборочные ковариационные матрицы являются наиболее простыми и наиболее часто используемыми оценщиками для ковариационных матриц, но существуют и другие оценки, в том числе регуляризованные или усадочные оценки, которые могут иметь лучшие свойства.
Приложения
[ редактировать ]Ковариационная матрица является полезным инструментом во многих различных областях. Из него матрицу преобразования можно вывести , называемую преобразованием отбеливания , позволяющую полностью декоррелировать данные. [ нужна ссылка ] или, с другой точки зрения, найти оптимальную основу для компактного представления данных. [ нужна ссылка ] ( см. в разделе «Фактор Рэлея» формальное доказательство и дополнительные свойства ковариационных матриц ).Это называется анализом главных компонент (PCA) и преобразованием Карунена-Лоэва (KL-преобразованием).
Ковариационная матрица играет ключевую роль в финансовой экономике , особенно в теории портфеля и ее теореме о разделении взаимных фондов , а также в модели ценообразования капитальных активов . Матрица ковариаций доходности различных активов используется для определения, при определенных допущениях, относительных сумм различных активов, которые инвесторы должны (в нормативном анализе ) или, по прогнозам, (в позитивном анализе ) предпочитают держать в контексте диверсификация .
Использование в оптимизации
[ редактировать ]Стратегия эволюции , особое семейство эвристик рандомизированного поиска, в своем механизме фундаментально опирается на ковариационную матрицу. Оператор характеристической мутации извлекает шаг обновления из многомерного нормального распределения, используя развивающуюся ковариационную матрицу. Существует формальное доказательство того, что ковариационная матрица стратегии эволюции адаптируется к обратной матрице Гессе ландшафта поиска, с точностью до скалярного коэффициента и небольших случайных флуктуаций (доказано для стратегии с одним родителем и статической модели, как численность популяции увеличивается, исходя из квадратичного приближения). [9] Интуитивно этот результат подтверждается тем, что оптимальное ковариационное распределение может предлагать этапы мутации, контуры вероятности эквивалентности которых соответствуют наборам уровней ландшафта, и поэтому они максимизируют скорость прогресса.
Ковариационное отображение
[ редактировать ]При ковариационном отображении значения или матрицы отображаются в виде двумерной карты. Когда векторы и являются дискретными случайными функциями , на карте показаны статистические отношения между различными областями случайных функций. Статистически независимые области функций отображаются на карте как равнины нулевого уровня, а положительные или отрицательные корреляции отображаются соответственно в виде холмов или долин.
На практике векторы-столбцы , и приобретаются экспериментально в виде рядов образцы, например где — i -е дискретное значение в выборке j случайной функции . Ожидаемые значения, необходимые в формуле ковариации, оцениваются с использованием выборочного среднего значения , например а ковариационная матрица оценивается с помощью выборочной ковариационной матрицы где угловые скобки обозначают выборочное усреднение, как и раньше, за исключением того, что поправку Бесселя необходимо внести во избежание систематической ошибки . Используя эту оценку, частичную ковариационную матрицу можно рассчитать как где обратная косая черта обозначает левый оператор деления матрицы , который обходит требование инвертировать матрицу и доступен в некоторых вычислительных пакетах, таких как Matlab . [10]
На рис. 1 показано, как строится карта частичной ковариации на примере эксперимента, проведенного на FLASH лазере на свободных электронах в Гамбурге. [11] Случайная функция представляет собой времяпролетный спектр ионов от кулоновского взрыва молекул азота, многократно ионизированных лазерным импульсом. Поскольку при каждом лазерном импульсе ионизируется всего несколько сотен молекул, спектры одиночных импульсов сильно флуктуируют. Однако сбор обычно такие спектры, , и усредняя их по создает гладкий спектр , который показан красным внизу на рис. 1. Средний спектр обнаруживает несколько ионов азота в виде пиков, уширенных их кинетической энергией, но для нахождения корреляций между стадиями ионизации и импульсами ионов требуется расчет ковариационной карты.
В примере рис. 1 спектры и одинаковы, за исключением того, что диапазон времени пролета отличается. Панель показывает , панель b показывает а панель c показывает их разницу, которая (обратите внимание на изменение цветовой гаммы). К сожалению, эта карта перегружена неинтересными синфазными корреляциями, вызванными колебаниями интенсивности лазера от выстрела к выстрелу. Для подавления таких корреляций интенсивность лазера записывается при каждом выстреле, помещается в и рассчитывается, как показано на панелях d и e . Однако подавление неинтересных корреляций несовершенно, поскольку существуют и другие источники синфазных флуктуаций, кроме интенсивности лазера, и в принципе все эти источники должны контролироваться в векторном режиме. . Однако на практике часто бывает достаточно сверхкомпенсации частичной ковариационной коррекции, как показано на панели f , где теперь ясно видны интересные корреляции импульсов ионов в виде прямых линий, центрированных на стадиях ионизации атомарного азота.
Двумерная инфракрасная спектроскопия
[ редактировать ]Двумерная инфракрасная спектроскопия использует корреляционный анализ для получения двумерных спектров конденсированной фазы . Существует две версии этого анализа: синхронная и асинхронная . Математически первое выражается через выборочную ковариационную матрицу, и этот метод эквивалентен ковариационному картированию. [12]
См. также
[ редактировать ]- Ковариационная функция
- Разложение по собственным значениям
- Матрица Грамиана
- Распределение Левандовски-Куровицки-Джо
- Многомерная статистика
- Основные компоненты
- Квадратичная форма (статистика)
Ссылки
[ редактировать ]- ^ Перейти обратно: а б с Пак, Кун Иль (2018). Основы теории вероятности и случайных процессов с приложениями к средствам связи . Спрингер. ISBN 978-3-319-68074-3 .
- ^ Уильям Феллер (1971). Введение в теорию вероятностей и ее приложения . Уайли. ISBN 978-0-471-25709-7 . Проверено 10 августа 2012 г.
- ^ Вассерман, Ларри (2004). Вся статистика: краткий курс статистических выводов . Спрингер. ISBN 0-387-40272-1 .
- ^ Табога, Марко (2010). «Лекции по теории вероятностей и математической статистике» .
- ^ Итон, Моррис Л. (1983). Многомерная статистика: векторно-пространственный подход . Джон Уайли и сыновья. стр. 116–117. ISBN 0-471-02776-6 .
- ^ Перейти обратно: а б В. Дж. Кржановский «Принципы многомерного анализа» (Oxford University Press, Нью-Йорк, 1988), гл. 14,4; К. В. Мардиа, Дж. Т. Кент и Дж. М. Бибби «Многомерный анализ (Academic Press, Лондон, 1997), глава 6.5.3; Т. В. Андерсон «Введение в многомерный статистический анализ» (Wiley, Нью-Йорк, 2003), 3-е изд., Главы 2.5.1 и 4.3.1.
- ^ Лапидот, Амос (2009). Фонд цифровых коммуникаций . Издательство Кембриджского университета. ISBN 978-0-521-19395-5 .
- ^ Брукс, Майк. «Справочное руководство по матрицам» .
- ^ Шир, ОМ; А. Иегудаев (2020). «О ковариационно-гессианском отношении в эволюционных стратегиях» . Теоретическая информатика . 801 . Эльзевир: 157–174. arXiv : 1806.03674 . дои : 10.1016/j.tcs.2019.09.002 .
- ^ Л. Дж. Фрасински «Методы ковариационного отображения» J. Phys. Б: В. Мол. Опция Физ. 49 152004 (2016), открытый доступ
- ^ Перейти обратно: а б О. Корнилов, М. Экстайн, М. Розенблатт, К. П. Шульц, К. Мотомура, А. Рузе, Дж. Клей, Л. Фукар, М. Сиано, А. Любке, Ф. Шаппер, П. Йонссон, DMP Holland, Т. Шлатхольтер, Т. Марченко, С. Дюстерер, К. Уэда, М. Дж. Враккинг и Л. Дж. Фрасински «Кулоновский взрыв двухатомных молекул в интенсивных XUV-полях, отображенный с помощью частичной ковариации» J. Phys. Б: В. Мол. Опция Физ. 46 164028 (2013), открытый доступ
- ^ I Нода «Обобщенный метод двумерной корреляции, применимый к инфракрасной, рамановской и другим типам спектроскопии» Прикл. Спектроск. 47 1329–36 (1993)
Дальнейшее чтение
[ редактировать ]- «Ковариационная матрица» , Математическая энциклопедия , EMS Press , 2001 [1994]
- « Ковариационная матрица с иллюстрациями » — простой способ визуализировать ковариационные матрицы!
- Вайсштейн, Эрик В. «Ковариационная матрица» . Математический мир .
- ван Кампен, НГ (1981). Случайные процессы в физике и химии . Нью-Йорк: Северная Голландия. ISBN 0-444-86200-5 .