Таким образом, знак ковариации показывает тенденцию линейной зависимости между переменными. Если более высокие значения одной переменной в основном соответствуют большим значениям другой переменной, и то же самое справедливо для меньших значений (т. е. переменные имеют тенденцию демонстрировать одинаковое поведение), ковариация положительна. [2] В противоположном случае, когда большие значения одной переменной в основном соответствуют меньшим значениям другой (т. е. переменные имеют тенденцию проявлять противоположное поведение), ковариация отрицательна. Величина ковариации представляет собой среднее геометрическое дисперсий, общих для двух случайных величин. Коэффициент корреляции нормализует ковариацию путем деления на среднее геометрическое общих дисперсий для двух случайных величин.
Необходимо проводить различие между (1) ковариацией двух случайных величин, которая является совокупности параметром , который можно рассматривать как свойство совместного распределения вероятностей , и (2) выборочной ковариацией, которая помимо того, что служит дескриптором выборки также служит оценочным значением параметра совокупности.
где ожидаемое значение , также известный как среднее значение . Ковариацию также иногда обозначают или , по аналогии с дисперсией . Используя свойство линейности ожиданий, это можно упростить до ожидаемого значения их продукта минус произведение их ожидаемых значений:
Единицы измерения ковариации являются те из раз больше, чем . Напротив, коэффициенты корреляции , которые зависят от ковариации, являются безразмерной мерой линейной зависимости. (На самом деле коэффициенты корреляции можно понимать просто как нормализованную версию ковариации.)
Если пара (реальных) случайных величин может принимать значения для , с равными вероятностями , то ковариацию можно эквивалентно записать через средние значения и как
Это также можно эквивалентно выразить, без прямой ссылки на средства, как [5]
В более общем плане, если есть возможные реализации , а именно но с возможно неравными вероятностями для , то ковариация равна
В случае, когда две дискретные случайные величины и имеют совместное распределение вероятностей, представленное элементами соответствующие совместным вероятностям , ковариация рассчитывается с помощью двойного суммирования по индексам матрицы:
Рассмотрим 3 независимые случайные величины и две константы .
В частном случае и , ковариация между и , это просто дисперсия и название «ковариантность» вполне уместно.
Геометрическая интерпретация примера ковариации. Каждый кубоид представляет собой выровненную по оси ограничивающую рамку своей точки ( x , y , f ( x , y )), а X и Y означают (пурпурная точка). Ковариация представляет собой сумму объемов кубоидов в 1-м и 3-м квадрантах (красный) минус объемы 2-го и 4-го (синий).
Предположим, что и имеют следующую совместную функцию массы вероятности : [6] в котором шесть центральных ячеек дают дискретные совместные вероятности из шести гипотетических реализаций :
Икс
5
6
7
и
8
0
0.4
0.1
0.5
9
0.3
0
0.2
0.5
0.3
0.4
0.3
1
может принимать три значения (5, 6 и 7), а можно взять двоих (8 и 9). Их средства и . Затем,
Дисперсия : — это частный случай ковариации, при котором две переменные идентичны (то есть, когда одна переменная имеет такое же распределение, как и другая) [4] : 121
Если , , , и являются действительными случайными величинами и являются действительными константами, то следствием определения ковариации являются следующие факты:
Для последовательности случайных величин в вещественных и константах , у нас есть
Случайные величины, ковариация которых равна нулю, называются некоррелированными . [4] : 121 Аналогично, компоненты случайных векторов, чья ковариационная матрица равна нулю в каждой записи за пределами главной диагонали, также называются некоррелированными.
Обратное, однако, в целом неверно. Например, пусть быть равномерно распределены в и разреши . Четко, и не являются независимыми, но
В этом случае отношения между и является нелинейным, а корреляция и ковариация являются мерами линейной зависимости между двумя случайными величинами. Этот пример показывает, что если две случайные величины некоррелированы, это, как правило, не означает, что они независимы. Однако если две переменные совместно нормально распределены (но не в том случае, если они просто нормально распределены по отдельности ), некоррелированность действительно подразумевает независимость. [9]
и ковариация которых положительна, называются положительно коррелированными, что означает, что если тогда вероятно . Наоборот, и с отрицательной ковариацией отрицательно коррелируют, и если тогда вероятно .
Фактически эти свойства подразумевают, что ковариация определяет скалярное произведение в фактор-векторном пространстве , полученное путем взятия подпространства случайных величин с конечным вторым моментом и идентификации любых двух, которые отличаются константой. (Эта идентификация превращает положительную полуопределенность, указанную выше, в положительную определенность.) Это фактор-векторное пространство изоморфно подпространству случайных величин с конечным вторым моментом и средним нулем; в этом подпространстве ковариация равна в точности L 2 внутренний продукт вещественных функций в выборочном пространстве.
В результате для случайных величин с конечной дисперсией неравенство
Выборочные ковариации среди переменные, основанные на наблюдения каждого из них, взятые из ненаблюдаемой популяции, представлены матрица с записями
что является оценкой ковариации между переменной и переменная .
Выборочное среднее и выборочная ковариационная матрица представляют собой несмещенные оценки среднего . и ковариационной матрицы случайного вектора , вектор, j- й элемент которого является одной из случайных величин. Причина, по которой выборочная ковариационная матрица имеет в знаменателе, а не по сути, это то, что население имеет в виду неизвестно и заменяется выборочным средним значением . Если население имеет в виду известна, аналогичная несмещенная оценка дается формулой
Для вектора из совместно распределенные случайные величины с конечными вторыми моментами, их автоковариационная матрица (также известная как дисперсионно-ковариационная матрица или просто ковариационная матрица ) (также обозначается или ) определяется как [10] : 335
Позволять — случайный вектор с ковариационной матрицей Σ , и пусть A — матрица, которая может действовать на слева. Ковариационная матрица произведения матрицы-вектора AX равна:
The -й элемент этой матрицы равен ковариации между i -й скалярной составляющей и j -я скалярная компонента . В частности, это транспонирование .
случайных векторов в действительном или комплексном пространстве гильбертовом Кросс-ковариационная полуторалинейная форма
В общем, пусть и , — гильбертово пространство над или с антилинейный по первой переменной, и пусть быть соотв. ценные случайные величины.
Тогда ковариация и представляет собой полуторалинейную форму на
(антилинейный по первой переменной), определяемый формулой
Ковариацию иногда называют мерой «линейной зависимости» между двумя случайными величинами. Это не означает то же самое, что в контексте линейной алгебры (см. линейную зависимость ). Когда ковариация нормализуется, получается коэффициент корреляции Пирсона , который показывает степень соответствия наилучшей возможной линейной функции, описывающей связь между переменными. В этом смысле ковариация представляет собой линейную меру зависимости.
Ковариация является важной мерой в биологии . Определенные последовательности ДНК более консервативны среди видов, чем другие, и поэтому для изучения вторичных и третичных структур белков или структур РНК последовательности сравнивают у близкородственных видов. ) обнаруживаются изменения последовательности или вообще не обнаруживаются изменения Если в некодирующей РНК (например, микроРНК , то оказывается, что последовательности необходимы для общих структурных мотивов, таких как петля РНК. В генетике ковариация служит основой для расчета матрицы генетических отношений (GRM) (также известной как матрица родства), позволяющей делать выводы о структуре популяции на основе выборки без известных близких родственников, а также делать выводы для оценки наследственности сложных признаков.
В усвоении метеорологических и океанографических данных [ править ]
Ковариационная матрица важна для оценки начальных условий, необходимых для запуска моделей прогноза погоды, — процедуры, известной как ассимиляция данных . «Ковариационная матрица ошибок прогноза» обычно строится на основе возмущений вокруг среднего состояния (климатологического или ансамблевого среднего). «Ковариационная матрица ошибок наблюдения» строится для представления величины комбинированных ошибок наблюдений (по диагонали) и коррелированных ошибок между измерениями (вне диагонали). Это пример его широкого применения для фильтрации Калмана и более общей оценки состояния изменяющихся во времени систем.
Метод вихревой ковариации является ключевым методом измерения атмосферных явлений, при котором ковариация между мгновенным отклонением вертикальной скорости ветра от среднего значения и мгновенным отклонением концентрации газа является основой для расчета вертикальных турбулентных потоков.
^ Юли Чжан; Хуайюй Ву; Лей Ченг (июнь 2012 г.). «Некоторые новые формулы деформации дисперсии и ковариации». Материалы 4-й Международной конференции по моделированию, идентификации и контролю (ICMIC2012) . стр. 987–992.
^ Деккинг, Мишель, изд. (2005). Современное введение в вероятность и статистику: понимание почему и как . Тексты Спрингера в статистике. Лондон [Гейдельберг]: Springer. ISBN 978-1-85233-896-1 .
^ Перейти обратно: а б Губнер, Джон А. (2006). Вероятность и случайные процессы для инженеров-электриков и вычислительной техники . Издательство Кембриджского университета. ISBN 978-0-521-86470-1 .
Arc.Ask3.Ru Номер скриншота №: FA26F4D409696C9FFD750699B602BCC0__1716958380 URL1:https://en.wikipedia.org/wiki/Covariance Заголовок, (Title) документа по адресу, URL1: Covariance - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть, любые претензии не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, денежную единицу можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)