дополнение Шура
Дополнение Шура блочной матрицы , встречающееся в линейной алгебре и теории матриц , определяется следующим образом.
Предположим, что p , q — неотрицательные целые числа такие, что p + q > 0 , и предположим, что A , B , C , D — соответственно p × p , p × q , q × p и q × q матрицы комплексных чисел. Позволять так что M — матрица ( p + q ) × ( p + q ).
Если D обратим, то дополнение Шура к блоку D матрицы M представляет собой матрицу p × p , определяемую формулой Если A обратим, дополнение Шура к блоку A матрицы M представляет собой матрицу q × q , определяемую формулой В случае, когда , замена обратных для A или D сингулярны M обобщенным / A и M/D обратным дает обобщенное дополнение Шура .
Дополнение Шура названо в честь Иссая Шура. [1] который использовал его для доказательства леммы Шура , хотя он использовался ранее. [2] Эмили Вирджиния Хейнсворт была первой, кто назвал это дополнением Шура . [3] Дополнение Шура — ключевой инструмент в области численного анализа, статистики и матричного анализа.Дополнение Шура иногда называют картой Фешбаха в честь физика Германа Фешбаха . [4]
Фон
[ редактировать ]Дополнение Шура возникает при выполнении блочного исключения Гаусса на матрице M . Чтобы исключить элементы ниже диагонали блока, матрицу M умножают на блочную нижнюю треугольную матрицу справа следующим образом: где I p обозначает p × p единичную матрицу размера . В результате дополнение Шура появляется в верхнем левом блоке p × p .
Продолжая процесс исключения за этой точкой (т. е. выполняя блок исключения Гаусса–Жордана ), приводит к LDU-разложению M читается , которое Таким образом, обратное к M может быть выражено с использованием D −1 и обратное дополнение Шура, если оно существует, как Вышеуказанная связь возникает в результате операций исключения, в которых участвуют D −1 и М/Д . роли A и D. Эквивалентный вывод можно сделать , поменяв местами Приравнивая выражения для M −1 Полученные этими двумя разными способами, можно установить лемму об обращении матрицы , которая связывает два дополнения Шура к M : M/D и M/A (см. «Вывод из разложения LDU» в матричном тождестве Вудбери § Альтернативные доказательства ).
Характеристики
[ редактировать ]- Если p и q оба равны 1 (т. е. A , B , C и D являются скалярами), мы получаем знакомую формулу для обратной матрицы 2х2:
- при условии, что AD − BC не равно нулю.
- В общем случае, если A обратимо, то
- всякий раз, когда это обратное существует.
- (Формула Шура) Когда A , соответственно D , обратимы, также ясно видно, что определитель M определяется выражением
- , соответственно
- ,
- которая обобщает определительную формулу для матриц 2 × 2.
- (Формула аддитивности ранга Гуттмана) Если обратим , то ранг M D определяется выражением
- ( Формула аддитивности инерции Хейнсворта ) Если A обратима, то инерция блочной матрицы M равна инерции A плюс инерция M / A .
- (частное тождество) . [5]
- Дополнение Шура к матрице Лапласа также является матрицей Лапласа. [6]
Приложение к решению линейных уравнений
[ редактировать ]Дополнение Шура естественным образом возникает при решении системы линейных уравнений, таких как [7]
.
Предполагая, что подматрица обратимо, мы можем устранить из уравнений следующим образом.
Подставив это выражение во второе уравнение, получим
Мы называем это приведенным уравнением, полученным путем исключения из исходного уравнения. Матрица, входящая в приведенное уравнение, называется дополнением Шура первого блока. в :
- .
Решая приведенное уравнение, получаем
Подставив это в первое уравнение, получим
Мы можем выразить два приведенных выше уравнения как:
Следовательно, формулировка обратной блочной матрицы такова:
В частности, мы видим, что дополнение Шура является обратным дополнению Шура. заблокировать ввод обратного значения .
На практике нужно быть хорошо обусловленным , чтобы этот алгоритм был численно точным.
Этот метод полезен в электротехнике для уменьшения размерности уравнений сети. Это особенно полезно, когда элементы выходного вектора равны нулю. Например, когда или равно нулю, мы можем исключить соответствующие строки матрицы коэффициентов без каких-либо изменений в остальной части выходного вектора. Если равно нулю, то приведенное выше уравнение для сводится к , тем самым уменьшая размерность матрицы коэффициентов, оставляя неизмененный. Это используется с успехом в электротехнике, где это называется устранением узла или уменьшением Крона .
Приложения к теории вероятностей и статистике
[ редактировать ]Предположим, что случайные векторы-столбцы X , Y живут в R н и Р м соответственно, а вектор ( X , Y ) в R п + м имеет многомерное нормальное распределение , ковариация которого представляет собой симметричную положительно определенную матрицу
где - ковариационная матрица X , - ковариационная матрица Y и ковариационная матрица между X и Y. —
Тогда условная ковариация X Y условии при является дополнением Шура к C в : [8]
Если мы возьмем матрицу Если выше, это не ковариация случайного вектора, а выборочная ковариация, то она может иметь распределение Уишарта . В этом случае дополнение Шура к C в также имеет дистрибутив Wishart. [ нужна ссылка ]
Условия положительной определенности и полуопределенности.
[ редактировать ]Пусть X — симметричная матрица действительных чисел, заданная формулой Затем
- Если A обратим, то X положительно определен тогда и только тогда, когда A и его дополнение X/A оба положительно определены: [2] : 34
- Если C обратим, то X положительно определен тогда и только тогда, когда C и его дополнение X/C оба положительно определены:
- Если A положительно определен, то X положительно полуопределенен тогда и только тогда, когда дополнение X/A положительно полуопределено: [2] : 34
- Если C положительно определен, то X положительно полуопределенен тогда и только тогда, когда дополнение X/C положительно полуопределено:
Первое и третье утверждения можно вывести [7] рассматривая минимизатор величины как функция v (при фиксированном u ).
Кроме того, поскольку и аналогично для положительных полуопределенных матриц второе (соответственно четвертое) утверждение является непосредственным из первого (соответственно третьего) утверждения.
Существует также достаточное и необходимое условие положительной полуопределенности X в терминах обобщенного дополнения Шура. [2] Именно так,
- и
где обозначает обобщенную инверсию .
См. также
[ редактировать ]- Матричное тождество Вудбери
- Квазиньютоновский метод
- Формула аддитивности инерции Хейнсворта
- Гауссов процесс
- Всего наименьших квадратов
Ссылки
[ редактировать ]- ^ Шур, Дж. (1917). «О степенных рядах, ограниченных внутри единичного круга» . Ж. Чистая и прикладная математика . 147 : 205–232. дои : 10.1515/crll.1917.147.205 .
- ↑ Перейти обратно: Перейти обратно: а б с д Чжан, Фучжэнь (2005). Чжан, Фучжэнь (ред.). Дополнение Шура и его приложения . Численные методы и алгоритмы. Том. 4. Спрингер. дои : 10.1007/b105056 . ISBN 0-387-24271-6 .
- ^ Хейнсворт, Э.В., «О дополнении Шура», Базельские математические заметки , # BNB 20, 17 страниц, июнь 1968 г.
- ^ Фешбах, Герман (1958). «Единая теория ядерных реакций». Анналы физики . 5 (4): 357–390. дои : 10.1016/0003-4916(58)90007-1 .
- ^ Крэбтри, Дуглас Э.; Хейнсворт, Эмили В. (1969). «Тождество для дополнения Шура матрицы» . Труды Американского математического общества . 22 (2): 364–366. дои : 10.1090/S0002-9939-1969-0255573-1 . ISSN 0002-9939 . S2CID 122868483 .
- ^ Девриендт, Карел (2022). «Эффективное сопротивление — это больше, чем расстояние: лапласианцы, симплики и дополнение Шура» . Линейная алгебра и ее приложения . 639 : 24–49. arXiv : 2010.04521 . дои : 10.1016/j.laa.2022.01.002 . S2CID 222272289 .
- ↑ Перейти обратно: Перейти обратно: а б Бойд С. и Ванденбергхе Л. (2004), «Выпуклая оптимизация», Cambridge University Press (Приложение A.5.5)
- ^ фон Мизес, Рихард (1964). «Глава VIII.9.3». Математическая теория вероятностей и статистика . Академическая пресса. ISBN 978-1483255385 .