Формула Якоби

В исчислении матричном Якоби выражает производную определителя A. матрицы A через сопряженное число A производную и формула ^{[ 1 ]}

Если $A$ — дифференцируемое отображение действительных чисел в $матрицы размера n \times n$ , то

{\frac {d}{dt}}\det A(t)=\operatorname {tr} \left(\operatorname {adj} (A(t))\,{\frac {dA(t)}{dt}}\right)=\left(\det A(t)\right)\cdot \operatorname {tr} \left(A(t)^{-1}\cdot \,{\frac {dA(t)}{dt}}\right)

где $tr(X)$ — след матрицы $X$ и $\operatorname {adj} (X)$ является его сопряженной матрицей . (Последнее равенство справедливо только в том случае, если A ( t ) обратимо .)

В качестве частного случая

{\partial \det(A) \over \partial A_{ij}}=\operatorname {adj} (A)_{ji}.

Эквивалентно, если $dA$ означает дифференциал A $:$ , общая формула будет такой

d\det(A)=\operatorname {tr} (\operatorname {adj} (A)\,dA).

Формула названа в честь математика Карла Густава Якоба Якоби .

Вывод

Через матричное вычисление

Теорема. (Формула Якоби) Для любого дифференцируемого отображения A действительных чисел в n × n матрицы размера

d\det(A)=\operatorname {tr} (\operatorname {adj} (A)\,dA).

Доказательство. Формулу Лапласа для определителя матрицы A можно записать как

\det(A)=\sum _{j}A_{ij}\operatorname {adj} ^{\rm {T}}(A)_{ij}.

Обратите внимание, что суммирование выполняется по некоторой произвольной строке i матрицы.

Определитель A можно рассматривать как функцию элементов A :

\det(A)=F\,(A_{11},A_{12},\ldots ,A_{21},A_{22},\ldots ,A_{nn})

так что по правилу цепочки его дифференциал равен

d\det(A)=\sum _{i}\sum _{j}{\partial F \over \partial A_{ij}}\,dA_{ij}.

Это суммирование выполняется по всем n × n элементам матрицы.

Чтобы найти ∂ F /∂ A _ij, учтите, что в правой части формулы Лапласа индекс i можно выбрать по желанию. (В целях оптимизации вычислений: любой другой выбор в конечном итоге даст тот же результат, но это может быть намного сложнее). В частности, его можно выбрать так, чтобы он соответствовал первому индексу ∂/∂ A _ij :

{\partial \det(A) \over \partial A_{ij}}={\partial \sum _{k}A_{ik}\operatorname {adj} ^{\rm {T}}(A)_{ik} \over \partial A_{ij}}=\sum _{k}{\partial (A_{ik}\operatorname {adj} ^{\rm {T}}(A)_{ik}) \over \partial A_{ij}}

Таким образом, по правилу произведения

{\partial \det(A) \over \partial A_{ij}}=\sum _{k}{\partial A_{ik} \over \partial A_{ij}}\operatorname {adj} ^{\rm {T}}(A)_{ik}+\sum _{k}A_{ik}{\partial \operatorname {adj} ^{\rm {T}}(A)_{ik} \over \partial A_{ij}}.

Теперь, если элемент матрицы A _ij и кофактор adj ^Т( A ) _ik элемента A _ik лежат в одной строке (или столбце), то сомножитель не будет функцией A _ij , поскольку сомножитель A _ik выражается через элементы, находящиеся не в его собственной строке (или столбце) ). Таким образом,

{\partial \operatorname {adj} ^{\rm {T}}(A)_{ik} \over \partial A_{ij}}=0,

так

{\partial \det(A) \over \partial A_{ij}}=\sum _{k}\operatorname {adj} ^{\rm {T}}(A)_{ik}{\partial A_{ik} \over \partial A_{ij}}.

Все элементы A независимы друг от друга, т.е.

{\partial A_{ik} \over \partial A_{ij}}=\delta _{jk},

где δ — дельта Кронекера , поэтому

{\partial \det(A) \over \partial A_{ij}}=\sum _{k}\operatorname {adj} ^{\rm {T}}(A)_{ik}\delta _{jk}=\operatorname {adj} ^{\rm {T}}(A)_{ij}.

Поэтому,

d(\det(A))=\sum _{i}\sum _{j}\operatorname {adj} ^{\rm {T}}(A)_{ij}\,dA_{ij}=\sum _{j}\sum _{i}\operatorname {adj} (A)_{ji}\,dA_{ij}=\sum _{j}(\operatorname {adj} (A)\,dA)_{jj}=\operatorname {tr} (\operatorname {adj} (A)\,dA).\ \square

По цепному правилу

Лемма 1. $\det '(I)=\mathrm {tr}$ , где $\det '$ является дифференциалом $\det$ .

Это уравнение означает, что дифференциал $\det$ , оцененный по единичной матрице, равен следу. Дифференциал $\det '(I)$ — линейный оператор, отображающий матрицу размера n × n в действительное число.

Доказательство. Используя определение производной по направлению вместе с одним из ее основных свойств для дифференцируемых функций, мы имеем

\det '(I)(T)=\nabla _{T}\det(I)=\lim _{\varepsilon \to 0}{\frac {\det(I+\varepsilon T)-\det I}{\varepsilon }}

$\det(I+\varepsilon T)$ является полиномом по $\varepsilon$ порядка n . Он тесно связан с характеристическим полиномом $T$ . Постоянный член в этом многочлене (член с $\varepsilon =0$ ) равен 1, а линейный член в $\varepsilon$ является $\mathrm {tr} \ T$ .

Лемма 2. Для обратимой матрицы A имеем: $\det '(A)(T)=\det A\;\mathrm {tr} (A^{-1}T)$ .

Доказательство. Рассмотрим следующую функцию X :

\det X=\det(AA^{-1}X)=\det(A)\ \det(A^{-1}X)

Вычисляем дифференциал $\det X$ и оценить его в $X=A$ используя лемму 1, приведенное выше уравнение и правило цепочки:

\det '(A)(T)=\det A\ \det '(I)(A^{-1}T)=\det A\ \mathrm {tr} (A^{-1}T)

Теорема. (формула Якоби) ${\frac {d}{dt}}\det A=\mathrm {tr} \left(\mathrm {adj} \ A{\frac {dA}{dt}}\right)$

Доказательство. Если $A$ обратима по лемме 2, причем $T=dA/dt$

{\frac {d}{dt}}\det A=\det A\;\mathrm {tr} \left(A^{-1}{\frac {dA}{dt}}\right)=\mathrm {tr} \left(\mathrm {adj} \ A\;{\frac {dA}{dt}}\right)

используя уравнение, адъюгат связывающее $A$ к $A^{-1}$ . Теперь формула справедлива для всех матриц, поскольку множество обратимых линейных матриц плотно в пространстве матриц.

Через диагонализацию

Обе части формулы Якоби являются полиномами от матрицы коэффициенты при $А$ и $А'$ . Поэтому достаточно для проверки полиномиального тождества на плотном подмножестве где собственные значения $A$ различны и отличны от нуля.

Если $фактор А$ дифференцированно $A=BC$ , затем

\mathrm {tr} (A^{-1}A')=\mathrm {tr} ((BC)^{-1}(BC)')=\mathrm {tr} (B^{-1}B')+\mathrm {tr} (C^{-1}C').

В частности, если $L$ обратима, то $I=L^{-1}L$ и

0=\mathrm {tr} (I^{-1}I')=\mathrm {tr} (L(L^{-1})')+\mathrm {tr} (L^{-1}L').

Поскольку $A$ имеет различные собственные значения, существует дифференцируемая комплексная обратимая матрица $L$ такая, что $A=L^{-1}DL$ и $D$ – диагональ. Затем

\mathrm {tr} (A^{-1}A')=\mathrm {tr} (L(L^{-1})')+\mathrm {tr} (D^{-1}D')+\mathrm {tr} (L^{-1}L')=\mathrm {tr} (D^{-1}D').

Позволять $\lambda _{i}$ , $i=1,\ldots ,n$ быть собственными значениями $A$ . Затем

{\frac {\det(A)'}{\det(A)}}=\sum _{i=1}^{n}\lambda _{i}'/\lambda _{i}=\mathrm {tr} (D^{-1}D')=\mathrm {tr} (A^{-1}A'),

что представляет собой формулу Якоби для матриц $A$ с различными ненулевыми собственные значения.

Следствие

Ниже приведено полезное соотношение, связывающее трассу с определителем соответствующей матричной экспоненты :

$\det e^{B}=e^{\operatorname {tr} \left(B\right)}$

Это утверждение ясно для диагональных матриц, и отсюда следует доказательство общего утверждения.

Для любой обратимой матрицы $A(t)$ , в предыдущем разделе «Через правило цепочки» мы показали, что

{\frac {d}{dt}}\det A(t)=\det A(t)\;\operatorname {tr} \left(A(t)^{-1}\,{\frac {d}{dt}}A(t)\right)

Учитывая $A(t)=\exp(tB)$ в этом уравнении дает:

{\frac {d}{dt}}\det e^{tB}=\operatorname {tr} (B)\det e^{tB}

Желаемый результат следует из решения этого обыкновенного дифференциального уравнения.

Приложения

Несколько форм формулы лежат в основе алгоритма Фаддеева–Леверье для вычисления характеристического полинома и явных применений теоремы Кэли–Гамильтона . Например, исходя из следующего уравнения, доказанного выше: