Formula for the derivative of a matrix determinant
В исчислении матричном Якоби выражает производную определителя A. матрицы A через сопряженное число A производную и формула [ 1 ]
Если A — дифференцируемое отображение действительных чисел в матрицы размера n × n , то

где tr( X ) — след матрицы X и
является его сопряженной матрицей . (Последнее равенство справедливо только в том случае, если A ( t ) обратимо .)
В качестве частного случая

Эквивалентно, если dA означает дифференциал A : , общая формула будет такой

Формула названа в честь математика Карла Густава Якоба Якоби .
Теорема. (Формула Якоби) Для любого дифференцируемого отображения A действительных чисел в n × n матрицы размера

Доказательство. Формулу Лапласа для определителя матрицы A можно записать как

Обратите внимание, что суммирование выполняется по некоторой произвольной строке i матрицы.
Определитель A можно рассматривать как функцию элементов A :

так что по правилу цепочки его дифференциал равен

Это суммирование выполняется по всем n × n элементам матрицы.
Чтобы найти ∂ F /∂ A ij, учтите, что в правой части формулы Лапласа индекс i можно выбрать по желанию. (В целях оптимизации вычислений: любой другой выбор в конечном итоге даст тот же результат, но это может быть намного сложнее). В частности, его можно выбрать так, чтобы он соответствовал первому индексу ∂/∂ A ij :

Таким образом, по правилу произведения

Теперь, если элемент матрицы A ij и кофактор adj Т ( A ) ik элемента A ik лежат в одной строке (или столбце), то сомножитель не будет функцией A ij , поскольку сомножитель A ik выражается через элементы, находящиеся не в его собственной строке (или столбце) ). Таким образом,

так

Все элементы A независимы друг от друга, т.е.

где δ — дельта Кронекера , поэтому

Поэтому,

Лемма 1.
, где
является дифференциалом
.
Это уравнение означает, что дифференциал
, оцененный по единичной матрице, равен следу. Дифференциал
— линейный оператор, отображающий матрицу размера n × n в действительное число.
Доказательство. Используя определение производной по направлению вместе с одним из ее основных свойств для дифференцируемых функций, мы имеем

является полиномом по
порядка n . Он тесно связан с характеристическим полиномом
. Постоянный член в этом многочлене (член с
) равен 1, а линейный член в
является
.
Лемма 2. Для обратимой матрицы A имеем:
.
Доказательство. Рассмотрим следующую функцию X :

Вычисляем дифференциал
и оценить его в
используя лемму 1, приведенное выше уравнение и правило цепочки:

Теорема. (формула Якоби)
Доказательство. Если
обратима по лемме 2, причем

используя уравнение, адъюгат связывающее
к
. Теперь формула справедлива для всех матриц, поскольку множество обратимых линейных матриц плотно в пространстве матриц.
Обе части формулы Якоби являются полиномами от матрицы
коэффициенты при А и А' . Поэтому
достаточно для проверки полиномиального тождества на плотном подмножестве
где собственные значения A различны и отличны от нуля.
Если фактор А дифференцированно
, затем

В частности, если L обратима, то
и

Поскольку A имеет различные собственные значения,
существует дифференцируемая комплексная обратимая матрица L такая, что
и D – диагональ.
Затем

Позволять
,
быть собственными значениями A .
Затем

что представляет собой формулу Якоби для матриц A с различными ненулевыми
собственные значения.
Ниже приведено полезное соотношение, связывающее трассу с определителем соответствующей матричной экспоненты :
Это утверждение ясно для диагональных матриц, и отсюда следует доказательство общего утверждения.
Для любой обратимой матрицы
, в предыдущем разделе «Через правило цепочки» мы показали, что

Учитывая
в этом уравнении дает:

Желаемый результат следует из решения этого обыкновенного дифференциального уравнения.
Несколько форм формулы лежат в основе алгоритма Фаддеева–Леверье для вычисления характеристического полинома и явных применений теоремы Кэли–Гамильтона . Например, исходя из следующего уравнения, доказанного выше:

и используя
, мы получаем:
![{\displaystyle {\frac {d}{dt}}\this(tI-B)=\this(tI-B)\operatorname{tr}[(tI-B)^{-1}]=\operatorname{tr } [\operatorname{прил}(tI-B)]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/23c86c8faefc03cdf9b628c8f6c597edab683ce8)
где adj обозначает сопряженную матрицу .