Матричное исчисление

Из Википедии, бесплатной энциклопедии

В математике матричное исчисление это специализированное обозначение для выполнения исчисления с множеством переменных , особенно над пространствами матриц . Он собирает различные частные производные одной функции по отношению ко многим переменным и/или многомерной функции по отношению к одной переменной в векторы и матрицы, которые можно рассматривать как отдельные объекты. Это значительно упрощает такие операции, как поиск максимума или минимума функции многих переменных и решение систем дифференциальных уравнений . Используемые здесь обозначения обычно используются в статистике и технике , тогда как обозначение тензорного индекса является предпочтительным в физике .

Два конкурирующих соглашения об обозначениях разделяют область матричного исчисления на две отдельные группы. Эти две группы можно отличить по тому, записывают ли они производную скаляра по вектору как вектор-столбец или вектор-строку . Оба этих соглашения возможны, даже если сделано общее предположение, что векторы следует рассматривать как векторы-столбцы при объединении с матрицами (а не как векторы-строки). Единое соглашение может быть в некоторой степени стандартным для одной области, в которой обычно используется матричное исчисление (например, эконометрика , статистика, теория оценки и машинное обучение ). Однако даже внутри одной области можно найти разных авторов, используя конкурирующие соглашения. Авторы обеих групп часто пишут так, как если бы их конкретные условности были стандартными. Серьезные ошибки могут возникнуть при объединении результатов разных авторов без тщательной проверки использования совместимых обозначений. Определения этих двух конвенций и сравнение между ними собраны в раздел соглашений о макете .

Область применения [ править ]

Матричное исчисление относится к ряду различных обозначений, в которых используются матрицы и векторы для сбора производной каждого компонента зависимой переменной по отношению к каждому компоненту независимой переменной. В общем, независимая переменная может быть скаляром, вектором или матрицей, тогда как зависимая переменная также может быть любой из них. Каждая отдельная ситуация приведет к различному набору правил или отдельному исчислению , если использовать более широкий смысл этого термина. Матричная запись служит удобным способом организованного сбора множества производных.

В качестве первого примера рассмотрим градиент из векторного исчисления . Для скалярной функции трех независимых переменных: , градиент задается векторным уравнением

где представляет собой единичный вектор в направление для . Этот тип обобщенной производной можно рассматривать как производную скаляра f по вектору: , и его результат можно легко собрать в векторной форме.

Более сложные примеры включают производную скалярной функции по матрице, известную как матрица градиента , которая собирает производную по каждому элементу матрицы в соответствующей позиции в результирующей матрице. В этом случае скаляр должен быть функцией каждой независимой переменной в матрице. В качестве другого примера: если у нас есть n -вектор зависимых переменных или функции m независимых переменных, мы могли бы рассмотреть производную зависимого вектора по независимому вектору. Результат может быть собран в матрице размера m × n , состоящей из всех возможных комбинаций производных.

Всего существует девять возможностей использования скаляров, векторов и матриц. Обратите внимание: если мы рассматриваем большее количество компонентов в каждой из независимых и зависимых переменных, у нас может остаться очень большое количество возможностей. Шесть видов деривативов, которые наиболее удобно организовать в матричной форме, собраны в следующей таблице. [1]

Виды производной матрицы
Типы Скаляр Вектор Матрица
Скаляр
Вектор
Матрица

Здесь мы использовали термин «матрица» в его самом общем смысле, понимая, что векторы — это просто матрицы с одним столбцом (а скаляры — это просто векторы с одной строкой). Кроме того, мы использовали жирные буквы для обозначения векторов и жирные заглавные буквы для матриц. Это обозначение используется повсюду.

Обратите внимание, что мы также можем говорить о производной вектора по матрице или любой другой незаполненной ячейке нашей таблицы. Однако эти производные наиболее естественно организованы в тензоре ранга выше 2, поэтому они не вписываются аккуратно в матрицу. В следующих трех разделах мы определим каждую из этих производных и соотнесем их с другими разделами математики. смотрите в разделе «Условия компоновки» Более подробную таблицу .

Связь с другими производными инструментами [ править ]

Матричная производная — это удобное обозначение для отслеживания частных производных при выполнении вычислений. Производная Фреше — это стандартный способ в функциональном анализе получить производные по векторам. В случае, если матричная функция матрицы дифференцируема по Фреше, две производные согласуются с точностью до перевода обозначений. Как и в случае с частными производными , некоторые формулы могут расширяться при более слабых аналитических условиях, чем существование производной как аппроксимирующего линейное отображение.

Использование [ править ]

Матричное исчисление используется для получения оптимальных стохастических оценок, часто с использованием множителей Лагранжа . Сюда входит вывод:

Обозначения [ править ]

Векторные и матричные производные, представленные в последующих разделах, в полной мере используют преимущества матричной записи , используя одну переменную для представления большого количества переменных. В дальнейшем мы будем различать скаляры, векторы и матрицы по их шрифту. Обозначим через M ( n , m ) пространство действительных матриц размера n × m с n строками и m столбцами. Такие матрицы будут обозначаться жирными заглавными буквами: A , X , Y и т. д. Элемент M ( n , 1) , то есть вектор-столбец , обозначается жирной строчной буквой: a , x , y и т. д. Элемент M (1,1) является скаляром, обозначаемым строчным курсивом: a , t , x и т. д. X. Т обозначает транспонирование матрицы , tr( X ) след , а det( X ) или | Х | является определителем . Предполагается, что все функции относятся к классу дифференцируемости C. 1 если иное не отмечено. Обычно буквы из первой половины алфавита (a, b, c, ...) используются для обозначения констант, а из второй половины (t, x, y, ...) для обозначения переменных.

ПРИМЕЧАНИЕ . Как упоминалось выше, существуют конкурирующие обозначения для представления систем частных производных в векторах и матрицах, и, похоже, никакого стандарта еще не появилось. В следующих двух вводных разделах используется соглашение о расположении числителя просто для удобства, чтобы не слишком усложнять обсуждение. В следующем разделе соглашения о компоновке обсуждаются более подробно. Важно осознавать следующее:

  1. Несмотря на использование терминов «схема числителя» и «схема знаменателя», на самом деле существует более двух возможных вариантов обозначения. Причина в том, что выбор числителя или знаменателя (или, в некоторых ситуациях, числителя или смешанного метода) может быть сделан независимо для скалярно-векторного, векторно-скалярного, векторно-векторного и скалярно-по-калярного значений. производные матрицы, и ряд авторов смешивают и сопоставляют варианты макета различными способами.
  2. Выбор расположения числителя во вводных разделах ниже не означает, что это «правильный» или «лучший» выбор. У различных типов планировок есть свои преимущества и недостатки. Серьезные ошибки могут возникнуть из-за небрежного объединения формул, написанных в разных макетах, а преобразование из одного макета в другой требует осторожности, чтобы избежать ошибок. В результате при работе с существующими формулами лучше всего, вероятно, определить, какой макет используется, и поддерживать с ним согласованность, а не пытаться использовать один и тот же макет во всех ситуациях.

Альтернативы [ править ]

Обозначение тензорного индекса с его соглашением Эйнштейна о суммировании очень похоже на матричное исчисление, за исключением того, что за раз записывается только один компонент. Его преимущество состоит в том, что можно легко манипулировать тензорами сколь угодно высокого ранга, тогда как тензоры ранга выше двух довольно громоздки с матричной записью. Вся работа здесь может быть выполнена в этой записи без использования матричной записи с одной переменной. Однако многие проблемы в теории оценивания и других областях прикладной математики приводят к тому, что индексов становится слишком много, чтобы их можно было правильно отслеживать, что указывает на пользу матричного исчисления в этих областях. Кроме того, нотация Эйнштейна может быть очень полезна при доказательстве представленных здесь тождеств (см. раздел о дифференцировании ) в качестве альтернативы типичной нотации элементов, которая может стать громоздкой, когда используются явные суммы. Обратите внимание, что матрицу можно рассматривать как тензор второго ранга.

Производные с векторами [ править ]

Поскольку векторы представляют собой матрицы только с одним столбцом, простейшими производными матрицы являются производные векторов.

Разработанные здесь обозначения позволяют выполнять обычные операции векторного исчисления , отождествляя пространство M ( n ,1) n -векторов с евклидовым пространством R. н , а скаляр M (1,1) отождествляется с R . Соответствующее понятие из векторного исчисления указано в конце каждого подраздела.

ПРИМЕЧАНИЕ . Обсуждение в этом разделе предполагает использование соглашения о расположении числителя в педагогических целях. Некоторые авторы используют другие соглашения. В разделе, посвященном соглашениям о компоновке, этот вопрос обсуждается более подробно. Идентификаторы, приведенные ниже, представлены в формах, которые можно использовать в сочетании со всеми распространенными соглашениями о компоновке.

Векторно-скалярный [ править ]

Производная вектора x , скаляром записывается обозначении расположения числителя ) как

В векторном исчислении производная вектора y по скаляру x известна как касательный вектор вектора y , . Обратите внимание, что y : R 1 Р м .

Пример Простые примеры этого включают вектор скорости в евклидовом пространстве , который является касательным вектором ( вектора положения рассматриваемого как функция времени). Кроме того, ускорение - это касательный вектор скорости.

Скалярно-векторный [ править ]

Производная скаляра y по вектору , записывается (в обозначении расположения числителя ) как

В векторном исчислении градиент поля скалярного f : R н R (независимые координаты которого являются компонентами x ) — это транспонирование производной скаляра вектором.

Например, в физике электрическое поле представляет собой отрицательный векторный градиент электрического потенциала .

Производная по направлению скалярной функции f ( x ) пространственного вектора x в направлении единичного вектора u (представленного в данном случае как вектор-столбец) определяется с использованием градиента следующим образом.

Используя только что определенные обозначения для производной скаляра по вектору, мы можем переписать производную по направлению как Этот тип обозначений будет удобен при доказательстве правил произведения и правил цепочки, которые выглядят похоже на то, с чем мы знакомы для скалярной производной .

Вектор за вектором [ править ]

Каждый из предыдущих двух случаев можно рассматривать как применение производной вектора по отношению к вектору, используя соответственно вектор размера один. Аналогичным образом мы обнаружим, что производные, включающие матрицы, соответствующим образом сводятся к производным, включающим векторы.

Производная векторной функции (вектора, компоненты которого являются функциями) , относительно входного вектора, , записывается (в обозначении расположения числителя ) как

В векторном исчислении производная векторной функции y по вектору x , компоненты которого представляют пространство, известна как матрица прямого продвижения (или дифференциал) , или матрица Якобиана .

Продвижение вектор-функции f относительно вектора v в R н дан кем-то

Производные с матрицами [ править ]

Существует два типа производных с матрицами, которые можно организовать в матрицу одинакового размера. Это производная матрицы по скаляру и производная скаляра по матрице. Они могут быть полезны в задачах минимизации, встречающихся во многих областях прикладной математики, и получили названия касательная матрица и градиентная матрица соответственно после своих аналогов для векторов.

Примечание . Обсуждение в этом разделе предполагает использование соглашения о расположении числителя в педагогических целях. Некоторые авторы используют другие соглашения. В разделе, посвященном соглашениям о компоновке, этот вопрос обсуждается более подробно. Идентификаторы, приведенные ниже, представлены в формах, которые можно использовать в сочетании со всеми распространенными соглашениями о компоновке.

Матрица по скаляру [ править ]

Производная матричной функции Y по скаляру x известна как касательная матрица и определяется (в обозначениях расположения числителя ) выражением

Скаляр по матрице [ править ]

Производная скалярной функции y по отношению к независимых переменных размера p × q матрице X определяется (в обозначениях расположения числителя ) выражением

Важные примеры скалярных функций матриц включают след матрицы и определитель .

По аналогии с векторным исчислением эту производную часто записывают следующим образом.

Также по аналогии с векторным исчислением производная по направлению скаляра f ( X ) матрицы X в направлении матрицы Y определяется выражением

В частности, именно градиентная матрица находит множество применений в задачах минимизации в теории оценивания , особенно при выводе алгоритма фильтра Калмана , который имеет большое значение в этой области.

матрицы производные Другие

Три типа производных, которые не рассматривались, — это производные с использованием векторов по матрицам, матриц за векторами и матриц за матрицами. Они не так широко рассматриваются, и обозначения не получили широкого согласия.

Соглашения о макете [ править ]

В этом разделе обсуждаются сходства и различия между соглашениями об обозначениях, которые используются в различных областях, использующих преимущества матричного исчисления. Хотя в основном существуют два последовательных соглашения, некоторые авторы считают удобным смешивать эти два соглашения в формах, которые обсуждаются ниже. После этого раздела уравнения будут перечислены в обеих конкурирующих формах отдельно.

Фундаментальный вопрос заключается в том, что производная вектора по вектору, т.е. , часто пишется двумя конкурирующими способами. Если числитель y имеет размер m , а знаменатель x — размер n , то результат можно представить либо в виде m × n матрицы n × m , либо в виде матрицы , т. е. m элементов y , расположенных в строках, а n элементов из x, расположенных в столбцах, или наоборот. Это приводит к следующим возможностям:

  1. Расположение числителя , т.е. расположение в соответствии с y и x Т (т.е. вопреки x ). Иногда это называют формулировкой Якобиана . Это соответствует макету m × n в предыдущем примере, что означает, что номер строки равен размеру числителя и номер столбца равен размеру x Т .
  2. Расположение знаменателя , т.е. расположение по y Т и x (т.е. в противоположность y ). Иногда это называют формулировкой Гессе . Некоторые авторы называют эту схему градиентом в отличие от якобиана (схемы числителя), который является его транспонированием. (Однако градиент чаще означает производную независимо от планировки). Это соответствует макету n×m в предыдущем примере, что означает, что номер строки равен размеру x (знаменатель).
  3. Иногда рассматривается третья возможность — настаивать на записи производной в виде (т.е. производная берется относительно транспонирования x ) и следуйте расположению числителя. Это позволяет утверждать, что матрица раскладывается как по числителю, так и по знаменателю. На практике это дает такие же результаты, как и расположение числителя.

При работе с градиентом и обратный случай у нас те же проблемы. Чтобы быть последовательными, нам следует сделать одно из следующих действий:

  1. Если мы выберем расположение числителя для мы должны выложить градиент как вектор-строка, и как вектор-столбец.
  2. Если мы выберем расположение знаменателя для мы должны выложить градиент как вектор-столбец, и как вектор-строка.
  3. В третьей возможности выше мы пишем и и используйте макет числителя.

Не все учебники и статьи по математике единообразны в этом отношении. То есть иногда в одной и той же книге или статье в разных контекстах используются разные условные обозначения. Например, некоторые выбирают расположение знаменателя для градиентов (расположение их в виде векторов-столбцов), но расположение числителя для повекторной производной.

Аналогично, когда речь идет о скалярных производных и скалярные производные матрицы затем согласованное расположение числителя распределяется в соответствии с Y и X Т , в то время как согласованное расположение знаменателя расположено в соответствии с Y Т и Х. ​ Однако на практике, следуя схеме знаменателя для и раскладываем результат по Y Т , встречается редко, поскольку приводит к уродливым формулам, не соответствующим скалярным формулам. В результате часто можно встретить следующие макеты:

  1. Последовательное расположение числителя , в котором согласно Y и по мнению Х Т .
  2. Смешанная планировка , в которой раскладывается согласно Y и по Х. мнению
  3. Используйте обозначения с теми же результатами, что и при последовательном расположении числителя.

В следующих формулах мы обрабатываем пять возможных комбинаций. и в отдельности. Мы также рассматриваем случаи поскалярных производных, которые включают промежуточный вектор или матрицу. (Это может возникнуть, например, если многомерная параметрическая кривая определена через скалярную переменную, а затем берется производная скалярной функции кривой по скаляру, который параметризует кривую.) Для каждого Из различных комбинаций мы приводим результаты с расположением числителя и знаменателя, за исключением случаев, описанных выше, когда расположение знаменателя встречается редко. В случаях, когда это имеет смысл, мы даем результаты с числителем и смешанным расположением. Как отмечалось выше, случаи, когда знаменатели векторов и матриц записаны в записи транспонирования, эквивалентны расположению числителя, в котором знаменатели записаны без транспонирования.

Имейте в виду, что разные авторы используют разные комбинации расположения числителя и знаменателя для разных типов производных, и нет никакой гарантии, что автор будет последовательно использовать расположение числителя или знаменателя для всех типов. Сопоставьте приведенные ниже формулы с формулами, указанными в источнике, чтобы определить структуру, используемую для этого конкретного типа производной, но будьте осторожны и не предполагайте, что производные других типов обязательно имеют ту же структуру.

При использовании производных с агрегатным (векторным или матричным) знаменателем для нахождения максимума или минимума агрегата следует иметь в виду, что использование расположения числителя приведет к получению результатов, транспонированных по отношению к агрегату. Например, при попытке найти оценку максимального правдоподобия многомерного нормального распределения с помощью матричного исчисления, если областью определения является вектор-столбец k × 1, то результат с использованием схемы числителя будет в форме 1 × k. вектора-строки . Таким образом, либо результаты следует транспонировать в конце, либо следует использовать раскладку знаменателя (или смешанную раскладку).

Результат дифференциации различных видов агрегатов с другими видами агрегатов.
Скалярный у Вектор-столбец y (размер m ×1 ) Матрица Y (размер m × n )
Обозначения Тип Обозначения Тип Обозначения Тип
Скаляр х Числитель Скаляр Size -m Вектор-столбец m × n матрица
Знаменатель Размер- м вектор-строка
Вектор-столбец x
(размер n × 1 )
Числитель Размер - n вектор-строка m × n матрица
Знаменатель Размер- n вектор-столбец n × m матрица
Матрица Х
(размер p × q )
Числитель q × p матрица
Знаменатель p × q матрица

Результаты операций будут транспонированы при переключении между форматом числителя и форматом знаменателя.

Обозначение расположения числителя [ править ]

Используя обозначение расположения числителя, мы имеем: [1]

Следующие определения предоставляются только в формате числителя:

Обозначение расположения знаменателя [ править ]

Используя обозначение макета знаменателя, мы имеем: [2]

Личности [ править ]

Как отмечалось выше, в общем случае результаты операций будут транспонированы при переключении между форматом числителя и форматом знаменателя.

Чтобы разобраться во всех приведенных ниже тождествах, помните о наиболее важных правилах: правиле цепочки , правиле произведения и правиле сумм . Правило сумм применяется универсально, а правило произведения применяется в большинстве приведенных ниже случаев при условии, что порядок произведений матрицы сохраняется, поскольку произведения матрицы не являются коммутативными. Цепное правило применяется в некоторых случаях, но, к сожалению, не применяется в производных по матрице или по матрице (в последнем случае в основном используется оператор трассировки , применяемый к матрицам). В последнем случае правило произведения также не может быть применено напрямую, но его эквивалент можно сделать, приложив немного больше усилий, используя дифференциальные тождества.

Следующие тождества принимают следующие соглашения:

  • скаляры a , b , c , d и e постоянны относительно, а скаляры u и v являются функциями одного из x , x или X ;
  • векторы a , b , c , d и e являются постоянными относительно, а векторы u и v являются функциями одного из x , x или X ;
  • матрицы A , B , C , D и E постоянны относительно, а матрицы U и V являются функциями одного из x , x или X .

Векторные тождества [ править ]

Это представлено первым, потому что все операции, которые применяются к повекторному дифференцированию, применимы непосредственно к поскалярному или поскалярному дифференцированию просто путем приведения соответствующего вектора в числителе или знаменателе к скаляру.

Идентичность: вектор за вектором
Состояние Выражение Расположение числителя, т.е. по y и x Т Расположение знаменателя, т.е. по y Т и х
a не является функцией x
A не является функцией x
A не является функцией x
а не является функцией х ,
ты знак равно ты ( Икс )
v знак равно v ( Икс ) ,
a не является функцией x
v знак равно v ( Икс ) , ты знак равно ты ( Икс )
A не является функцией x ,
ты знак равно ты ( Икс )
ты знак равно ты ( Икс ) , v знак равно v ( Икс )
ты знак равно ты ( Икс )
ты знак равно ты ( Икс )

Скалярно-векторные тождества [ править ]

Основные идентичности расположены над толстой черной линией.

Тождества: скалярно-векторное
Состояние Выражение Расположение числителя,
то есть по х Т ; результат — вектор-строка
Расположение знаменателя,
т.е. по x ; результат — вектор-столбец
a не является функцией x [номер 1] [номер 1]
а не является функцией х ,
ты знак равно ты ( Икс )
ты знак равно ты ( Икс ) , v знак равно v ( Икс )
ты знак равно ты ( Икс ) , v знак равно v ( Икс )
ты знак равно ты ( Икс )
ты знак равно ты ( Икс )
ты знак равно ты ( Икс ) , v знак равно v ( Икс )

в макете числителя

в знаменателе

ты знак равно ты ( Икс ) , v знак равно v ( Икс ) ,
A не является функцией x

в макете числителя

в знаменателе

, матрица Гессе [3]
a не является функцией x

A не является функцией x
b не является функцией x
A не является функцией x
A не является функцией x
А симметричен
A не является функцией x
A не является функцией x
А симметричен
а не является функцией х ,
ты знак равно ты ( Икс )

в макете числителя

в знаменателе

a , b не являются функциями x
A , b , C , D , e не являются функциями x
a не является функцией x

Векторно-скалярные тождества [ править ]

Идентичность: вектор по скаляру
Состояние Выражение Расположение числителя, т.е. по y ,
результат — вектор-столбец
Расположение знаменателя, т.е. по y Т ,
результат — вектор-строка
a не является функцией x [номер 1]
а не является функцией х ,
ты знак равно ты ( Икс )
A не является функцией x ,
ты знак равно ты ( Икс )
ты знак равно ты ( Икс )
ты знак равно ты ( Икс ) , v знак равно v ( Икс )
ты знак равно ты ( Икс ) , v знак равно v ( Икс )
ты знак равно ты ( Икс )
Предполагается последовательная компоновка матрицы; см. ниже.
ты знак равно ты ( Икс )
Предполагается последовательная компоновка матрицы; см. ниже.
U знак равно U ( Икс ) , v знак равно v ( Икс )

ПРИМЕЧАНИЕ . Формулы, включающие повекторные производные и (чьи выходные данные являются матрицами) предполагают, что матрицы расположены в соответствии с векторной компоновкой, т.е. матрица компоновки числителя, когда вектор компоновки числителя, и наоборот; в противном случае транспонируйте повекторные производные.

Скалярно-матричные тождества [ править ]

Обратите внимание, что точных эквивалентов правила скалярного произведения и правила цепочки не существует применительно к матричным функциям матриц. Однако правило произведения такого рода действительно применимо к дифференциальной форме (см. ниже), и это способ вывести многие из приведенных ниже тождеств с использованием функции трассировки в сочетании с тем фактом, что функция трассировки допускает транспонирование и циклическую перестановку. то есть:

Например, чтобы вычислить

Поэтому,

(расположение числителя)
(расположение знаменателя)

(Последний шаг см. в разделе «Преобразование дифференциальной формы в производную ».)

Тождества: скаляр по матрице
Состояние Выражение Расположение числителя, т.е. по X Т Расположение знаменателя, т.е. по X
a не является функцией X [номер 2] [номер 2]
а не является функцией от X , ты знак равно ты ( Икс )
ты знак равно ты ( Икс ) , v знак равно v ( Икс )
ты знак равно ты ( Икс ) , v знак равно v ( Икс )
ты знак равно ты ( Икс )
ты знак равно ты ( Икс )
U знак равно U ( Икс ) [3]     
Обе формы предполагают расположение числителя для

раскладка знаменателя для X. т.е. смешанная раскладка, если используется

a и b не являются функциями X
a и b не являются функциями X
a , b и C не являются функциями X
a , b и C не являются функциями X
U знак равно U ( Икс ) , V знак равно V ( Икс )
a не является функцией X ,
U знак равно U ( Икс )
g ( X ) — любой полином со скалярными коэффициентами или любая матричная функция, определенная бесконечным полиномиальным рядом (например, e Икс , sin( X ) , cos( X ) , ln( X ) и т. д. с использованием ряда Тейлора ); g ( x ) — эквивалентная скалярная функция, g ( x ) — ее производная, а g ( X ) — соответствующая матричная функция
A не является функцией X [4]     
A не является функцией X [3]     
A не является функцией X [3]     
A не является функцией X [3]     
A , B не являются функциями X
A , B , C не являются функциями X
n — положительное целое число [3]     
A не является функцией X ,
n — положительное целое число
[3]     
[3]     
[3]     
[5]     
a не является функцией X [3] [номер 3]
A , B не являются функциями X [3]     
n — положительное целое число [3]     
(см. псевдообратный ) [3]     
(см. псевдообратный ) [3]     
A не является функцией X ,
X квадратный и обратимый
A не является функцией X ,
X неквадратный,
А симметричен
A не является функцией X ,
X неквадратный,
А несимметричен

Матричные скалярные тождества [ править ]

Тождества: матрица по скаляру
Состояние Выражение Расположение числителя, т.е. по Y
U знак равно U ( Икс )
A , B не являются функциями x ,
U знак равно U ( Икс )
U знак равно U ( Икс ) , V знак равно V ( Икс )
U знак равно U ( Икс ) , V знак равно V ( Икс )
U знак равно U ( Икс ) , V знак равно V ( Икс )
U знак равно U ( Икс ) , V знак равно V ( Икс )
U знак равно U ( Икс )
U знак равно U ( Икс , у )
A не является функцией x , g ( X ) — любой полином со скалярными коэффициентами или любая матричная функция, определяемая бесконечным полиномиальным рядом (например, e Икс , sin( X ) , cos( X ) , ln( X ) и т. д.); g ( x ) — эквивалентная скалярная функция, g ( x ) — ее производная, а g ( X ) — соответствующая матричная функция
A не является функцией x

Скалярные тождества [ править ]

С участием векторов [ править ]

Тождества: поскалярно, с участием векторов.
Состояние Выражение Любой макет (предполагается, что скалярное произведение игнорирует расположение строк и столбцов)
ты знак равно ты ( Икс )
ты знак равно ты ( Икс ) , v знак равно v ( Икс )

С участием матриц [ править ]

Тождества: скаляр за скаляром, с участием матриц. [3]
Состояние Выражение Последовательное расположение числителя,
т.е. по Y и X Т
Смешанная планировка,
т.е. по Y и X
U знак равно U ( Икс )
U знак равно U ( Икс )
U знак равно U ( Икс )
U знак равно U ( Икс )
A не является функцией x , g ( X ) — любой полином со скалярными коэффициентами или любая матричная функция, определяемая бесконечным полиномиальным рядом (например, e Икс , sin( X ) , cos( X ) , ln( X ) и т. д.); g ( x ) — эквивалентная скалярная функция, g ( x ) – ее производная, а g ( X ) – соответствующая матричная функция.
A не является функцией x

Тождества в дифференциальной форме [ править ]

Зачастую проще работать в дифференциальной форме, а затем преобразовать обратно в нормальные производные. Это хорошо работает только при использовании макета числителя. В этих правилах a является скаляром.

Дифференциальные тождества: скаляр, включающий матрицу [1] [3]
Выражение Результат (расположение числителя)
Дифференциальные тождества: матрица [1] [3] [6] [7]
Состояние Выражение Результат (расположение числителя)
A не является функцией X
a не является функцией X
( продукт Кронекера )
( произведение Адамара )
( сопряженное транспонирование )
n — положительное целое число
является диагонализируемым


f дифференцируемо по каждому собственному значению

В последнем ряду это дельта Кронекера и — это набор операторов ортогонального проектирования, которые проектируются на k -й собственный вектор X . Q — матрица векторов собственных , и являются собственными значениями. Матричная функция определяется через скалярную функцию для диагонализуемых матриц по где с .

Чтобы преобразовать в нормальную производную форму, сначала преобразуйте ее в одну из следующих канонических форм, а затем используйте эти тождества:

Преобразование из дифференциальной формы в производную [1]
Каноническая дифференциальная форма Эквивалентная форма производной (расположение числителя)

Приложения [ править ]

Матричное дифференциальное исчисление используется в статистике и эконометрике, особенно для статистического анализа многомерных распределений , особенно многомерного нормального распределения и других эллиптических распределений . [8] [9] [10]

Он используется в регрессионном анализе для вычисления, например, обычной формулы регрессии наименьших квадратов для случая нескольких независимых переменных . [11] Он также используется в случайных матрицах, статистических моментах, локальной чувствительности и статистической диагностике. [12] [13]

См. также [ править ]

Примечания [ править ]

  1. ^ Перейти обратно: а б с Здесь, относится к вектор-столбцу , состоящему из всех нулей, размера n , где n — длина x .
  2. ^ Перейти обратно: а б Здесь, относится к матрице всех нулей той же формы, что и X .
  3. ^ Константа a исчезает в результате. Это намеренно. В общем,
    или, также

Ссылки [ править ]

  1. ^ Перейти обратно: а б с д Это Томас П., Минка (28 декабря 2000 г.). «Старая и новая матричная алгебра, полезная для статистики» . Примечание MIT Media Lab (1997; исправлено 12/00) . Проверено 5 февраля 2016 г.
  2. ^ Фелиппа, Карлос А. «Приложение D, Линейная алгебра: определители, обратные, ранг» (PDF) . ASEN 5007: Введение в методы конечных элементов . Боулдер, Колорадо: Университет Колорадо . Проверено 5 февраля 2016 г. Использует гессианское ( транспонирование в якобиан ) определение векторных и матричных производных.
  3. ^ Перейти обратно: а б с д Это ж г час я дж к л м н О п д Петерсен, Кааре Брандт; Педерсен, Майкл Сискинд. Поваренная книга «Матрица» (PDF) . Архивировано из оригинала 2 марта 2010 года . Проверено 5 февраля 2016 г. В этой книге используется смешанная раскладка, т.е. по Y в по X в
  4. ^ Дучи, Джон К. «Свойства следа и производных матрицы» (PDF) . Стэндфордский Университет . Проверено 5 февраля 2016 г.
  5. ^ См. Определитель § Производная для вывода.
  6. ^ Джайлз, Майк Б. (2008). «Собраны результаты производных матриц для алгоритмического дифференцирования в прямом и обратном режиме». В Бишофе, Кристиан Х.; Бюкер, Х. Мартин; Ховланд, Пол; Науманн, Уве; Утке, Жан (ред.). Достижения в области автоматической дифференциации . Конспекты лекций по вычислительной технике и технике. Том. 64. Берлин: Шпрингер. стр. 35–44. дои : 10.1007/978-3-540-68942-3_4 . ISBN  978-3-540-68935-5 . МР   2531677 .
  7. ^ Неопубликованная записка С. Адлера (IAS)
  8. ^ Фанг, Кай-Тай ; Чжан, Яо-Тин (1990). Обобщенный многомерный анализ . Science Press (Пекин) и Springer-Verlag (Берлин). ISBN  3540176519 . 9783540176510.
  9. ^ Пан, Цзяньсинь; Фанг, Кайтай (2007). Модели кривой роста и статистическая диагностика . Пекин: Наука Пресс. ISBN  9780387950532 .
  10. ^ Колло, Тону; Розен, Дитрих (2005). Расширенная многомерная статистика с матрицами . Дордрехт: Спрингер. ISBN  978-1-4020-3418-3 .
  11. ^ Магнус, Ян; Нойдекер, Хайнц (2019). Матричное дифференциальное исчисление с приложениями в статистике и эконометрике . Нью-Йорк: Джон Уайли. ISBN  9781119541202 .
  12. ^ Лю, Шуанчжэ; Лейва, Виктор; Чжуан, Дэн; Ма, Тифенг; Фигероа-Суньига, Хорхе И. (2022). «Матричное дифференциальное исчисление с приложениями в многомерной линейной модели и ее диагностика» . Журнал многомерного анализа . 188 : 104849. doi : 10.1016/j.jmva.2021.104849 .
  13. ^ Лю, Шуанчжэ; Тренклер, Гетц; Колло, Тону; фон Розен, Дитрих; Баксалари, Оскар Мария (2023). «Профессор Хайнц Нойдекер и матричное дифференциальное исчисление». Статистические документы . дои : 10.1007/s00362-023-01499-w . S2CID   263661094 .

Дальнейшее чтение [ править ]

  • Абадир, Карим М.; Магнус, Ян Р. (2005). Матричная алгебра . Эконометрические упражнения. Кембридж: Издательство Кембриджского университета. ISBN  978-0-511-64796-3 . OCLC   569411497 .
  • Лакс, Питер Д. (2007). «9. Исчисление вектор- и матричных функций». Линейная алгебра и ее приложения (2-е изд.). Хобокен, Нью-Джерси: Wiley-Interscience. ISBN  978-0-471-75156-4 .
  • Магнус, Ян Р. (октябрь 2010 г.). «О понятии матричной производной». Журнал многомерного анализа . 101 (9): 2200–2206. дои : 10.1016/j.jmva.2010.05.005 . . Обратите внимание, что эта статья в Википедии почти полностью изменена по сравнению с версией, критикуемой в этой статье.

Внешние ссылки [ править ]

Программное обеспечение [ править ]

Информация [ править ]