Два конкурирующих соглашения об обозначениях разделяют область матричного исчисления на две отдельные группы. Эти две группы можно отличить по тому, записывают ли они производную скаляра по вектору как вектор-столбец или вектор-строку . Оба этих соглашения возможны, даже если делается общее предположение, что векторы следует рассматривать как векторы-столбцы при объединении с матрицами (а не как векторы-строки). Единственное соглашение может быть в некоторой степени стандартным для одной области, в которой обычно используется матричное исчисление (например, эконометрика , статистика, теория оценки и машинное обучение ). Однако даже внутри одной области можно найти разных авторов, используя конкурирующие соглашения. Авторы обеих групп часто пишут так, как если бы их конкретные условности были стандартными. Серьезные ошибки могут возникнуть при объединении результатов разных авторов без тщательной проверки использования совместимых обозначений. Определения этих двух конвенций и сравнение между ними собраны в раздел соглашений о макете .
Матричное исчисление относится к ряду различных обозначений, в которых используются матрицы и векторы для сбора производной каждого компонента зависимой переменной по отношению к каждому компоненту независимой переменной. В общем, независимая переменная может быть скаляром, вектором или матрицей, тогда как зависимая переменная также может быть любой из них. Каждая отдельная ситуация приведет к различному набору правил или отдельному исчислению , если использовать более широкий смысл этого термина. Матричная запись служит удобным способом организованного сбора множества производных.
В качестве первого примера рассмотрим градиент из векторного исчисления . Для скалярной функции трех независимых переменных: , градиент задается векторным уравнением
где представляет собой единичный вектор в направление для . Этот тип обобщенной производной можно рассматривать как производную скаляра f по вектору: , и его результат можно легко собрать в векторной форме.
Более сложные примеры включают производную скалярной функции по матрице, известную как матрица градиента , которая собирает производную по каждому элементу матрицы в соответствующей позиции в результирующей матрице. В этом случае скаляр должен быть функцией каждой независимой переменной в матрице. В качестве другого примера: если у нас есть n -вектор зависимых переменных или функции m независимых переменных, мы могли бы рассмотреть производную зависимого вектора по независимому вектору. Результат может быть собран в матрице размера m × n, состоящей из всех возможных комбинаций производных.
Всего существует девять возможностей использования скаляров, векторов и матриц. Обратите внимание: если мы рассматриваем большее количество компонентов в каждой из независимых и зависимых переменных, у нас может остаться очень большое количество возможностей. Шесть видов деривативов, которые наиболее удобно организовать в матричной форме, собраны в следующей таблице. [1]
Виды производной матрицы
Типы
Скаляр
Вектор
Матрица
Скаляр
Вектор
Матрица
Здесь мы использовали термин «матрица» в его самом общем смысле, понимая, что векторы — это просто матрицы с одним столбцом (а скаляры — это просто векторы с одной строкой). Кроме того, мы использовали жирные буквы для обозначения векторов и жирные заглавные буквы для матриц. Это обозначение используется повсюду.
Обратите внимание, что мы также можем говорить о производной вектора по матрице или любой другой незаполненной ячейке нашей таблицы. Однако эти производные наиболее естественно организованы в тензоре ранга выше 2, поэтому они не вписываются аккуратно в матрицу. В следующих трех разделах мы определим каждую из этих производных и соотнесем их с другими разделами математики. смотрите в разделе «Условия компоновки» Более подробную таблицу .
Связь с другими производными инструментами [ править ]
Матричная производная — это удобное обозначение для отслеживания частных производных при выполнении вычислений. — Производная Фреше это стандартный способ в функциональном анализе получить производные по векторам. В случае, если матричная функция матрицы дифференцируема по Фреше, две производные согласуются с точностью до перевода обозначений. Как и в случае с частными производными , некоторые формулы могут расширяться при более слабых аналитических условиях, чем существование производной как аппроксимирующего линейное отображение.
Векторные и матричные производные, представленные в последующих разделах, в полной мере используют преимущества матричной записи , используя одну переменную для представления большого количества переменных. В дальнейшем мы будем различать скаляры, векторы и матрицы по их шрифту. Обозначим через M ( n , m ) пространство действительных матриц размера n × m с n строками и m столбцами. Такие матрицы будут обозначаться жирными заглавными буквами: A , X , Y и т. д. Элемент M ( n , 1) , то есть вектор-столбец , обозначается жирной строчной буквой: a , x , y и т. д. Элемент M (1,1) является скаляром, обозначаемым строчным курсивом: a , t , x и т. д. X. Т матрицы обозначает транспонирование , tr( X ) — след , а det( X ) или | Х | является определителем . Предполагается, что все функции относятся к классу дифференцируемости C. 1 если не указано иное. Обычно буквы из первой половины алфавита (a, b, c, ...) используются для обозначения констант, а из второй половины (t, x, y, ...) для обозначения переменных.
ПРИМЕЧАНИЕ . Как упоминалось выше, существуют конкурирующие обозначения для представления систем частных производных в векторах и матрицах, и, похоже, никакого стандарта еще не появилось. В следующих двух вводных разделах соглашение о расположении числителя используется просто для удобства, чтобы не слишком усложнять обсуждение. В следующем разделе соглашения о компоновке обсуждаются более подробно. Важно осознавать следующее:
Несмотря на использование терминов «схема числителя» и «схема знаменателя», на самом деле существует более двух возможных вариантов обозначения. Причина в том, что выбор числителя или знаменателя (или, в некоторых ситуациях, числителя или смешанного метода) может быть сделан независимо для скалярно-векторного, векторно-скалярного, векторно-векторного и скалярно-по-калярного значений. производные матрицы, и ряд авторов смешивают и сопоставляют варианты макета различными способами.
Выбор расположения числителя во вводных разделах ниже не означает, что это «правильный» или «лучший» выбор. У различных типов планировок есть свои преимущества и недостатки. Серьезные ошибки могут возникнуть в результате небрежного объединения формул, написанных в разных макетах, а преобразование из одного макета в другой требует осторожности, чтобы избежать ошибок. В результате при работе с существующими формулами лучше всего, вероятно, определить, какой макет используется, и поддерживать с ним согласованность, а не пытаться использовать один и тот же макет во всех ситуациях.
Обозначение тензорного индекса с его соглашением Эйнштейна о суммировании очень похоже на матричное исчисление, за исключением того, что за раз записывается только один компонент. Его преимущество состоит в том, что можно легко манипулировать тензорами сколь угодно высокого ранга, тогда как тензоры ранга выше двух довольно громоздки с матричной записью. Вся работа здесь может быть выполнена в этой записи без использования матричной записи с одной переменной. Однако многие проблемы в теории оценивания и других областях прикладной математики приводят к тому, что индексов становится слишком много, чтобы их можно было правильно отслеживать, что указывает на пользу матричного исчисления в этих областях. Кроме того, нотация Эйнштейна может быть очень полезна при доказательстве представленных здесь тождеств (см. раздел о дифференцировании ) в качестве альтернативы типичной нотации элементов, которая может стать громоздкой, когда используются явные суммы. Обратите внимание, что матрицу можно рассматривать как тензор второго ранга.
Поскольку векторы представляют собой матрицы только с одним столбцом, простейшими производными матрицы являются производные векторов.
Разработанные здесь обозначения позволяют выполнять обычные операции векторного исчисления , отождествляя пространство M ( n ,1) -векторов n с евклидовым пространством R. н , а скаляр M (1,1) отождествляется с R . Соответствующее понятие из векторного исчисления указано в конце каждого подраздела.
ПРИМЕЧАНИЕ . Обсуждение в этом разделе предполагает использование соглашения о расположении числителя в педагогических целях. Некоторые авторы используют другие соглашения. В разделе, посвященном соглашениям о компоновке, этот вопрос обсуждается более подробно. Идентификаторы, приведенные ниже, представлены в формах, которые можно использовать в сочетании со всеми распространенными соглашениями о компоновке.
В векторном исчислении скалярного градиент поля f : R н → R (независимые координаты которого являются компонентами x ) — это транспонирование производной скаляра вектором.
Производная по направлению скалярной функции f ( x ) пространственного вектора x в направлении единичного вектора u (представленного в данном случае как вектор-столбец) определяется с использованием градиента следующим образом.
Используя только что определенные обозначения для производной скаляра по вектору, мы можем переписать производную по направлению как Этот тип обозначений будет удобен при доказательстве правил произведения и правил цепочки, которые выглядят похоже на то, с чем мы знакомы для скалярной производной .
Каждый из двух предыдущих случаев можно рассматривать как применение производной вектора по отношению к вектору, используя соответственно вектор размера один. Аналогичным образом мы обнаружим, что производные, включающие матрицы, соответствующим образом сводятся к производным, включающим векторы.
Существует два типа производных с матрицами, которые можно организовать в матрицу одинакового размера. Это производная матрицы по скаляру и производная скаляра по матрице. Они могут быть полезны в задачах минимизации, встречающихся во многих областях прикладной математики, и получили названия касательная матрица и градиентная матрица соответственно после своих аналогов для векторов.
Примечание . Обсуждение в этом разделе предполагает использование соглашения о расположении числителя в педагогических целях. Некоторые авторы используют другие соглашения. В разделе, посвященном соглашениям о компоновке, этот вопрос обсуждается более подробно. Идентификаторы, приведенные ниже, представлены в формах, которые можно использовать в сочетании со всеми распространенными соглашениями о компоновке.
Производная скалярной функции y по отношению к независимых переменных размера p × q матрице X определяется (в обозначениях расположения числителя ) выражением
Также по аналогии с векторным исчислением производная по направлению скаляра f ( X ) матрицы X в направлении матрицы Y определяется выражением
В частности, именно градиентная матрица находит множество применений в задачах минимизации в теории оценивания , особенно при выводе алгоритма фильтра Калмана , который имеет большое значение в этой области.
Три типа производных, которые не рассматривались, — это производные с использованием векторов по матрицам, матриц за векторами и матриц за матрицами. Они не так широко рассматриваются, и обозначения не получили широкого согласия.
В этом разделе обсуждаются сходства и различия между соглашениями об обозначениях, которые используются в различных областях, использующих преимущества матричного исчисления. Хотя в основном существуют два последовательных соглашения, некоторые авторы считают удобным смешивать эти два соглашения в формах, которые обсуждаются ниже. После этого раздела уравнения будут перечислены в обеих конкурирующих формах отдельно.
Фундаментальный вопрос заключается в том, что производная вектора по вектору, т.е. , часто пишется двумя конкурирующими способами. Если числитель y имеет размер m , а знаменатель x — размер n , то результат можно представить либо в виде матрицы m × n , либо в виде матрицы n × m , т. е. m элементов y , расположенных в строках, а n элементов x , расположенных в столбцах, или наоборот. Это приводит к следующим возможностям:
Расположение числителя , т.е. расположение в соответствии с y и x Т (т.е. вопреки x ). Иногда это называют формулировкой Якобиана . Это соответствует макету m × n в предыдущем примере, что означает, что номер строки равен размеру числителя и номер столбца равен размеру x Т .
Расположение знаменателя , т.е. расположение по y Т и x (т.е. в противоположность y ). Иногда это называют формулировкой Гессе . Некоторые авторы называют эту схему градиентом в отличие от якобиана (схемы числителя), который является его транспонированием. (Однако градиент чаще означает производную независимо от планировки). Это соответствует макету n×m в предыдущем примере, что означает, что номер строки равен размеру x (знаменатель).
Иногда рассматривается третья возможность — настаивать на записи производной в виде (т.е. производная берется относительно транспонирования x ) и следуйте расположению числителя. Это позволяет утверждать, что матрица раскладывается как по числителю, так и по знаменателю. На практике это дает такие же результаты, как и расположение числителя.
При работе с градиентом и обратный случай у нас те же проблемы. Чтобы быть последовательными, нам следует сделать одно из следующих действий:
Если мы выберем расположение числителя для мы должны выложить градиент как вектор-строка, и как вектор-столбец.
Если мы выберем расположение знаменателя для мы должны выложить градиент как вектор-столбец, и как вектор-строка.
В третьей возможности выше мы пишем и и используйте макет числителя.
Не все учебники и статьи по математике единообразны в этом отношении. То есть иногда разные условные обозначения используются в разных контекстах одной и той же книги или статьи. Например, некоторые выбирают расположение знаменателя для градиентов (расположение их в виде векторов-столбцов), но расположение числителя для повекторной производной.
Аналогично, когда речь идет о скалярных производных и скалярные производные матрицы затем согласованное расположение числителя распределяется в соответствии с Y и X Т , в то время как согласованное расположение знаменателя расположено в соответствии с Y Т и Х. Однако на практике, следуя схеме знаменателя для и раскладываем результат по Y Т , встречается редко, поскольку приводит к уродливым формулам, не соответствующим скалярным формулам. В результате часто можно встретить следующие макеты:
Последовательное расположение числителя , в котором согласно Y и по мнению Х Т .
Смешанная планировка , в которой раскладывается согласно Y и мнению Х. по
Используйте обозначения с теми же результатами, что и при последовательном расположении числителя.
В следующих формулах мы обрабатываем пять возможных комбинаций. и отдельно. Мы также рассматриваем случаи поскалярных производных, которые включают промежуточный вектор или матрицу. (Это может возникнуть, например, если многомерная параметрическая кривая определена через скалярную переменную, а затем берется производная скалярной функции кривой по скаляру, который параметризует кривую.) Для каждого Из различных комбинаций мы приводим результаты с расположением числителя и знаменателя, за исключением случаев, описанных выше, когда расположение знаменателя встречается редко. В случаях, когда это имеет смысл, мы даем результаты с числителем и смешанным расположением. Как отмечалось выше, случаи, когда знаменатели векторов и матриц записаны в записи транспонирования, эквивалентны расположению числителя, в котором знаменатели записаны без транспонирования.
Имейте в виду, что разные авторы используют разные комбинации расположения числителя и знаменателя для разных типов производных, и нет никакой гарантии, что автор будет последовательно использовать расположение числителя или знаменателя для всех типов. Сопоставьте приведенные ниже формулы с формулами, указанными в источнике, чтобы определить структуру, используемую для этого конкретного типа производной, но будьте осторожны и не предполагайте, что производные других типов обязательно имеют ту же структуру.
При использовании производных с агрегатным (векторным или матричным) знаменателем для нахождения максимума или минимума агрегата следует иметь в виду, что использование расположения числителя приведет к получению результатов, транспонированных по отношению к агрегату. Например, при попытке найти максимального правдоподобия оценку многомерного нормального распределения с помощью матричного исчисления, если областью определения является вектор-столбец k × 1, то результат с использованием схемы числителя будет в форме 1 × k. вектора-строки . Таким образом, либо результаты следует транспонировать в конце, либо следует использовать раскладку знаменателя (или смешанную раскладку).
Результат дифференциации различных видов агрегатов с другими видами агрегатов.
Как отмечалось выше, как правило, результаты операций будут транспонированы при переключении между форматом числителя и форматом знаменателя.
Чтобы разобраться во всех приведенных ниже тождествах, помните о наиболее важных правилах: правиле цепочки , правиле произведения и правиле сумм . Правило сумм применяется универсально, а правило произведения применяется в большинстве приведенных ниже случаев при условии, что порядок произведений матрицы сохраняется, поскольку произведения матрицы не являются коммутативными. Цепное правило применяется в некоторых случаях, но, к сожалению, не применяется в производных по матрице или по матрице (в последнем случае в основном используется оператор трассировки , применяемый к матрицам). В последнем случае правило произведения также не может быть применено напрямую, но эквивалент можно сделать, приложив немного больше усилий, используя дифференциальные тождества.
Следующие тождества принимают следующие соглашения:
скаляры a , b , c , d и e постоянны относительно, а скаляры u и v являются функциями одного из x , x или X ;
векторы a , b , c , d и e являются постоянными относительно, а векторы u и v являются функциями одного из x , x или X ;
матрицы A , B , C , D и E постоянны относительно, а матрицы U и V являются функциями одного из x , x или X .
Это представлено первым, потому что все операции, которые применяются к повекторному дифференцированию, применимы непосредственно к поскалярному или поскалярному дифференцированию просто путем приведения соответствующего вектора в числителе или знаменателе к скаляру.
Идентичность: вектор за вектором
Состояние
Выражение
Расположение числителя, т.е. по y и x Т
Расположение знаменателя, т.е. по y Т и х
a не является функцией x
A не является функцией x
A не является функцией x
а не является функцией х , ты знак равно ты ( Икс )
v = v ( x ) , a не является функцией x
v знак равно v ( Икс ) , ты знак равно ты ( Икс )
A не является функцией x , ты знак равно ты ( Икс )
а не является функцией х , ты знак равно ты ( Икс )
A не является функцией x , ты знак равно ты ( Икс )
ты знак равно ты ( Икс )
ты знак равно ты ( Икс ) , v знак равно v ( Икс )
ты знак равно ты ( Икс ) , v знак равно v ( Икс )
ты знак равно ты ( Икс )
Предполагается последовательная компоновка матрицы; см. ниже.
ты знак равно ты ( Икс )
Предполагается последовательная компоновка матрицы; см. ниже.
U знак равно U ( Икс ) , v знак равно v ( Икс )
ПРИМЕЧАНИЕ . Формулы, включающие повекторные производные и (чьи выходные данные являются матрицами) предполагают, что матрицы расположены в соответствии с векторной компоновкой, т.е. матрица компоновки числителя, когда вектор компоновки числителя, и наоборот; в противном случае транспонируйте повекторные производные.
Обратите внимание, что точных эквивалентов правила скалярного произведения и правила цепочки не существует применительно к матричным функциям матриц. Однако правило произведения такого рода применимо к дифференциальной форме (см. ниже), и это способ получения многих из приведенных ниже тождеств с использованием функции трассировки в сочетании с тем фактом, что функция трассировки допускает транспонирование и циклическую перестановку. то есть:
т.е. смешанная раскладка, если раскладка знаменателя для X. используется
a и b не являются функциями X
a и b не являются функциями X
a , b и C не являются функциями X
a , b и C не являются функциями X
U знак равно U ( Икс ) , V знак равно V ( Икс )
a не является функцией X , U знак равно U ( Икс )
g ( X ) — любой полином со скалярными коэффициентами или любая матричная функция, определенная бесконечным полиномиальным рядом (например, e Х , sin( X ) , cos( X ) , ln( X ) и т. д. с использованием ряда Тейлора ); g ( x ) — эквивалентная скалярная функция, g ′ ( x ) — ее производная, а g ′ ( X ) — соответствующая матричная функция
A , B не являются функциями x , U знак равно U ( Икс )
U знак равно U ( Икс ) , V знак равно V ( Икс )
U знак равно U ( Икс ) , V знак равно V ( Икс )
U знак равно U ( Икс ) , V знак равно V ( Икс )
U знак равно U ( Икс ) , V знак равно V ( Икс )
U знак равно U ( Икс )
U знак равно U ( Икс , у )
A не является функцией x , g ( X ) — любой многочлен со скалярными коэффициентами или любая матричная функция, определяемая бесконечным полиномиальным рядом (например, e Х , sin( X ) , cos( X ) , ln( X ) и т. д.); g ( x ) — эквивалентная скалярная функция, g ′ ( x ) – ее производная, а g ′ ( X ) – соответствующая матричная функция
Последовательное расположение числителя, т.е. по Y и X Т
Смешанная планировка, т.е. по Y и X
U знак равно U ( Икс )
U знак равно U ( Икс )
U знак равно U ( Икс )
U знак равно U ( Икс )
A не является функцией x , g ( X ) — любой многочлен со скалярными коэффициентами или любая матричная функция, определяемая бесконечным полиномиальным рядом (например, e Х , sin( X ) , cos( X ) , ln( X ) и т. д.); g ( x ) — эквивалентная скалярная функция, g ′ ( x ) – ее производная, а g ′ ( X ) – соответствующая матричная функция.
Зачастую проще работать в дифференциальной форме, а затем преобразовать обратно в нормальные производные. Это хорошо работает только при использовании макета числителя. В этих правилах a является скаляром.
f дифференцируемо значению по каждому собственному
В последнем ряду это дельта Кронекера и — это набор операторов ортогонального проектирования, которые проектируются на k -й собственный вектор X . Q — матрица векторов собственных , и являются собственными значениями.Матричная функция определяется через скалярную функцию для диагонализуемых матриц по где с .
Чтобы преобразовать в нормальную производную форму, сначала преобразуйте ее в одну из следующих канонических форм, а затем используйте эти тождества:
Преобразование из дифференциальной формы в производную [1]
Каноническая дифференциальная форма
Эквивалентная форма производной (расположение числителя)
^ Джайлз, Майк Б. (2008). «Собраны результаты производных матриц для алгоритмического дифференцирования в прямом и обратном режиме». В Бишофе, Кристиан Х.; Бюкер, Х. Мартин; Ховланд, Пол; Науманн, Уве; Утке, Жан (ред.). Достижения в области автоматической дифференциации . Конспекты лекций по вычислительной технике и технике. Том. 64. Берлин: Шпрингер. стр. 35–44. дои : 10.1007/978-3-540-68942-3_4 . ISBN 978-3-540-68935-5 . МР 2531677 .
^ Колло, Тону; Розен, Дитрих (2005). Расширенная многомерная статистика с матрицами . Дордрехт: Спрингер. ISBN 978-1-4020-3418-3 .
^ Магнус, Ян; Нойдекер, Хайнц (2019). Матричное дифференциальное исчисление с приложениями в статистике и эконометрике . Нью-Йорк: Джон Уайли. ISBN 9781119541202 .
Абадир, Карим М.; Магнус, Ян Р. (2005). Матричная алгебра . Эконометрические упражнения. Кембридж: Издательство Кембриджского университета. ISBN 978-0-511-64796-3 . OCLC 569411497 .
Лакс, Питер Д. (2007). «9. Исчисление вектор- и матричных функций». Линейная алгебра и ее приложения (2-е изд.). Хобокен, Нью-Джерси: Wiley-Interscience. ISBN 978-0-471-75156-4 .
Магнус, Ян Р. (октябрь 2010 г.). «О понятии матричной производной». Журнал многомерного анализа . 101 (9): 2200–2206. дои : 10.1016/j.jmva.2010.05.005 . . Обратите внимание, что эта статья в Википедии почти полностью изменена по сравнению с версией, критикуемой в этой статье.
Arc.Ask3.Ru Номер скриншота №: 5aa34a8706aa5c62face7543e1be5ba9__1715399700 URL1:https://arc.ask3.ru/arc/aa/5a/a9/5aa34a8706aa5c62face7543e1be5ba9.html Заголовок, (Title) документа по адресу, URL1: Matrix calculus - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)