Умножение матрицы

Из Википедии, бесплатной энциклопедии
Для умножения матриц количество столбцов в первой матрице должно быть равно количеству строк во второй матрице. Матрица результатов имеет количество строк первой и количество столбцов второй матрицы.

В математике , особенно в линейной алгебре , умножение матриц — это бинарная операция , которая создает матрицу из двух матриц. Для умножения матриц количество столбцов в первой матрице должно быть равно количеству строк во второй матрице. Результирующая матрица, известная как матричное произведение , имеет количество строк первой и количество столбцов второй матрицы. Произведение матриц A и B обозначается как AB . [1]

Умножение матриц было впервые описано французским математиком Жаком Филиппом Мари Бине в 1812 году. [2] для представления композиции линейных карт , представленных матрицами. Таким образом, умножение матриц является основным инструментом линейной алгебры и поэтому имеет многочисленные применения во многих областях математики, а также в прикладной математике , статистике , физике , экономике и технике . [3] [4] Вычисление матричных произведений — центральная операция во всех вычислительных приложениях линейной алгебры.

Обозначения [ править ]

В этой статье будут использоваться следующие обозначения: матрицы обозначаются заглавными буквами, выделенными жирным шрифтом, например A ; векторы выделены строчными буквами и жирным шрифтом, например a ; а записи векторов и матриц выделены курсивом (это числа из поля), например A и a . Обозначение индекса часто является самым ясным способом выражения определений и используется в качестве стандарта в литературе. Запись в строке i , столбце j матрицы A обозначается ( A ) ij , A ij или a ij . Напротив, один индекс, например A 1 , A 2 , используется для выбора матрицы (а не элемента матрицы) из набора матриц.

Определения [ править ]

Матрица, умноженная на матрицу [ править ]

Если A матрица размера m × n , а B матрица размера n × p ,

матричное произведение C = AB (обозначается без знаков умножения и точек) определяется как размера m × p матрица [5] [6] [7] [8]
такой, что
для i = 1,..., m и j = 1,..., p .

То есть запись произведения получается путем почленного умножения записей i -й строки A и j -го столбца B и суммирования этих n произведений. Другими словами, является скалярным произведением A i- й строки и j - го столбца B .

Следовательно, AB также можно записать как

Таким образом, произведение AB определяется тогда и только тогда, когда количество столбцов в A равно количеству строк в B , [1] в этом случае н .

В большинстве сценариев записи представляют собой числа, но они могут быть любыми математическими объектами , для которых определены сложение и умножение, которые являются ассоциативными и такими, что сложение является коммутативным , а умножение является распределительным по отношению к сложению. . В частности, записи сами могут быть матрицами (см. блочную матрицу ).

Вектор матрицы времен [ править ]

Вектор длины можно рассматривать как вектор-столбец , соответствующий матрица чьи записи даны Если является матрица, произведение матрицы на вектор, обозначаемое тогда это вектор который, рассматриваемый как вектор-столбец, равен матрица В индексной записи это равно:

Один из способов взглянуть на это состоит в том, что изменения от «простого» вектора к вектору-столбцу и обратно предполагаются и остаются неявными.

Матрица векторных времен [ править ]

Аналогично, вектор длины можно рассматривать как вектор-строку , соответствующую матрица. Чтобы было понятно, что имеется в виду вектор-строка, в этом контексте принято представлять его как транспонирование вектора -столбца; таким образом, можно увидеть такие обозначения, как Личность держит. В индексной записи, если является матрица, составляет:

Вектор, умноженный на вектор [ править ]

Скалярное произведение из двух векторов и одинаковой длины равен одной записи матрица, полученная в результате умножения этих векторов на строку и вектор-столбец, таким образом: (или что приводит к тому же матрица).

Иллюстрация [ править ]

На рисунке справа схематически показано произведение двух матриц A и B как каждое пересечение в матрице произведения соответствует строке A и столбцу B. , показывая ,

Значения на пересечениях, отмеченных кружками на рисунке справа, следующие:

Фундаментальные приложения [ править ]

Исторически умножение матриц было введено для облегчения и уточнения вычислений в линейной алгебре . Эта сильная связь между умножением матриц и линейной алгеброй остается фундаментальной во всей математике, а также в физике , химии , технике и информатике .

Линейные карты [ править ]

Если векторное пространство имеет конечный базис , каждый его вектор однозначно представлен конечной последовательностью скаляров, называемой координатным вектором , элементы которого являются координатами вектора в базисе. Эти координатные векторы образуют другое векторное пространство, изоморфное исходному векторному пространству. Координатный вектор обычно организуется как матрица-столбец (также называемая вектор-столбец ), которая представляет собой матрицу только с одним столбцом. Итак, вектор-столбец представляет собой как вектор координат, так и вектор исходного векторного пространства.

Линейное отображение A из векторного пространства размерности n в векторное пространство размерности m отображает вектор-столбец.

на вектор-столбец

Таким образом , линейное отображение A определяется матрицей

и отображает вектор-столбец к матричному произведению

Если B — еще одна линейная карта из предыдущего векторного пространства размерности m в векторное пространство размерности p , она представлена матрица Непосредственное вычисление показывает, что матрица составного отображения это матричное произведение Общая формула ), определяющий композицию функции, здесь рассматривается как частный случай ассоциативности матричного произведения (см. § Ассоциативность ниже):

Геометрические вращения [ править ]

Используя декартову систему координат в евклидовой плоскости, поворот на угол вокруг начала координат представляет собой линейную карту. Точнее,

где исходная точка и его изображение записываются в виде векторов-столбцов.

Состав ротации по и это по тогда соответствует матричному произведению

соответствующие тригонометрические тождества где для второго равенства используются . То есть композиция соответствует повороту на угол , как и ожидалось.

ресурсов экономике в Распределение

Вычисление нижней левой записи соответствует рассмотрению всех путей (выделено) от основного товара до конечного продукта на графике производственного потока.

Например, фиктивная фабрика использует 4 вида основных товаров : производить 3 вида промежуточных товаров , , которые, в свою очередь, используются для производства 3 видов конечной продукции , . Матрицы

и

обеспечить количество основных товаров, необходимых для данного количества промежуточных товаров, и количество промежуточных товаров, необходимых для данного количества конечной продукции, соответственно. Например, для производства одной единицы промежуточного товара , одна единица основного товара , две единицы , нет единиц и одна единица необходимы, соответствующие первому столбцу .

Используя умножение матриц, вычислите

эта матрица напрямую показывает количество основных товаров, необходимых для данного количества конечной продукции. Например, нижняя левая запись вычисляется как , отражая это единицы необходимы для производства одной единицы . Действительно, один агрегат нужен для , по одному на каждого из двух , и для каждого из четырёх единицы, которые входят в блок, см. рисунок.

Чтобы произвести, например, 100 единиц конечного продукта , 80 единиц и 60 единиц , необходимое количество основных товаров можно рассчитать как

то есть, единицы , единицы , единицы , единицы необходимы. Аналогично, матрица продуктов может использоваться для расчета необходимого количества основных товаров для получения других данных о количестве конечного товара. [9]

Система линейных уравнений [ править ]

Общий вид системы линейных уравнений имеет вид

Используя те же обозначения, что и выше, такая система эквивалентна одноматричному уравнению

Скалярное произведение, билинейная форма полуторалинейная форма и

Скалярное произведение двух векторов-столбцов является уникальной записью матричного произведения

где вектор - строка , полученная транспонированием . (Как обычно, матрица 1×1 идентифицируется по уникальной записи.)

В более общем смысле, любая билинейная форма в векторном пространстве конечной размерности может быть выражена как матричное произведение.

и любая полуторалинейная форма может быть выражена как

где обозначает транспонирование сопряженное (сопряжение транспонирования или, что эквивалентно, транспонирование конъюгата).

Общие свойства [ править ]

Умножение матриц имеет некоторые общие свойства с обычным умножением . Однако умножение матриц не определено, если число столбцов первого фактора отличается от количества строк второго фактора и оно некоммутативно . [10] даже если произведение остается определенным после изменения порядка факторов. [11] [12]

Некоммутативность [ править ]

Операция называется коммутативной , если даны два элемента A и B такие, что произведение определено, то также определяется, и

Если A и B — матрицы соответствующих размеров и , затем определяется, если , и определяется, если . Следовательно, если один из продуктов определен, другой определять не требуется. Если , два продукта определены, но имеют разные размеры; поэтому они не могут быть равными. Только если , то есть, если A и B квадратные матрицы одинакового размера, оба продукта определены и имеют одинаковый размер. Даже в этом случае в целом

Например

но

Этот пример можно расширить, чтобы показать, что, если A является матрица с записями в поле F , то для каждого матрица B с элементами из F , когда тогда и только тогда где и я , единичная матрица . Если вместо поля предполагается принадлежность записей кольцу , нужно добавить условие принадлежности c центру то кольца.

Один особый случай, когда коммутативность действительно имеет место, - это когда D и E представляют собой две (квадратные) диагональные матрицы (одного и того же размера); тогда DE = ED . [10] Опять же, если матрицы расположены над общим кольцом, а не над полем, соответствующие элементы в каждой из них также должны коммутировать друг с другом, чтобы это выполнялось.

Дистрибутивность [ править ]

Матричное произведение является дистрибутивным относительно сложения матриц . То есть, если A , B , C , D являются матрицами соответствующих размеров m × n , n × p , n × p и p × q , имеет место (левая дистрибутивность)

и (правая дистрибутивность)

[10]

Это следует из распределения коэффициентов по формуле

Произведение со скаляром [ править ]

Если A — матрица, а c — скаляр, то матрицы и получаются умножением всех записей A на c слева или справа . Если скаляры обладают коммутативным свойством , то

Если продукт определено (то есть количество столбцов A равно количеству строк B ), тогда

и

Если скаляры обладают свойством коммутативности, то все четыре матрицы равны. В более общем смысле, все четыре равны, если c принадлежит центру кольца , содержащего элементы матриц, потому что в этом случае c X = X c для всех матриц X .

Эти свойства являются результатом билинейности произведения скаляров:

Транспонировать [ править ]

Если скаляры обладают коммутативным свойством , транспонирование произведения матриц является произведением транспонированных множителей в обратном порядке. То есть

где Т обозначает транспонирование, то есть замену строк и столбцов.

Это тождество не справедливо для некоммутативных элементов, поскольку порядок между элементами A и B меняется на обратный, когда расширяется определение матричного произведения.

Комплексно-сопряженное [ править ]

Если A и B имеют комплексные записи, то

где * элементам обозначает комплексно-сопряженную матрицу по .

Это является результатом применения к определению матричного произведения того факта, что сопряженная сумма является суммой сопряженных слагаемых, а сопряженная часть произведения является произведением сопряженных множителей.

Транспозиция действует на индексы статей, а сопряжение действует независимо на сами записи. В результате, если A и B имеют комплексные записи, то

где обозначает сопряженное транспонирование (сопряженное транспонирование или, что эквивалентно, транспонирование сопряженного).

Ассоциативность [ править ]

Учитывая три матрицы A , B и C , произведения ( AB ) C и A ( BC ) определяются тогда и только тогда, когда количество столбцов A равно количеству строк B , а количество столбцов B равно числу строк C (в частности, если определено одно из произведений, то определено и другое). В этом случае имеется ассоциативное свойство

Как и любая ассоциативная операция, это позволяет опустить круглые скобки и записать приведенные выше произведения в виде

Это естественным образом распространяется на произведение любого количества матриц при условии совпадения размеров. То есть, если A 1 , A 2 , ..., An являются матрицами такими, что количество столбцов A i равно количеству строк A i + 1 для i = 1, ..., n – 1 , тогда продукт

определена и не зависит от порядка умножения , если порядок матриц сохраняется фиксированным.

Эти свойства можно доказать с помощью простых, но сложных манипуляций с суммированием . Этот результат также следует из того, что матрицы представляют собой линейные отображения . Следовательно, ассоциативное свойство матриц — это просто частный случай ассоциативного свойства композиции функций .

Сложность вычислений зависит от скобок [ править ]

Хотя результат последовательности произведений матриц не зависит от порядка выполнения операции (при условии, что порядок матриц не изменяется), сложность вычислений может существенно зависеть от этого порядка.

Например, если A , B и C — матрицы соответствующих размеров 10×30, 30×5, 5×60 , для вычисления ( AB ) C требуется 10×30×5 + 10×5×60 = 4500 умножений, при вычислении A ( BC ) требуется 30×5×60 + 10×30×60 = 27 000 умножений.

Разработаны алгоритмы выбора наилучшего порядка произведений, см. Умножение цепочки матриц . при увеличении числа матриц n выбор наилучшего порядка имеет сложность Было показано, что

Приложение к сходству [ править ]

Любая обратимая матрица определяет преобразование подобия (на квадратных матрицах того же размера, что и )

Преобразования сходства отображают продукт в продукты, то есть

Фактически, у человека есть

Квадратные матрицы [ править ]

Обозначим набор n × n квадратных матриц размера с элементами в кольце R , которое на практике часто является полем .

В , произведение определено для каждой пары матриц. Это делает кольцо (матрица , , которое имеет единичную матрицу I в качестве единичного элемента диагональные элементы которой равны 1, а все остальные элементы равны 0). Это кольцо также является ассоциативной R -алгеброй .

Если n > 1 , многие матрицы не имеют мультипликативной обратной . Например, матрица, в которой все элементы строки (или столбца) равны 0, не имеет обратной. Если она существует, обратная матрица A обозначается A −1 , и, таким образом, проверяет

Матрица, имеющая обратную, является обратимой матрицей . В противном случае это сингулярная матрица .

Произведение матриц обратимо тогда и только тогда, когда обратим каждый множитель. В этом случае имеется

Когда R коммутативно произведения является и, в частности, когда оно является полем, определитель произведением определителей. Поскольку определители являются скалярами, а скаляры коммутируют, то имеем

Другие инварианты матрицы ведут себя с произведениями не так хорошо. Тем не менее, если R коммутативно, AB и BA имеют один и тот же след , один и тот же характеристический полином и одни и те же собственные значения с одинаковыми кратностями. Однако собственные векторы , как правило, различны, если AB BA .

Степени матрицы [ править ]

Квадратную матрицу можно возвести в любую неотрицательную целую степень, многократно умножив ее на себя так же, как и для обычных чисел. То есть,

Для вычисления k -й степени матрицы требуется в k – 1 раз больше времени, чем умножение одной матрицы, если это делается с помощью тривиального алгоритма (повторное умножение). Поскольку это может занять очень много времени, обычно предпочитают использовать возведение в степень возведением в квадрат , которое требует менее 2 log 2 k умножений матриц и, следовательно, намного более эффективно.

Самый простой случай возведения в степень — это случай диагональной матрицы . Поскольку произведение диагональных матриц представляет собой простое умножение соответствующих диагональных элементов вместе, k -я степень диагональной матрицы получается путем возведения элементов в степень k :

Абстрактная алгебра [ править ]

Определение матричного произведения требует, чтобы элементы принадлежали полукольцу, и не требует, чтобы умножение элементов полукольца было коммутативным . Во многих приложениях элементы матрицы принадлежат полю, хотя тропическое полукольцо также является распространенным выбором для задач о кратчайшем пути графа . [13] Даже в случае матриц над полями произведение вообще не коммутативно, хотя оно ассоциативно и дистрибутивно относительно сложения матриц . Единичные матрицы (которые представляют собой квадратные матрицы , элементы которых равны нулю вне главной диагонали и 1 на главной диагонали) являются единичными элементами матричного произведения. Отсюда следует, что матрицы размера n × n над кольцом образуют кольцо, которое некоммутативно, за исключением случаев, когда n = 1 и основное кольцо коммутативно.

Квадратная матрица может иметь мультипликативную обратную матрицу , называемую обратной матрицей . В общем случае, когда элементы принадлежат коммутативному кольцу R , матрица имеет обратную тогда и только тогда, когда ее имеет мультипликативную обратную в R. определитель Определителем произведения квадратных матриц является произведение определителей множителей. Матрицы размера n × n , имеющие обратную форму, группу при умножении матриц образуют , подгруппы которой называются группами матриц . Многие классические группы (включая все конечные группы ) изоморфны матричным группам; это отправная точка теории представлений групп .

Вычислительная сложность [ править ]

Улучшение оценок показателя ω с течением времени для вычислительной сложности умножения матриц

умножения матриц Алгоритм , который следует из определения, требует, в худшем случае , умножения и сложение скаляров для вычисления произведения двух квадратных матриц размера n × n . Таким образом, его вычислительная сложность составляет , в модели вычислений , для которой скалярные операции занимают постоянное время.

Довольно удивительно, что эта сложность не является оптимальной, как показал в 1969 году Фолькер Штрассен , который разработал алгоритм, теперь называемый алгоритмом Штрассена , со сложностью [14] Алгоритм Штрассена можно распараллелить для дальнейшего повышения производительности. [15] По состоянию на январь 2024 г. , лучший рецензируемый алгоритм умножения матриц принадлежит Вирджинии Василевской Уильямс , Иньчжан Сюй, Цзысюань Сюй и Жэньфэй Чжоу и имеет сложность O ( n 2.371552 ) . [16] [17] Неизвестно, можно ли выполнить умножение матриц за n 2 + о(1) время. [18] Это было бы оптимально, так как необходимо прочитать элементы матрицы, чтобы умножить ее на другую матрицу.

Поскольку умножение матриц составляет основу многих алгоритмов, а многие операции над матрицами даже имеют ту же сложность, что и умножение матриц (с точностью до мультипликативной константы), вычислительная сложность умножения матриц проявляется во всей числовой линейной алгебре и теоретической информатике .

Обобщения [ править ]

К другим видам изделий из матриц относятся:

См. также [ править ]

Примечания [ править ]

  1. ^ Перейти обратно: а б Никамп, Дуэйн. «Умножение матриц и векторов» . Математическое понимание . Проверено 6 сентября 2020 г.
  2. ^ О'Коннор, Джон Дж.; Робертсон, Эдмунд Ф. , «Жак Филипп Мари Бине» , Архив истории математики MacTutor , Университет Сент-Эндрюс
  3. ^ Лернер, Р.Г .; Тригг, Г.Л. (1991). Энциклопедия физики (2-е изд.). Издатели ВГС. ISBN  978-3-527-26954-9 .
  4. ^ Паркер, CB (1994). Энциклопедия физики МакГроу Хилла (2-е изд.). МакГроу-Хилл. ISBN  978-0-07-051400-3 .
  5. ^ Липшуц, С.; Липсон, М. (2009). Линейная алгебра . Очерки Шаума (4-е изд.). МакГроу Хилл (США). стр. 30–31. ISBN  978-0-07-154352-1 .
  6. ^ Райли, К.Ф.; Хобсон, член парламента; Бенс, SJ (2010). Математические методы в физике и технике . Издательство Кембриджского университета. ISBN  978-0-521-86153-3 .
  7. ^ Адамс, РА (1995). Исчисление, полный курс (3-е изд.). Эддисон Уэсли. п. 627. ИСБН  0-201-82823-5 .
  8. ^ Хорн, Джонсон (2013). Матричный анализ (2-е изд.). Издательство Кембриджского университета. п. 6. ISBN  978-0-521-54823-6 .
  9. ^ Питер Стингл (1996). Математика для технических вузов - технологии и информатика (на немецком языке) (5-е изд.). Мюнхен : Карл Хансер Верлаг . ISBN  3-446-18668-9 . Здесь: Пример.5.4.10, стр.205-206.
  10. ^ Перейти обратно: а б с Вайсштейн, Эрик В. «Умножение матриц» . mathworld.wolfram.com . Проверено 06 сентября 2020 г.
  11. ^ Липшуц, С.; Липсон, М. (2009). «2». Линейная алгебра . Очерки Шаума (4-е изд.). МакГроу Хилл (США). ISBN  978-0-07-154352-1 .
  12. ^ Хорн, Джонсон (2013). «Глава 0». Матричный анализ (2-е изд.). Издательство Кембриджского университета. ISBN  978-0-521-54823-6 .
  13. ^ Мотвани, Раджив ; Рагхаван, Прабхакар (1995). Рандомизированные алгоритмы . Издательство Кембриджского университета. п. 280. ИСБН  9780521474658 .
  14. ^ Фолькер Штрассен (август 1969 г.). «Исключение по Гауссу не является оптимальным» . Численная математика . 13 (4): 354–356. дои : 10.1007/BF02165411 . S2CID   121656251 .
  15. ^ К.-К. Чжоу и Ю.-Ф. Дэн, Г. Ли и Ю. Ван (1995). «Распараллеливание метода Штрассена для умножения матриц в архитектурах MIMD с распределенной памятью» (PDF) . Компьютеры Математика. Приложение . 30 (2): 49–69. дои : 10.1016/0898-1221(95)00077-C .
  16. ^ Василевска Уильямс, Вирджиния; Сюй, Иньчжан; Сюй, Цзысюань; Чжоу, Ренфэй. Новые границы умножения матриц: от альфы до омеги . Материалы ежегодного симпозиума ACM-SIAM по дискретным алгоритмам (SODA) 2024 года. стр. 3792–3835. arXiv : 2307.07970 . дои : 10.1137/1.9781611977912.134 .
  17. ^ Надис, Стив (7 марта 2024 г.). «Новый прорыв приближает умножение матриц к идеалу» . Проверено 9 марта 2024 г.
  18. ^ то есть за время n 2+ж(п) , для некоторой функции f такой, что f ( n ) 0 при n → ∞

Ссылки [ править ]