Jump to content

Матрица (математика)

Это хорошая статья. Нажмите здесь для получения дополнительной информации.
(Перенаправлено из Бесконечная матрица )

Две высокие квадратные скобки с m-многими строками, каждая из которых содержит n-многие переменные с индексом «a». Каждой букве «а» присваивается номер строки и номер столбца в качестве нижнего индекса.
Матрица размера m × n : строки m горизонтальны, а столбцы n вертикальны. Каждый элемент матрицы часто обозначается переменной с двумя индексами . Например, 2,1 представляет элемент во второй строке и первом столбце матрицы.

В математике матрица прямоугольный ( мн.: matrices ) — это массив или таблица чисел , символов или выражений с элементами или записями, расположенными в строках и столбцах, которая используется для представления математического объекта или свойства такого объекта.

Например, представляет собой матрицу с двумя строками и тремя столбцами. Это часто называют «матрицей два на три». матрица" или матрица размерности .

Матрицы обычно связаны с линейной алгеброй . Заметные исключения включают матрицы инцидентности и матрицы смежности в теории графов . [1] Эта статья посвящена матрицам, связанным с линейной алгеброй, и, если не указано иное, все матрицы представляют собой линейные карты или могут рассматриваться как таковые.

Квадратные матрицы , матрицы с одинаковым количеством строк и столбцов, играют важную роль в теории матриц. Квадратные матрицы заданной размерности образуют некоммутативное кольцо , которое является одним из наиболее распространенных примеров некоммутативного кольца. Определителем квадратной матрицы является число , связанное с матрицей, которое является фундаментальным для изучения квадратной матрицы; например, квадратная матрица обратима тогда и только тогда, когда она имеет ненулевой определитель, а собственные значения квадратной матрицы являются корнями полиномиального определителя .

В геометрии матрицы широко используются для определения и представления геометрических преобразований (например, поворотов ) и изменений координат . В численном анализе многие вычислительные задачи решаются путем сведения их к матричным вычислениям, и это часто предполагает вычисления с матрицами огромных размеров. Матрицы используются в большинстве областей математики и научных областей либо напрямую, либо посредством их использования в геометрии и численном анализе.

Теория матриц — это раздел математики , который занимается изучением матриц. Первоначально это была часть линейной алгебры , но вскоре она расширилась и включила в себя предметы, связанные с теорией графов , алгеброй , комбинаторикой и статистикой .

Определение

[ редактировать ]

Матрица это прямоугольный массив чисел (или других математических объектов), называемый элементами матрицы. С матрицами выполняются стандартные операции, такие как сложение и умножение . [2] Чаще всего матрица над F представляет собой прямоугольный массив элементов F полем . [3] [4] и Действительная матрица комплексная матрица — это матрицы, элементами которых являются соответственно действительные или комплексные числа . Более общие типы записей обсуждаются ниже . Например, это реальная матрица:

Числа, символы или выражения в матрице называются ее записями или элементами . Горизонтальные и вертикальные строки элементов матрицы называются строками и столбцами соответственно.

Размер матрицы определяется количеством содержащихся в ней строк и столбцов. Нет ограничений на количество строк и столбцов, которые может иметь матрица (в обычном смысле), если они являются целыми положительными числами. Матрица с ряды и столбцы называются матрица, или -к- матрица, где и называются его размерами . Например, матрица выше это матрица.

Матрицы с одной строкой называются векторами-строками , а матрицы с одним столбцом — векторами-столбцами . Матрица с одинаковым количеством строк и столбцов называется квадратной матрицей . [5] Матрица с бесконечным числом строк или столбцов (или того и другого) называется бесконечной матрицей . В некоторых контекстах, например в программах компьютерной алгебры , полезно рассматривать матрицу без строк и столбцов, называемую пустой матрицей .

Обзор размера матрицы
Имя Размер Пример Описание Обозначения
Вектор-строка 1  ×  n Матрица с одной строкой, иногда используемая для представления вектора.
Вектор-столбец n  ×  1 Матрица с одним столбцом, иногда используемая для представления вектора.
Квадратная матрица n  ×  n Матрица с одинаковым количеством строк и столбцов, иногда используемая для представления линейного преобразования векторного пространства в себя, такого как отражение , вращение или сдвиг .

Обозначения

[ редактировать ]

Специфика обозначения символьных матриц широко варьируется, но преобладают некоторые тенденции. Матрицы обычно записываются в квадратных скобках или круглых скобках , так что матрица представлен как Это можно сократить, написав только один общий термин, возможно, вместе с индексами, как в или в случае, если .

Матрицы обычно обозначаются прописными буквами (например, в примерах выше), а соответствующие строчные буквы с двумя индексами нижнего регистра (например, , или ), представляют записи. Помимо использования заглавных букв для обозначения матриц, многие авторы используют специальный типографский стиль , обычно жирный римский (не курсив), чтобы еще больше отличать матрицы от других математических объектов. Альтернативное обозначение включает использование двойного подчеркивания имени переменной с жирным шрифтом или без него, как в .

Запись в i -й строке и j -м столбце матрицы A иногда называют или вход матрицы и обычно обозначается или . Альтернативные обозначения для этой записи: и . Например, ввод следующей матрицы равно 5 (также обозначается , , или ):

Иногда элементы матрицы можно определить по такой формуле, как . Например, каждая из записей следующей матрицы определяется по формуле .

В этом случае сама матрица иногда определяется этой формулой в квадратных или двойных скобках. Например, приведенная выше матрица определяется как или . Если размер матрицы , указанная выше формула действителен для любого и любой . Это можно указать отдельно или указать с помощью в качестве нижнего индекса. Например, матрица выше это , и может быть определен как или .

Некоторые языки программирования используют массивы с двойным индексом (или массивы массивов) для представления m матрицы размером на n . Некоторые языки программирования начинают нумерацию индексов массива с нуля, и в этом случае элементы матрицы m - n индексируются и . [6] Эта статья следует более распространенному соглашению в математической литературе, согласно которому нумерация начинается с 1 .

Набор действительных матриц размером всех m на n часто обозначается или Набор всех mxn размером матриц над другим полем или над кольцом R аналогично обозначается или Если m   =   n , например, в случае квадратных матриц , размерность не повторяется: или [7] Часто, , или , используется вместо

Основные операции

[ редактировать ]

К матрицам можно применять несколько основных операций. Некоторые из них, такие как транспонирование и подматрица, не зависят от характера записей. Другие, такие как сложение матриц , скалярное умножение , умножение матриц и операции со строками, включают операции с элементами матрицы и, следовательно, требуют, чтобы элементы матрицы были числами или принадлежали полю или кольцу . [8]

В этом разделе предполагается, что элементы матрицы принадлежат фиксированному кольцу, которое обычно представляет собой поле чисел.

Сложение, скалярное умножение, вычитание и транспонирование.

[ редактировать ]
Добавление

Сумма двух A + B матриц m x n размером A и B вычисляется по пунктам:

( A + B ) я , j знак равно А я , j + B я , j , где 1 ≤ я м и 1 ≤ j п .

Например,

Скалярное умножение

Произведение c A числа c (также называемого в этом контексте скаляром ) и матрицы A вычисляется путем умножения каждой записи A на c :

( c А ) я , j знак равно c · А я , j .

Эта операция называется скалярным умножением , но ее результат не называется «скалярным произведением», чтобы избежать путаницы, поскольку «скалярное произведение» часто используется как синоним « внутреннего произведения ». Например:

Вычитание

Вычитание двух матриц размера m × n определяется путем сложения матриц со скалярным умножением на –1 :

Транспонирование

Транспонирование . матрицы m размером на A n представляет собой n размером на m матрицу A Т (также обозначается А тр или т А ) образуется путем превращения строк в столбцы и наоборот:

( А Т ) я , j знак равно А j , я .

Например:

На эти операции над матрицами распространяются знакомые свойства чисел: например, сложение коммутативно то есть сумма матриц не зависит от порядка слагаемых: A   +   B   =   B   +   A. , [9] Транспонирование совместимо со сложением и скалярным умножением, что выражается формулой ( c A ) Т = с ( А Т ) и ( А   +   В ) Т  =   А Т  +   Б Т . Наконец ( А Т ) Т  =   А.

Умножение матрицы

[ редактировать ]
Схематическое изображение матричного произведения AB двух матриц A и B.

Умножение двух матриц определяется тогда и только тогда, когда количество столбцов левой матрицы совпадает с количеством строк правой матрицы. Если A m матрица размером на n , а B n матрица размером на p , то их матричный продукт AB — это m матрица размером на p , элементы которой задаются скалярным произведением соответствующей строки A и соответствующей строки. столбец B : [10]

где 1 ≤ i m и 1 ≤ j p . [11] Например, подчеркнутая запись 2340 в произведении рассчитывается как (2×1000) + (3×100) + (4×10) = 2340:

Умножение матриц удовлетворяет правилам ( AB ) C = A ( BC ) ( ассоциативность ) и ( A + B ) C = AC + BC , а также C ( A + B ) = CA + CB (левая и правая дистрибутивность ), всякий раз, когда размер матриц таков, что определены различные продукты. [12] Произведение AB может быть определено без BA определения , а именно, если A и B представляют собой матрицы m -by- n и n -by- k соответственно, и m k . Даже если определены оба продукта, они, как правило, не обязательно должны быть равными, то есть:

АВ БА ,

Другими словами, умножение матриц не является коммутативным , в отличие от чисел (рациональных, действительных или комплексных), произведение которых не зависит от порядка множителей. [10] Пример двух матриц, не коммутирующих друг с другом:

тогда как

Помимо только что описанного обычного умножения матриц, существуют и другие менее часто используемые операции с матрицами, которые можно рассматривать как формы умножения, такие как произведение Адамара и произведение Кронекера . [13] Они возникают при решении матричных уравнений, таких как уравнение Сильвестра .

Операции со строками

[ редактировать ]

Существует три типа операций со строками:

  1. добавление строки, то есть добавление одной строки к другой.
  2. умножение строк, то есть умножение всех записей строки на ненулевую константу;
  3. переключение строк, то есть замена двух строк матрицы;

Эти операции используются несколькими способами, включая решение линейных уравнений и поиск обратных матриц .

Подматрица

[ редактировать ]

Подматрица . матрицы — это матрица, полученная удалением любого набора строк и/или столбцов [14] [15] [16] Например, из следующей матрицы 3х4 мы можем построить подматрицу 2х3, удалив строку 3 и столбец 2:

Миноры определителя и кофакторы матрицы находятся путем вычисления определенных подматриц. [16] [17]

Главная подматрица — это квадратная подматрица, полученная удалением определенных строк и столбцов. Определение варьируется от автора к автору. По мнению некоторых авторов, главная подматрица — это подматрица, в которой набор оставшихся индексов строк такой же, как набор оставшихся индексов столбцов. [18] [19] Другие авторы определяют главную подматрицу как такую, в которой первые k строк и столбцов для некоторого числа k являются теми, которые остаются; [20] этот тип подматрицы также называют ведущей главной подматрицей . [21]

Линейные уравнения

[ редактировать ]

Матрицы можно использовать для компактной записи и работы с несколькими линейными уравнениями, то есть системами линейных уравнений. Например, если A m x матрица размером n , x обозначает вектор-столбец (то есть матрицу n × 1) из n переменных x 1 , x 2 , ..., x n , а b — матрица m ×1-вектор-столбец, то матричное уравнение

эквивалентна системе линейных уравнений [22]

Используя матрицы, эту задачу можно решить более компактно, чем это было бы возможно, выписав все уравнения по отдельности. Если n = m и уравнения независимы , то это можно сделать, написав

где А −1 является матрицей A . обратной Если A не имеет обратного, решения (если таковые имеются) можно найти, используя его обобщенное обратное .

Линейные преобразования

[ редактировать ]
Векторы, представленные матрицей 2х2, соответствуют сторонам единичного квадрата, преобразованного в параллелограмм.

Матрицы и умножение матриц раскрывают свои существенные особенности, когда они связаны с линейными преобразованиями , также известными как линейные карты . Действительная размером m × n матрица A приводит к линейному преобразованию R н Р м отображение каждого вектора x в R н к (матричному) произведению Ax , которое является вектором в R м . И наоборот, каждое линейное преобразование f : R н Р м возникает из уникальной mxn размером , матрицы A : явно ( i , j ) -запись A является i й координата f ( e j ), где e j = (0,...,0,1,0,...,0) единичный вектор с 1 в j й позиция и 0 в другом месте. f , Говорят, что матрица A представляет линейное а A называется матрицей преобразования f отображение .

Например, матрица 2×2

можно рассматривать как преобразование единичного квадрата в параллелограмм с вершинами в точках (0, 0) , ( a , b ) , ( a + c , b + d ) и ( c , d ) . Параллелограмм, изображенный справа, получается умножением A на каждый из вектор-столбцов. , и по очереди. Эти векторы определяют вершины единичного квадрата.

В следующей таблице показано несколько действительных матриц 2 × 2 с соответствующими линейными картами R. 2 . Синий зеленой оригинал сопоставляется с сеткой и фигурами. Начало координат (0,0) отмечено черной точкой.

Горизонтальный сдвиг
при м = 1,25.
Отражение через вертикальную ось Сжатие карт
с г = 3/2
Масштабирование
в 3/2 раза
Вращение
на π /6 = 30°

При соответствии 1 к 1 между матрицами и линейными картами умножение матриц соответствует композиции карт: [23] если k размером x m матрица B представляет собой другую линейную карту g : R м Р к , то композиция g f представляется через BA, так как

( г ж )( Икс ) знак равно г ( ж ( Икс )) знак равно г ( Ах ) знак равно B ( Ах ) знак равно ( BA ) Икс .

Последнее равенство следует из отмеченной выше ассоциативности умножения матриц.

Ранг матрицы A — это максимальное количество линейно независимых векторов-строк матрицы, которое совпадает с максимальным количеством линейно независимых векторов-столбцов. [24] Эквивалентно это размерность изображения представленной линейной карты, A . [25] Теорема о ранге-нулевости утверждает, что размерность ядра матрицы плюс ранг равна количеству столбцов матрицы. [26]

Квадратная матрица

[ редактировать ]

Квадратная матрица это матрица с одинаковым количеством строк и столбцов. [5] Матрица n на размера n называется квадратной матрицей порядка n. Любые две квадратные матрицы одного порядка можно складывать и перемножать.Элементы a ii образуют главную диагональ квадратной матрицы. Они лежат на воображаемой линии, идущей из левого верхнего угла в правый нижний угол матрицы.

Основные типы

[ редактировать ]
Имя Пример с n = 3
Диагональная матрица
Нижняя треугольная матрица
Верхняя треугольная матрица

Диагональная и треугольная матрица

[ редактировать ]

Если все элементы A ниже главной диагонали равны нулю, A называется верхней треугольной матрицей . Аналогично, если все элементы A выше главной диагонали равны нулю, A называется нижней треугольной матрицей . Если все элементы за пределами главной диагонали равны нулю, A называется диагональной матрицей .

Матрица идентичности

[ редактировать ]

Единичная матрица I n размера n — это n матрица размером × n , в которой все элементы на главной диагонали равны 1, а все остальные элементы равны 0, например,

Это квадратная матрица порядка n , а также особый вид диагональной матрицы . Она называется единичной матрицей, потому что умножение на нее оставляет матрицу неизменной:

AI n = I m A = A для любой m x размера n матрицы A .

Ненулевое скалярное кратное единичной матрицы называется скалярной матрицей. Если элементы матрицы происходят из поля, скалярные матрицы образуют группу при умножении матриц, которая изоморфна мультипликативной группе ненулевых элементов поля.

Симметричная или кососимметричная матрица

[ редактировать ]

Квадратная матрица A , равная ее транспонированной, то есть A = A Т , является симметричной матрицей . Если вместо этого A равно отрицательному результату транспонирования, то есть A = − A Т , то A кососимметричная матрица . В комплексных матрицах симметрию часто заменяют понятием эрмитовых матриц , удовлетворяющих условию А = A , где звездочка или звездочка обозначает сопряженное транспонирование матрицы, то есть транспонирование комплексно -сопряженного числа A .

По спектральной теореме вещественные симметричные матрицы и комплексные эрмитовые матрицы имеют собственный базис ; то есть каждый вектор выражается как линейная комбинация собственных векторов. В обоих случаях все собственные значения действительны. [27] Эту теорему можно обобщить на бесконечномерные ситуации, связанные с матрицами с бесконечным числом строк и столбцов, см. ниже .

Обратимая матрица и ее обратная

[ редактировать ]

Квадратная матрица A называется обратимой или неособой, если существует матрица B такая, что

AB = BA = I n , [28] [29]

где I n n × n единичная матрица размера с единицами на главной диагонали и нулями в остальных местах. Если B существует, она уникальна и называется обратной матрицей A A. , обозначаемой −1 .

Определенная матрица

[ редактировать ]
Положительно определенная матрица Неопределенная матрица

Точки такие, что
( Эллипс )

Точки такие, что
( Гипербола )

Несимметричная вещественная матрица A называется положительно определенной, если ассоциированная квадратичная форма

ж ( Икс ) знак равно Икс Т А   х

имеет положительное значение для каждого ненулевого вектора x в R н . Если f ( x ) дает только отрицательные значения, то A является отрицательно определенным ; если f действительно дает как отрицательные, так и положительные значения, то A является неопределенным . [30] Если квадратичная форма f дает только неотрицательные значения (положительные или нулевые), симметричная матрица называется положительно-полуопределенной (или, если только неположительные значения, то отрицательно-полуопределенной); следовательно, матрица является неопределенной именно тогда, когда она не является ни положительно-полуопределенной, ни отрицательно-полуопределенной.

Симметричная матрица является положительно определенной тогда и только тогда, когда все ее собственные значения положительны, то есть матрица положительно-полуопределенна и обратима. [31] Таблица справа показывает две возможности для матриц 2х2.

Разрешение в качестве входных данных двух разных векторов вместо этого дает билинейную форму, связанную с A : [32]

B А ( Икс , y ) знак равно Икс Т Ой .

В случае комплексных матриц применяются та же терминология и результат: симметричная матрица , квадратичная форма , билинейная форма и транспонирование x Т заменены соответственно эрмитовой матрицей , эрмитовой формой , полуторалинейной формой и сопряженным транспонированием x ЧАС .

Ортогональная матрица

[ редактировать ]

Ортогональная матрица — это квадратная матрица с действительными элементами, столбцы и строки которой являются ортогональными единичными векторами (то есть ортонормированными векторами). Эквивалентно, матрица A ортогональна, если ее транспонирование равно обратному :

что влечет за собой

где I n единичная матрица размера n .

Ортогональная матрица A обязательно обратима (с обратной A −1 = А Т ), унитарный ( А −1 = A * ) и нормальный ( A * A = AA * ). Определитель любой ортогональной матрицы равен +1 или −1 . Специальная ортогональная матрица — это ортогональная матрица с определителем +1. В качестве линейного преобразования каждая ортогональная матрица с определителем +1 представляет собой чистое вращение без отражения, т. е. преобразование сохраняет ориентацию преобразованной структуры, в то время как каждая ортогональная матрица с определителем -1 меняет ориентацию на противоположную, т. е. представляет собой композицию чистое отражение и (возможно, нулевое) вращение. Единичные матрицы имеют определитель 1 и представляют собой чистые повороты на нулевой угол.

Комплексным аналогом ортогональной матрицы является унитарная матрица .

Основные операции

[ редактировать ]

След представляет собой tr( A ) квадратной матрицы A сумму ее диагональных элементов. Хотя умножение матриц не является коммутативным, как упоминалось выше , след произведения двух матриц не зависит от порядка множителей:

.

Это следует из определения умножения матриц:

Отсюда следует, что след произведения более чем двух матриц не зависит от циклических перестановок матриц, однако это, вообще говоря, неприменимо для произвольных перестановок (например, tr( ABC ) ≠ tr( BAC ), вообще говоря) . Кроме того, след матрицы равен следу ее транспонирования, то есть

тр( А ) = тр( А Т ) .

Определитель

[ редактировать ]
Линейное преобразование на R 2 заданной указанной матрицей. Определитель этой матрицы равен -1, так как площадь зеленого параллелограмма справа равна 1, но карта меняет ориентацию на противоположную , поскольку она меняет ориентацию векторов против часовой стрелки на ориентацию по часовой стрелке.

Определитель |) — это число , квадратной матрицы A (обозначается det( A ) или | A кодирующее определенные свойства матрицы. Матрица обратима тогда и только тогда, когда ее определитель отличен от нуля. Его абсолютное значение равно площади (в R 2 ) или объём (в Р 3 ) образа единичного квадрата (или куба), а его знак соответствует ориентации соответствующего линейного отображения: определитель положителен тогда и только тогда, когда ориентация сохраняется.

Определитель матриц 2х2 определяется выражением

[33]

Определитель матриц 3х3 включает 6 членов ( правило Сарруса ). Более длинная формула Лейбница обобщает эти две формулы на все измерения. [34]

Определитель произведения квадратных матриц равен произведению их определителей:

det( AB ) = det( A ) · det( B ) или используя альтернативные обозначения:
| АБ | = | А | · | Б |. [35]

Добавление кратного любой строки к другой строке или кратного любого столбца к другому столбцу не меняет определитель. Перестановка двух строк или двух столбцов влияет на определитель, умножая его на -1. [36] С помощью этих операций любую матрицу можно преобразовать в нижнюю (или верхнюю) треугольную матрицу, причем для таких матриц определитель равен произведению элементов на главной диагонали; это обеспечивает метод вычисления определителя любой матрицы. Наконец, разложение Лапласа выражает определитель через миноры , то есть определители меньших матриц. [37] Это расширение можно использовать для рекурсивного определения определителей (взяв в качестве начального случая определитель матрицы 1 на 1, который является ее уникальной записью, или даже определитель матрицы 0 на 0, который равен 1) , что, как можно видеть, эквивалентно формуле Лейбница. Определители можно использовать для решения линейных систем с использованием правила Крамера , где деление определителей двух связанных квадратных матриц приравнивается к значению каждой из переменных системы. [38]

Собственные значения и собственные векторы

[ редактировать ]

Число и ненулевой вектор v, удовлетворяющий

называются собственным значением и вектором A собственным соответственно. [39] [40] Число λ является собственным значением n × n -матрицы A тогда и только тогда, когда A − λ I n не обратима, эквивалентно что

[41]

Полином p A от неопределенного X, вычислением определителя det( X I n A ), называется характеристическим многочленом A заданный . Это полином степени n . монический Следовательно, полиномиальное уравнение p A (λ)   =   0 имеет не более n различных решений, т. е. собственных значений матрицы. [42] Они могут быть сложными, даже если записи A реальны. Согласно теореме Кэли-Гамильтона , p A ( A ) = 0 , то есть результат подстановки самой матрицы в ее характеристический полином дает нулевую матрицу .

Вычислительные аспекты

[ редактировать ]

Матричные вычисления часто могут выполняться с использованием различных методов. Многие задачи можно решить как прямыми алгоритмами, так и итерационными подходами. Например, собственные векторы квадратной матрицы можно получить, найдя последовательность векторов x n, сходящихся к собственному вектору, когда n стремится к бесконечности . [43]

Чтобы выбрать наиболее подходящий алгоритм для каждой конкретной задачи, важно определить как эффективность, так и точность всех доступных алгоритмов. Область, изучающая эти вопросы, называется числовой линейной алгеброй . [44] Как и в других числовых ситуациях, двумя основными аспектами являются сложность алгоритмов и их численная стабильность .

Определение сложности алгоритма означает нахождение верхних границ или оценок того, сколько элементарных операций, таких как сложение и умножение скаляров, необходимо для выполнения некоторого алгоритма, например, умножения матриц . Для вычисления матричного произведения двух n матриц размером на n с использованием приведенного выше определения требуется n 3 умножения, поскольку для любого из n 2 записей произведения, n необходимо умножений. Алгоритм Штрассена превосходит этот «наивный» алгоритм; для этого нужно только н 2.807 умножения. [45] Усовершенствованный подход также учитывает особенности вычислительных устройств.

Во многих практических ситуациях известна дополнительная информация об используемых матрицах. Важным случаем являются разреженные матрицы , то есть матрицы, большинство элементов которых равны нулю. Существуют специально адаптированные алгоритмы, скажем, для решения линейных систем Ax = b для разреженных матриц A , такие как метод сопряженного градиента . [46]

Алгоритм, грубо говоря, численно устойчив, если небольшие отклонения входных значений не приводят к большим отклонениям результата. Например, вычисление обратной матрицы с помощью расширения Лапласа (adj( ) обозначает сопряженную матрицу A A )

А −1 = прил( А ) / дет( А )

может привести к значительным ошибкам округления, если определитель матрицы очень мал. Норму матрицы можно использовать для определения обусловленности линейных алгебраических задач, таких как вычисление обратной матрицы. [47]

Большинство языков программирования поддерживают массивы, но не имеют встроенных команд для работы с матрицами. Вместо этого доступные внешние библиотеки обеспечивают матричные операции с массивами почти на всех используемых в настоящее время языках программирования. Манипулирование матрицами было одним из первых численных применений компьютеров. [48] Первоначальный Dartmouth BASIC имел встроенные команды для матричной арифметики с массивами из его второй версии в 1964 году. Еще в 1970-х годах некоторые инженерные настольные компьютеры, такие как HP 9830, имели картриджи ПЗУ для добавления команд BASIC для матриц . Некоторые компьютерные языки, такие как APL, были разработаны для управления матрицами, а различные математические программы . для вычислений с матрицами можно использовать [49] По состоянию на 2023 год большинство компьютеров имеют те или иные встроенные матричные операции на низком уровне, реализующие стандартную спецификацию BLAS , на которую опирается большинство библиотек матриц и линейной алгебры более высокого уровня (например, EISPACK , LINPACK , LAPACK ). Хотя большинство этих библиотек требуют профессионального уровня кодирования, доступ к LAPACK можно получить с помощью привязок более высокого уровня (и удобных для пользователя), таких как NumPy / SciPy , R , GNU Octave , MATLAB .

Разложение

[ редактировать ]

Существует несколько методов преобразования матриц в более доступную форму. Их обычно называют методами матричной декомпозиции или матричной факторизации . Интерес всех этих методов состоит в том, что они сохраняют определенные свойства рассматриваемых матриц, такие как определитель, ранг или обратные значения, так что эти величины можно вычислить после применения преобразования или что определенные матричные операции алгоритмически легче выполнять. для некоторых типов матриц.

как Матрицы факторов разложения LU произведение нижней ( L ) и верхней треугольных матриц ( U ). [50] После расчета этого разложения линейные системы можно решать более эффективно с помощью простого метода, называемого прямой и обратной заменой . Аналогично, обратные треугольные матрицы алгоритмически легче вычислять. Исключение Гаусса — аналогичный алгоритм; он преобразует любую матрицу в форму эшелона строк . [51] Оба метода основаны на умножении матрицы на подходящие элементарные матрицы , что соответствует перестановке строк или столбцов и добавлению кратных одной строки к другой строке. Разложение по сингулярным значениям выражает любую матрицу A как произведение UDV. , где U и V унитарные матрицы , а D — диагональная матрица.

Пример матрицы в жордановой нормальной форме. Серые блоки называются блоками Жордана.

Собственное разложение или диагонализация выражает A как произведение VDV. −1 , где D — диагональная матрица, а V — подходящая обратимая матрица. [52] Если А можно записать в такой форме, то она называется диагонализируемой . В более общем смысле и применимо ко всем матрицам, разложение Жордана преобразует матрицу в нормальную форму Жордана , то есть матрицы, единственными ненулевыми элементами которых являются собственные значения от λ 1 до λ n матрицы A , расположенные на главной диагонали и, возможно, элементы, равные один прямо над основной диагональю, как показано справа. [53] Учитывая собственное разложение, n й степень A (то есть n -кратное итерированное умножение матрицы) можно вычислить с помощью

А н = ( VDV −1 ) н = VDV −1 VDV −1 ... VDV −1 = Генеральный директор н V −1

а степень диагональной матрицы можно вычислить, взяв соответствующие степени диагональных элементов, что намного проще, чем возводить в степень A. вместо этого Это можно использовать для вычисления матричной экспоненты e А , необходимость часто возникающая при решении линейных дифференциальных уравнений , матричных логарифмов и квадратных корней матриц . [54] Чтобы избежать численно плохо обусловленных дополнительные алгоритмы, такие как разложение Шура . ситуаций, можно использовать [55]

Абстрактные алгебраические аспекты и обобщения

[ редактировать ]

Матрицы можно обобщать по-разному. Абстрактная алгебра использует матрицы с элементами в более общих полях или даже кольцах , тогда как линейная алгебра кодифицирует свойства матриц в понятии линейных карт. Можно рассматривать матрицы с бесконечным числом столбцов и строк. Другое расширение — тензоры , которые можно рассматривать как многомерные массивы чисел, в отличие от векторов, которые часто можно реализовать как последовательности чисел, тогда как матрицы представляют собой прямоугольные или двумерные массивы чисел. [56] Матрицы при соблюдении определенных требований имеют тенденцию образовывать группы, известные как матричные группы. Аналогичным образом при определенных условиях матрицы образуют кольца, известные как матричные кольца . Хотя произведение матриц, как правило, не является коммутативным, некоторые матрицы образуют поля, известные как матричные поля .В общем, матрицы и их умножение тоже образуют категорию , категорию матриц .

Матрицы с более общими записями

[ редактировать ]

В этой статье основное внимание уделяется матрицам, элементы которых являются действительными или комплексными числами. Однако матрицы можно рассматривать с гораздо более общими типами элементов, чем действительные или комплексные числа. В качестве первого шага обобщения можно использовать любое поле , то есть набор , в котором сложения , вычитания , умножения и деления определены и корректно выполняются операции вместо R или C , например рациональные числа или конечные поля . Например, теория кодирования использует матрицы над конечными полями. Везде, где рассматриваются собственные значения , поскольку они являются корнями многочлена, они могут существовать только в более широком поле, чем поле элементов матрицы; например, они могут быть сложными в случае матрицы с действительными элементами. Возможность по-новому интерпретировать элементы матрицы как элементы более крупного поля (например, рассматривать действительную матрицу как комплексную матрицу, все элементы которой оказываются вещественными), а затем позволяет считать, что каждая квадратная матрица обладает полным набором собственных значений. В качестве альтернативы можно рассматривать только матрицы с элементами в алгебраически замкнутое поле , такое как C , с самого начала.

матрицы с элементами в кольце R. В более общем смысле, в математике широко используются [57] Кольца — более общее понятие, чем поля, поскольку операция деления не требуется. На этот параметр распространяются те же операции сложения и умножения матриц. Множество M( n , R ) (также обозначаемое M n (R) [7] ) всех квадратных n размера на n матриц над R представляет собой кольцо, называемое матричным кольцом , изоморфное кольцу эндоморфизмов левого R - модуля R. н . [58] Если кольцо R коммутативно коммутативно , то кольцо M( n , R ) также является ассоциативной алгеброй над R. , то есть его умножение Определитель все еще квадратных матриц над коммутативным кольцом R можно определить с помощью формулы Лейбница ; такая матрица обратима тогда и только тогда, когда ее определитель обратим в R , что обобщает ситуацию над полем F , где каждый ненулевой элемент обратим. [59] Матрицы над суперкольцами называются суперматрицами . [60]

Матрицы не всегда содержат все свои элементы в одном кольце   или даже в каком-либо кольце вообще. Особым, но распространенным случаем являются блочные матрицы , которые можно рассматривать как матрицы, элементы которых сами являются матрицами. Элементы не обязательно должны быть квадратными матрицами и, следовательно, не обязательно должны быть членами какого-либо кольца ; но их размеры должны соответствовать определенным условиям совместимости.

Связь с линейными картами

[ редактировать ]

Линейные карты R н Р м эквивалентны mxn матрицам размером , как описано выше . В более общем смысле, любое линейное отображение f : V W между конечномерными векторными пространствами может быть описано матрицей A = ( a ij ) после выбора баз v 1 , ..., v n из V и w 1 , . .., w m W (так что n — размерность V , а m размерность W ), что таково, что

Другими словами, столбец таблицы A выражает vj в ; терминах базисных векторов wI таблицы W образ j таким образом, это соотношение однозначно определяет элементы матрицы A . Матрица зависит от выбора оснований: разный выбор оснований порождает разные, но эквивалентные матрицы . [61] Многие из приведенных выше конкретных понятий могут быть переосмыслены в этом свете, например, транспонированная матрица A Т описывает транспонирование линейной карты, заданной A , относительно двойственных базисов . [62]

Эти свойства можно сформулировать более естественно: категория матриц с записями в поле с умножением как композицией эквивалентно категории конечномерных векторных пространств и линейных отображений над этим полем. [63]

В более общем смысле набор матриц размера m × n можно использовать для представления R -линейных отображений между свободными модулями R. м и Р н для произвольного кольца R с единицей. Когда n   =   m возможна композиция этих отображений, и это приводит к появлению матричного кольца из n × n, представляющего кольцо эндоморфизмов R матриц размера н .

Группы матриц

[ редактировать ]

Группа — это математическая структура , состоящая из набора объектов вместе с бинарной операцией , то есть операцией объединения любых двух объектов с третьим при соблюдении определенных требований. [64] Группа, в которой объектами являются матрицы, а групповая операция — умножение матриц, называется матричной группой . [65] [66] Поскольку группа каждого элемента должна быть обратимой, наиболее общими группами матриц являются группы всех обратимых матриц заданного размера, называемые общими линейными группами .

Любое свойство матриц, которое сохраняется при матричных произведениях и обратных, может быть использовано для определения дальнейших групп матриц. Например, матрицы заданного размера и с определителем 1 образуют подгруппу (то есть меньшую группу, содержащуюся в) их общей линейной группы, называемой специальной линейной группой . [67] Ортогональные матрицы , определяемые условием

М Т М = Я ,

образуют ортогональную группу . [68] Каждая ортогональная матрица имеет определитель 1 или -1. Ортогональные матрицы с определителем 1 образуют подгруппу, называемую специальной ортогональной группой .

Каждая конечная группа изоморфна регулярное группе матриц, в чем можно убедиться, рассмотрев представление симметрической группы . [69] Общие группы можно изучать с помощью матричных групп, которые сравнительно хорошо изучены, с помощью теории представлений . [70]

Бесконечные матрицы

[ редактировать ]

Также можно рассматривать матрицы с бесконечным количеством строк и/или столбцов. [71] хотя, поскольку объекты бесконечны, такие матрицы нельзя записать явно. Все, что имеет значение, это то, что для каждого элемента в строках индексирования набора и для каждого элемента в столбцах индексирования набора существует четко определенная запись (эти наборы индексов не обязательно должны быть даже подмножествами натуральных чисел). Основные операции сложения, вычитания, скалярного умножения и транспонирования по-прежнему можно определить без проблем; однако умножение матриц может включать бесконечное суммирование для определения результирующих элементов, и в целом они не определены.

Если R — любое кольцо с единицей, то кольцо эндоморфизмов кольца поскольку правый R- модуль изоморфен кольцу конечных матриц-столбцов чьи записи индексируются , и каждый столбец которого содержит только конечное число ненулевых записей. Эндоморфизмы M , рассматриваемого как левый R- модуль, приводят к аналогичному объекту - матрицам, имеющим конечные строки. каждая строка которого имеет только конечное число ненулевых записей.

Если для описания линейных карт используются бесконечные матрицы, то можно использовать только те матрицы, все столбцы которых имеют лишь конечное число ненулевых элементов, по следующей причине. Чтобы матрица A описывала линейное отображение f : V W , должны быть выбраны базы для обоих пространств; что по определению это означает, что каждый вектор в пространстве может быть записан однозначно как (конечная) линейная комбинация базисных векторов, так что записанный как вектор (столбец)   ve ​​коэффициентов Напомним , , только конечное число элементов v I ненулевые. Теперь столбцы A описывают изображения f отдельных базисных векторов V в базисе W , что имеет смысл только в том случае, если эти столбцы имеют только конечное число ненулевых записей. нет Однако ограничений на строки A : в произведении A · v задействовано только конечное число ненулевых коэффициентов при v , поэтому каждый из его элементов, даже если он задан как бесконечная сумма произведений, включает только конечное число много ненулевых членов и поэтому корректно определен. Более того, это равнозначно образованию линейной комбинации столбцов A , который фактически включает в себя только конечное число из них, поэтому результат имеет только конечное число ненулевых записей, поскольку они есть в каждом из этих столбцов. Произведения двух матриц данного типа корректно определены (при условии совпадения наборов индексов столбцов и индексов строк), являются однотипными и соответствуют композиции линейных отображений.

Если R нормированное кольцо, то условие конечности строки или столбца можно ослабить. При наличии нормы абсолютно сходящиеся ряды вместо конечных сумм можно использовать . Например, матрицы, суммы столбцов которых являются сходящимися последовательностями, образуют кольцо. Аналогично, матрицы, суммы строк которых представляют собой сходящиеся ряды, также образуют кольцо.

Бесконечные матрицы также можно использовать для описания операторов в гильбертовых пространствах , где возникают вопросы сходимости и непрерывности , что снова приводит к определенным ограничениям, которые необходимо наложить. Однако явная точка зрения на матрицы имеет тенденцию запутывать дело. [72] абстрактные и более мощные инструменты функционального анализа вместо этого можно использовать .

Пустая матрица

[ редактировать ]

Пустая матрица — это матрица, в которой количество строк или столбцов (или того и другого) равно нулю. [73] [74] Пустые матрицы помогают иметь дело с отображениями, включающими нулевое векторное пространство . Например, если A — матрица 3 на 0, а B — матрица 0 на 3, то AB — это нулевая матрица 3 на 3, соответствующая нулевой карте из трехмерного пространства V в себя, в то время как BA является матрицей 0 на 0. Не существует общего обозначения пустых матриц, но большинство систем компьютерной алгебры позволяют создавать и выполнять вычисления с их помощью. Определитель матрицы размером 0 на 0 равен 1, как показано ниже, относительно пустого произведения, встречающегося в формуле Лейбница для определителя, равного 1. Это значение также согласуется с тем фактом, что тождественное отображение любого конечномерного пространства в себя имеет детерминант   1, факт, который часто используется как часть характеристики детерминантов.

Приложения

[ редактировать ]

Существует множество применений матриц как в математике, так и в других науках. Некоторые из них просто используют преимущества компактного представления набора чисел в матрице. Например, в теории игр и экономике матрица выигрышей кодирует выигрыш для двух игроков в зависимости от того, какую из заданного (конечного) набора стратегий игроки выбирают. [75] Анализ текста и автоматическая компиляция тезауруса используют матрицы терминов документов, такие как tf-idf, для отслеживания частоты употребления определенных слов в нескольких документах. [76]

Комплексные числа могут быть представлены конкретными действительными матрицами 2х2 с помощью

при котором сложение и умножение комплексных чисел и матриц соответствуют друг другу. Например, матрицы вращения 2х2 представляют собой умножение на некоторое комплексное число с абсолютным значением 1, как указано выше . Аналогичная интерпретация возможна для кватернионов [77] и алгебры Клиффорда в целом.

Ранние методы шифрования , такие как шифр Хилла, также использовали матрицы. Однако из-за линейной природы матриц эти коды сравнительно легко взломать. [78] Компьютерная графика использует матрицы для представления объектов; рассчитывать преобразования объектов с использованием аффинных матриц вращения для выполнения таких задач, как проецирование трехмерного объекта на двухмерный экран, что соответствует теоретическому наблюдению с помощью камеры; а также применять свертки изображения, такие как повышение резкости, размытие, обнаружение краев и многое другое. [79] Матрицы над кольцом полиномов играют важную роль в изучении теории управления .

Химия использует матрицы по-разному, особенно после использования квантовой теории для обсуждения молекулярных связей и спектроскопии . Примерами являются матрица перекрытия и матрица Фока, используемые при решении уравнений Рутана для получения молекулярных орбиталей метода Хартри-Фока .

Теория графов

[ редактировать ]
Неориентированный граф с матрицей смежности:

Матрица смежности конечного графа является основным понятием теории графов . [80] Он записывает, какие вершины графа соединены ребром. Матрицы, содержащие только два разных значения (1 и 0 означают, например, «да» и «нет» соответственно), называются логическими матрицами . Матрица расстояний (или стоимости) содержит информацию о расстояниях ребер. [81] Эти концепции можно применять к веб-сайтам, соединенным гиперссылками , или к городам, соединенным дорогами, и т. д., и в этом случае (если сеть соединений не очень плотная) матрицы имеют тенденцию быть разреженными , то есть содержать мало ненулевых элементов. можно использовать специально адаптированные матричные алгоритмы Следовательно, в теории сетей .

Анализ и геометрия

[ редактировать ]

Матрица Гессе функции дифференцируемой ƒ : R н R состоит из производных ƒ вторых по нескольким координатным направлениям, то есть [82]

В седловой точке ( x   =   0, y   =   0) (красный) функции f ( x ,− y ) =   x 2    и 2 , матрица Гессе является бессрочным .

Он кодирует информацию о локальном росте функции: задана критическая точка x   =   ( x 1 ,   ...,   x n ), то есть точка, в которой первые частные производные исчезает ƒ , функция имеет локальный минимум , если матрица Гессе положительно определена . Квадратичное программирование можно использовать для поиска глобальных минимумов или максимумов квадратичных функций, тесно связанных с функциями, связанными с матрицами (см. Выше ). [83]

Другая матрица, часто используемая в геометрических ситуациях, — это матрица Якоби дифференцируемого отображения f : R. н Р м . Если f 1 , ..., f m обозначают компоненты f , то матрица Якоби определяется как [84]

Если n > m и если ранг матрицы Якоби достигает максимального значения m , f локально обратима в этой точке по теореме о неявной функции . [85]

Уравнения в частных производных можно классифицировать, рассматривая матрицу коэффициентов дифференциальных операторов высшего порядка уравнения. Для эллиптических уравнений в частных производных эта матрица положительно определена, что оказывает решающее влияние на множество возможных решений рассматриваемого уравнения. [86]

Метод конечных элементов — важный численный метод решения уравнений в частных производных, широко применяемый при моделировании сложных физических систем. Он пытается аппроксимировать решение некоторого уравнения кусочно-линейными функциями, где кусочки выбираются относительно достаточно мелкой сетки, которая, в свою очередь, может быть преобразована в матричное уравнение. [87]

Теория вероятностей и статистика

[ редактировать ]
Две разные цепи Маркова. На диаграмме показано количество частиц (всего 1000) в состоянии «2». Оба предельных значения можно определить из матриц перехода, которые имеют вид (красный) и (черный).

Стохастические матрицы — это квадратные матрицы, строки которых представляют собой векторы вероятности , то есть элементы которых неотрицательны и в сумме дают единицу. Стохастические матрицы используются для определения цепей Маркова с конечным числом состояний. [88] Строка стохастической матрицы дает распределение вероятностей для следующей позиции некоторой частицы, находящейся в данный момент в состоянии, соответствующем этой строке. , подобных цепям Маркова Свойства поглощающих состояний , то есть состояний, которых в конечном итоге достигает любая частица, можно прочитать по собственным векторам матриц перехода. [89]

В статистике также используются матрицы во многих различных формах. [90] Описательная статистика занимается описанием наборов данных, которые часто могут быть представлены в виде матриц данных , которые затем могут быть подвергнуты методам уменьшения размерности . Ковариационная матрица кодирует взаимную дисперсию нескольких случайных величин . [91] Другой метод использования матриц — это линейный метод наименьших квадратов , метод, который аппроксимирует конечный набор пар ( x 1 , y 1 ), ( x 2 , y 2 ), ..., ( x N , y N ) линейной функцией.

y я ax i + b , я знак равно 1, ..., N

которое можно сформулировать в терминах матриц, связанных с по сингулярным значениям . разложением матриц [92]

Случайные матрицы — это матрицы, элементы которых представляют собой случайные числа, подчиняющиеся подходящим распределениям вероятностей , таким как матричное нормальное распределение . Помимо теории вероятностей, они применяются в самых разных областях: от теории чисел до физики . [93] [94]

Симметрии и преобразования в физике

[ редактировать ]

Линейные преобразования и связанные с ними симметрии играют ключевую роль в современной физике. Например, элементарные частицы в квантовой теории поля классифицируются как представления группы Лоренца специальной теории относительности и, более конкретно, по их поведению под спиновой группой . Конкретные представления, включающие матрицы Паули и более общие гамма-матрицы, являются неотъемлемой частью физического описания фермионов , которые ведут себя как спиноры . [95] Для трех легчайших кварков существует теоретико-групповое представление, включающее специальную унитарную группу SU (3); для своих расчетов физики используют удобное матричное представление, известное как матрицы Гелла-Манна , которые также используются для калибровочной группы SU(3) , составляющей основу современного описания сильных ядерных взаимодействий — квантовой хромодинамики . Матрица Кабиббо-Кобаяши-Маскавы , в свою очередь, выражает тот факт, что основные состояния кварков, важные для слабых взаимодействий, не совпадают, а линейно связаны с основными состояниями кварков, которые определяют частицы с конкретными и различными массами . [96]

Линейные комбинации квантовых состояний

[ редактировать ]

Первая модель квантовой механики ( Гейзенберг , 1925) представляла операторы теории бесконечномерными матрицами, действующими на квантовые состояния. [97] Это также называется матричной механикой . Одним из конкретных примеров является матрица плотности , которая характеризует «смешанное» состояние квантовой системы как линейную комбинацию элементарных, «чистых» собственных состояний . [98]

Другая матрица служит ключевым инструментом для описания экспериментов по рассеянию, которые составляют краеугольный камень экспериментальной физики частиц: реакции столкновения, подобные тем, которые происходят в ускорителях частиц , когда невзаимодействующие частицы направляются навстречу друг другу и сталкиваются в небольшой зоне взаимодействия с новой множество невзаимодействующих частиц в результате можно описать как скалярное произведение состояний исходящих частиц и линейную комбинацию состояний входящих частиц. Линейная комбинация задается матрицей, известной как S-матрица , которая кодирует всю информацию о возможных взаимодействиях между частицами. [99]

Обычные режимы

[ редактировать ]

Общее применение матриц в физике — это описание линейно связанных гармонических систем. Уравнения движения таких систем можно описать в матричной форме: матрица масс, умножающая обобщенную скорость, дает кинетический член, а матрица сил , умножающая вектор смещения, для характеристики взаимодействий. системы Лучший способ получить решения — определить собственные векторы , ее нормальные моды , путем диагонализации матричного уравнения. Подобные методы имеют решающее значение, когда речь идет о внутренней динамике молекул : внутренних колебаниях систем, состоящих из взаимно связанных атомов-компонентов. [100] Они также необходимы для описания механических колебаний и колебаний в электрических цепях. [101]

Геометрическая оптика

[ редактировать ]

Геометрическая оптика обеспечивает дополнительные матричные приложения. В этой приближенной теории не учитывается волновая природа света. В результате получается модель, в которой световые лучи действительно являются геометрическими лучами . Если отклонение световых лучей оптическими элементами невелико, то действие линзы или отражающего элемента на данный световой луч можно выразить как умножение двухкомпонентного вектора на матрицу два на два, называемое лучевым анализом матрицы переноса : компонентами вектора являются наклон светового луча и его расстояние от оптической оси, а матрица кодирует свойства оптического элемента. Существует два вида матриц, а именно. матрицу преломления, описывающую преломление на поверхности линзы, и матрицу перемещения , описывающую перенос плоскости отсчета к следующей преломляющей поверхности, где применяется другая матрица преломления.Оптическая система, состоящая из комбинации линз и/или отражающих элементов, просто описывается матрицей, полученной в результате произведения матриц компонентов. [102]

Электроника

[ редактировать ]

Традиционный сеточный анализ и узловой анализ в электронике приводят к системе линейных уравнений, которую можно описать с помощью матрицы.

Поведение многих электронных компонентов можно описать с помощью матриц. Пусть A будет двумерным вектором с входным напряжением v 1 компонента и входным током I 1 в качестве его элементов, и пусть B будет двумерным вектором с выходным напряжением v 2 компонента и выходным током I 2 в качестве его элементов. Тогда поведение электронного компонента можно описать формулой B = H · A , где H — матрица 2 x 2, содержащая один импеданса элемент ( h 12 ), один элемент адмиттанса ( h 21 ) и два безразмерных элемента ( h 11 и ч 22 ). Расчет схемы теперь сводится к умножению матриц.

Матрицы имеют долгую историю применения при решении линейных уравнений , но до 1800-х годов они были известны как массивы. Китайский текст «Девять глав математического искусства», написанный в X–II веках до нашей эры, является первым примером использования методов массива для решения одновременных уравнений . [103] включая концепцию детерминантов . В 1545 году итальянский математик Джероламо Кардано представил этот метод Европе, опубликовав Ars Magna . [104] Японский математик Секи использовал те же методы массивов для решения одновременных уравнений в 1683 году. [105] Голландский математик Ян де Витт представил преобразования с использованием массивов в своей книге 1659 года «Элементы кривых» (1659). [106] Между 1700 и 1710 годами Готфрид Вильгельм Лейбниц опубликовал информацию об использовании массивов для записи информации или решений и экспериментировал с более чем 50 различными системами массивов. [104] Крамер представил свое правило в 1750 году.

Термины «матрица» (лат. «матка», «плотина» (животное женского пола, не являющееся человеком, содержащееся для разведения), «источник», «происхождение», «список» и «регистр» происходят от слова mater — мать . [107] ) был придуман Джеймсом Джозефом Сильвестром в 1850 году, [108] который понимал матрицу как объект, порождающий несколько определителей, сегодня называемых минорами , то есть определителей меньших матриц, которые получаются из исходной путем удаления столбцов и строк. В статье 1851 года Сильвестр объясняет: [109]

В предыдущих статьях я определил «Матрицу» как прямоугольный массив терминов, из которого из лона общего родителя могут возникнуть различные системы детерминантов.

Артур Кэли опубликовал трактат о геометрических преобразованиях с использованием матриц, которые не были повернутыми версиями исследуемых коэффициентов, как это делалось ранее. Вместо этого он определил такие операции, как сложение, вычитание, умножение и деление, как преобразования этих матриц и показал сохраняющиеся ассоциативные и распределительные свойства. Кэли исследовал и продемонстрировал некоммутативное свойство умножения матриц, а также коммутативное свойство сложения матриц. [104] Ранняя теория матриц ограничивала использование массивов почти исключительно детерминантами, а абстрактные матричные операции Артура Кэли были революционными. Он сыграл важную роль в предложении матричной концепции, независимой от систем уравнений. В 1858 году Кэли опубликовал свои мемуары по теории матриц. [110] [111] в котором он предложил и продемонстрировал теорему Кэли-Гамильтона . [104]

Английский математик Катберт Эдмунд Каллис был первым, кто использовал современное обозначение скобок для матриц в 1913 году, и одновременно он продемонстрировал первое значимое использование обозначения A = [ a I , j ] для представления матрицы, где a I , j относится к i-му элементу. строка и j-й столбец. [104]

Современное исследование детерминант возникло из нескольких источников. [112] Теоретико-числовые проблемы заставили Гаусса связать коэффициенты квадратичных форм , то есть такие выражения, как x 2 + ху − 2 у 2 и в линейные отображения трех измерениях в матрицы. Эйзенштейн развил эти понятия, включая замечание, что, говоря современным языком, произведения некоммутативны матричные . Коши был первым, кто доказал общие положения об определителях, используя в качестве определения определителя матрицы A = [ a i , j ] следующее: заменить степени a j к на jk в полиноме

,

где обозначает произведение указанных слагаемых. В 1829 году он также показал, что собственные значения симметричных матриц действительны. [113] Якоби изучал «функциональные определители» — позже названные определителями Якоби Сильвестром — которые можно использовать для описания геометрических преобразований на локальном (или бесконечно малом ) уровне, см . выше . Кронекера . «Vorlesungen über die Theorie der Determinanten» [114] и Вейерштрасса « О детерминантной теории» . [115] оба, опубликованные в 1903 году, впервые трактовали детерминанты аксиоматически , в отличие от предыдущих более конкретных подходов, таких как упомянутая формула Коши. На тот момент определяющие факторы были твердо установлены.

Многие теоремы были впервые установлены только для небольших матриц, например, теорема Кэли-Гамильтона была доказана для матриц 2 × 2 Кэли в вышеупомянутых мемуарах и Гамильтоном для матриц 4 × 4. Фробениус , работая над билинейными формами , обобщил теорему на все измерения (1898). Также в конце 19-го века исключение Гаусса-Жордана (обобщающее особый случай, ныне известный как исключение Гаусса установил Вильгельм Йордан ) . В начале 20 века матрицы заняли центральную роль в линейной алгебре. [116] частично из-за их использования в классификации гиперкомплексных систем счисления прошлого века.

Зарождение механики Гейзенбергом матричной , Борном и Джорданом привело к изучению матриц с бесконечным числом строк и столбцов. [117] Позже фон Нейман осуществил математическую формулировку квантовой механики , путем дальнейшего развития функционально-аналитических понятий, таких как линейные операторы в гильбертовых пространствах , которые, очень грубо говоря, соответствуют евклидову пространству , но с бесконечностью независимых направлений .

Другие исторические варианты использования слова «матрица» в математике.

[ редактировать ]

Это слово необычным образом использовалось как минимум двумя авторами, имеющими историческое значение.

Бертран Рассел и Альфред Норт Уайтхед в своих Principia Mathematica (1910–1913) используют слово «матрица» в контексте своей аксиомы сводимости . Они предложили эту аксиому как средство последовательного сведения любой функции к функции более низкого типа так, чтобы на «низу» (нулевой порядок) функция была идентична своему расширению : [118]

Назовем матрицей любую функцию любого количества переменных, которая не включает в себя какие-либо видимые переменные . Затем любая возможная функция, отличная от матрицы, получается из матрицы с использованием обобщения, то есть путем рассмотрения утверждения о том, что рассматриваемая функция истинна со всеми возможными значениями или с некоторым значением одного из аргументов, а другой аргумент или аргументы остаются. неопределенный.

Например, функцию Φ( x, y ) двух переменных x и y можно свести к набору функций одной переменной, например, y , «рассмотрев» функцию для всех возможных значений «индивидуумов» a. Я заменил переменную x . И тогда полученный набор функций одной переменной y , то есть a i : Φ( a i , y ) , можно свести к «матрице» значений, «рассмотрев» функцию для всех возможных значений « люди" b i подставлены вместо переменной y :

б j а я : Φ( а я , б j ).

Альфред Тарский в своем «Введении в логику» 1946 года использовал слово «матрица» как синоним понятия таблицы истинности , используемого в математической логике. [119]

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ Однако в случае матриц смежности умножение матриц или его вариант позволяет одновременно вычислить количество путей между любыми двумя вершинами и кратчайшую длину пути между двумя вершинами.
  2. ^ Ланг 2002
  3. ^ Фрэли (1976 , стр. 209)
  4. ^ Неринг (1970 , стр. 37)
  5. ^ Jump up to: Перейти обратно: а б Вайсштейн, Эрик В. «Матрица» . mathworld.wolfram.com . Проверено 19 августа 2020 г.
  6. ^ Oualline 2003 , гл. 5
  7. ^ Jump up to: Перейти обратно: а б Поп; Фурдуи (2017). Квадратные матрицы порядка 2 . Международное издательство Спрингер. ISBN  978-3-319-54938-5 .
  8. ^ Браун 1991 , Определение I.2.1 (сложение), Определение I.2.4 (скалярное умножение) и Определение I.2.33 (транспонирование)
  9. ^ Браун 1991 , Теорема I.2.6.
  10. ^ Jump up to: Перейти обратно: а б «Как умножать матрицы» . www.mathsisfun.com . Проверено 19 августа 2020 г.
  11. ^ Браун 1991 , Определение I.2.20.
  12. ^ Браун 1991 , Теорема I.2.24.
  13. ^ Horn & Johnson 1985 , гл. 4 и 5
  14. ^ Бронсон (1970 , стр. 16)
  15. ^ Крейциг (1972 , стр. 220)
  16. ^ Jump up to: Перейти обратно: а б Проттер и Морри (1970 , стр. 869)
  17. ^ Крейциг (1972 , стр. 241, 244)
  18. ^ Шнайдер, Ганс; Баркер, Джордж Филлип (2012), Матрицы и линейная алгебра , Dover Books on Mathematics, Courier Dover Corporation, стр. 251, ISBN  978-0-486-13930-2 .
  19. ^ Перлис, Сэм (1991), Теория матриц , Дуврские книги по высшей математике, Courier Dover Corporation, стр. 103, ISBN  978-0-486-66810-9 .
  20. ^ Антон, Ховард (2010), Элементарная линейная алгебра (10-е изд.), John Wiley & Sons, стр. 414, ISBN  978-0-470-45821-1 .
  21. ^ Хорн, Роджер А.; Джонсон, Чарльз Р. (2012), Матричный анализ (2-е изд.), Cambridge University Press, стр. 17, ISBN  978-0-521-83940-2 .
  22. ^ Браун 1991 , I.2.21 и 22.
  23. ^ Греуб 1975 , Раздел III.2.
  24. ^ Браун 1991 , Определение II.3.3.
  25. ^ Греуб 1975 , Раздел III.1
  26. ^ Браун 1991 , Теорема II.3.22.
  27. ^ Хорн и Джонсон 1985 , Теорема 2.5.6.
  28. ^ Браун 1991 , Определение I.2.28.
  29. ^ Браун 1991 , Определение I.5.13.
  30. ^ Хорн и Джонсон 1985 , Глава 7
  31. ^ Хорн и Джонсон 1985 , Теорема 7.2.1.
  32. ^ Horn & Johnson 1985 , Пример 4.0.6, стр. 169
  33. ^ «Матрица | математика» . Британская энциклопедия . Проверено 19 августа 2020 г.
  34. ^ Браун 1991 , Определение III.2.1.
  35. ^ Браун 1991 , Теорема III.2.12.
  36. ^ Браун 1991 , следствие III.2.16
  37. ^ Мирский 1990 , Теорема 1.4.1.
  38. ^ Браун 1991 , Теорема III.3.18.
  39. ^ Eigen означает «собственный» на немецком и голландском языках .
  40. ^ Браун 1991 , Определение III.4.1.
  41. ^ Браун 1991 , Определение III.4.9
  42. ^ Браун 1991 , следствие III.4.10
  43. ^ Домохозяин 1975 , Гл. 7
  44. ^ Бау III и Трефетен , 1997 г.
  45. ^ Голуб и Ван Лоан 1996 , Алгоритм 1.3.1
  46. ^ Голуб и Ван Лоан 1996 , главы 9 и 10, особенно. раздел 10.2
  47. ^ Голуб и Ван Лоан 1996 , Глава 2.3
  48. ^ Грчар, Джозеф Ф. (1 января 2011 г.). «Анализ исключения Гаусса Джоном фон Нейманом и истоки современного численного анализа» . Обзор СИАМ . 53 (4): 607–682. дои : 10.1137/080734716 . ISSN   0036-1445 .
  49. ^ Например, Mathematica , см. Wolfram 2003 , Ch. 3.7
  50. ^ Пресс, Фланнери и Теукольский и др. 1992 год
  51. ^ Стер и Булирш 2002 , раздел 4.1.
  52. ^ Хорн и Джонсон 1985 , Теорема 2.5.4.
  53. ^ Horn & Johnson 1985 , гл. 3.1, 3.2
  54. ^ Арнольд и Кук 1992 , разделы 14.5, 7, 8.
  55. ^ Бронсон 1989 , Гл. 15
  56. ^ Коберн 1955 , гл. В
  57. ^ Ланг 2002 , Глава XIII
  58. ^ Ланг 2002 , XVII.1, с. 643
  59. ^ Ланг 2002 , Предложение XIII.4.16.
  60. ^ Райхл 2004 , Раздел L.2.
  61. ^ Греуб 1975 , Раздел III.3
  62. ^ Греуб 1975 , Раздел III.3.13.
  63. ^ Перроне (2024) , стр. 99–100
  64. ^ См. любую стандартную ссылку в группе.
  65. ^ Кроме того, группа должна быть замкнутой в общей линейной группе.
  66. ^ Бейкер 2003 , Def. 1.30
  67. ^ Бейкер 2003 , Теорема 1.2.
  68. ^ Артин 1991 , Глава 4.5.
  69. ^ Роуэн 2008 , пример 19.2, с. 198
  70. ^ См. любую ссылку по теории представлений или представлению групп .
  71. ^ См. пункт «Матрица» в Ито, изд. 1987 год
  72. ^ «Немногие из теории матриц переносятся на бесконечномерные пространства, и то, что это делает, не так уж полезно, но иногда помогает». Халмош 1982 , с. 23, Глава 5
  73. ^ «Пустая матрица: матрица пуста, если размер ее строки или столбца равен нулю», глоссарий , заархивировано 29 апреля 2009 г. на Wayback Machine , Руководство пользователя O-Matrix v6.
  74. ^ «Матрица, имеющая хотя бы одно измерение, равное нулю, называется пустой матрицей», Структуры данных MATLAB. Архивировано 28 декабря 2009 г. на Wayback Machine.
  75. ^ Фуденберг и Тироль , 1983 , раздел 1.1.1.
  76. ^ Мэннинг 1999 , раздел 15.3.4.
  77. ^ Уорд 1997 , гл. 2,8
  78. ^ Стинсон 2005 , гл. 1.1.5 и 1.2.4
  79. ^ Ассоциация вычислительной техники 1979 , гл. 7
  80. ^ Годсил и Ройл 2004 , гл. 8.1
  81. ^ Пуннен 2002
  82. ^ Ланг 1987a , Гл. XVI.6
  83. ^ Нокедал 2006 , Гл. 16
  84. ^ Ланг 1987a , Гл. XVI.1
  85. ^ Ланг 1987a , Гл. XVI.5. Более продвинутое и более общее утверждение см. в Lang 1969 , Ch. VI.2
  86. ^ Гилбарг и Трудингер , 2001 г.
  87. ^ Шолин 2005 , Гл. 2.5. См. также метод жесткости .
  88. ^ Латуш и Рамасвами, 1999 г.
  89. ^ Мехта и Шринивасан 1978 , гл. 2,8
  90. ^ Хили, Майкл (1986), Матрицы для статистики , Oxford University Press , ISBN  978-0-19-850702-4
  91. ^ Кржановский 1988 , Гл. 2.2., с. 60
  92. ^ Кржановский 1988 , Гл. 4.1
  93. ^ Конри   2007
  94. ^ Zabrodin, Brezin & Kazakov et al.  2006
  95. ^ Ицыксон и Зубер 1980 , гл. 2
  96. ^ см. Burgess & Moore 2007 , раздел 1.6.3. (SU(3)), раздел 2.4.3.2. (матрица Кобаяши – Маскавы)
  97. ^ Шифф 1968 , Гл. 6
  98. ^ Бом 2001 , разделы II.4 и II.8.
  99. ^ Вайнберг 1995 , Гл. 3
  100. ^ Уэрретт 1987 , часть II
  101. ^ Райли, Хобсон и Бенс 1997 , 7.17
  102. ^ Гюнтер 1990 , гл. 5
  103. ^ Шен, Кроссли и Лун 1999, цитируется Бретчером 2005 , стр. 1
  104. ^ Jump up to: Перейти обратно: а б с д и Дискретная математика 4-е изд. Досси, Отто, Спенс, Ванден Эйнден, опубликовано Аддисоном Уэсли, 10 октября 2001 г. ISBN   978-0-321-07912-1 , с. 564-565
  105. ^ Нидэм, Джозеф ; Ван Лин (1959). Наука и цивилизация в Китае . Том. III. Кембридж: Издательство Кембриджского университета. п. 117. ИСБН  978-0-521-05801-8 .
  106. ^ Дискретная математика 4-е изд. Досси, Отто, Спенс, Ванден Эйнден, опубликовано Аддисоном Уэсли, 10 октября 2001 г. ISBN   978-0-321-07912-1 , с. 564
  107. ^ Словарь Мерриам-Вебстера , Merriam-Webster , получено 20 апреля 2009 г.
  108. ^ что Дж. Дж. Сильвестр ввел математический термин «матрица» в 1848 году, Сильвестр ничего не опубликовал в 1848 году. Хотя многие источники утверждают , Джозеф Сильвестр (Кембридж, Англия: Издательство Кембриджского университета, 1904), т. 1. ) Самое раннее использование им термина «матрица» встречается в 1850 году у Дж. Дж. Сильвестра (1850) «Дополнения к статьям в сентябрьском номере этого журнала, «О новом классе теорем» и о теореме Паскаля», The London, Edinburgh and Dublin Philosophical Magazine and Journal of Science , 37 : 363–370. Со страницы 369 : «Для этой цели мы должны начать не с квадрата, а с продолговатого набора терминов, состоящего, предположим, из m строк и n столбцов. были Матрицей, из которой мы можем формировать различные системы определителей...»
  109. ^ Сборник математических статей Джеймса Джозефа Сильвестра: 1837–1853, статья 37 , стр. 247
  110. ^ Фил.Транс. 1858, т. 148, стр. 17-37 Матем. Документы II 475-496
  111. ^ Дьедонне, изд. 1978 , Том. 1, гл. III, с. 96
  112. ^ Кноблох 1994 г.
  113. ^ Хокинс 1975
  114. ^ Кронекер 1897 г.
  115. ^ Вейерштрасс 1915 , стр. 271–286
  116. ^ Бошер 2004
  117. ^ Мехра и Рехенберг 1987
  118. ^ Уайтхед, Альфред Норт; и Рассел, Бертран (1913) Principia Mathematica до *56 , Кембридж в University Press, Кембридж, Великобритания (переиздано в 1962 г.), см. стр. 162 и далее.
  119. ^ Тарский, Альфред; (1946) Введение в логику и методологию дедуктивных наук , Dover Publications, Inc, Нью-Йорк, штат Нью-Йорк, ISBN   0-486-28462-X .

Ссылки по физике

[ редактировать ]
  • Бом, Арно (2001), Квантовая механика: основы и приложения , Springer, ISBN  0-387-95330-2
  • Берджесс, Клифф; Мур, Гай (2007), Стандартная модель. Букварь , издательство Кембриджского университета, ISBN  978-0-521-86036-9
  • Гюнтер, Роберт Д. (1990), Современная оптика , Джон Уайли, ISBN  0-471-60538-7
  • Ицыксон, Клод; Зубер, Жан-Бернар (1980), Квантовая теория поля , МакГроу – Хилл, ISBN  0-07-032071-3
  • Райли, Кеннет Ф.; Хобсон, Майкл П.; Бенс, Стивен Дж. (1997), Математические методы в физике и технике , издательство Кембриджского университета, ISBN  0-521-55506-Х
  • Шифф, Леонард И. (1968), Квантовая механика (3-е изд.), МакГроу – Хилл
  • Вайнберг, Стивен (1995), Квантовая теория полей. Том I: Основы , издательство Кембриджского университета, ISBN  0-521-55001-7
  • Верретт, Брайан С. (1987), Теория групп атомов, молекул и твердых тел , Prentice-Hall International, ISBN  0-13-365461-3
  • Забродин Антон; Брезен, Эдуард; Казаков Владимир; Сербан, Дидина; Вигманн, Пол (2006), «Применение случайных матриц в физике» (Научная серия НАТО II: математика, физика и химия) , Берлин, Германия; Нью-Йорк, штат Нью-Йорк: Springer-Verlag , ISBN  978-1-4020-4530-1

Исторические справки

[ редактировать ]

Дальнейшее чтение

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 6b04411f8ead4636c17333931f6bf7e4__1721703480
URL1:https://arc.ask3.ru/arc/aa/6b/e4/6b04411f8ead4636c17333931f6bf7e4.html
Заголовок, (Title) документа по адресу, URL1:
Matrix (mathematics) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)