Матрица норма
В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
В области математики . нормы определяются для элементов пространства векторного В частности, когда векторное пространство содержит матрицы, такие нормы называются матричными нормами . Матричные нормы отличаются от векторных тем, что они также должны взаимодействовать с матричным умножением.
Предварительные сведения
[ редактировать ]Учитывая поле действительных пусть или комплексных чисел , – K - векторное пространство матриц с ряды и столбцы и записи в поле . Матричная норма – норма это .
Нормы часто обозначаются двойной вертикальной чертой (например: ). Таким образом, матричная норма является функцией который должен удовлетворять следующим свойствам: [1] [2]
Для всех скаляров и матрицы ,
- ( положительное значение )
- ( определенный )
- ( абсолютно однородный )
- ( субаддитивный или удовлетворяющий неравенству треугольника )
Единственная особенность, отличающая матрицы от переставленных векторов, — это умножение . Матричные нормы особенно полезны, если они также являются субмультипликативными : [1] [2] [3]
Каждая норма на K n × n можно масштабировать до суб-мультипликативного значения; в некоторых книгах терминологическая матричная норма зарезервирована для субмультипликативных норм. [4]
Матричные нормы, индуцированные векторными нормами
[ редактировать ]Предположим, что векторная норма на и векторная норма на даны. Любой матрица A индуцирует линейный оператор из к относительно стандартного базиса и определяется соответствующая индуцированная норма , или операторная норма , или подчиненная норма в пространстве из всех матрицы следующим образом: где обозначает супремум . Эта норма измеряет, насколько отображение, индуцированное может растягивать векторы.В зависимости от векторных норм , используются обозначения, отличные от можно использовать для оператора нормы.
Матричные нормы, индуцированные векторными p-нормами
[ редактировать ]Если p -норма для векторов ( ) используется для обоих пространств и тогда соответствующая операторная норма равна: [2] Эти индуцированные нормы отличаются от «входных» p -норм и Шаттена p -норм для рассматриваемых ниже матриц, которые также обычно обозначаются через
С геометрической точки зрения можно представить себе единичный шар p-нормы. в , затем примените линейное отображение на мяч. В конечном итоге это превратится в искаженную выпуклую форму. , и измеряет самый длинный «радиус» искаженной выпуклой формы. Другими словами, мы должны взять единичный шар с p-нормой. в , затем умножьте его как минимум на , чтобы он был достаточно большим, чтобы вместить .
р = 1, ∞
[ редактировать ]Когда , у нас есть простые формулы. что представляет собой просто максимальную абсолютную сумму столбцов матрицы. что представляет собой просто максимальную абсолютную сумму строк матрицы.Например, для у нас есть это
Спектральная норма (p = 2)
[ редактировать ]Когда ( евклидова норма или -норма для векторов), норма индуцированной матрицы является спектральной нормой . (Эти два значения не совпадают в бесконечных измерениях — дальнейшее обсуждение см . в разделе «Спектральный радиус» . Спектральный радиус не следует путать со спектральной нормой.) Спектральная норма матрицы является наибольшим сингулярным значением (т. е. квадратный корень из наибольшего собственного значения матрицы где обозначает транспонирование сопряженное ): [5] где представляет наибольшее сингулярное значение матрицы
Есть еще свойства:
- Доказывается неравенством Коши–Шварца .
- . Доказано методом сингулярного разложения (SVD) на .
- , где является нормой Фробениуса . Равенство имеет место тогда и только тогда, когда матрица является матрицей первого ранга или нулевой матрицей.
- .
Матричные нормы, индуцированные векторными α- и β-нормами
[ редактировать ]Мы можем обобщить приведенное выше определение. Предположим, у нас есть векторные нормы и для помещений и соответственно; соответствующая операторная норма равна В частности, определенное ранее, является частным случаем .
В особых случаях и , индуцированные матричные нормы можно вычислить по формуле где — i-я строка матрицы .
В особых случаях и , индуцированные матричные нормы можно вычислить по формуле где — j-й столбец матрицы .
Следовательно, и — максимальная 2-норма строки и столбца матрицы соответственно.
Характеристики
[ редактировать ]Любая операторная норма согласуется с индуцирующими ее векторными нормами, что дает
Предполагать ; ; и — операторные нормы, индуцированные соответствующими парами векторных норм ; ; и . Затем,
это следует из и
Квадратные матрицы
[ редактировать ]Предполагать – операторная норма в пространстве квадратных матриц индуцированные векторными нормами и .Тогда норма оператора является субмультипликативной матричной нормой:
Более того, любая такая норма удовлетворяет неравенству
( 1 ) |
для всех положительных целых чисел , где ( A ) — спектральный радиус A. r ρ Для симметричного или эрмитового A мы имеем равенство в ( 1 ) для 2-нормы, так как в этом случае 2-норма в точности спектральным радиусом A. является Для произвольной матрицы мы не можем иметь равенства ни по какой норме; контрпримером будет который имеет исчезающий спектральный радиус. В любом случае для любой матричной нормы имеем формулу спектрального радиуса :
Последовательные и совместимые нормы
[ редактировать ]Матричная норма на называется согласованным с векторной нормой на и векторная норма на , если: для всех и все . В частном случае m = n и , также называется совместимым с .
Все индуцированные нормы непротиворечивы по определению. Кроме того, любая субмультипликативная матричная норма на индуцирует совместимую векторную норму на определяя .
«Входные» матричные нормы
[ редактировать ]Эти нормы рассматривают матрица как вектор размера и используйте одну из знакомых векторных норм. Например, используя p -норму для векторов p ≥ 1 , мы получаем:
Это норма, отличная от индуцированной p -нормы Шаттена -нормы (см. выше) и p (см. ниже), но обозначения те же.
Частный случай p = 2 — это норма Фробениуса, а p = ∞ дает максимальную норму.
L 2,1 и L p,q Нормы
[ редактировать ]Позволять быть столбцами матрицы . Согласно первоначальному определению, матрица представляет n точек данных в m-мерном пространстве. норма [6] – сумма евклидовых норм столбцов матрицы:
The норма как функция ошибок более надежна, поскольку ошибка для каждой точки данных (столбца) не возводится в квадрат. Он используется для надежного анализа данных и разреженного кодирования .
Для p , q ≥ 1 , норма может быть обобщена на норма следующим образом:
Норма Фробениуса
[ редактировать ]Когда p = q = 2 для нормой, ее называют нормой Фробениуса или нормой Гильберта–Шмидта , хотя последний термин чаще используется в контексте операторов в (возможно, бесконечномерном) гильбертовом пространстве . Эту норму можно определить по-разному:
где трасса представляет собой сумму диагональных элементов, а являются значениями сингулярными . Второе равенство доказывается явным вычислением . Третье равенство доказывается сингулярным значениям разложением по и тот факт, что след инвариантен относительно круговых сдвигов.
Норма Фробениуса является расширением евклидовой нормы на и получается из внутреннего произведения Фробениуса на пространстве всех матриц.
Норма Фробениуса субмультипликативна и очень полезна для числовой линейной алгебры . Субмультипликативность нормы Фробениуса можно доказать с помощью неравенства Коши – Шварца .
Норму Фробениуса часто легче вычислить, чем индуцированные нормы, и она обладает полезным свойством инвариантности относительно вращений (и унитарных операций в целом). То есть, для любой унитарной матрицы . Это свойство следует из цикличности следа ( ):
и аналогично:
где мы использовали унитарную природу (то есть, ).
Это также удовлетворяет
и
где — внутренний продукт Фробениуса , а Re — действительная часть комплексного числа (не имеет значения для действительных матриц)
Макс норма
[ редактировать ]Максимальная норма — это поэлементная норма в пределе, когда p = q стремится к бесконечности:
Эта норма не является субмультипликативной ; но изменив правую часть на делает это так.
Обратите внимание, что в некоторой литературе (например, «Коммуникационная сложность ») существует альтернативное определение максимальной нормы, также называемое -норма относится к норме факторизации:
Теневые нормы
[ редактировать ]-нормы Шаттена p возникают при применении p -нормы к вектору сингулярных значений матрицы. [2] Если сингулярные значения матрица обозначаются σ i -норма Шаттена , то p определяется формулой
Эти нормы снова имеют те же обозначения, что и индуцированные и входные p -нормы, но они различны.
Все нормы Шаттена субмультипликативны. Они также унитарно инвариантны, что означает, что для всех матриц и все унитарные матрицы и .
Наиболее знакомые случаи — p = 1, 2, ∞. Случай p = 2 дает введенную ранее норму Фробениуса. Случай p = ∞ дает спектральную норму, которая представляет собой операторную норму, индуцированную векторной 2-нормой (см. выше). Наконец, p = 1 дает ядерную норму (также известную как норма следа или Кай Фана). «n»-норма [7] ), определяемый как:
где обозначает положительную полуопределенную матрицу такой, что . Точнее, поскольку — положительно-полуопределенная матрица , ее квадратный корень корректно определен. Ядерная норма является выпуклой оболочкой ранговой функции , поэтому его часто используют в математической оптимизации для поиска матриц низкого ранга.
Объединение неравенства следов фон Неймана с неравенством Гельдера для евклидова пространства дает версию неравенства Гельдера для норм Шаттена для :
В частности, отсюда следует нормовое неравенство Шаттена
Монотонные нормы
[ редактировать ]Матричная норма называется монотонным, если оно монотонно относительно порядка Лёвнера . Таким образом, норма матрицы возрастает, если
Норма Фробениуса и спектральная норма являются примерами монотонных норм. [8]
Вырезать нормы
[ редактировать ]Другим источником вдохновения для матричных норм является рассмотрение матрицы как смежности взвешенного матрицы ориентированного графа . [9] Так называемая «норма сокращения» измеряет, насколько близок связанный граф к двудольному : где A ∈ K m × n . [9] [10] [11] Эквивалентные определения (с точностью до постоянного множителя) налагают условия 2| С | > п и 2 | Т | > м ; С = Т ; или S ∩ Т знак равно ∅ . [10]
Разрезанная норма эквивалентна индуцированной операторной норме ‖·‖ ∞→1 , которая сама по себе эквивалентна другой норме, называемой нормой Гротендика . [11]
Чтобы определить норму Гротендика, сначала заметим, что линейный оператор K 1 → К 1 является просто скаляром и, таким образом, продолжается до линейного оператора на любом K к → К к . Более того, при любом выборе базиса для K н и К м , любой линейный оператор K н → К м продолжается до линейного оператора ( K к ) н → ( К к ) м , позволяя каждому элементу матрицы на элементах K к посредством скалярного умножения. Норма Гротендика является нормой этого расширенного оператора; в символах: [11]
Норма Гротендика зависит от выбора базиса (обычно принимаемого за стандартный ) и k .
Эквивалентность норм
[ редактировать ]Для любых двух матричных норм и , у нас есть это:
для некоторых положительных чисел r и s для всех матриц . Другими словами, все нормы по эквивалентны ; они индуцируют одну и ту же топологию на . Это верно, поскольку векторное пространство имеет конечную размерность .
Более того, для каждой матричной нормы на существует единственное положительное действительное число такой, что является субмультипликативной матричной нормой для каждого ; а именно,
- .
Субмультипликативная матричная норма называется минимальной , если не существует другой субмультипликативной матричной нормы удовлетворяющий .
Примеры эквивалентности норм
[ редактировать ]Позволять еще раз обратимся к норме, индуцированной вектором p -нормой (как указано выше в разделе «Индуцированная норма»).
Для матрицы ранга , имеют место следующие неравенства: [12] [13]
См. также
[ редактировать ]Примечания
[ редактировать ]- ^ Условие применяется только тогда, когда продукт определен, например, в случае квадратных матриц ( m = n ).
Ссылки
[ редактировать ]- ^ Jump up to: а б Вайсштейн, Эрик В. «Матрица Нормы» . mathworld.wolfram.com . Проверено 24 августа 2020 г.
- ^ Jump up to: а б с д «Матрица норм» . fourier.eng.hmc.edu . Проверено 24 августа 2020 г.
- ^ Малек-Шахмирзади, Масуд (1983). «Характеристика некоторых классов матричных норм». Линейная и полилинейная алгебра . 13 (2): 97–99. дои : 10.1080/03081088308817508 . ISSN 0308-1087 .
- ^ Хорн, Роджер А. (2012). Матричный анализ . Джонсон, Чарльз Р. (2-е изд.). Кембридж: Издательство Кембриджского университета. стр. 340–341. ISBN 978-1-139-77600-4 . OCLC 817236655 .
- ^ Карл Д. Мейер, Матричный анализ и прикладная линейная алгебра, §5.2, стр.281, Общество промышленной и прикладной математики, июнь 2000 г.
- ^ Дин, Крис; Чжоу, Дин; Он, Сяофэн; Чжа, Хунъюань (июнь 2006 г.). «R1-PCA: Анализ главных компонентов вращательной инвариантной нормы L1 для устойчивой факторизации подпространства». Материалы 23-й Международной конференции по машинному обучению . ICML '06. Питтсбург, Пенсильвания, США: ACM. стр. 281–288. дои : 10.1145/1143844.1143880 . ISBN 1-59593-383-2 .
- ^ Фан, Кентукки (1951). «Максимальные свойства и неравенства для собственных значений вполне непрерывных операторов» . Труды Национальной академии наук Соединенных Штатов Америки . 37 (11): 760–766. Бибкод : 1951PNAS...37..760F . дои : 10.1073/pnas.37.11.760 . ПМЦ 1063464 . ПМИД 16578416 .
- ^ Сиарле, Филипп Г. (1989). Введение в численную линейную алгебру и оптимизацию . Кембридж, Англия: Издательство Кембриджского университета. п. 57. ИСБН 0521327881 .
- ^ Jump up to: а б Фриз, Алан; Каннан, Рави (1 февраля 1999 г.). «Быстрое приближение к матрицам и приложениям» . Комбинаторика . 19 (2): 175–220. дои : 10.1007/s004930050052 . ISSN 1439-6912 . S2CID 15231198 .
- ^ Jump up to: а б Ловаш Ласло (2012). «Дистанция разреза». Большие сети и ограничения графов . Публикации коллоквиума AMS. Том. 60. Провиденс, Род-Айленд: Американское математическое общество. стр. 127–131. ISBN 978-0-8218-9085-1 . Обратите внимание, что Ловас масштабирует ‖ A ‖ □ так, чтобы он лежал в [0, 1] .
- ^ Jump up to: а б с Алон, Нога ; Наор, Ассаф (13 июня 2004 г.). «Аппроксимация нормы сокращения с помощью неравенства Гротендика» . Материалы тридцать шестого ежегодного симпозиума ACM по теории вычислений . СТОК '04. Чикаго, Иллинойс, США: Ассоциация вычислительной техники. стр. 72–80. дои : 10.1145/1007352.1007371 . ISBN 978-1-58113-852-8 . S2CID 1667427 .
- ^ Голуб, Джин ; Чарльз Ф. Ван Лоан (1996). Матричные вычисления – третье издание. Балтимор: Издательство Университета Джона Хопкинса, 56–57. ISBN 0-8018-5413-X .
- ^ Роджер Хорн и Чарльз Джонсон. Матричный анализ, глава 5, издательство Кембриджского университета, 1985. ISBN 0-521-38632-2 .
Библиография
[ редактировать ]- Джеймс В. Деммел , «Прикладная численная линейная алгебра», раздел 1.7, опубликовано SIAM, 1997.
- Карл Д. Мейер, Матричный анализ и прикладная линейная алгебра, опубликовано SIAM, 2000. [1]
- Джон Уотрус , Теория квантовой информации, 2.3 Нормы операторов , конспект лекций, Университет Ватерлоо, 2011.
- Кендалл Аткинсон , Введение в численный анализ, опубликовано John Wiley & Sons, Inc, 1989 г.