коэффициент Рэлея
В математике коэффициент Рэлея [1] ( / ˈ r eɪ . l i / ) для данной комплексной эрмитовой матрицы и ненулевой вектор определяется как: [2] [3] Для вещественных матриц и векторов условие эрмитовости сводится к условию симметричности , а сопряженное транспонирование к обычному транспонированию . Обратите внимание, что для любого ненулевого скаляра . Напомним, что эрмитова (или вещественная симметричная) матрица диагонализируема только с действительными собственными значениями . Можно показать, что для данной матрицы коэффициент Рэлея достигает минимального значения. (наименьшее собственное значение ) когда является (соответствующий собственный вектор ). [4] Сходным образом, и .
Фактор Рэлея используется в теореме о мин-максе для получения точных значений всех собственных значений. Он также используется в алгоритмах собственных значений (таких как итерация фактора Рэлея ) для получения аппроксимации собственных значений из аппроксимации собственных векторов.
Область действия фактора Рэлея (для любой матрицы, не обязательно эрмитовой) называется числовой областью и содержит ее спектр . Когда матрица эрмитова, числовой радиус равен спектральной норме. Еще в функциональном анализе, известен как спектральный радиус . В контексте -алгебры или алгебраическая квантовая механика, функция, которая связывает фактор Рэлея – Ритца за фиксированную и изменение в алгебре будет называться векторным состоянием алгебры.
В квантовой механике коэффициент Рэлея дает математическое ожидание наблюдаемой, соответствующей оператору для системы, состояние которой определяется выражением .
Если мы исправим комплексную матрицу , то результирующее отображение коэффициентов Рэлея (рассматриваемое как функция ) полностью определяет через тождество поляризации ; действительно, это остается верным, даже если мы допускаем быть неэрмитовым. Однако если мы ограничим поле скаляров действительными числами, то фактор Рэлея будет определять только симметричную часть .
Границы для эрмитова M
[ редактировать ]Как указано во введении, для любого вектора x имеет место , где являются соответственно наименьшими и наибольшими собственными значениями . Это сразу видно после того, как мы заметили, что коэффициент Рэлея представляет собой средневзвешенное значение собственных значений M : где это -я собственная пара после ортонормировки и это -я координата x в собственном базисе. Тогда легко проверить, что оценки достигаются на соответствующих собственных векторах .
Тот факт, что частное представляет собой средневзвешенное значение собственных значений, можно использовать для определения второго, третьего и... крупнейших собственных значений. Позволять — собственные значения в порядке убывания. Если и ограничена ортогональностью , в этом случае , затем имеет максимальное значение , что достигается, когда .
Особый случай ковариационных матриц
[ редактировать ]Эмпирическая ковариационная матрица можно представить как произведение матрицы данных предварительно умноженный на его транспонирование . Будучи положительной полуопределенной матрицей, имеет неотрицательные собственные значения и ортогональные (или ортогонализуемые) собственные векторы, что можно продемонстрировать следующим образом.
Во-первых, собственные значения неотрицательны:
Во-вторых, собственные векторы ортогональны друг другу: если собственные значения разные – в случае кратности базис можно ортогонализировать.
Чтобы теперь установить, что коэффициент Рэлея максимизируется собственным вектором с наибольшим собственным значением, рассмотрим разложение произвольного вектора на основе собственных векторов : где это координата ортогонально проецируется на . Таким образом, мы имеем: который в силу ортонормированности собственных векторов принимает вид:
Последнее представление устанавливает, что коэффициент Рэлея представляет собой сумму квадратов косинусов углов, образованных вектором и каждый собственный вектор , взвешенный по соответствующим собственным значениям.
Если вектор максимизирует , то любое ненулевое скалярное кратное также максимизирует , поэтому задачу можно свести к задаче Лагранжа о максимизации при условии, что .
Определять: . Тогда это становится линейной программой , которая всегда достигает максимума в одном из углов области. Максимальная точка будет иметь и для всех (когда собственные значения упорядочены по убыванию величины).
Таким образом, фактор Рэлея максимизируется собственным вектором с наибольшим собственным значением.
Формулировка с использованием множителей Лагранжа
[ редактировать ]Альтернативно, этот результат может быть получен методом множителей Лагранжа . Первая часть — показать, что частное является постоянным при масштабировании. , где является скаляром
Ввиду этой инвариантности достаточно изучить частный случай . Задача состоит в том, чтобы найти критические точки функции с учетом ограничения Другими словами, это поиск критических точек где является множителем Лагранжа. Стационарные точки происходить в и
Следовательно, собственные векторы из - критические точки фактора Рэлея и соответствующие им собственные значения являются стационарными значениями . Это свойство лежит в основе анализа главных компонент и канонической корреляции .
Использование в теории Штурма – Лиувилля.
[ редактировать ]Теория Штурма – Лиувилля касается действия линейного оператора во внутреннем пространстве продукта, определяемом формулой функций, удовлетворяющих некоторым заданным граничным условиям в точках a и b . В этом случае коэффициент Рэлея равен
Иногда это представляется в эквивалентной форме, полученной путем разделения интеграла в числителе и использования интегрирования по частям :
Обобщения
[ редактировать ]- Для данной пары ( A , B ) матриц и данного ненулевого вектора x обобщенный фактор Рэлея определяется как: Обобщенный коэффициент Рэлея можно свести к коэффициенту Рэлея. через трансформацию где является разложением Холецкого эрмитовой положительно определенной матрицы B .
- Для данной пары ( x , y ) ненулевых векторов и данной эрмитовой матрицы H обобщенный фактор Рэлея может быть определен как: который совпадает с R ( H , x ), когда x = y . В квантовой механике эту величину называют «матричным элементом» или иногда «амплитудой перехода».
См. также
[ редактировать ]- Числовой диапазон
- Принцип минимакса Куранта
- Теорема Мин-Макса
- Коэффициент Рэлея в анализе вибраций
- собственное значение Дирихле
Ссылки
[ редактировать ]- ^ Также известно как соотношение Рэлея-Ритца ; назван в честь Вальтера Ритца и лорда Рэлея .
- ^ Хорн, РА; Джонсон, Калифорния (1985). Матричный анализ . Издательство Кембриджского университета. стр. 176–180. ISBN 0-521-30586-1 .
- ^ Парлетт, Б.Н. (1998). Симметричная проблема собственных значений . Классика прикладной математики. СИАМ. ISBN 0-89871-402-8 .
- ^ Костин, Родика Д. (2013). «Промежуточные заметки» (PDF) . Математика 5102 Линейная математика в бесконечных измерениях, конспекты лекций . Университет штата Огайо.
Дальнейшее чтение
[ редактировать ]- Ши Ю, Леон-Шарль Траншевант, Барт Мур, Ив Моро, Объединение данных на основе ядра для машинного обучения: методы и приложения в биоинформатике и анализе текста , гл. 2, Спрингер, 2011.