Метод наискорейшего спуска
В математике метод наискорейшего спуска или метод перевала является расширением метода Лапласа для аппроксимации интеграла, при котором контурный интеграл деформируется в комплексной плоскости так, чтобы он проходил вблизи стационарной точки ( седловой точки ), примерно в направлении крутой спуск или стационарная фаза. Приближение перевала используется с интегралами на комплексной плоскости, тогда как метод Лапласа используется с действительными интегралами.
Интеграл, который необходимо оценить, часто имеет вид
где C — контур, а λ велико. Одна из версий метода наискорейшего спуска деформирует контур интегрирования C в новый путь интегрирования C' так, что выполняются следующие условия:
- C′ проходит через один или несколько нулей производной g ′( z ),
- мнимая часть g ( z ) постоянна на C' .
Метод наискорейшего спуска был впервые опубликован Дебаем (1909) , который использовал его для оценки функций Бесселя и указал, что он встречается в неопубликованной заметке Римана (1863) о гипергеометрических функциях . Контур наискорейшего спуска обладает минимаксным свойством, см. Федорюк (2001) . Сигель (1932) описал некоторые другие неопубликованные заметки Римана, где он использовал этот метод для вывода формулы Римана-Зигеля .
Основная идея
[ редактировать ]Метод наискорейшего спуска — это метод аппроксимации комплексного интеграла вида для больших , где и являются аналитическими функциями . Поскольку подынтегральная функция аналитична, контур можно деформировать в новый контур без изменения интеграла. В частности, ищут новый контур, на котором мнимая часть, обозначаемая , из постоянно ( обозначает действительную часть). Затем а оставшийся интеграл можно аппроксимировать другими методами, например методом Лапласа . [1]
Этимология
[ редактировать ]Метод называется методом наискорейшего спуска, поскольку для аналитических , контуры постоянной фазы эквивалентны контурам наискорейшего спуска.
Если является аналитической функцией , он удовлетворяет уравнениям Коши–Римана Затем поэтому контуры постоянной фазы являются также контурами наискорейшего спуска.
Простая оценка
[ редактировать ]Пусть f , S : C н → C и C ⊂ C н . Если
где обозначает действительную часть, и существует положительное действительное число λ 0 такое, что
то имеет место следующая оценка: [2]
Доказательство простой оценки:
Случай одной невырожденной седловой точки
[ редактировать ]Основные понятия и обозначения
[ редактировать ]Пусть x — комплексный n -мерный вектор и
обозначают матрицу Гессе для функции S ( x ) . Если
является векторной функцией, то ее матрица Якоби определяется как
Невырожденная седловая точка , z 0 ∈ С н , голоморфной функции S ( z ) является критической точкой функции (т. е. ∇ S ( z 0 ) = 0 ), где матрица Гессе функции имеет ненулевой определитель (т. е. ).
Основным инструментом построения асимптотики интегралов в случае невырожденной седловой точки является следующий:
Комплексная лемма Морса
[ редактировать ]Лемма Морса для вещественнозначных функций обобщается следующим образом. [3] для голоморфных функций : вблизи невырожденной седловой точки z 0 голоморфной функции S ( z ) существуют координаты, в терминах которых S ( z ) − S ( z 0 ) точно квадратичен. Для уточнения пусть S — голоморфная функция с областью определения W ⊂ C н , и пусть z 0 в W — невырожденное седло S , т. е. ∇ S ( z 0 ) = 0 и . Тогда существуют окрестности U ⊂ W точки z 0 и V ⊂ C н w φ = 0 и биективная голоморфная функция φ : V → U с = (0) z 0 такой, что
Здесь µ j — собственные значения матрицы .
Следующее доказательство является прямым обобщением доказательства вещественной леммы Морса , которое можно найти в. [4] Начнем с демонстрации
- Вспомогательное заявление. Пусть f : C н → C голоморфен (0 ) в окрестности начала координат и f = 0 . Тогда в некоторой окрестности существуют функции g i : C н → C такой, что где g i голоморфен и каждый
От личности
мы заключаем, что
и
Без ограничения общности переведем начало координат в z 0 , такой, что z 0 = 0 и S (0) = 0 . Используя вспомогательное утверждение, мы имеем
Поскольку начало координат является седловой точкой,
мы также можем применить вспомогательное утверждение к функциям g i ( z ) и получить
( 1 ) |
Напомним, что произвольную матрицу A можно представить в виде суммы симметричных A ( с ) и антисимметричный A ( а ) матрицы,
Сжатие любой симметричной матрицы B с произвольной матрицей A равно
( 2 ) |
т. е. антисимметричный компонент A не дает вклада, потому что
Таким образом, h ij ( z ) в уравнении (1) можно считать симметричным относительно перестановки индексов i и j . Обратите внимание, что
следовательно, det( h ij (0)) ≠ 0, поскольку начало координат является невырожденной седловой точкой.
Покажем по индукции , что существуют локальные координаты ) , z = ψ ( u = ( u 1 , ... un u ) , 0 = ψ ( 0 ) такие, что
( 3 ) |
Во-первых, предположим, что существуют локальные координаты y = ( y 1 , ... y n ), z = φ ( y ), 0 = φ (0) , такие, что
( 4 ) |
где H ij симметричен согласно уравнению (2). Линейной заменой переменных ( y r , ... y n ) мы можем гарантировать, что H rr (0) ≠ 0 . Из правила цепочки имеем
Поэтому:
откуда,
Матрицу ( H ij (0)) можно привести к жордановой нормальной форме : ( H ij (0)) = LJL −1 , где L желаемое неособое линейное преобразование, а диагональ J содержит ненулевые собственные значения ( дает H ij (0)) . Если H ij (0) ≠ 0 , то в силу непрерывности H ij ( y ) он также должен быть ненулевым в некоторой окрестности начала координат. представив , мы пишем
Руководствуясь последним выражением, введем новые координаты z = η ( x ), 0 = η (0),
Замена переменных y ↔ x локально обратима, поскольку соответствующий якобиан отличен от нуля,
Поэтому,
( 5 ) |
Сравнивая уравнения (4) и (5), приходим к выводу, что уравнение (3) проверено. Обозначая собственные значения на µ j уравнение (3) можно переписать как
( 6 ) |
Поэтому,
( 7 ) |
Из уравнения (6) следует, что . Жорданова нормальная форма читает , где J z — верхняя диагональная матрица, содержащая собственные значения и det P ≠ 0 ; следовательно, . Из уравнения (7) получаем
Если , то замена двух переменных гарантирует, что .
Асимптотическое разложение в случае одной невырожденной седловой точки
[ редактировать ]Предполагать
- f ( z ) и S ( z ) — голоморфные функции в открытом , ограниченном и односвязном множестве Ω x ⊂ C н такой, что I x = Ω x ∩ R н подключен ;
- имеет единственный максимум: ровно для одной точки x 0 я € Икс ;
- х 0 является невырожденным седлом (т. е. ∇ S ( x 0 ) = 0 и ).
Тогда имеет место следующая асимптотика
( 8 ) |
где μ j — собственные значения гессиана и определяются с аргументами
( 9 ) |
Это утверждение является частным случаем более общих результатов, представленных Федорюком (1987). [5]
Сначала деформируем контур I x в новый контур проходящий через седловую точку x 0 и делит границу с I x . Эта деформация не меняет значения интеграла I ( λ ) . Мы используем Комплексную лемму Морса, чтобы изменить переменные интегрирования. Согласно лемме функция φ ( w ) отображает окрестность x 0 ∈ U ⊂ Ω x на окрестность Ω w, содержащую начало координат. Интеграл I ( λ ) можно разбить на два: I ( λ ) = I 0 ( λ ) + I 1 ( λ ) , где I 0 ( λ ) — интеграл по , в то время как I 1 ( λ ) закончилось (т.е. оставшаяся часть контура I′ x ). Поскольку последняя область не содержит седловой точки x 0 , значение I 1 ( λ ) экспоненциально меньше, чем I 0 ( λ ) при λ → ∞ ; [6] таким образом, I 1 ( λ ) игнорируется. Введя контур I w такой, что , у нас есть
( 10 ) |
Вспоминая, что х 0 = φ (0), а также , разложим предэкспоненциальную функцию в ряд Тейлора и оставить только главный член нулевого порядка
( 11 ) |
Здесь мы заменили область интегрирования I w на R н поскольку оба содержат начало координат, которое является седловой точкой, следовательно, они равны с точностью до экспоненциально малого члена. [7] Интегралы в правой части уравнения (11) можно выразить как
( 12 ) |
Из этого представления заключаем, что условие (9) должно выполняться, чтобы правая и левая части уравнения (12) совпадали. Согласно предположению 2, является отрицательно определенной квадратичной формой (т. е., ), что означает существование интеграла , что легко вычисляется
Уравнение (8) также можно записать как
( 13 ) |
где филиал
выбирается следующим образом
Рассмотрим важные частные случаи:
- Если S ( x ) имеет вещественное значение для реальных x и x 0 в Р н (он же многомерный метод Лапласа ), то [8]
- Если S ( x ) является чисто мнимым для вещественного x (т. е. для всех x в R н ) и х 0 в Р н (он же многомерный метод стационарной фазы ), [9] затем [10] где обозначает сигнатуру матрицы , что равно количеству отрицательных собственных значений минус количество положительных. Примечательно, что в приложениях метода стационарной фазы к многомерному приближению ВКБ в квантовой механике (а также в оптике) Ind связан с индексом Маслова, см., например, Чайчян и Демичев (2001) и Шульман (2005) .
Случай нескольких невырожденных седловых точек
[ редактировать ]Если функция S ( x ) имеет несколько изолированных невырожденных седловых точек, т. е.
где
является открытым покрытием Ω x , то вычисление интегральной асимптотики сводится к случаю одной седловой точки с использованием разбиения единицы . Разбиение единицы позволяет построить набор непрерывных функций ρ k ( x ) : Ω x → [0, 1], 1 ⩽ k ⩽ K , таких, что
Откуда,
Поэтому при λ → ∞ имеем:
где на последнем этапе использовалось уравнение (13), а предэкспоненциальная функция f ( x ) как минимум должна быть непрерывной.
Другие случаи
[ редактировать ]Когда ∇ S ( z 0 ) = 0 и , точка z 0 ∈ С н называется вырожденной седловой точкой функции S ( z ) .
Вычисление асимптотики
когда λ → ∞, f ( x ) непрерывна, а S ( z ) имеет вырожденную седловую точку, представляет собой очень сложную задачу, решение которой в значительной степени опирается на теорию катастроф . Здесь теория катастроф заменяет лемму Морса , справедливую только в невырожденном случае, для преобразования функции S ( z ) в одно из множества канонических представлений. Более подробную информацию см., например, в Poston & Stewart (1978) и Fedoryuk (1987) .
Интегралы с вырожденными седловыми точками естественным образом появляются во многих приложениях, включая оптическую каустику и многомерное приближение ВКБ в квантовой механике.
Остальные случаи, например, когда f ( x ) и/или S ( x ) являются разрывными или когда экстремум S ( x ) лежит на границе области интегрирования, требуют особого внимания (см., например, Федорюк (1987) и Вонг (1989) ).
Расширения и обобщения
[ редактировать ]Расширением метода наискорейшего спуска является так называемый нелинейный метод стационарной фазы/наискорейшего спуска . Здесь вместо интегралов нужно асимптотически оценивать решения задач факторизации Римана–Гильберта .
Учитывая контур C в комплексной сфере , функцию f, определенную на этом контуре, и специальную точку, скажем, бесконечность, ищут функцию M, голоморфную вдали от контура C , с заданным переходом через C и с заданной нормализацией на бесконечности. Если f и, следовательно, M являются матрицами, а не скалярами, то эта проблема, вообще говоря, не допускает явного решения.
Тогда возможна асимптотическая оценка в соответствии с методом линейной стационарной фазы/наискорейшего спуска. Идея состоит в том, чтобы асимптотически свести решение данной проблемы Римана–Гильберта к решению более простой, явно решаемой проблемы Римана–Гильберта. Теорема Коши используется для обоснования деформаций контура скачка.
Нелинейная стационарная фаза была введена Дейфтом и Чжоу в 1993 году на основе более ранней работы российского математика Александра Итса. (Собственно говоря) нелинейный метод наискорейшего спуска был представлен Камвиссисом, К. Маклафлином и П. Миллером в 2003 году на основе предыдущих работ Лакса, Левермора, Дейфта, Венакидеса и Чжоу. Как и в линейном случае, контуры наискорейшего спуска решают задачу мин-макс. В нелинейном случае они оказываются «S-образными кривыми» (определенными в другом контексте еще в 80-х годах Шталем, Гончаром и Рахмановым).
Нелинейный метод стационарной фазы/наискорейшего спуска имеет приложения в теории солитонных уравнений и интегрируемых моделях , случайных матрицах и комбинаторике .
Другое расширение - это метод Честера-Фридмана-Урселла для объединения седловых точек и равномерных асимптотических расширений.
См. также
[ редактировать ]Примечания
[ редактировать ]- ^ Бендер, Карл М.; Орзаг, Стивен А. (1999). Передовые математические методы для ученых и инженеров I . Нью-Йорк, штат Нью-Йорк: Springer New York. дои : 10.1007/978-1-4757-3069-2 . ISBN 978-1-4419-3187-0 .
- ^ Модифицированная версия леммы 2.1.1 на стр. 56 у Федорюка (1987) .
- ^ Лемма 3.3.2 на стр. 113 в Федорюке (1987).
- ^ Постон и Стюарт (1978) , стр. 54; см. также комментарий на стр. 479 в Wong (1989) .
- ^ Федорюк (1987) , страницы 417-420.
- ^ Этот вывод следует из сравнения окончательной асимптотики I 0 ( λ ) , заданной уравнением (8), и простой оценки отброшенного интеграла I 1 ( λ ) .
- ^ Это подтверждается сравнением интегральной асимптотики по R н [см. уравнение (8)] с простой оценкой измененной части.
- ^ См. уравнение (4.4.9) на стр. 125 у Федорюка (1987).
- ^ Строго говоря, этот случай не может быть выведен из уравнения (8), поскольку второе допущение , использованное при выводе, нарушается. Чтобы учесть обсуждаемый случай чисто мнимой фазовой функции, условие (9) следует заменить на
- ^ См. уравнение (2.2.6') на стр. 186 у Федорюка (1987).
Ссылки
[ редактировать ]- Чайчян, М.; Демичев, А. (2001), Интегралы по траекториям в физике, том 1: случайный процесс и квантовая механика , Тейлор и Фрэнсис, с. 174, ISBN 075030801X
- Дебай, П. (1909), «Приближенные формулы для цилиндрических функций при больших значениях аргумента и бесконечно переменных значениях индекса» , Mathematical Annals , 67 (4): 535–558, doi : 10.1007/ BF01450097 , S2CID 122219667 перевод на английский язык Дебай, Питер Дж. В. (1954), Сборник статей Питера Дж. В. Дебая , Interscience Publishers, Inc., Нью-Йорк, ISBN 978-0-918024-58-9 , МР 0063975
- Дейфт, П.; Чжоу, X. (1993), «Метод наискорейшего спуска для колебательных задач Римана-Гильберта. Асимптотика уравнения МКдВ», Ann. математики. , том. 137, нет. 2, Анналы математики, Том. 137, № 2, стр. 295–368, arXiv : math/9201261 , doi : 10.2307/2946540 , JSTOR 2946540 , S2CID 12699956 .
- Эрдели А. (1956), Асимптотические разложения , Дувр .
- Федорюк, М.В. (2001) [1994], «Метод перевала» , Энциклопедия Математики , EMS Press .
- Федорюк М.В. (1987), Асимптотика: интегралы и ряды , Наука, Москва .
- Камвиссис, С.; Маклафлин, КТ-Р.; Миллер, П. (2003), «Полуклассические солитонные ансамбли для фокусирующего нелинейного уравнения Шредингера», Annals of Mathematics Studies , vol. 154, Издательство Принстонского университета .
- Риман, Б. (1863), О развитии частного двух гипергеометрических рядов в бесконечной цепной дроби (неопубликованная заметка, воспроизведена в сборнике статей Римана).
- Сигель, CL (1932), «О наследии Римана в аналитической теории чисел», Источники и исследования по истории математики, астрономии и физики , 2 : 45–80 , перепечатано в сборнике статей, том 1. Берлин: Springer-Verlag, 1966.
- Переведено на Баркан, Эрик; Склар, Дэвид (2018), «О наласе Римана для аналитической теории чисел: перевод Убера Сигела», arXiv : 1810.05198 [ math.HO ] .
- Постон, Т.; Стюарт, И. (1978), Теория катастроф и ее приложения , Питман .
- Шульман, Л.С. (2005), «Глава 17: Фаза квазиклассической амплитуды», Методы и приложения интеграции путей , Дувр, ISBN 0486445283
- Вонг, Р. (1989), Асимптотические приближения интегралов , Academic Press .