Jump to content

Метод присоединенного состояния

Метод сопряженного состояния — это численный метод эффективного вычисления градиента функции оператора или в задаче численной оптимизации . [1] Он находит применение в геофизике , сейсмической визуализации , фотонике и, в последнее время, в нейронных сетях . [2]

Сопряженное пространство состояний выбрано для упрощения физической интерпретации ограничений уравнения . [3]

Методы сопряженного состояния позволяют использовать интегрирование по частям , в результате чего получается форма, которая явно содержит физически интересную величину. Вводится сопряженное уравнение состояния, включающее новую неизвестную переменную.

Сопряженный метод формулирует градиент функции к ее параметрам в форме оптимизации ограничений. Используя двойную форму этой задачи оптимизации ограничений, ее можно использовать для очень быстрого расчета градиента. Приятным свойством является то, что количество вычислений не зависит от количества параметров, для которых вам нужен градиент.Сопряженный метод вытекает из двойственной задачи [4] и используется, например, в итерационном методе Ландвебера . [5]

Название метода сопряженного состояния относится к двойственной форме задачи, где сопряженная матрица используется.

Когда исходная задача состоит в вычислении произведения и должен удовлетворить , двойственная задача может быть реализована как вычисление произведения ( ) , где должен удовлетворить . И называется вектором присоединенного состояния.

Общий случай

[ редактировать ]

Оригинальный метод сопряженных вычислений восходит к Жану Сеа. [6] с использованием лагранжиана задачи оптимизации для вычисления производной функционала по параметру формы .

Для переменной состояния , переменная оптимизации , целевой функционал определяется. Переменная состояния часто неявно зависит от через (прямое) уравнение состояния (обычно слабая форма уравнения в частных производных ), поэтому рассматриваемая цель . Обычно интересуют расчеты используя правило цепочки :

К сожалению, термин часто очень трудно дифференцировать аналитически, поскольку зависимость определяется с помощью неявного уравнения. В качестве решения этой проблемы можно использовать функционал Лагранжа. Поскольку уравнение состояния можно рассматривать как ограничение при минимизации , проблема

имеет ассоциированный лагранжев функционал определяется

где является множителем Лагранжа или присоединенной переменной состояния и является внутренним продуктом на . Метод множителей Лагранжа утверждает, что решением задачи должна быть стационарная точка лагранжиана, а именно

где является производной Гато от относительно в направлении . Последнее уравнение эквивалентно , уравнение состояния, решением которого является . Первое уравнение представляет собой так называемое уравнение сопряженного состояния.

поскольку задействованный оператор является сопряженным оператором , . Решение этого уравнения дает сопряженное состояние .Градиент интересующего количества относительно является (второе уравнение с и ), поэтому его можно легко идентифицировать путем последующего решения прямых и сопряженных уравнений состояния. Процесс еще проще, если оператор является самосопряженным или симметричным, поскольку прямое и сопряженное уравнения состояния различаются только правой частью.

Пример: линейный случай

[ редактировать ]

В реальном конечномерном контексте линейного программирования целевая функция может быть такой: , для , и , и пусть уравнение состояния будет , с и .

Лагранжева функция задачи равна , где .

Производная от относительно дает уравнение состояния, как показано ранее, а переменная состояния равна . Производная от относительно эквивалентно сопряженному уравнению, то есть для любого ,

Таким образом, мы можем написать символически . Градиент будет

где третьего порядка – тензор , представляет собой диадический продукт между прямым и присоединенным состояниями и обозначает двойное тензорное сжатие . Предполагается, что имеет известное аналитическое выражение, которое легко дифференцировать.

Численное рассмотрение самосопряженного случая

[ редактировать ]

Если оператор был самосопряженным, , прямое уравнение состояния и уравнение сопряженного состояния будут иметь одну и ту же левую часть. Чтобы никогда не инвертировать матрицу, что в численном отношении является очень медленным процессом, LU-разложение для решения уравнения состояния, в вместо этого можно использовать операции по разложению и операции по разрешению. Затем то же самое разложение можно использовать для решения сопряженного уравнения состояния всего за операций, поскольку матрицы одинаковы.

См. также

[ редактировать ]
  1. ^ Поллини, Николо; Лаван, Орен; Амир, Одед (01 июня 2018 г.). «Анализ сопряженной чувствительности и оптимизация гистерезисных динамических систем с нелинейными вязкостными демпферами». Структурная и междисциплинарная оптимизация . 57 (6): 2273–2289. дои : 10.1007/s00158-017-1858-2 . ISSN   1615-1488 . S2CID   125712091 .
  2. ^ Рикки Т.К. Чен, Юлия Рубанова, Джесси Бетанкур, Дэвид Дювено. Нейронные обыкновенные дифференциальные уравнения , доступные в Интернете.
  3. ^ Плессикс, RE. «Обзор метода сопряженного состояния для вычисления градиента функционала в геофизических приложениях». Международный геофизический журнал, 2006, 167(2): 495-503. бесплатный доступ на сайте GJI
  4. ^ Макнамара, Антуан; Трей, Адриан; Попович, Зоран; Стам, Джос (август 2004 г.). «Регулирование жидкости сопряженным методом» (PDF) . Транзакции ACM с графикой . 23 (3): 449–456. дои : 10.1145/1015706.1015744 . Архивировано (PDF) из оригинала 29 января 2022 года . Проверено 28 октября 2022 г.
  5. ^ Лундвалль, Йохан (2007). «Ассимиляция данных в гидродинамике с использованием сопряженной оптимизации» (PDF) . Швеция: Технологический университет Линчёпинга . Архивировано (PDF) из оригинала 9 октября 2022 года . Проверено 28 октября 2022 г.
  6. ^ Сеа, Жан (1986). «Оптимальная конструкция или идентификация формы, быстрый расчет производной функции стоимости по направлению» . ESAIM: Математическое моделирование и численный анализ - Математическое моделирование и численный анализ (на французском языке). 20 (3): 371–402. дои : 10.1051/м2ан/1986200303711 .
[ редактировать ]
  • Хорошо написанное объяснение Эррико: Что такое присоединенная модель?
  • Еще одно хорошо написанное объяснение с проработанными примерами, написанное Брэдли [1].
  • Более техническое объяснение: обзор метода сопряженного состояния для вычисления градиента функционала в геофизических приложениях.
  • курс Массачусетского технологического института [2]
  • С примечаниями [3]


Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: eb2ecbbbcdbf5d52fe681482cb8bc66f__1709018880
URL1:https://arc.ask3.ru/arc/aa/eb/6f/eb2ecbbbcdbf5d52fe681482cb8bc66f.html
Заголовок, (Title) документа по адресу, URL1:
Adjoint state method - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)