Жесткое уравнение
В математике — жесткое уравнение это дифференциальное уравнение , для которого определенные численные методы решения уравнения численно нестабильны , если только размер шага не считается чрезвычайно малым. Сформулировать точное определение жесткости оказалось сложно, но основная идея заключается в том, что уравнение включает в себя некоторые члены, которые могут привести к быстрому изменению решения.
При численном интегрировании дифференциального уравнения можно было бы ожидать, что необходимый размер шага будет относительно небольшим в области, где кривая решения сильно варьируется, и относительно большим, когда кривая решения выпрямляется и приближается к линии с наклоном, близким к нулю. Для некоторых проблем это не так. Чтобы численный метод дал надежное решение дифференциальной системы, иногда требуется, чтобы размер шага был на неприемлемо малом уровне в области, где кривая решения очень гладкая. Это явление известно как жесткость . В некоторых случаях могут существовать две разные задачи с одним и тем же решением, но одна не является жесткой, а другая — жесткой. Следовательно, это явление не может быть свойством точного решения, поскольку оно одинаково для обеих задач и должно быть свойством самой дифференциальной системы. Такие системы поэтому известны как жесткие системы .
Мотивирующий пример
[ редактировать ]Рассмотрим задачу начального значения
( 1 ) |
Точное решение (показано голубым цветом):
( 2 ) |
Мы ищем численное решение , которое демонстрирует такое же поведение.
Рисунок (справа) иллюстрирует численные проблемы для различных числовых интеграторов, применяемых в уравнении.
- Метод Эйлера с шагом сильно колеблется и быстро выходит за пределы диапазона графика (показано красным).
- Метод Эйлера с половиной шага, , дает решение в пределах границ графика, но колеблется около нуля (показано зеленым).
- Трапециевидный метод (т. е. двухэтапный метод Адамса – Моултона ) имеет вид
где . Применение этого метода вместо метода Эйлера дает гораздо лучший результат (синий). Численные результаты монотонно убывают до нуля, как и точное решение.( 3 )
Одним из наиболее ярких примеров жестких обыкновенных дифференциальных уравнений (ОДУ) является система, описывающая химическую реакцию Робертсона: [1]
( 4 ) |
Если рассматривать эту систему на коротком интервале, например, проблем с численным интегрированием нет. Однако если интервал очень велик (10 11 скажем), то многие стандартные коды не могут правильно его интегрировать.
Коэффициент жесткости
[ редактировать ]Рассмотрим линейную неоднородную систему с постоянными коэффициентами
( 5 ) |
где и является постоянной, диагонализируемой, матрица с собственными значениями (предполагается различными) и соответствующие собственные векторы . Общее решение ( 5 ) принимает вид
( 6 ) |
где являются произвольными константами и является частным интегралом. Теперь предположим, что
( 7 ) |
из чего следует, что каждое из слагаемых как , так что решение подходы асимптотически как ; термин будет монотонно затухать, если действительно и синусоидально, если является сложным.
Устный перевод быть временем (как это часто бывает в физических проблемах), называется переходным решением и стационарное решение . Если велико, то соответствующий член быстро распадется, так как увеличивается и поэтому называется быстрым переходным процессом ; если мал, соответствующий член затухает медленно и называется медленным переходным процессом . Позволять определяться
( 8 ) |
так что является самым быстрым переходным процессом и самый медленный. Теперь мы определяем коэффициент жесткости как [2]
( 9 ) |
Характеристика жесткости
[ редактировать ]В этом разделе мы рассмотрим различные аспекты явления жесткости. «Феномен», вероятно, более подходящее слово, чем «свойство», поскольку последнее скорее подразумевает, что жесткость можно определить в точных математических терминах; оказывается, что сделать это удовлетворительным образом невозможно даже для ограниченного класса линейных систем с постоянными коэффициентами. Мы также увидим несколько качественных утверждений, которые могут быть сделаны (и в большинстве случаев были сделаны) в попытке сформулировать понятие жесткости, и сформулируем, вероятно, наиболее удовлетворительное из них как «определение» жесткости.
Дж. Д. Ламберт определяет жесткость следующим образом:
Если численный метод с конечной областью абсолютной устойчивости , примененный к системе с любыми начальными условиями , вынужден использовать на некотором интервале интегрирования длину шага, чрезмерно малую по отношению к гладкости точного решения на этом интервале система называется жесткой . , то на этом интервале
Существуют и другие характеристики, которые демонстрируются во многих примерах жестких задач, но для каждого из них есть контрпримеры, поэтому эти характеристики не могут служить хорошим определением жесткости. Тем не менее, определения, основанные на этих характеристиках, широко используются некоторыми авторами и являются хорошим ключом к определению наличия жесткости. Ламберт называет их «утверждениями», а не определениями по вышеупомянутым причинам. Некоторые из них:
- Линейная система постоянных коэффициентов является жесткой, если все ее собственные значения имеют отрицательную действительную часть и коэффициент жесткости велик.
- Жесткость возникает, когда длина шага ограничивается требованиями стабильности, а не требованиями точности.
- Жесткость возникает, когда некоторые компоненты раствора распадаются гораздо быстрее, чем другие. [3]
Этимология
[ редактировать ]Происхождение термина «жесткость» точно не установлено. По словам Джозефа Окленда Хиршфельдера , термин «жесткий» используется потому, что такие системы соответствуют плотной связи между приводом приводными сервомеханизмами и . [4] По словам Ричарда. Л. Берден и Дж. Дуглас Фейрс,
Значительные трудности могут возникнуть при применении стандартных численных методов для аппроксимации решения дифференциального уравнения , когда точное решение содержит члены вида , где комплексное число с отрицательной действительной частью.
. . .
Проблемы, связанные с быстро затухающими переходными решениями, естественным образом возникают в самых разных приложениях, включая исследование пружин и систем демпфирования, анализ систем управления и проблемы химической кинетики . Все это примеры класса задач, называемых жесткими (математической жесткостью) системами дифференциальных уравнений из-за их применения при анализе движения пружинных и массовых систем, имеющих большие константы пружины (физическая жесткость ). [5]
Например, задача начального значения
( 10 ) |
с , , , можно записать в виде ( 5 ) с и
( 11 ) |
и имеет собственные значения . Оба собственных значения имеют отрицательную действительную часть, а коэффициент жесткости равен
( 12 ) |
что довольно велико. Тогда система ( 10 ) заведомо удовлетворяет утверждениям 1 и 3. Здесь жесткость пружины велика, а константа затухания еще больше. [6] (хотя «большой» не является четко определенным термином, но чем больше вышеуказанные величины, тем более выраженным будет эффект жесткости.)Точное решение ( 10 ) есть
( 13 ) |
Уравнение 13 ведет себя очень похоже на простую экспоненту. , но наличие члена, даже с небольшим коэффициентом, достаточно, чтобы сделать численные вычисления очень чувствительными к размеру шага. Стабильное интегрирование ( 10 ) требует очень маленького шага до достижения гладкой части кривой решения, что приводит к ошибке, намного меньшей, чем требуется для точности. Таким образом, система также удовлетворяет утверждению 2 и определению Ламберта.
А-стабильность
[ редактировать ]Поведение численных методов решения жестких задач можно проанализировать, применив эти методы к тестовому уравнению при условии начального состояния с . Решение этого уравнения есть . Это решение приближается к нулю, поскольку когда Если численный метод также демонстрирует такое поведение (при фиксированном размере шага), то метод называется A-стабильным. [7] Численный метод, который является L-стабильным (см. ниже), обладает более сильным свойством: решение приближается к нулю за один шаг, когда размер шага стремится к бесконечности. А-стабильные методы не вызывают проблем нестабильности, описанных в мотивирующем примере.
Методы Рунге-Кутты
[ редактировать ]Методы Рунге – Кутты, примененные к проверочному уравнению принять форму , и по индукции . Функция называется функцией устойчивости . Таким образом, условие, как эквивалентно . Это мотивирует определение области абсолютной устойчивости (иногда называемой просто областью устойчивости ), которая представляет собой множество . Метод A-стабилен, если область абсолютной устойчивости содержит множество , то есть левая полуплоскость.
Пример: методы Эйлера
[ редактировать ]Рассмотрим методы Эйлера, описанные выше. Явный метод Эйлера, примененный к тестовому уравнению является
Следовательно, с . Таким образом, область абсолютной устойчивости для этого метода равна это диск, изображенный справа. Метод Эйлера не является A-стабильным.
Мотивирующим примером был . Значение z при выборе размера шага является , что находится за пределами области устойчивости. Действительно, численные результаты не сходятся к нулю. Однако с размером шага , у нас есть что находится как раз внутри области устойчивости, и численные результаты сходятся к нулю, хотя и довольно медленно.
Пример: Трапециевидный метод
[ редактировать ]Рассмотрим трапециевидный метод
применительно к проверочному уравнению , является
Решение для урожайность
Таким образом, функция устойчивости равна
и область абсолютной устойчивости
Эта область содержит левую полуплоскость, поэтому трапециевидный метод A-стабилен. Фактически область устойчивости идентична левой полуплоскости, и, следовательно, численное решение сходится к нулю тогда и только тогда, когда сходится точное решение. Тем не менее трапециевидный метод не обладает идеальным поведением: он затухает все затухающие компоненты, но быстро затухающие компоненты затухают лишь очень слабо, поскольку как . Это привело к концепции L-стабильности : метод является L-стабильным, если он A-стабилен и как . Трапециевидный метод является A-стабильным, но не L-стабильным. Неявный метод Эйлера является примером L-стабильного метода. [8]
Общая теория
[ редактировать ]Функция устойчивости метода Рунге–Кутты с коэффициентами и дается
где обозначает вектор со всеми единицами. Это рациональная функция (один многочлен делится на другой).
Явные методы Рунге – Кутты имеют строго нижнюю треугольную матрицу коэффициентов. и, следовательно, их функция устойчивости является полиномом. Отсюда следует, что явные методы Рунге–Кутты не могут быть A-устойчивыми.
Функция устойчивости неявных методов Рунге – Кутты часто анализируется с использованием звезд порядка . Звезда порядка для метода с функцией устойчивости определяется как набор . Метод A-стабилен тогда и только тогда, когда его функция устойчивости не имеет полюсов в левой плоскости и его порядковая звезда не содержит чисто мнимых чисел. [9]
Многошаговые методы
[ редактировать ]Линейные многошаговые методы имеют вид
Применительно к проверочному уравнению они становятся
который можно упростить до
где . Это линейное рекуррентное соотношение . Метод A-стабилен, если все решения рекуррентного соотношения сходятся к нулю, когда . Характеристический полином
Все решения сходятся к нулю при заданном значении если все решения из лежат в единичном круге.
Тогда областью абсолютной устойчивости многошагового метода указанного вида является совокупность всех ради чего все такой, что удовлетворить . Опять же, если это множество содержит левую полуплоскость, многошаговый метод называется A-стабильным.
Пример: метод Адамса – Башфорта второго порядка.
[ редактировать ]Определим область абсолютной устойчивости двухшагового метода Адамса–Бэшфорта.
Характеристический полином
у которого есть корни
таким образом, область абсолютной устойчивости
Этот регион показан справа. Он не включает всю левую полуплоскость (фактически он включает только действительную ось между ), поэтому метод Адамса – Башфорта не является A-стабильным.
Общая теория
[ редактировать ]Явные многошаговые методы никогда не могут быть A-стабильными, как и явные методы Рунге–Кутты. Неявные многошаговые методы могут быть A-стабильными только в том случае, если их порядок не превышает 2. Последний результат известен как второй Далквиста барьер ; это ограничивает полезность линейных многошаговых методов для жестких уравнений. Примером A-стабильного метода второго порядка является упомянутое выше правило трапеций, которое также можно рассматривать как линейный многошаговый метод. [10]
См. также
[ редактировать ]- Формула обратного дифференцирования — семейство неявных методов, специально используемых для решения жестких дифференциальных уравнений.
- Номер условия
- Дифференциальное включение , расширение понятия дифференциального уравнения, которое допускает разрывы, отчасти как способ обойти некоторые проблемы жесткости.
- Явные и неявные методы
Примечания
[ редактировать ]- ^ Робертсон, Х.Х. (1966). «Решение системы уравнений скорости реакций». Численный анализ: введение . Академическая пресса. стр. 178–182.
- ^ Ламберт (1992 , стр. 216–217)
- ^ Ламберт (1992 , стр. 217–220)
- ^ Хиршфельдер (1963)
- ^ Бремя и ярмарки (1993 , стр. 314)
- ^ Крейциг (1972 , стр. 62–68)
- ^ Это определение принадлежит Далквисту (1963) .
- ^ Определение L-стабильности принадлежит Эле (1969) .
- ^ Определение дано Ваннером, Хайрером и Норсеттом (1978) ; см. также Iserles & Nørsett (1991) .
- ^ См. Далквист (1963) .
Ссылки
[ редактировать ]- Берден, Ричард Л.; Фейрес, Дж. Дуглас (1993), Численный анализ (5-е изд.), Бостон: Приндл, Вебер и Шмидт , ISBN 0-534-93219-3 .
- Далквист, Гермунд (1963), «Специальная проблема устойчивости линейных многошаговых методов», BIT , 3 (1): 27–43, doi : 10.1007/BF01963532 , hdl : 10338.dmlcz/103497 , S2CID 120241743 .
- Эберли, Дэвид (2008), Анализ устойчивости систем дифференциальных уравнений (PDF) .
- Эле, Б.Л. (1969), Об аппроксимациях Паде экспоненциальной функции и A-стабильных методах численного решения начальных задач (PDF) , Университет Ватерлоо .
- Гир, К.В. (1971), Численные задачи начального значения в обыкновенных дифференциальных уравнениях , Энглвуд Клиффс: Прентис Холл , Бибкод : 1971nivp.book.....G .
- Гир, К.В. (1981), «Численное решение обыкновенных дифференциальных уравнений: осталось ли что-нибудь сделать?», SIAM Review , 23 (1): 10–24, doi : 10.1137/1023002 .
- Хайрер, Эрнст; Ваннер, Герхард (1996), Решение обыкновенных дифференциальных уравнений II: жесткие и дифференциально-алгебраические задачи (второе изд.), Берлин: Springer-Verlag , ISBN 978-3-540-60452-5 .
- Хиршфельдер, Дж. О. (1963), «Прикладная математика, используемая в теоретической химии», Симпозиум Американского математического общества : 367–376 .
- Изерлес, Арье; Норсетт, Сиверт (1991), Звезды Ордена , Чепмен и Холл , ISBN 978-0-412-35260-7 .
- Крейциг, Эрвин (1972), Высшая инженерная математика (3-е изд.), Нью-Йорк: Wiley , ISBN 0-471-50728-8 .
- Ламберт, Дж. Д. (1977), Д. Джейкобс (редактор), «Проблема начального значения для обыкновенных дифференциальных уравнений», Состояние дел в численном анализе , Нью-Йорк: Academic Press : 451–501 .
- Ламберт, JD (1992), Численные методы для обыкновенных дифференциальных систем , Нью-Йорк: Wiley , ISBN 978-0-471-92990-1 .
- Мэтьюз, Джон; Финк, Куртис (1992), Численные методы с использованием MATLAB .
- Пресс, WH; Теукольский, С.А.; Феттерлинг, WT; Фланнери, BP (2007). «Раздел 17.5. Жесткие системы уравнений» . Численные рецепты: искусство научных вычислений (3-е изд.). Нью-Йорк: Издательство Кембриджского университета. ISBN 978-0-521-88068-8 . Архивировано из оригинала 11 августа 2011 г. Проверено 17 августа 2011 г.
- Шампин, LF; Гир, CW (1979), «Взгляд пользователя на решение жестких обыкновенных дифференциальных уравнений» , SIAM Review , 21 (1): 1–17, doi : 10.1137/1021001 .
- Ваннер, Герхард; Хайрер, Эрнст; Норсетт, Сиверт (1978), «Звезды порядка и теория стабильности», BIT , 18 (4): 475–489, doi : 10.1007/BF01932026 , S2CID 8824105 .
- Устойчивость методов Рунге-Кутты [1]