Дифференциал функции

Из Википедии, бесплатной энциклопедии

В исчислении дифференциал . представляет собой основную часть изменения функции относительно изменений независимой переменной. Дифференциал определяется

где является производной f по , и является дополнительной действительной переменной (так что является функцией и ). Обозначения таковы, что уравнение

имеет место, где производная представлена ​​в обозначениях Лейбница , и это согласуется с представлением о производной как о частном дифференциалов. Еще один пишет

Точное значение переменных и зависит от контекста приложения и требуемого уровня математической строгости. Область определения этих переменных может иметь особое геометрическое значение, если дифференциал рассматривается как особая дифференциальная форма , или аналитическое значение, если дифференциал рассматривается как линейное приближение к приращению функции. Традиционно переменные и считаются очень малыми ( бесконечно малыми ), и эта интерпретация становится строгой в нестандартном анализе .

История и использование [ править ]

Дифференциал был впервые введен через интуитивное или эвристическое определение Исааком Ньютоном и развит Готфридом Лейбницем , который думал о дифференциале dy как о бесконечно малом (или бесконечно малом ) изменении значения y функции, соответствующем бесконечно малому изменению dx. в аргументе функции x . По этой причине мгновенная скорость изменения y по отношению к x , которая является значением производной функции , обозначается дробью

в так называемой нотации Лейбница для производных. Частное не является бесконечно малым; скорее это реальное число .

Использование бесконечно малых в этой форме подверглось широкой критике, например, в знаменитой брошюре «Аналитик» епископа Беркли . Огюстен-Луи Коши ( 1823 ) определил дифференциал, не обращаясь к атомизму бесконечно малых Лейбница. [1] [2] Вместо этого Коши, вслед за Даламбером , перевернул логический порядок Лейбница и его последователей: производная сама стала фундаментальным объектом, определяемым как предел разностных коэффициентов, а затем через него определялись дифференциалы. То есть можно было свободно определять дифференциал по выражению

в котором и это просто новые переменные, принимающие конечные действительные значения, [3] не фиксированные бесконечно малые величины, как это было у Лейбница. [4]

По мнению Бойера (1959 , стр. 12), подход Коши был значительным логическим улучшением по сравнению с бесконечно малым подходом Лейбница, поскольку вместо обращения к метафизическому понятию бесконечно малых величин величины и теперь можно манипулировать точно так же, как и любыми другими реальными величинами. осмысленным образом. Общий концептуальный подход Коши к дифференциалам остается стандартным в современных аналитических подходах. [5] хотя последнее слово о строгости, вполне современном понятии предела, в конечном счете принадлежало Карлу Вейерштрассу . [6]

В физических подходах, например, в теории термодинамики , по-прежнему преобладает точка зрения на бесконечно малые величины. Курант и Джон (1999 , стр. 184) примиряют физическое использование бесконечно малых дифференциалов с их математической невозможностью следующим образом. Дифференциалы представляют собой конечные ненулевые значения, которые меньше степени точности, необходимой для конкретной цели, для которой они предназначены. Таким образом, «физические бесконечно малые» не обязательно апеллируют к соответствующим математическим бесконечно малым, чтобы иметь точный смысл.

После достижений двадцатого века в области математического анализа и дифференциальной геометрии стало ясно, что понятие дифференциала функции можно расширить различными способами. В реальном анализе целесообразнее иметь дело непосредственно с дифференциалом как с главной частью приращения функции. Это непосредственно приводит к представлению о том, что дифференциал функции в точке является линейным функционалом от приращения . Этот подход позволяет разрабатывать дифференциал (как линейное отображение) для множества более сложных пространств, что в конечном итоге приводит к появлению таких понятий, как производная Фреше или Гато . Точно так же в дифференциальной геометрии дифференциал функции в точке является линейной функцией касательного вектора («бесконечно малое смещение»), что демонстрирует его как своего рода одну форму: внешнюю производную функции. В нестандартном исчислении дифференциалы рассматриваются как бесконечно малые, которым самим можно поставить строгие основания (см. дифференциал (бесконечно малый) ).

Определение [ править ]

Дифференциал функции в какой-то момент .

Дифференциал определяется в современных трактовках дифференциального исчисления следующим образом. [7] Дифференциал функции одной действительной переменной это функция двух независимых действительных переменных и данный

Один или оба аргумента могут быть подавлены, т. е. можно увидеть или просто . Если , дифференциал также можно записать как . С , принято писать так что имеет место следующее равенство:

Это понятие дифференциала широко применимо, когда ищется линейное приближение к функции, в которой значение приращения достаточно мал. Точнее, если является дифференцируемой функцией при , то разница в -ценности

удовлетворяет

где ошибка в приближении удовлетворяет как . Другими словами, имеется приблизительное тождество

при котором погрешность можно сделать сколь угодно малой относительно ограничивая быть достаточно маленьким; то есть,

как . По этой причине дифференциал функции известен как главная (линейная) часть приращения функции: дифференциал является линейной функцией приращения функции. , и хотя ошибка может быть нелинейным, оно быстро стремится к нулю, поскольку стремится к нулю.

Дифференциалы в нескольких переменных [ править ]

Оператор/Функция
Дифференциал 1: 2:

3:

Частная производная
Полная производная

Следуя Гурса (1904 , I, §15), для функций более чем одной независимой переменной:

Частный дифференциал y y по любой из переменных x 1 является основной частью изменения в результате изменения dx 1 в этой переменной. Частный дифференциал, следовательно,

включая производную y . по x 1 частную Сумма частных дифференциалов по всем независимым переменным представляет собой полный дифференциал.

что является основной частью изменения y в результате изменений независимых переменных x i .

Точнее, в контексте исчисления многих переменных, следуя Куранту (1937b) , если f — дифференцируемая функция, то по определению дифференцируемости приращение

где члены ошибки ε   i стремятся к нулю, поскольку приращения Δ x i совместно стремятся к нулю. Тогда полный дифференциал строго определяется как

Поскольку согласно этому определению

надо

Как и в случае с одной переменной, справедливо приблизительное тождество

при котором общую ошибку можно сделать сколь угодно малой по отношению к ограничивая внимание достаточно малыми приращениями.

Применение общего дифференциала оценки ошибки для

При измерении общий дифференциал используется для оценки погрешности. функции на основе ошибок параметров . Предполагая, что интервал достаточно короткий, чтобы изменение было примерно линейным:

и что все переменные независимы, то для всех переменных

Это потому, что производная по конкретному параметру дает чувствительность функции к изменению , в частности ошибка . Поскольку предполагается, что они независимы, анализ описывает наихудший сценарий. Используются абсолютные значения погрешностей составляющих, поскольку после простого вычисления производная может иметь отрицательный знак. Из этого принципа выводятся правила ошибок суммирования, умножения и т. д., например:

Позволять . Тогда конечную ошибку можно аппроксимировать как

Оценка производных:
Деление на f , которое равно a × b

То есть при умножении общая относительная ошибка представляет собой сумму относительных ошибок параметров.

Чтобы проиллюстрировать, как это зависит от рассматриваемой функции, рассмотрим случай, когда функция равна вместо. Затем можно вычислить, что оценка ошибки равна

с дополнительным коэффициентом ' ln b ', которого нет в случае простого продукта. Этот дополнительный фактор имеет тенденцию уменьшать ошибку, поскольку ln b не так велик, как голый b .

Дифференциалы высшего порядка [ править ]

Дифференциалы высшего порядка функции y = f ( x ) одной переменной x могут быть определены через: [8]

и вообще,
Неформально это мотивирует обозначения Лейбница для производных более высокого порядка.
Когда самой независимой переменной x разрешается зависеть от других переменных, выражение становится более сложным, поскольку оно должно включать также дифференциалы более высокого порядка в самой x . Так, например,
и так далее.

Аналогичные соображения применимы и к определению дифференциалов более высокого порядка функций нескольких переменных. Например, если f — функция двух переменных x и y , то

где является биномиальным коэффициентом . Для большего количества переменных справедливо аналогичное выражение, но с соответствующим полиномиальным, а не биномиальным разложением. [9]

Дифференциалы более высокого порядка в нескольких переменных также усложняются, когда независимым переменным разрешается зависеть от других переменных. Например, для функции f от x и y , которой разрешено зависеть от вспомогательных переменных, имеем

Из-за этой неуклюжести обозначений использование дифференциалов более высокого порядка подверглось резкой критике со стороны Адамара (1935) , который пришел к выводу:

Наконец, что означает или представляет собой равенство?

По-моему, вообще ничего.

То есть: Наконец, что подразумевается или представлено равенством [...]? По-моему, вообще ничего. Несмотря на этот скептицизм, дифференциалы более высокого порядка все же стали важным инструментом анализа. [10]

В этих контекстах дифференциал n -го порядка функции f , примененной к приращению Δ x, определяется выражением

или эквивалентное выражение, например
где представляет собой n прямую разность с приращением t Δ x .

Это определение имеет смысл и в том случае, если f — функция нескольких переменных (здесь для простоты рассматривается как векторный аргумент). Тогда n таким образом -й дифференциал является однородной функцией степени n по приращению вектора ∆x . определенный Кроме того, ряд Тейлора функции f в точке x определяется выражением

более высокого порядка Производная Гато обобщает эти соображения на бесконечномерные пространства.

Свойства [ править ]

Ряд свойств дифференциала непосредственно вытекает из соответствующих свойств производной, частной производной и полной производной. К ним относятся: [11]

  • Линейность : для констант a и b и дифференцируемых функций f и g :
  • Правило произведения : для двух дифференцируемых f и g функций

Операция d с этими двумя свойствами известна в абстрактной алгебре как дифференцирование . Они подразумевают правило власти

различные формы цепного правила : Кроме того, с возрастающей степенью общности применяются [12]

  • Если y = f ( u ) — дифференцируемая функция переменной u , а u = g ( x ) — дифференцируемая функция от x , то
  • Если y = f ( x1 , , xn ... ) и все переменные x1 правилу ..., xn , зависят от другой переменной t , то по цепочки для частных производных имеем
    Эвристически правило цепочки для нескольких переменных можно понять, разделив обе части этого уравнения на бесконечно малую величину dt .
  • Имеют место более общие аналогичные выражения, в которых промежуточные переменные x i зависят более чем от одной переменной.

Общая формулировка [ править ]

Непротиворечивое понятие дифференциала можно разработать для функции f : R н Р м между двумя евклидовыми пространствами . Пусть x x R н быть парой евклидовых векторов . Приращение функции f равно

Если существует размера m × n матрица A такая, что
котором вектор ε → 0 при Δx в → 0 , то f по определению дифференцируема в точке x . Матрицу A иногда называют матрицей Якобиана , а линейное преобразование , которое соответствует приращению Δ x R н вектор A x R м в этой общей ситуации известен как дифференциал df ( x ) функции f в точке x . Это и есть производная Фреше , и ту же самую конструкцию можно использовать для функции между любыми банаховыми пространствами .

Другая плодотворная точка зрения состоит в том, чтобы определить дифференциал непосредственно как своего рода производную по направлению :

это подход, который уже использовался для определения дифференциалов более высокого порядка (и наиболее близок к определению, данному Коши). Если t представляет время и x положение , то h представляет собой скорость, а не смещение, как мы считали его до сих пор. Это дает еще одно уточнение понятия дифференциала: он должен быть линейной функцией кинематической скорости. Набор всех скоростей, проходящих через данную точку пространства, известен как касательное пространство , и поэтому df дает линейную функцию в касательном пространстве: дифференциальную форму . При такой интерпретации дифференциал f известен как внешняя производная и имеет широкое применение в дифференциальной геометрии , поскольку понятие скоростей и касательного пространства имеет смысл на любом дифференцируемом многообразии . Если, кроме того, выходное значение f также представляет положение (в евклидовом пространстве), то анализ размерностей подтверждает, что выходное значение df должно быть скоростью. Если рассматривать дифференциал таким образом, то он известен как pushforward , поскольку он «выталкивает» скорости из исходного пространства в скорости в целевом пространстве.

Другие подходы [ править ]

Хотя понятие бесконечно малого приращения dx не имеет четкого определения в современном математическом анализе , существует множество методов определения бесконечно малого дифференциала , чтобы дифференциал функции можно было обрабатывать способом, не противоречащим обозначениям Лейбница. . К ним относятся:

Примеры и приложения [ править ]

Дифференциалы могут эффективно использоваться в численном анализе для изучения распространения экспериментальных ошибок в расчетах и, следовательно, общей численной устойчивости задачи ( Courant 1937a ). Предположим, что переменная x представляет собой результат эксперимента, а y – результат численного вычисления, примененного к x . Вопрос в том, в какой степени ошибки измерения x влияют на результат вычисления y . Если x известен с точностью до Δ x от его истинного значения, то теорема Тейлора дает следующую оценку ошибки Δ y при вычислении y :

где ξ = x + θ Δ x для некоторого 0 < θ < 1 . Если Δ x мало, то членом второго порядка можно пренебречь, так что Δ y для практических целей хорошо аппроксимируется выражением dy = f' ( x ) Δ x .

Дифференциал часто бывает полезен при переписывании дифференциального уравнения.

в виде
в частности, когда кто-то хочет разделить переменные .

Примечания [ править ]

  1. Подробный исторический отчет о дифференциале см. в Boyer 1959 , особенно на стр. 275, где представлен вклад Коши по этому вопросу. Сокращенный отчет появляется в Kline 1972 , глава 40.
  2. ^ Коши явно отрицал возможность существования реальных бесконечно малых и бесконечных величин ( Boyer 1959 , стр. 273–275) и придерживался радикально иной точки зрения, согласно которой «переменная величина становится бесконечно малой, когда ее числовое значение бесконечно уменьшается таким образом, как сходиться к нулю» ( Коши 1823 , стр. 12; перевод из Бойера 1959 , стр. 273).
  3. ^ Бойер 1959 , с. 275
  4. ^ Бойер 1959 , с. 12: «Дифференциалы, определенные таким образом, являются лишь новыми переменными , а не фиксированными бесконечно малыми...»
  5. ^ Courant 1937a , II, §9: «Здесь лишь мимоходом отметим, что можно использовать это приближенное представление приращения линейным выражением построить логически удовлетворительное определение «дифференциала», как это, в частности, сделал Коши».
  6. ^ Бойер 1959 , с. 284
  7. ^ См., например, влиятельные трактаты Куранта 1937а , Клайна 1977 , Гурса 1904 и Харди 1908 . Третичные источники этого определения включают также Толстова 2001 и Ито 1993 , §106.
  8. ^ Коши 1823 . См. также, например, Goursat 1904 , I, §14.
  9. ^ Гурса 1904 , I, §14
  10. ^ В частности, к бесконечномерной голоморфности ( Hille & Phillips 1974 ) и численному анализу посредством исчисления конечных разностей .
  11. ^ Гурса 1904 , I, §17
  12. ^ Гурса 1904 , I, §§14,16
  13. ^ Эйзенбуд и Харрис 1998 .
  14. ^ См. Kock 2006 и Moerdijk & Reyes 1991 .
  15. ^ См. Робинсон 1996 и Кейслер 1986 .

См. также [ править ]

Ссылки [ править ]

Внешние ссылки [ править ]