Дифференциальное исчисление

Из Википедии, бесплатной энциклопедии
График функции, нарисованный черным цветом, и касательная к этой функции, нарисованная красным. Наклон касательной равен производной функции в отмеченной точке.

В математике , дифференциальное исчисление — это раздел исчисления изучающий скорость изменения величин. [1] Это один из двух традиционных разделов исчисления, второй — интегральное исчисление — изучение площади под кривой. [2]

Основными объектами изучения дифференциального исчисления являются производная функции , связанные с ней понятия , такие как дифференциал , и их приложения. Производная функции при выбранном входном значении описывает скорость изменения функции вблизи этого входного значения. Процесс нахождения производной называется дифференцированием . Геометрически производная в точке — это наклон касательной в этой точке, при условии , к графику функции что производная существует и определена в этой точке. Для вещественной функции одной действительной переменной производная функции в точке обычно определяет наилучшее линейное приближение функции в этой точке.

Дифференциальное исчисление и интегральное исчисление связаны основной теоремой исчисления . Это означает, что дифференциация является процессом, обратным интеграции .

Дифференциация находит применение почти во всех количественных дисциплинах. В физике производная смещения движущегося тела по времени — это скорость тела, а производная скорости по времени — ускорение . Производная импульса тела по времени равна силе, приложенной к телу; перестановка этого утверждения о производной приводит к знаменитому уравнению F = ma, связанному со вторым законом движения Ньютона . Скорость реакции химической реакции является производной. В исследовании операций деривативы определяют наиболее эффективные способы транспортировки материалов и проектирования заводов.

Производные часто используются для нахождения максимумов и минимумов функции. Уравнения с производными называются дифференциальными уравнениями и имеют основополагающее значение для описания природных явлений . Производные и их обобщения появляются во многих областях математики, таких как комплексный анализ , функциональный анализ , дифференциальная геометрия , теория меры и абстрактная алгебра .

Производная [ править ]

График произвольной функции . Оранжевая линия касается , что означает, что именно в этой точке наклон кривой и прямой линии одинаковы.
Производная в разных точках дифференцируемой функции

Производная от в точку это наклон касательной к . [3] Чтобы получить представление об этом, нужно сначала научиться находить наклон линейного уравнения, записанного в виде . Наклон уравнения – это его крутизна. Его можно найти, выбрав любые две точки и разделив изменение на изменением в , означающий, что . Ибо график имеет наклон , как показано на схеме ниже:

График

Для краткости, часто пишется как , с греческая буква дельта, означающая «изменение». Наклон линейного уравнения постоянен, а это означает, что крутизна везде одинакова. Однако многие графики, такие как различаются по своей крутизне. Это означает, что вы больше не можете выбрать любые две произвольные точки и вычислить наклон. Вместо этого наклон графика можно вычислить, рассматривая касательную линию — линию, которая «просто касается» определенной точки. [а] Наклон кривой в определенной точке равен наклону касательной к этой точке. Например, имеет наклон в потому что наклон касательной к этой точке равен :

График , с прямой, касательной к . Наклон касательной равен . (Оси графика не имеют масштаба 1:1.)


Тогда производная функции это просто наклон этой касательной линии. [б] Несмотря на то, что касательная линия касается только одной точки в точке касания, ее можно аппроксимировать линией, проходящей через две точки. Это известно как секущая линия . Если две точки, через которые проходит секущая, расположены близко друг к другу, то секущая линия очень похожа на касательную, и, как следствие, ее наклон также очень похож:

Пунктирная линия проходит через точки и , которые оба лежат на кривой . Поскольку эти две точки расположены довольно близко друг к другу, пунктирная линия и касательная линия имеют одинаковый наклон. По мере сближения двух точек ошибка секущей линии становится исчезающе малой.


Преимущество использования секущей линии заключается в том, что ее наклон можно рассчитать напрямую. Рассмотрим две точки на графике и , где это небольшое число. Как и раньше, наклон линии, проходящей через эти две точки, можно рассчитать по формуле . Это дает

Как становится все ближе и ближе к , наклон секущей линии становится все ближе и ближе к наклону касательной. Формально это записывается как

Вышеприведенное выражение означает «как становится все ближе и ближе к 0, наклон секущей линии становится все ближе и ближе к определенному значению». Значение, к которому приближаются, является производной ; это можно записать как . Если , производная также может быть записана как , с представляющее бесконечно малое изменение. Например, представляет собой бесконечно малое изменение x. [с] Подводя итог, если , то производная от является

при условии, что такой предел существует. [4] [д] Таким образом, нам удалось правильно определить производную функции, а это означает, что «наклон касательной линии» теперь имеет точный математический смысл. Дифференцирование функции с использованием приведенного выше определения известно как дифференцирование от первых принципов. Вот доказательство, используя дифференцирование от первых принципов, что производная является :

Как подходы , подходы . Поэтому, . Это доказательство можно обобщить и показать, что если и являются константами . Это известно как правило власти . Например, . Однако многие другие функции не могут быть дифференцированы так же легко, как полиномиальные функции , а это означает, что иногда для нахождения производной функции необходимы дополнительные методы. Эти методы включают правило цепочки , правило произведения и правило фактора . Другие функции вообще не могут быть дифференцированы, что порождает понятие дифференцируемости .

Близким понятием, связанным с производной функции, является ее дифференциал . Когда x и y являются действительными переменными, производная f в точке x представляет собой наклон касательной линии к графику f в точке x . Поскольку источник и цель f одномерны, производная f является действительным числом. Если x и y — векторы, то лучшее линейное приближение графика f зависит от того, как f изменяется сразу в нескольких направлениях. Выбор наилучшего линейного приближения в одном направлении определяет частную производную , которую обычно обозначают у / Икс . Линеаризация f во всех направлениях одновременно называется полной производной .

История дифференциации [ править ]

Понятие производной в смысле касательной линии — очень старое, знакомое древнегреческим математикам , таким как Евклид (ок. 300 г. до н. э.), Архимед (ок. 287–212 до н. э.) и Аполлоний Пергский (ок. 262–190 до н. э.). [5] Архимед также использовал неделимые , хотя они в основном использовались для изучения площадей и объемов, а не производных и касательных (см. « Метод механических теорем »). Использование бесконечно малых величин для расчета скорости изменений было значительно развито Бхаскарой II (1114–1185); действительно, это утверждалось [6] что многие ключевые понятия дифференциального исчисления можно найти в его работах, например, в « Теореме Ролля ». [7]

Математик Шараф ад-Дин ат-Туси (1135–1213) в своем «Трактате об уравнениях» установил условия, при которых некоторые кубические уравнения имеют решения, путем нахождения максимумов соответствующих кубических многочленов. Он получил, например, что максимум (при положительном x ) кубической оси 2 - Икс 3 происходит, когда x = 2 a / 3 , и отсюда пришел к выводу, что уравнение ax 2 = х 3 + c имеет ровно одно положительное решение, когда c = 4 a 3 / 27 и два положительных решения всякий раз, когда 0 < c < 4 a 3 / 27 . [8] [ нужна страница ] Историк науки Рошди Рашед . [8] [ нужна страница ] утверждал, что ат-Туси, должно быть, использовал производную кубического числа, чтобы получить этот результат. Однако вывод Рашеда оспаривается другими учеными, которые утверждают, что он мог получить результат другими методами, которые не требуют знания производной функции. [8] [ нужна страница ]

Современное развитие исчисления обычно приписывают Исааку Ньютону (1643–1727) и Готфриду Вильгельму Лейбницу (1646–1716), которые предоставили независимые [Это] и унифицированные подходы к дифференциации и производным. Однако ключевым открытием, которое принесло им эту похвалу, была фундаментальная теорема исчисления, касающаяся дифференцирования и интегрирования: она сделала устаревшими большинство предыдущих методов вычисления площадей и объемов. [ф] В своих идеях о производных и Ньютон, и Лейбниц опирались на важные более ранние работы математиков, таких как Пьер де Ферма (1607–1665), Исаак Барроу (1630–1677), Рене Декарт (1596–1650), Христиан Гюйгенс (1629–1695 ). ), Блез Паскаль (1623–1662) и Джон Уоллис (1616–1703). Что касается влияния Ферма, Ньютон однажды написал в письме: « Я получил намек на этот метод [флюксий] из способа Ферма проводить касательные, и, применив его к абстрактным уравнениям, прямо или наоборот, я сделал его общим » . [9] Исааку Бэрроу обычно приписывают раннюю разработку дериватива. [10] Тем не менее, Ньютон и Лейбниц остаются ключевыми фигурами в истории дифференциации, не в последнюю очередь потому, что Ньютон был первым, кто применил дифференцирование в теоретической физике , а Лейбниц систематически разработал большую часть обозначений, используемых до сих пор.

Начиная с 17 века многие математики внесли свой вклад в теорию дифференцирования. В XIX веке исчисление было поставлено на гораздо более строгую основу такими математиками, как Огюстен Луи Коши (1789–1857), Бернхард Риман (1826–1866) и Карл Вейерштрасс (1815–1897). Именно в этот период дифференциация была распространена на евклидово пространство и комплексную плоскость .

20-й век принес два важных шага к нашему нынешнему пониманию и практике вывода: интеграция Лебега , помимо расширения интегрального исчисления на многие другие функции, прояснила связь между выводом и интегрированием с понятием абсолютной непрерывности . Позже теория распределений (после Лорана Шварца ) распространила вывод на обобщенные функции (например, дельта-функция Дирака, ранее введенная в квантовой механике ) и стала фундаментальной для современного прикладного анализа, особенно за счет использования слабых решений уравнений в частных производных .

Применение деривативов [ править ]

Оптимизация [ править ]

Если f дифференцируемая функция на (или открытом интервале ), а локальный максимум или локальный минимум f x , то производная f в точке x равна нулю. Точки, в которых f' ( x ) = 0, называются критическими точками или стационарными точками (а значение f в точке x называется критическим значением ). Если не предполагается, что f всюду дифференцируема, то точки, в которых она не дифференцируема, также называются критическими точками.

Если f дважды дифференцируемо, то, наоборот, критическую точку x функции f можно проанализировать, рассматривая производную f вторую в точке x :

  • если он положителен, x является локальным минимумом;
  • если он отрицательный, x является локальным максимумом;
  • если он равен нулю, то x может быть локальным минимумом, локальным максимумом или ни тем, ни другим. (Например, f ( x ) = x 3 имеет критическую точку при x = 0 , но не имеет там ни максимума, ни минимума, тогда как f ( x ) = ± x 4 имеет критическую точку при x = 0 и там соответственно минимум и максимум.)

Это называется тестом второй производной . Альтернативный подход, называемый тестом первой производной , предполагает рассмотрение знака f' по обе стороны от критической точки.

Поэтому получение производных и определение критических точек часто является простым способом найти локальные минимумы или максимумы, что может быть полезно при оптимизации . По теореме о крайних значениях непрерывная функция на отрезке должна хотя бы один раз достичь своих минимального и максимального значений. Если функция дифференцируема, минимумы и максимумы могут возникать только в критических или конечных точках.

Это также имеет применение при построении графиков: как только локальные минимумы и максимумы дифференцируемой функции найдены, можно получить приблизительный график графика, наблюдая, что он будет либо увеличиваться, либо уменьшаться между критическими точками.

В более высоких измерениях критическая точка скалярной функции — это точка, в которой градиент равен нулю. Тест второй производной по-прежнему можно использовать для анализа критических точек путем рассмотрения собственных значений матрицы Гессе вторых частных производных функции в критической точке. Если все собственные значения положительны, то точка является локальным минимумом; если все отрицательные, это локальный максимум. Если существуют некоторые положительные и некоторые отрицательные собственные значения, то критическая точка называется « седловой точкой », и если ни один из этих случаев не выполняется (т. е. некоторые из собственных значений равны нулю), то тест считается безрезультатным.

Вариационное исчисление [ править ]

Один из примеров задачи оптимизации: найти кратчайшую кривую между двумя точками на поверхности, предполагая, что кривая также должна лежать на поверхности. Если поверхность — плоскость, то самая короткая кривая — линия. Но если поверхность имеет, например, яйцеобразную форму, то кратчайший путь сразу не ясен. Эти пути называются геодезическими , и одной из наиболее фундаментальных задач вариационного исчисления является нахождение геодезических. Другой пример: Найдите наименьшую площадь заполнения поверхности замкнутой кривой в пространстве. Эта поверхность называется минимальной поверхностью , и ее тоже можно найти с помощью вариационного исчисления.

Физика [ править ]

Исчисление имеет жизненно важное значение в физике: многие физические процессы описываются уравнениями с производными, называемыми дифференциальными уравнениями . Физика особенно озабочена тем, как величины изменяются и развиваются с течением времени, а концепция « производной по времени » — скорости изменения во времени — важна для точного определения нескольких важных понятий. важны производные по времени от положения объекта В частности, в ньютоновской физике :

  • Скорость — это производная (по времени) смещения объекта (расстояния от исходного положения).
  • ускорение — это производная (по времени) скорости объекта, то есть вторая производная (по времени) положения объекта.

Например, если положение объекта на линии задано формулой

тогда скорость объекта равна

и ускорение объекта равно

который является постоянным.

Дифференциальные уравнения [ править ]

Дифференциальное уравнение — это связь между набором функций и их производными. Обыкновенное дифференциальное уравнение — это дифференциальное уравнение, которое связывает функции одной переменной с их производными по этой переменной. Уравнение в частных производных — это дифференциальное уравнение, которое связывает функции более чем одной переменной с их частными производными . Дифференциальные уравнения естественным образом возникают в физических науках, при математическом моделировании и в самой математике. Например, второй закон Ньютона , описывающий связь между ускорением и силой, можно сформулировать как обыкновенное дифференциальное уравнение.

с Уравнение теплопроводности одной пространственной переменной, которое описывает, как тепло распространяется через прямой стержень, представляет собой уравнение в частных производных.

Здесь u ( x , t ) — температура стержня в положении x и времени t , а α — константа, зависящая от того, насколько быстро тепло распространяется через стержень.

Теорема о среднем значении

Теорема о среднем значении: для каждой дифференцируемой функции с Eсть с .

Теорема о среднем значении дает связь между значениями производной и значениями исходной функции. Если f ( x ) является действительной функцией, а a и b являются числами с a < b , то теорема о среднем значении говорит, что при мягких гипотезах наклон между двумя точками ( a , f ( a )) и ( b , f ( b )) равен наклону касательной к f в некоторой точке c между a и b . Другими словами,

На практике теорема о среднем значении позволяет управлять функцией через ее производную. Например, предположим, что f имеет производную, равную нулю в каждой точке. Это означает, что ее касательная горизонтальна в каждой точке, поэтому функция также должна быть горизонтальной. Теорема о среднем значении доказывает, что это должно быть верно: наклон между любыми двумя точками на графике f должен равняться наклону одной из касательных линий f . Все эти наклоны равны нулю, поэтому любая линия, идущая от одной точки графика к другой точке, также будет иметь нулевой наклон. Но это говорит о том, что функция не перемещается вверх или вниз, поэтому это должна быть горизонтальная линия. Более сложные условия для производной приводят к менее точной, но все же весьма полезной информации об исходной функции.

Полиномы Тейлора и ряды Тейлора

Производная дает наилучшее линейное приближение функции в данной точке, но она может сильно отличаться от исходной функции. Одним из способов улучшения приближения является использование квадратичного приближения. Другими словами, линеаризация действительной функции f ( x ) в точке x 0 представляет собой линейный многочлен a + b ( x x 0 ) , и возможно получить лучшее приближение, рассматривая квадратичную многочлен а + б ( Икс - Икс 0 ) + c ( Икс - Икс 0 ) 2 . Еще лучше мог бы быть кубический полином a + b ( x x 0 ) + c ( x x 0 ) 2 + d ( Икс - Икс 0 ) 3 , и эту идею можно распространить на полиномы сколь угодно высокой степени. Для каждого из этих полиномов должен быть наилучший выбор коэффициентов a , b , c и d , который делает аппроксимацию как можно более хорошей.

В окрестности точки x0 ) для a наилучший выбор всегда есть f ( x0 есть ) , а для наилучший выбор всегда ' ( x0 f b . Для c , d и коэффициентов более высокой степени эти коэффициенты определяются высшими производными f . с всегда должно быть f'' ( x 0 ) / 2 , а d всегда должно быть f''' ( x 0 ) / 3! . Использование этих коэффициентов дает полином Тейлора от f . Полином Тейлора степени d — это полином степени d , который лучше всего приближает f , и его коэффициенты можно найти путем обобщения приведенных выше формул. Теорема Тейлора дает точную оценку того, насколько хороша аппроксимация. Если f — многочлен степени меньше или равной d , то полином Тейлора степени d равен f .

Пределом полиномов Тейлора является бесконечный ряд, называемый рядом Тейлора . Ряд Тейлора часто является очень хорошим приближением к исходной функции. Функции, равные своему ряду Тейлора, называются аналитическими функциями . Функции с разрывами или острыми углами не могут быть аналитическими; более того, существуют гладкие функции , которые также не являются аналитическими.

Теорема о функции неявной

Некоторые естественные геометрические фигуры, такие как круги , нельзя изобразить в виде графика функции . Например, если f ( x , y ) = x 2 + и 2 − 1 , то окружность представляет собой множество всех пар ( x , y ) таких, что f ( x , y ) = 0 . Этот набор называется нулевым набором f и не совпадает с графиком f , который является параболоидом . Теорема о неявной функции преобразует такие отношения, как f ( x , y ) = 0, в функции. Он утверждает, что если f , непрерывно дифференцируема то вокруг большинства точек нулевое множество f выглядит как графики функций, склеенных вместе. Точки, в которых это не так, определяются условием на производную f . Например, круг можно склеить из графиков двух функций ± 1 - x 2 . В окрестности каждой точки окружности, кроме (−1, 0) и (1, 0) , одна из этих двух функций имеет график, похожий на окружность. (Эти две функции также встречаются (−1, 0) и (1, 0) , но это не гарантируется теоремой о неявной функции.)

Теорема о неявной функции тесно связана с теоремой об обратной функции , которая гласит, что функция выглядит как графики обратимых функций, склеенные вместе.

См. также [ править ]

Примечания [ править ]

  1. ^ Это не формальное определение того, что такое касательная линия. Определение производной как предела делает понятие касательной линии строгим.
  2. ^ Хотя техническое определение функции несколько сложное, интуитивно легко понять, что такое функция. Функция принимает входные данные и производит выходные данные. Например, функция берет число и возводит его в квадрат. Число, над которым функция выполняет операцию, часто обозначается буквой , но нет никакой разницы между написанием и писать . По этой причине, часто называют «фиктивной переменной».
  3. ^ Термин «бесконечно малое» иногда может привести к тому, что люди ошибочно полагают, что существует «бесконечно малое число», то есть положительное действительное число, которое меньше любого другого действительного числа. Фактически, термин «бесконечно малый» — это просто сокращение для предельного процесса. По этой причине, это не дробь, а, скорее, предел дроби.
  4. ^ Не каждую функцию можно дифференцировать, поэтому это определение применимо только в том случае, если «предел существует». Дополнительную информацию см. в статье Википедии о дифференцируемости .
  5. Ньютон начал свою работу в 1665 году, а Лейбниц — в 1676 году. Однако Лейбниц опубликовал свою первую статью в 1684 году, до публикации Ньютона в 1693 году. Вполне возможно, что Лейбниц видел черновики работы Ньютона в 1673 или 1676 году, или что Ньютон использовал работы Лейбница, чтобы усовершенствовать свою собственную. И Ньютон, и Лейбниц утверждали, что оба занимались плагиатом их работ. Это привело к ожесточенному спору между ними о том, кто первым изобрел исчисление, который потряс математическое сообщество в начале 18 века.
  6. Это было монументальное достижение, хотя ограниченная версия была ранее доказана Джеймсом Грегори (1638–1675), а некоторые ключевые примеры можно найти в работах Пьера де Ферма (1601–1665).

Ссылки [ править ]

Цитаты [ править ]

  1. ^ «Определение ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ» . www.merriam-webster.com . Проверено 9 мая 2020 г.
  2. ^ «Определение интегрального исчисления» . www.merriam-webster.com . Проверено 9 мая 2020 г.
  3. ^ Алкок, Лара (2016). Как думать об анализе . Нью-Йорк: Издательство Оксфордского университета. стр. 155–157. ISBN  978-0-19-872353-0 .
  4. ^ Вайсштейн, Эрик В. «Производная» . mathworld.wolfram.com . Проверено 26 июля 2020 г.
  5. ^ См. «Элементы Евклида» , «Палимпсест Архимеда» и « Элементы Евклида». О'Коннор, Джон Дж.; Робертсон, Эдмунд Ф. , «Аполлоний Пергский» , Архив истории математики MacTutor , Университет Сент-Эндрюс
  6. ^ Ян Г. Пирс. Бхаскарачарья II. Архивировано 1 сентября 2016 г. в Wayback Machine.
  7. ^ Бродбент, ТАА; Клайн, М. (октябрь 1968 г.). «Рецензируемые работы: История древнеиндийской математики К. Н. Шринивасенгара». Математический вестник . 52 (381): 307–8. дои : 10.2307/3614212 . JSTOR   3614212 . S2CID   176660647 .
  8. ^ Перейти обратно: а б с Берггрен 1990 .
  9. ^ Сабра, А. И. (1981). Теории света: от Декарта до Ньютона . Издательство Кембриджского университета. п. 144. ИСБН  978-0521284363 .
  10. ^ Ивс, Х. (1990).

Цитируемые работы [ править ]

  • Берггрен, Дж. Л. (1990). «Инновации и традиции в Муадалате Шарафа ад-Дина ат-Туси». Журнал Американского восточного общества . 110 (2): 304–309. дои : 10.2307/604533 . JSTOR   604533 .

Другие источники [ править ]