Градиент

Из Википедии, бесплатной энциклопедии
Градиент, представленный синими стрелками, обозначает направление наибольшего изменения скалярной функции. Значения функции представлены в оттенках серого и увеличиваются в диапазоне от белого (низкий) до темного (высокий).

В векторном градиент функции скалярнозначной дифференцируемой исчислении нескольких переменных векторное поле (или векторная функция ) чье значение в точке дает направление и скорость самого быстрого роста. Градиент трансформируется как вектор при изменении базиса пространства переменных . Если градиент функции отличен от нуля в точке , направление градиента — это направление, в котором функция возрастает быстрее всего от , а величина градиента — это скорость увеличения в этом направлении, наибольшая абсолютная производная по направлению. [1] Кроме того, точка, где градиент равен нулевому вектору, называется стационарной точкой . Таким образом, градиент играет фундаментальную роль в теории оптимизации , где он используется для минимизации функции путем градиентного спуска . В бескоординатных терминах градиент функции может быть определено:

где это полное бесконечно малое изменение для бесконечно малого перемещения , и считается максимальным, когда находится в направлении градиента . Символ наблы , записанный в виде перевернутого треугольника и произносится как «del», обозначает векторный дифференциальный оператор .

Когда используется система координат, в которой базисные векторы не являются функциями положения, градиент задается вектором [а] являются частными производными компоненты которого в . [2] То есть для , его градиент определяется в точке в n -мерном пространстве как вектор [б]

Обратите внимание, что приведенное выше определение градиента определено только для функции , если оно дифференцируемо в . Могут существовать функции, у которых частные производные существуют во всех направлениях, но не дифференцируемы. Более того, это определение как вектора частных производных действительно только в том случае, если базис системы координат ортонормирован. Для любого другого базиса метрический тензор необходимо учитывать в этой точке.

Например, функция если только в пункте отправления, где , не дифференцируема в начале координат, поскольку не имеет четко определенной касательной плоскости, несмотря на наличие четко определенных частных производных во всех направлениях в начале координат. [3] В этом конкретном примере при вращении системы координат xy приведенная выше формула для градиента не может преобразоваться как вектор (градиент становится зависимым от выбора основы для системы координат), а также не может указывать на «самый крутой подъем» в некоторых ориентациях. Можно показать, что для дифференцируемых функций, для которых справедлива формула градиента, она всегда преобразуется как вектор при преобразовании базиса, чтобы всегда указывать на наиболее быстрое увеличение.

Градиент двойственен полной производной : значение градиента в точке представляет собой касательный вектор – вектор в каждой точке; а значение производной в точке представляет собой кокасательный вектор – линейный функционал от векторов. [с] Они связаны тем, что скалярное произведение градиента в какой-то момент с другим касательным вектором равна по направлению производной в функции вдоль ; то есть, . Градиент допускает множественные обобщения на более общие функции на многообразиях ; см . § Обобщения .

Мотивация [ править ]

Градиент двумерной функции f ( x , y ) = xe −( х 2 + и 2 ) отображается в виде стрелок на псевдоцветном графике функции.

Рассмотрим комнату, где температура задается скалярным полем , T поэтому в каждой точке ( x , y , z ) температура равна T ( x , y , z ) , независимо от времени. В каждой точке комнаты градиент T в этой точке будет показывать направление, в котором температура повышается быстрее всего, удаляясь от ( x , y , z ) . Величина градиента будет определять, насколько быстро температура повысится в этом направлении.

Рассмотрим поверхность, высота которой над уровнем моря в точке ( x , y ) равна H ( x , y ) . Градиент H в точке представляет собой плоский вектор, указывающий в направлении самого крутого склона или уклона в этой точке. Крутизна склона в этой точке определяется величиной вектора градиента.

Градиент также можно использовать для измерения того, как скалярное поле изменяется в других направлениях, а не только в направлении наибольшего изменения, путем взятия скалярного произведения . Предположим, что самый крутой уклон холма составляет 40%. Дорога, идущая прямо в гору, имеет уклон 40%, но дорога, огибающая холм под углом, будет иметь более пологий уклон. Например, если дорога расположена под углом 60° к направлению подъема (когда оба направления проецируются на горизонтальную плоскость), то уклон вдоль дороги будет скалярным произведением вектора градиента и единичного вектора вдоль дороги. , поскольку скалярное произведение измеряет, насколько единичный вектор вдоль дороги совпадает с самым крутым уклоном [д] , что в 40% больше косинуса 60°, или 20%.

В более общем смысле, если функция высоты холма H дифференцируема , , то градиент H отмеченный единичным вектором, дает наклон холма в направлении вектора, производную по направлению от H вдоль единичного вектора.

Обозначения [ править ]

Градиент функции в точку обычно записывается как . Он также может обозначаться любым из следующих символов:

  • : чтобы подчеркнуть векторность результата.
  • и : Написано с использованием обозначений Эйнштейна , где повторяющиеся индексы ( i ) суммируются.

Определение [ править ]

Градиент функции f ( x , y ) = −(cos 2 х + потому что 2 и ) 2 изображается в виде проецируемого векторного поля на нижнюю плоскость.

скалярной функции f ( x 1 , x 2 , x 3 , …, x n ) обозначается f или f , где ( nabla ) обозначает векторный дифференциальный оператор Градиент (или векторное поле градиента ) del . Обозначение grad f также часто используется для обозначения градиента. Градиент f определяется как уникальное векторное поле, скалярное произведение которого с любым вектором v в каждой точке x является производной f по направлению вдоль v . То есть,

где правая часть — это производная по направлению , и существует много способов ее представления. Формально производная двойственна градиенту; см. связь с производной .

Когда функция также зависит от такого параметра, как время, градиент часто относится просто к вектору только ее пространственных производных (см. Пространственный градиент ).

Величина и направление вектора градиента не зависят от конкретного представления координат . [4] [5]

Декартовы координаты [ править ]

В трехмерной декартовой системе координат с евклидовой метрикой градиент, если он существует, определяется выражением

где i , j , k стандартные единичные векторы в направлениях координат x , y и z соответственно. Например, градиент функции

является
или

В некоторых приложениях градиент принято представлять как вектор-строку или вектор-столбец его компонентов в прямоугольной системе координат; эта статья следует соглашению, согласно которому градиент является вектором-столбцом, а производная — вектором-строкой.

Цилиндрические и сферические координаты [ править ]

В цилиндрических координатах с евклидовой метрикой градиент определяется как: [6]

где ρ — осевое расстояние, φ — азимут или азимутальный угол, z — осевая координата, а e ρ , e φ и e z — единичные векторы, указывающие вдоль координатных направлений.

В сферических координатах градиент определяется как: [6]

где r — радиальное расстояние, φ — азимутальный угол, а θ — полярный угол, а er , e θ и e φ это снова локальные единичные векторы, указывающие в координатных направлениях (то есть нормированный ковариантный базис ).

Информацию о градиенте в других ортогональных системах координат см. в разделе Ортогональные координаты (Дифференциальные операторы в трех измерениях) .

Общие координаты [ править ]

Рассмотрим общие координаты , которые запишем как x 1 , …, Икс я , …, Икс н , где n — количество измерений области. Здесь верхний индекс относится к положению в списке координаты или компонента, поэтому x 2 относится ко второму компоненту, а не к величине x в квадрате. Индексная переменная i относится к произвольному элементу x я . Используя обозначение Эйнштейна , градиент можно записать как:

(Обратите внимание, что его двойственным является ),

где и относятся к ненормализованным локальным ковариантным и контравариантным базам соответственно, обратный метрический тензор , а соглашение Эйнштейна о суммировании подразумевает суммирование по i и j .

Если координаты ортогональны, мы можем легко выразить градиент (и дифференциал ) через нормализованные базы, которые мы называем и , используя масштабные коэффициенты (также известные как коэффициенты Ламе )  :

),

где мы не можем использовать обозначения Эйнштейна, так как невозможно избежать повторения более двух индексов. Несмотря на использование верхних и нижних индексов, , , и не являются ни контравариантными, ни ковариантными.

Последнее выражение соответствует приведенным выше выражениям для цилиндрических и сферических координат.

Связь с производной [ править ]

полной производной Связь с

Градиент тесно связан с полной производной ( полным дифференциалом ). : они транспонированы ( двойственны ) друг другу. Используя соглашение о том, что векторы в представлены векторами-столбцами , а ковекторы (линейные карты ) представлены векторами-строками , [а] градиент и производная выражаются как вектор-столбец и вектор-строка соответственно с одинаковыми компонентами, но транспонированными друг друга:

Хотя они оба имеют одинаковые компоненты, они различаются тем, какой математический объект они представляют: в каждой точке производная представляет собой котангенс вектор , линейную форму (или ковектор), которая выражает, насколько (скалярный) выходной сигнал изменяется для данного бесконечно малое изменение (векторного) входного сигнала, в то время как в каждой точке градиент представляет собой касательный вектор , который представляет бесконечно малое изменение (векторного) входного сигнала. В символах градиент — это элемент касательного пространства в точке, , а производная представляет собой отображение касательного пространства на действительные числа, . Касательные пространства в каждой точке можно «естественно» идентифицировать [Это] с векторным пространством само по себе, и аналогично кокасательное пространство в каждой точке можно естественным образом отождествить с двойственным векторным пространством ковекторов; таким образом, значение градиента в точке можно рассматривать как вектор в оригинале. , а не просто как касательный вектор.

В вычислительном отношении, учитывая касательный вектор, вектор можно умножить на производную (в виде матрицы), что равно скалярному произведению с градиентом:

Дифференциал или (внешняя) производная [ править ]

Наилучшее линейное приближение дифференцируемой функции

в какой-то момент в представляет собой линейную карту из к который часто обозначается или и называется дифференциалом или полной производной в . Функция , который отображает к , называется полным дифференциалом или внешней производной и является примером дифференциальной 1-формы .

как производная функции одной переменной представляет собой наклон касательной Подобно тому , к графику функции, [7] производная по направлению функции от нескольких переменных представляет собой наклон касательной гиперплоскости в направлении вектора.

Градиент связан с дифференциалом формулой

для любого , где — это скалярное произведение : скалярное произведение вектора с градиентом аналогично взятию производной по направлению вдоль вектора.

Если рассматривается как пространство (размерность ) вектор-столбцы (действительных чисел), то можно рассматривать как вектор-строка с компонентами

так что определяется умножением матриц . Предполагая стандартную евклидову метрику на , тогда градиент представляет собой соответствующий вектор-столбец, то есть

Линейное приближение функции [ править ]

Наилучшее линейное приближение функции можно выразить через градиент, а не через производную. Градиент функции из евклидова пространства к в любой конкретный момент в характеризует наилучшее линейное приближение к в . Приближение следующее:

для рядом с , где это градиент рассчитано на , а точка обозначает скалярное произведение на . Это уравнение эквивалентно первым двум слагаемым в в ряд Тейлора для многих переменных . разложении в .

В отношениях с Производная Фреше [ править ]

Пусть U открытое множество в R н . Если функция f : U R дифференцируема, то дифференциал f является производной Фреше от f . Таким образом, f — функция из U в пространство R н такой, что

где · – скалярное произведение.

Как следствие, для градиента сохраняются обычные свойства производной, хотя градиент сам по себе не является производной, а скорее двойственен производной:

Линейность
Градиент является линейным в том смысле, что если f и g — две действительные функции, дифференцируемые в точке a R н , а α и β — две константы, то αf + βg дифференцируемо в точке a и, более того,
Правило продукта
Если f и g — вещественные функции, дифференцируемые в точке a R н , то правило произведения утверждает, что произведение fg дифференцируемо в точке a , и
Правило цепи
Предположим, что f : A R — вещественная функция, определенная на подмножестве A из R. н , и что f дифференцируема в точке a . К градиенту применяются две формы цепного правила. Предположим сначала, что функция g является параметрической кривой ; то есть функция g : I R н отображает подмножество I R в R н . Если g дифференцируема в точке c I такой, что g ( c ) = a , то
где ∘ - оператор композиции : ( ж г )( Икс ) знак равно ж ( г ( Икс )) .

В более общем смысле, если вместо этого I R к , то имеет место следующее:

где ( Дг ) Т обозначает транспонированную матрицу Якобиана .

Для второй формы цепного правила предположим, что : I R вещественнозначная функция на подмножестве I из R и что h дифференцируема в точке f ( a ) ∈ I. h Затем

Дополнительные свойства и приложения [ править ]

Наборы уровней [ править ]

Поверхность уровня, или изоповерхность , — это набор всех точек, в которых некоторая функция имеет заданное значение.

Если f дифференцируемо, то скалярное произведение (∇ f ) x v градиента в точке x с вектором v дает производную по направлению от f в точке x в направлении v . этом случае градиент f ортогонален Отсюда следует , множествам уровня f что в . Например, поверхность уровня в трехмерном пространстве определяется уравнением формы F ( x , y , z ) = c . Тогда градиент F будет нормален к поверхности.

В более общем смысле, любая вложенная гиперповерхность в римановом многообразии может быть вырезана уравнением вида F ( P ) = 0 таким, что dF нигде не равен нулю. Тогда градиент F нормален к гиперповерхности.

Аналогично, аффинная алгебраическая гиперповерхность может быть определена уравнением F ( x 1 , ..., x n ) = 0 , где F — многочлен. Градиент F равен нулю в особой точке гиперповерхности (это определение особой точки). В неособой точке это ненулевой нормальный вектор.

поля и градиентная теорема векторные Консервативные

Градиент функции называется полем градиента. (Непрерывное) градиентное поле всегда является консервативным векторным полем : его линейный интеграл вдоль любого пути зависит только от конечных точек пути и может быть оценен с помощью градиентной теоремы (фундаментальной теоремы исчисления для линейных интегралов). И наоборот, (непрерывное) консервативное векторное поле всегда является градиентом функции.

Обобщения [ править ]

Якобиан [ править ]

Матрица Якоби является обобщением градиента для вектор-функций нескольких переменных и дифференцируемых отображений между евклидовыми пространствами или, в более общем плане, многообразиями . [8] [9] Дальнейшим обобщением функции между банаховыми пространствами является производная Фреше .

Предположим, f : R н Р м — это функция такая, что каждая из ее частных производных первого порядка существует на н . Тогда матрица Якоби функции f определяется как матрица размера m × n , обозначаемая через или просто . ( i , ) j запись . Явно

Градиент векторного поля [ править ]

Поскольку полная производная векторного поля представляет собой линейное отображение векторов в векторы, она является тензорной величиной.

В прямоугольных координатах градиент векторного поля f = ( f 1 , ж 2 , ж 3 ) определяется:

(где обозначения суммирования Эйнштейна используются и тензорное произведение векторов ei и . ek является двоичным тензором типа (2,0)) В целом это выражение эквивалентно транспонированию матрицы Якобиана:

В криволинейных координатах или, в более общем смысле, на искривленном многообразии , градиент включает в себя символы Кристоффеля :

где г джк являются компонентами обратного метрического тензора , а e i являются координатными базисными векторами.

Выражаясь более инвариантно, градиент векторного поля f можно определить с помощью связи Леви-Чивита и метрического тензора: [10]

где c — связь.

Римановы многообразия [ править ]

Для любой гладкой функции f на римановом многообразии ( M , g ) градиент f — это векторное поле f такое, что для любого векторного X поля

то есть,
где g x (, ) обозначает скалярное произведение касательных векторов в точке x , определенное метрикой g , а X f - это функция, которая переводит любую точку x M в производную по направлению от f в направлении X , вычисляемую в x . Другими словами, в координатной карте φ из открытого подмножества M в открытое подмножество R н , (∂ X f )( x ) определяется формулой:
где Х дж обозначает j -й компонент X на этой координатной карте.

Итак, локальная форма градиента принимает вид:

Обобщая случай M = R н градиент функции связан с ее внешней производной, поскольку

Точнее, градиент f — это векторное поле, связанное с дифференциальной 1-формой df с помощью музыкального изоморфизма
(называемый «острым»), определяемый метрикой g . Связь между внешней производной и градиентом функции на R н является частным случаем этого, в котором метрика представляет собой плоскую метрику, заданную скалярным произведением.

См. также [ править ]

Примечания [ править ]

  1. ^ Перейти обратно: а б В этой статье используется соглашение, согласно которому векторы-столбцы представляют векторы, а векторы-строки представляют ковекторы, но также распространено и противоположное соглашение.
  2. ^ Строго говоря, градиент — это векторное поле. , а значение градиента в точке представляет собой касательный вектор в касательном пространстве в этой точке, , а не вектор в исходном пространстве . Однако все касательные пространства естественным образом отождествляются с исходным пространством. , поэтому их не нужно различать; см. § Определение и связь с производной .
  3. ^ Значение градиента в точке можно рассматривать как вектор в исходном пространстве. , а значение производной в точке можно рассматривать как ковектор в исходном пространстве: линейное отображение .
  4. ^ скалярное произведение (уклон дороги вокруг холма) будет 40%, если угол между дорогой и самым крутым склоном равен 0 °, т. е. когда они полностью выровнены, и плоским, когда угол равен 90 °, т. е. когда дорога перпендикулярна самому крутому склону.
  5. ^ Неофициально «естественное» определение означает, что это можно сделать, не делая произвольного выбора. Это можно формализовать естественным преобразованием .

Ссылки [ править ]

  1. ^
  2. ^
  3. ^ «Недифференцируемые функции должны иметь разрывные частные производные — Math Insight» . mathinsight.org . Проверено 21 октября 2023 г.
  4. ^ Крейциг (1972 , стр. 308–309)
  5. ^ Стокер (1969 , стр. 292)
  6. ^ Перейти обратно: а б Шей 1992 , стр. 139–142.
  7. ^ Проттер и Морри (1970 , стр. 21, 88)
  8. ^ Борегар и Фрели (1973 , стр. 87, 248)
  9. ^ Крейциг (1972 , стр. 333, 353, 496)
  10. ^ Dubrovin, Fomenko & Novikov 1991 , pp. 348–349.

Дальнейшее чтение [ править ]

  • Корн, Тереза ​​М .; Корн, Гранино Артур (2000). Математический справочник для ученых и инженеров: определения, теоремы и формулы для справки и обзора . Дуврские публикации. стр. 157–160. ISBN  0-486-41147-8 . OCLC   43864234 .

Внешние ссылки [ править ]