Симметрия вторых производных
В математике симметрия вторых производных (также называемая равенством смешанных частных ) — это тот факт, что замена порядка частных производных многомерной функции
не меняет результат, если непрерывности выполняются некоторые условия (см. ниже); т. е. частные производные второго порядка удовлетворяют тождествам
Другими словами, матрица частных производных второго порядка, известная как матрица Гессе , является симметричной матрицей .
Достаточные условия для выполнения симметрии даны теоремой Шварца , также называемой теоремой Клеро или теоремой Юнга . [1] [2]
В контексте уравнений в частных производных это называется Шварца интегрируемости условием .
Формальные выражения симметрии
[ редактировать ]Символически симметрию можно выразить так:
Другое обозначение:
С точки зрения композиции дифференциального оператора D i , который принимает частную производную по x i :
- .
Из этого соотношения следует, что дифференциальных операторов с постоянными коэффициентами , порожденное Di кольцо , коммутативно ; но это верно только для операторов над областью достаточно дифференцируемых функций. Легко проверить симметрию применительно к мономам можно взять многочлены от xi , так что в качестве области определения . Фактически, гладкие функции — еще одна допустимая область применения.
История
[ редактировать ]Результат о равенстве смешанных частных производных при определенных условиях имеет долгую историю. Список неудачных предложенных доказательств начался с доказательства Эйлера , опубликованного в 1740 году. [3] хотя уже в 1721 году Бернулли неявно предположил этот результат без формального обоснования. [4] Клеро также опубликовал предложенное доказательство в 1740 году, и до конца 18 века никаких других попыток не предпринималось. Начиная с этого момента, в течение 70 лет, был предложен ряд неполных доказательств. Доказательство Лагранжа (1797 г.) было улучшено Коши (1823 г.), но предполагалось существование и непрерывность частных производных. и . [5] Другие попытки были предприняты П. Бланше (1841 г.), Дюамелем (1856 г.), Штурмом (1857 г.), Шлёмильхом (1862 г.) и Бертраном (1864 г.). Наконец, в 1867 году Линделёф систематически проанализировал все ранее ошибочные доказательства и смог продемонстрировать конкретный контрпример, в котором смешанные производные не были равны. [6] [7]
Шесть лет спустя Шварцу удалось дать первое строгое доказательство. [8] Позже Дини внес свой вклад, обнаружив более общие условия, чем у Шварца. нашел более чистую и более общую версию В конце концов, в 1883 году Джордан , которая до сих пор является доказательством, которое можно найти в большинстве учебников. Незначительные варианты более ранних доказательств были опубликованы Лораном (1885 г.), Пеано (1889 и 1893 гг.), Дж. Эдвардсом (1892 г.), П. Хаагом (1893 г.), Дж. К. Уиттемором (1898 г.), Виванти (1899 г.) и Пьерпонтом (1905 г.). Дальнейший прогресс был достигнут в 1907–1909 годах, когда Э. У. Хобсон и У. Янг нашли доказательства с более слабыми условиями, чем у Шварца и Дини. В 1918 году Каратеодори дал другое доказательство, основанное на интеграле Лебега . [7]
Теорема Шварца
[ редактировать ]В математическом анализе теорема Шварца (или теорема Клеро о равенстве смешанных частиц ) [9] названный в честь Алексиса Клеро и Германа Шварца , утверждает, что для функции определено на множестве , если это такая точка, что окрестность некоторая содержится в и имеет непрерывные вторые частные производные в этой окрестности , то для всех i и j в
Частные производные этой функции коммутируют в этой точке.
Один простой способ доказать эту теорему (в случае, когда , , и легко влечет за собой результат в целом) заключается в применении теоремы Грина к градиенту , что
Элементарное доказательство для функций на открытых подмножествах плоскости таково (простой редукцией общий случай теоремы Шварца легко сводится к плоскому случаю). [10] Позволять быть дифференцируемой функцией на открытом прямоугольнике содержащий точку и предположим, что является непрерывным с непрерывным и над Определять
Эти функции определены для , где и содержится в
По теореме о среднем значении для фиксированного h и k, отличного от нуля, можно найти в открытом интервале с
С , первое равенство ниже можно разделить на :
Сдача в аренду стремятся к нулю в последнем равенстве, предположения о непрерывности и теперь подразумеваю, что
Это описание представляет собой простой классический метод, который можно найти во многих учебниках, например, у Беркилла, Апостола и Рудина. [10] [11] [12]
Хотя приведенный выше вывод является элементарным, этот подход также можно рассматривать с более концептуальной точки зрения, чтобы результат стал более очевидным. [13] [14] [15] [16] [17] Действительно, разностные операторы ездить на работу и склонны к как стремится к 0, аналогичное утверждение для операторов второго порядка. [а] Здесь для вектор на плоскости и вектор направления или , разностный оператор определяется формулой
По основной теореме исчисления для функции на открытом интервале с
Следовательно
- .
Это обобщенная версия теоремы о среднем значении . Напомним, что элементарное обсуждение максимумов и минимумов вещественных функций подразумевает, что если постоянно включен и дифференцируемо по , тогда есть смысл в такой, что
Для векторных функций с В конечномерном нормированном пространстве аналога приведенного выше равенства не существует, более того, оно неверно. Но поскольку , приведенное выше неравенство является полезной заменой. Более того, используя спаривание двойственных с его двойственной нормой дает следующее неравенство:
- .
Эти версии теоремы о среднем обсуждаются у Рудина, Хёрмандера и других авторов. [19] [20]
Для а функцию на открытом множестве на плоскости, определим и . Кроме того, для набор
- .
Тогда для в открытом множестве обобщенную теорему о среднем значении можно применить дважды:
Таким образом имеет тенденцию как стремится к 0. Те же рассуждения показывают, что имеет тенденцию . Следовательно, поскольку разностные операторы коммутируют, коммутируют и операторы в частных производных. и , как утверждается. [21] [22] [23] [24] [25]
Замечание. По двум применениям классической теоремы о среднем значении:
для некоторых и в . Таким образом, первое элементарное доказательство можно переинтерпретировать с помощью разностных операторов. И наоборот, вместо использования обобщенной теоремы о среднем значении во втором доказательстве можно использовать классическую теорему о среднем значении.
Доказательство теоремы Клеро с помощью повторных интегралов.
[ редактировать ]Свойства повторных интегралов Римана непрерывной функции F на компактном прямоугольнике [ a , b ] × [ c , d ] легко устанавливаются. [26] Из непрерывности равномерной F сразу следует, что функции и являются непрерывными. [27] Отсюда следует, что
- ;
более того, очевидно, что повторный интеграл положителен, если F положителен. [28] Вышеупомянутое равенство является простым случаем теоремы Фубини , не включающим теорию меры . Титчмарш (1939) доказывает это простым способом, используя аппроксимирующие суммы Римана, соответствующие подразделениям прямоугольника на меньшие прямоугольники.
Чтобы доказать теорему Клеро, предположим, — дифференцируемая функция на открытом множестве U , для которой смешанные вторые частные производные fyx что и fxy f существуют и непрерывны. Дважды используя фундаментальную теорему исчисления ,
Сходным образом
Таким образом, два повторных интеграла равны. С другой стороны, поскольку f xy ( x , y ) является непрерывным, второй повторный интеграл может быть выполнен путем сначала интегрирования по x , а затем по y . Но тогда повторный интеграл от f yx − f xy на [ a , b ] × [ c , d ] должен обратиться в нуль. Однако если повторный интеграл непрерывной функции F обращается в нуль для всех прямоугольников, то F должен быть тождественно нулю; в противном случае F или − F были бы строго положительными в некоторой точке и, следовательно, по непрерывности на прямоугольнике, что невозможно. Следовательно, f yx − f xy должно быть тождественно равно нулю, так что f yx = f xy всюду. [29] [30] [31] [32] [33]
Достаточность дважды-дифференцируемости
[ редактировать ]Более слабое условие, чем непрерывность вторых частных производных (которое подразумевается последним), которого достаточно для обеспечения симметрии, состоит в том, что все частные производные сами по себе дифференцируемы . [34] Другое усиление теоремы, в котором утверждается существование перестановочного смешанного парциала, было предложено Пеано в короткой заметке 1890 года о Mathesis :
- Если определяется на открытом множестве ; и существуют повсюду на ; является непрерывным в , и если существует в окрестностях г. , затем существует в и . [35]
Формулировка теории распределения
[ редактировать ]Теория распределений (обобщенных функций) устраняет аналитические проблемы с симметрией. Производную интегрируемой функции всегда можно определить как распределение, а симметрия смешанных частных производных всегда соблюдается как равенство распределений. Использование формального интегрирования по частям для определения дифференциации распределений возвращает вопрос симметрии к пробным функциям , которые являются гладкими и заведомо удовлетворяют этой симметрии. Более подробно (где f — распределение, записанное в виде оператора над пробными функциями, а φ — пробная функция),
Другой подход, определяющий преобразование Фурье функции, заключается в том, чтобы отметить, что при таких преобразованиях частные производные становятся операторами умножения, коммутация которых гораздо более очевидна. [а]
Требование непрерывности
[ редактировать ]Симметрия может быть нарушена, если функция не имеет дифференцируемых частных производных, что возможно, если не выполняется теорема Клеро (вторые частные производные не являются непрерывными ).
Примером несимметрии является функция (по Пеано ) [36] [37]
( 1 ) |
Это можно представить с помощью полярной формы ; он всюду непрерывен, но его производные в точке (0, 0) не могут быть вычислены алгебраически. Скорее, предельные разностные коэффициенты показывают, что , поэтому график имеет горизонтальную касательную плоскость в точке (0, 0) и частные производные существуют и всюду непрерывны. Однако вторые частные производные не являются непрерывными в точке (0, 0) , и симметрия нарушается. Фактически, вдоль x оси производная по y равна , и так:
Напротив, вдоль y оси x производная , и так . То есть, в (0, 0) , хотя смешанные частные производные существуют, и в любой другой точке симметрия сохраняется.
Вышеуказанную функцию, записанную в полярных координатах, можно выразить как
показывая, что функция колеблется четыре раза при одиночном обходе произвольно малого цикла, содержащего начало координат. Следовательно, интуитивно локальное поведение функции в точке (0, 0) не может быть описано как квадратичная форма, и, таким образом, матрица Гессе не может быть симметричной.
В общем, обмен ограничивающими операциями не требует коммутации . Учитывая две переменные вблизи (0, 0) и два предельных процесса на
соответствующее сначала сделать h → 0, а затем сначала сделать k → 0. Это может иметь значение, если учитывать члены первого порядка, которые применяются первыми. Это приводит к построению патологических примеров, в которых вторые производные несимметричны. Примеры такого рода относятся к теории реального анализа , где имеет значение поточечное значение функций. Если рассматривать его как распределение, значения второй частной производной можно изменить в произвольном наборе точек, если он имеет меру Лебега 0. Поскольку в этом примере гессиан симметричен везде, кроме (0, 0) , противоречия с тот факт, что гессиан, рассматриваемый как распределение Шварца , симметричен.
В теории лжи
[ редактировать ]Считайте, что дифференциальные операторы первого порядка D i являются инфинитезимальными операторами в евклидовом пространстве . То есть D i в некотором смысле генерирует однопараметрическую группу перемещений , параллельных оси x i . Эти группы коммутируют друг с другом, и, следовательно, бесконечно малые генераторы тоже коммутируют; скобка Лжи
- [ D я , D j ] знак равно 0
является отражением этого свойства. Другими словами, производная Ли одной координаты по другой равна нулю.
Приложение к дифференциальным формам
[ редактировать ]Теорема Клеро-Шварца является ключевым фактом, необходимым для доказательства того, что для любого (или хотя бы дважды дифференцируемая) дифференциальная форма , вторая внешняя производная обращается в нуль: . Отсюда следует, что каждая дифференцируемая точная форма (т. е. форма такой, что для какой-то формы ) закрыто (т.е. ), с . [38]
В середине XVIII века теория дифференциальных форм была впервые изучена в простейшем случае 1-форм на плоскости, т. е. , где и являются функциями на плоскости. Изучение 1-форм и дифференциалов функций началось с работ Клеро в 1739 и 1740 годах. На этом этапе его исследования интерпретировались как способы решения обыкновенных дифференциальных уравнений . Формально Клеро показал, что 1-форма на открытом прямоугольнике закрыто, т.е. , тогда и только имеет форму для какой-то функции на диске. Решение для можно записать интегральной формулой Коши
в то время как если , закрытое свойство это личность . (На современном языке это одна из версий леммы Пуанкаре .) [39]
Примечания
[ редактировать ]- ^ Jump up to: а б Их также можно перефразировать в терминах действия операторов на функции Шварца на плоскости. При преобразовании Фурье операторы разности и дифференциала являются просто операторами умножения. [18]
- ^ «Теорема Юнга» (PDF) . Калифорнийский университет в Беркли. Архивировано из оригинала (PDF) 18 мая 2006 г. Проверено 2 января 2015 г.
- ^ Аллен 1964 , стр. 300–305 .
- ^ Эйлер 1740 .
- ^ Sandifer 2007 , стр. 142–147 , сноска: Comm. акад. наук. Имп. Петрополь. 7 (1734/1735) 1740 , 174–189, 180–183; Опера Омния , 1.22, 34-56..
- ^ Мингуцци 2015 .
- ^ Линделеф 1867 .
- ^ Jump up to: а б Хиггинс, 1940 год .
- ^ Черный 1873 .
- ^ Джеймс 1966 , с. [ нужна страница ] .
- ^ Jump up to: а б Беркилл 1962 , стр. 154–155.
- ^ Апостол 1965 .
- ^ Рудин 1976 .
- ^ Hörmander 2015 , стр. 7, 11. Этот сокращенный отчет, возможно, самый короткий.
- ^ Дьедонне 1960 , стр. 179–180.
- ^ Godement 1998b , стр. 287–289.
- ^ Ланг 1969 , стр. 108–111.
- ^ Картан 1971 , стр. 64–67.
- ^ Хёрмандер 2015 , Глава VII.
- ^ Хёрмандер 2015 , с. 6.
- ^ Рудин 1976 , с. [ нужна страница ] .
- ^ Хёрмандер 2015 , с. 11.
- ^ Дьедонне 1960 .
- ^ Годемент 1998a .
- ^ Ланг 1969 .
- ^ Картман 1971 .
- ^ Титчмарш 1939 , с. [ нужна страница ] .
- ^ Титчмарш 1939 , стр. 23–25.
- ^ Титчмарш 1939 , стр. 49–50.
- ^ Спивак 1965 , с. 61.
- ^ МакГрат 2014 .
- ^ Аксой и Мартелли 2002 .
- ^ Экслер 2020 , стр. 142–143.
- ^ Маршалл, Дональд Э., Теоремы Фубини и Клеро (PDF) , Вашингтонский университет
- ^ Хаббард и Хаббард 2015 , стр. 732–733.
- ^ Рудин 1976 , стр. 235–236.
- ^ Хобсон 1921 , стр. 403–404.
- ^ Апостол 1974 , с. 358–359.
- ^ Вт 2010 .
- ^ Кац 1981 .
Ссылки
[ редактировать ]- Аксой, А.; Мартелли, М. (2002), «Смешанные частные производные и теорема Фубини» , College Mathematics Journal of MAA , 33 (2): 126–130, doi : 10.1080/07468342.2002.11921930 , S2CID 124561972
- Аллен, RGD (1964). Математический анализ для экономистов . Нью-Йорк: Пресса Святого Мартина. ISBN 9781443725224 .
- Апостол, Том М. (1965), Математический анализ: современный подход к углубленному исчислению , Лондон: Addison-Wesley, OCLC 901554874 .
- Апостол, Том М. (1974), Математический анализ , Аддисон-Уэсли, ISBN 9780201002881
- Экслер, Шелдон (2020), Измерение, интеграция и реальный анализ , Тексты для выпускников по математике, том. 282, Спрингер, ISBN 9783030331436
- Бурбаки, Николя (1952), «Глава III: Измерения в локально компактных пространствах», Элементы математики, Книга VI: Интеграция (на французском языке), Hermann et Cie
- Беркилл, Дж. К. (1962), Первый курс математического анализа , издательство Кембриджского университета , ISBN 9780521294683 (переиздано в 1978 г.)
- Картан, Анри (1971), Calcul Differentiel (на французском языке), Герман , ISBN 9780395120330
- Клеро, AC (1739), «Общие исследования по интегральному исчислению» , Мемуары Королевской академии наук : 425–436.
- Клеро, AC (1740), «Об интегрировании или построении дифференциальных уравнений первого порядка» , Mémoires de l'Académie Royale des Sciences , 2 : 293–323.
- Дьедонне, Ж. (1937), «О числовых непрерывных функциях, определенных в произведении двух компактов», Comptes Rendus de l'Académie des Sciences de Paris , 205 : 593–595.
- Дьедонне, Ж. (1960), Основы современного анализа , Чистая и прикладная математика, том. 10, Академическое издательство, ISBN 9780122155505
- Дьедонне, Ж. (1976), Трактат об анализе. Том. II. , Чистая и прикладная математика, вып. 10-II, перевод И.Г. Макдональда , Academic Press, ISBN 9780122155024
- Эйлер, Леонард (1740). «О бесконечном (многом) однотипных кривых, т. е. метод нахождения уравнений для бесконечного ( многого) однотипных кривых». Комментарии Петрополитанской академии наук (на латыни). 7 : 174–189, 180–183 – через Архив Эйлера, поддерживаемый Тихоокеанским университетом.
- Гилки, Питер; Пак, ЧонХён; Васкес-Лоренцо, Рамон (2015), Аспекты дифференциальной геометрии I , Обобщающие лекции по математике и статистике, том. 15, Морган и Клейпул, ISBN 9781627056632
- Годемент, Роджер (1998a), Математический анализ I , Springer
- Годемент, Роджер (1998b), Математический анализ II , Springer
- Хиггинс, Томас Джеймс (1940). «Заметка об истории смешанных частных производных» . Скрипта Математика . 7 : 59–62. Архивировано из оригинала 19 апреля 2017 г. Проверено 19 апреля 2017 г.
- Хобсон, Э.В. (1921), Теория функций действительной переменной и теория рядов Фурье. Том. I. , Издательство Кембриджского университета
- Хёрмандер, Ларс (2015), Анализ линейных дифференциальных операторов с частными производными I: Теория распределения и анализ Фурье , Классика математики (2-е изд.), Springer, ISBN 9783642614972
- Хаббард, Джон ; Хаббард, Барбара (2015). Векторное исчисление, линейная алгебра и дифференциальные формы (5-е изд.). Матричные издания. ISBN 9780971576681 .
- Джеймс, RC (1966). Продвинутое исчисление . Бельмонт, Калифорния: Уодсворт.
- Джордан, Камилла (1893), курс анализа в Политехнической школе. Том I. Дифференциальное исчисление (The Grands Classiques Gauthier-Villars) , Éditions Jacques Gaba]
- Кац, Виктор Дж. (1981), «История дифференциальных форм от Клеро до Пуанкаре», Historia Mathematica , 8 (2): 161–188, doi : 10.1016/0315-0860(81)90027-6
- Ланг, Серж (1969), Реальный анализ , Аддисон-Уэсли , ISBN 0201041790
- Линделеф, Л.Л. (1867), "Замечания о различных способах установления формулы 2 z/dx dy = d 2 z/dy dx» , Acta Societatis Scientiarum Fennicae , 8 : 205–213.
- Лумис, Линн Х. (1953), Введение в абстрактный гармонический анализ , Д. Ван Ностранд, hdl : 2027/uc1.b4250788
- МакГрат, Питер Дж. (2014), «Еще одно доказательство теоремы Клеро», Amer. Математика. Monthly , 121 (2): 165–166, doi : 10.4169/amer.math.monthly.121.02.165 , S2CID 12698408
- Мингуцци, Э. (2015). «Равенство смешанных частных производных при условиях слабой дифференцируемости». Обмен реальным анализом . 40 : 81–98. arXiv : 1309.5841 . дои : 10.14321/realanalexch.40.1.0081 . S2CID 119315951 .
- Нахбин, Леопольдо (1965), Элементы теории приближения , Математические заметки, т. 1, с. 33, Рио-де-Жанейро: выпуск опубликован Институтом чистой и прикладной математики Национального исследовательского совета.
- Рудин, Уолтер (1976), Принципы математического анализа , Международная серия по чистой и прикладной математике, McGraw-Hill, ISBN 0-07-054235-Х
- Сандифер, К. Эдвард (2007), «Смешанные частные производные равны» , Ранняя математика Леонарда Эйлера, Vol. 1 , Американская математическая ассоциация, ISBN 9780883855591
- Шварц, Х.А. (1873), «Коммуникация» , Архив физических и естественных наук , 48 : 38–44.
- Спивак, Майкл (1965), Исчисление на многообразиях. Современный подход к классическим теоремам продвинутого исчисления , В.А. Бенджамин.
- Тао, Теренс (2006), Анализ II (PDF) , Тексты и материалы для чтения по математике, том. 38, Книжное агентство Индостан, номер номера : 10.1007/978-981-10-1804-6 , ISBN. 8185931631
- Титчмарш, ЕС (1939), Теория функций (2-е изд.), Oxford University Press
- Ту, Лоринг В. (2010), Введение в многообразия (2-е изд.), Нью-Йорк: Springer, ISBN 978-1-4419-7399-3
Дальнейшее чтение
[ редактировать ]- «Частная производная» , Математическая энциклопедия , EMS Press , 2001 [1994]