Номер условия
В численном анализе функции число обусловленности измеряет , насколько может измениться выходное значение функции при небольшом изменении входного аргумента. Это используется для измерения того, насколько чувствительна функция к изменениям или ошибкам во входных данных, а также насколько велика ошибка в выходных данных из-за ошибки во входных данных. Очень часто решают обратную задачу: дано нужно найти решение для x, и поэтому необходимо использовать число обусловленности (локального) обратного. [1] [2]
Число обусловленности выводится из теории распространения неопределенности и формально определяется как значение асимптотического относительного изменения выходных данных для наихудшего случая при относительном изменении входных данных. «Функция» — это решение проблемы, а «аргументы» — это данные в задаче. Число обусловленности часто применяется к вопросам линейной алгебры , и в этом случае производная очевидна, но ошибка может быть во многих разных направлениях и, таким образом, вычисляется на основе геометрии матрицы. В более общем смысле числа обусловленности могут быть определены для нелинейных функций от нескольких переменных.
Задача с низким числом обусловленности называется хорошо обусловленной , а задача с большим числом обусловленности — плохо обусловленной . С нематематической точки зрения, плохо обусловленная задача — это задача, в которой при небольшом изменении входных данных ( независимых переменных ) происходит большое изменение ответа или зависимой переменной . Это означает, что правильное решение/ответ уравнения становится трудно найти. Число обусловленности является свойством задачи. В паре с задачей существует любое количество алгоритмов, которые можно использовать для решения задачи, то есть для вычисления решения. Некоторые алгоритмы обладают свойством, называемым обратной стабильностью ; в общем, можно ожидать, что обратно устойчивый алгоритм будет точно решать хорошо обусловленные задачи. В учебниках по численному анализу приводятся формулы для чисел обусловленности задач и определяются известные обратно устойчивые алгоритмы.
Как правило, если номер условия , то вы можете проиграть до цифры точности сверх того, что было бы потеряно при численном методе из-за потери точности арифметических методов. [3] Однако число обусловленности не дает точного значения максимальной неточности, которая может возникнуть в алгоритме. Обычно он просто ограничивает его оценкой (вычисленное значение которой зависит от выбора нормы для измерения неточности).
Общее определение в контексте анализа ошибок
[ редактировать ]Учитывая проблему и алгоритм с входом и вывод ошибка абсолютная ошибка и относительная ошибка
В этом контексте абсолютное число обусловленности проблемы является [ нужны разъяснения ]
и относительный номер состояния [ нужны разъяснения ]
Матрицы
[ редактировать ]Например, число обусловленности, связанное с линейным уравнением Ax = b, дает оценку того, насколько неточным решение x будет эффекты ошибки округления после аппроксимации. Обратите внимание, что это происходит до того, как будут учтены ; обусловленность — это свойство матрицы , а не алгоритма или точности вычислений с плавающей запятой компьютера, используемого для решения соответствующей системы. В частности, число обусловленности следует рассматривать как (очень грубо) скорость, с которой решение x будет меняться по отношению к изменению b . Таким образом, если число обусловленности велико, даже небольшая ошибка в b может вызвать большую ошибку в x . С другой стороны, если число обусловленности мало, то ошибка в x не будет намного больше, чем ошибка в b .
Число обусловленности определяется более точно как максимальное отношение относительной ошибки в x к относительной ошибке в b .
Пусть e будет ошибкой в b . Если предположить, что A — неособая матрица, то ошибка решения A −1 б это А −1 е . Отношение относительной ошибки решения к относительной ошибке b равно
Максимальное значение (для ненулевых b и e ) тогда рассматривается как произведение двух норм оператора следующим образом:
То же определение используется для любой непротиворечивой нормы , т. е. такой, которая удовлетворяет условию
Когда число обусловленности равно единице (что может произойти только в том случае, если A является скалярным кратным линейной изометрии ), тогда алгоритм решения может найти (в принципе, это означает, что алгоритм не вносит собственных ошибок) аппроксимацию решения точность которых не хуже точности данных.
Однако это не означает, что алгоритм быстро сходится к этому решению, просто он не будет произвольно расходиться из-за неточности исходных данных (обратная ошибка), при условии, что прямая ошибка, вносимая алгоритмом, также не расходится, поскольку накопления промежуточных ошибок округления. [ нужны разъяснения ]
Число обусловленности также может быть бесконечным, но это означает, что задача некорректна (не имеет единственного, четко определенного решения для каждого выбора данных; то есть матрица необратима ) , и ни один алгоритм не может быть описан. Ожидается, что будет надежно найдено решение.
Определение числа обусловленности зависит от выбора нормы , что можно проиллюстрировать двумя примерами.
Если — матричная норма, индуцированная (векторной) евклидовой нормой (иногда называемой L 2 норма и обычно обозначается как ), затем
где и являются максимальными и минимальными сингулярными значениями соответственно. Следовательно:
- Если это нормально , тогда где и являются максимальными и минимальными (по модулям) собственными значениями соответственно.
- Если унитарна то ,
Число обусловленности по отношению к L 2 возникает так часто в числовой линейной алгебре , что ему дают имя — число обусловленности матрицы .
Если – матричная норма, индуцированная (векторная) норма и является нижнетреугольным неособым (т.е. для всех ), затем
напоминая, что собственные значения любой треугольной матрицы — это просто диагональные элементы.
Число обусловленности, вычисленное с помощью этой нормы, обычно больше, чем число обусловленности, вычисленное относительно евклидовой нормы , но его можно оценить легче (и часто это единственное практически вычислимое число обусловленности, когда задача, которую нужно решить, включает в себя нелинейную задачу). алгебра [ нужны разъяснения ] , например, при аппроксимации иррациональных и трансцендентных функций или чисел численными методами).
Если число обусловленности не значительно больше единицы, матрица хорошо обусловлена , а это означает, что ее обратную величину можно вычислить с хорошей точностью. Если число обусловленности очень велико, то матрица называется плохо обусловленной . Практически такая матрица почти сингулярна, и вычисление ее обратной или решения линейной системы уравнений подвержено большим числовым ошибкам.
Часто говорят, что матрица, которая не является обратимой, имеет число обусловленности, равное бесконечности. Альтернативно его можно определить как , где Мура-Пенроуза является псевдообратной функцией . Для квадратных матриц это, к сожалению, делает число обусловленности разрывным, но это полезное определение для прямоугольных матриц, которые никогда не являются обратимыми, но все еще используются для определения систем уравнений.
Нелинейный
[ редактировать ]Числа обусловленности также можно определить для нелинейных функций и вычислить с помощью исчисления . Номер состояния зависит от точки; в некоторых случаях можно использовать максимальное (или супремум ) число обусловленности в области определения функции или области вопроса в качестве общего числа условия, тогда как в других случаях больший интерес представляет число обусловленности в конкретной точке.
Одна переменная
[ редактировать ]Число обусловленности дифференцируемой функции в одной переменной как функция . Оценивается в точку , Это
Обратите внимание, что это абсолютное значение эластичности функции в экономике.
Наиболее элегантно это можно понимать как ( абсолютное значение ) отношение логарифмической производной , что и логарифмическая производная , что , что дает соотношение . Это потому, что логарифмическая производная — это бесконечно малая скорость относительного изменения функции: это производная масштабируется по значению . Обратите внимание, что если функция имеет ноль в точке, ее число обусловленности в этой точке бесконечно, поскольку бесконечно малые изменения входных данных могут изменить выходной сигнал с нуля на положительный или отрицательный, давая соотношение с нулем в знаменателе, следовательно, бесконечное относительное значение. изменять.
Более непосредственно, учитывая небольшое изменение в , относительное изменение является , а относительное изменение является . Взяв соотношение, получаем
Последний член представляет собой коэффициент разности (наклон секущей линии ), и взятие предела дает производную.
Числа обусловленности обычных элементарных функций особенно важны при вычислении значащих цифр и могут быть вычислены непосредственно из производной. Несколько важных из них приведены ниже:
Имя | Символ | Номер условия |
---|---|---|
Сложение/вычитание | ||
Скалярное умножение | ||
Разделение | ||
Полиномиальный | ||
Экспоненциальная функция | ||
натурального логарифма Функция | ||
Синусоидальная функция | ||
Функция косинуса | ||
Функция касательной | ||
Обратная функция синуса | ||
Обратная функция косинуса | ||
Функция обратного тангенса |
Несколько переменных
[ редактировать ]Номера условий могут быть определены для любой функции. сопоставление своих данных с каким-либо доменом (например, -кортеж действительных чисел ) в некоторый кодомен (например, -кортеж действительных чисел ), где и домен, и кодомен являются банаховыми пространствами . Они показывают, насколько чувствительна функция к небольшим изменениям (или небольшим ошибкам) в ее аргументах. Это имеет решающее значение для оценки чувствительности и потенциальных проблем с точностью многочисленных вычислительных задач, например, поиска корня полинома или вычисления собственных значений .
Число условий в какой-то момент (в частности, его относительный номер состояния [4] ) затем определяется как максимальное соотношение дробного изменения любому дробному изменению , в пределе, когда изменение в становится бесконечно малым: [4]
где является нормой в домене/кодомене .
Если дифференцируемо, это эквивалентно: [4]
где обозначает Якоби частных производных матрицу в , и – индуцированная норма матрицы.
См. также
[ редактировать ]- Численные методы линейного метода наименьших квадратов
- Численная стабильность
- Матрица Гильберта
- Некорректная задача
- Единственное значение
- Матрица Вильсона
Ссылки
[ редактировать ]- ^ Белсли, Дэвид А.; Кух, Эдвин ; Уэлш, Рой Э. (1980). «Номер условия» . Регрессионная диагностика: выявление влиятельных данных и источников коллинеарности . Нью-Йорк: Джон Уайли и сыновья. стр. 100–104. ISBN 0-471-05856-4 .
- ^ Песаран, М. Хашем (2015). «Проблема мультиколлинеарности» . Эконометрика временных рядов и панельных данных . Нью-Йорк: Издательство Оксфордского университета. стр. 67–72 [с. 70]. ISBN 978-0-19-875998-0 .
- ^ Чейни; Кинкейд (2008). Численная математика и вычислительная техника . п. 321. ИСБН 978-0-495-11475-8 .
- ^ Перейти обратно: а б с Трефетен, Л.Н.; Бау, Д. (1997). Численная линейная алгебра . СИАМ. ISBN 978-0-89871-361-9 .
Дальнейшее чтение
[ редактировать ]- Деммель, Джеймс (1990). «Ближайшие дефектные матрицы и геометрия плохого кондиционирования». В Коксе, Миннесота; Хаммарлинг, С. (ред.). Надежные численные вычисления . Оксфорд: Кларендон Пресс. стр. 35–55. ISBN 0-19-853564-3 .