Система линейных уравнений
Эта статья включает список общих ссылок , но в ней отсутствуют достаточные соответствующие встроенные цитаты . ( Октябрь 2015 г. ) |
В математике система линейных уравнений (или линейная система ) представляет собой совокупность двух или более линейных уравнений с одними и теми же переменными . [1] [2] Например,
представляет собой систему трех уравнений с тремя переменными x , y , z . Решение . линейной системы — это присвоение значений переменным таким образом, чтобы все уравнения одновременно удовлетворялись В приведенном выше примере решение дается упорядоченной тройкой поскольку это делает все три уравнения действительными.
Линейные системы являются фундаментальной частью линейной алгебры , предмета, используемого в большинстве современной математики. Вычислительные алгоритмы поиска решений являются важной частью числовой линейной алгебры и играют заметную роль в технике , физике , химии , информатике и экономике . Систему нелинейных уравнений часто можно аппроксимировать линейной системой (см. линеаризацию ), что является полезным методом при создании математической модели или компьютерного моделирования относительно сложной системы .
Очень часто, и в этой статье, коэффициенты и решения уравнений ограничены действительными или комплексными числами , но теория и алгоритмы применимы к коэффициентам и решениям в любой области . Для других алгебраических структур были разработаны другие теории. Для коэффициентов и решений в области целостности , такой как кольцо целых чисел , см. Линейное уравнение над кольцом . Чтобы узнать о коэффициентах и решениях, являющихся полиномами, см. Базис Грёбнера . Чтобы найти «лучшие» целочисленные решения среди многих, см. Целочисленное линейное программирование . Пример более экзотической структуры, к которой можно применить линейную алгебру, см. в разделе « Тропическая геометрия» .
Элементарные примеры
[ редактировать ]Тривиальный пример
[ редактировать ]Система одного уравнения с одним неизвестным
есть решение
Однако наиболее интересные линейные системы имеют как минимум два уравнения.
Простой нетривиальный пример
[ редактировать ]Самый простой вид нетривиальной линейной системы включает два уравнения и две переменные:
Один из способов решения такой системы заключается в следующем. Сначала решим верхнее уравнение для с точки зрения :
Теперь подставьте это выражение для x в нижнее уравнение:
В результате получается единственное уравнение, включающее только переменную . Решение дает и подставив это обратно в уравнение для урожайность . Этот метод обобщается на системы с дополнительными переменными (см. «Устранение переменных» ниже или статью об элементарной алгебре ).
Общая форма
[ редактировать ]Общую систему m линейных уравнений с n неизвестными и коэффициентами можно записать как
где неизвестные, – коэффициенты системы, а являются постоянными условиями. [3]
Часто коэффициенты и неизвестные представляют собой действительные или комплексные числа , но также встречаются целые и рациональные числа , а также многочлены и элементы абстрактной алгебраической структуры .
Векторное уравнение
[ редактировать ]Одна чрезвычайно полезная точка зрения заключается в том, что каждое неизвестное является весом вектора-столбца в линейной комбинации .
весь язык и теорию векторных пространств (или, в более общем смысле, модулей Это позволяет использовать ). Например, совокупность всех возможных линейных комбинаций векторов в левой части называется их промежутком , и уравнения имеют решение только тогда, когда правый вектор находится внутри этого промежутка. Если каждый вектор внутри этого диапазона имеет ровно одно выражение как линейную комбинацию данных левых векторов, то любое решение уникально. В любом случае диапазон имеет основу из линейно независимых векторов, которые гарантируют ровно одно выражение; и количество векторов в этом базисе (его размерность ) не может быть больше m или n , но может быть меньше. Это важно, потому что если у нас есть m независимых векторов, решение гарантировано независимо от правой части, а в противном случае не гарантировано.
Матричное уравнение
[ редактировать ]Векторное уравнение эквивалентно матричному уравнению вида где A — матрица размера m × n , x — вектор-столбец с n элементами, а b — вектор-столбец с m элементами. [4]
Количество векторов в базисе диапазона теперь выражается как ранг матрицы.
Набор решений
[ редактировать ]Решением такое, что каждое из линейной системы является присвоение значений переменным x 1 , x 2 , ..., x n уравнений удовлетворяется. Множество множеством всех возможных решений называется решений . [5]
Линейная система может вести себя одним из трех возможных способов:
- Система имеет бесконечно много решений .
- Система имеет единственное решение .
- Система не имеет решения .
Геометрическая интерпретация
[ редактировать ]Для системы, включающей две переменные ( и y ) , каждое линейное уравнение определяет линию на xy плоскости x . Поскольку решение линейной системы должно удовлетворять всем уравнениям, набор решений представляет собой пересечение этих линий и, следовательно, представляет собой либо линию, одну точку, либо пустое множество .
Для трех переменных каждое линейное уравнение определяет плоскость в трехмерном пространстве , а множеством решений является пересечение этих плоскостей. Таким образом, набором решений может быть плоскость, линия, отдельная точка или пустое множество. Например, поскольку три параллельные плоскости не имеют общей точки, множество решений их уравнений пусто; множество решений уравнений трех плоскостей, пересекающихся в одной точке, одноточечное; если три плоскости проходят через две точки, их уравнения имеют по крайней мере два общих решения; на самом деле множество решений бесконечно и состоит из всех прямых, проходящих через эти точки. [6]
Для n переменных каждое линейное уравнение определяет гиперплоскость в n -мерном пространстве . Множество решений представляет собой пересечение этих гиперплоскостей и представляет собой плоскость , размерность которой может быть меньше n .
Общее поведение
[ редактировать ]В общем случае поведение линейной системы определяется соотношением количества уравнений и количества неизвестных. Здесь «в целом» означает, что при конкретных значениях коэффициентов уравнений может иметь место различное поведение.
- В общем случае система, в которой уравнений меньше, чем неизвестных, имеет бесконечно много решений, но может не иметь решения. Такая система известна как недоопределенная система .
- В общем случае система с одинаковым количеством уравнений и неизвестных имеет единственное решение.
- В общем случае система, в которой уравнений больше, чем неизвестных, не имеет решения. Такая система также известна как переопределенная система .
В первом случае размерность множества решений, вообще говоря, равна n − m , где n — количество переменных, а m — количество уравнений.
Следующие рисунки иллюстрируют эту трихотомию в случае двух переменных:
Первая система имеет бесконечное множество решений, а именно все точки синей линии. Вторая система имеет единственное единственное решение, а именно пересечение двух прямых. Третья система не имеет решений, поскольку все три линии не имеют общей точки.
Следует иметь в виду, что на рисунках выше показан только самый распространенный случай (общий случай). Система двух уравнений и двух неизвестных может не иметь решения (если две прямые параллельны), а система трех уравнений и двух неизвестных может быть разрешимой (если три прямые пересекаются в одной точке).
Система линейных уравнений ведет себя иначе, чем в общем случае, если уравнения линейно зависимы или если она несовместна и имеет не больше уравнений, чем неизвестных.
Характеристики
[ редактировать ]Независимость
[ редактировать ]Уравнения линейной системы являются независимыми , если ни одно из уравнений не может быть выведено алгебраическим путем из других. Когда уравнения независимы, каждое уравнение содержит новую информацию о переменных, и удаление любого из уравнений увеличивает размер набора решений. Для линейных уравнений логическая независимость аналогична линейной независимости .
Например, уравнения
не являются независимыми — это одно и то же уравнение, если масштабировать его в два раза, и они дадут идентичные графики. Это пример эквивалентности в системе линейных уравнений.
В более сложном примере уравнения
не являются независимыми, поскольку третье уравнение представляет собой сумму двух других. Действительно, любое из этих уравнений можно вывести из двух других, и любое из уравнений можно удалить, не затрагивая множество решений. Графики этих уравнений представляют собой три линии, пересекающиеся в одной точке.
Последовательность
[ редактировать ]Линейная система называется несовместной , если она не имеет решения, в противном случае ее называют совместной . [7] можно вывести противоречие Когда система несовместна, из уравнений , которое всегда можно переписать как утверждение 0 = 1 .
Например, уравнения
противоречивы. Фактически, вычитая первое уравнение из второго и умножая обе части результата на 1/6, мы получаем 0 = 1 . Графики этих уравнений на плоскости xy представляют собой пару параллельных линий.
Три линейных уравнения могут оказаться несовместными, даже если любые два из них согласуются друг с другом. Например, уравнения
противоречивы. Сложение первых двух уравнений дает 3 x + 2 y = 2 , которые можно вычесть из третьего уравнения и получить 0 = 1 . Любые два из этих уравнений имеют общее решение. То же явление может произойти для любого количества уравнений.
В общем случае противоречия возникают, если левые части уравнений системы линейно зависимы, а постоянные члены не удовлетворяют соотношению зависимости. Система уравнений, левые части которой линейно независимы, всегда совместна.
Другими словами, согласно теореме Руше-Капелли , любая система уравнений (переопределенная или иная) несовместна, если ранг расширенной матрицы больше ранга матрицы коэффициентов . Если же ранги этих двух матриц равны, система должна иметь хотя бы одно решение. Решение единственно тогда и только тогда, когда ранг равен числу переменных. В противном случае общее решение имеет k свободных параметров, где k — разница между количеством переменных и рангом; следовательно, в таком случае существует бесконечное число решений. Ранг системы уравнений (то есть ранг дополненной матрицы) никогда не может быть выше [количества переменных] + 1, а это значит, что систему с любым количеством уравнений всегда можно свести к системе, имеет число независимых уравнений , не превышающее [количество переменных] + 1.
Эквивалентность
[ редактировать ]Две линейные системы, использующие один и тот же набор переменных, эквивалентны, если каждое из уравнений второй системы можно вывести алгебраически из уравнений первой системы, и наоборот. Две системы эквивалентны, если либо обе несовместны, либо каждое уравнение каждой из них является линейной комбинацией уравнений другой. Отсюда следует, что две линейные системы эквивалентны тогда и только тогда, когда они имеют одно и то же множество решений.
Решение линейной системы
[ редактировать ]Существует несколько алгоритмов решения системы линейных уравнений.
Описание решения
[ редактировать ]Когда множество решений конечно, оно сводится к одному элементу. В этом случае единственное решение описывается последовательностью уравнений, левые части которых представляют собой имена неизвестных, а правые части — соответствующие значения, например . Когда порядок неизвестных фиксирован, например, в алфавитном порядке, решение можно описать как вектор значений, например для предыдущего примера.
Для описания множества с бесконечным числом решений обычно некоторые переменные обозначаются как свободные (или независимые , или как параметры ), что означает, что им разрешено принимать любое значение, в то время как остальные переменные зависят от значений свободные переменные.
Например, рассмотрим следующую систему:
Множество решений этой системы можно описать следующими уравнениями:
Здесь z — свободная переменная, а x и y зависят от z . Любую точку в наборе решений можно получить, сначала выбрав значение z , а затем вычислив соответствующие значения x и y .
Каждая свободная переменная дает пространству решений одну степень свободы , число которых равно размерности множества решений. Например, набор решений для приведенного выше уравнения представляет собой линию, поскольку точку в наборе решений можно выбрать, указав значение параметра z . Бесконечное решение более высокого порядка может описывать плоскость или множество более высокой размерности.
Разный выбор свободных переменных может привести к разным описаниям одного и того же набора решений. Например, решение приведенных выше уравнений можно альтернативно описать следующим образом:
Здесь x — свободная переменная, а y и z — зависимые.
Устранение переменных
[ редактировать ]Самый простой метод решения системы линейных уравнений — многократное исключение переменных. Этот метод можно описать следующим образом:
- В первом уравнении найдите одну из переменных через другие.
- Подставьте это выражение в оставшиеся уравнения. В результате получается система уравнений, в которой на одно уравнение меньше и неизвестное.
- Повторяйте шаги 1 и 2, пока система не сведется к одному линейному уравнению.
- Решите это уравнение, а затем выполняйте обратную замену, пока не будет найдено полное решение.
Например, рассмотрим следующую систему:
Решение первого уравнения для x дает , и подстановка этого во второе и третье уравнение дает
Поскольку левая часть обоих этих уравнений равна y , приравнивая правую часть уравнений. Теперь у нас есть:
Подстановка z = 2 во второе или третье уравнение дает y = 8, а значения y и z в первом уравнении дают x = -15. Следовательно, множество решений представляет собой упорядоченную тройку .
Сокращение строк
[ редактировать ]При сокращении строк (также известном как исключение Гаусса ) линейная система представляется как расширенная матрица. [8]
Затем эта матрица модифицируется с помощью элементарных операций со строками до тех пор, пока не достигнет сокращенной формы эшелона строк . Существует три типа элементарных операций над строками: [8]
- Тип 1 : Поменяйте местами две строки.
- Тип 2 : Умножить строку на ненулевой скаляр .
- Тип 3 : добавьте к одной строке скаляр, кратный другой.
Поскольку эти операции обратимы, созданная расширенная матрица всегда представляет собой линейную систему, эквивалентную исходной.
Существует несколько конкретных алгоритмов сокращения строк расширенной матрицы, самыми простыми из которых являются исключение Гаусса и исключение Гаусса – Жордана . Следующие вычисления показывают исключение Гаусса – Жордана, примененное к приведенной выше матрице:
Последняя матрица имеет форму сокращенного звена строк и представляет систему x = −15 , y = 8 , z = 2 . Сравнение с примером алгебраического исключения переменных из предыдущего раздела показывает, что эти два метода фактически одинаковы; разница заключается в том, как записываются вычисления.
Правило Крамера
[ редактировать ]Правило Крамера — это явная формула для решения системы линейных уравнений, в которой каждая переменная задается частным из двух определителей . [9] Например, решение системы
дается
Для каждой переменной знаменатель — это определитель матрицы коэффициентов , а числитель — это определитель матрицы, в которой один столбец заменен вектором постоянных членов.
Хотя правило Крамера важно теоретически, оно не имеет практической ценности для больших матриц, поскольку вычисление больших определителей несколько громоздко. (Действительно, большие определители легче всего вычислить с помощью сокращения строк.)Кроме того, правило Крамера имеет очень плохие числовые свойства, что делает его непригодным для надежного решения даже небольших систем, если только операции не выполняются в рациональной арифметике с неограниченной точностью. [ нужна ссылка ]
Матричное решение
[ редактировать ]Если систему уравнений выразить в матричной форме , все множество решений также можно выразить в матричной форме. Если матрица A квадратная (имеет m строк и n = m столбцов) и имеет полный ранг (все m строк независимы), то система имеет единственное решение, определяемое формулой
где является обратным A . В более общем смысле, независимо от того, m = n или нет, и независимо от ранга A , все решения (если таковые существуют) даются с использованием Мура-Пенроуза обратного к A , обозначаемого , следующее:
где — вектор свободных параметров, охватывающий все возможные векторы n ×1. Необходимым и достаточным условием существования любого решения(й) является то, что потенциальное решение, полученное с помощью удовлетворить - то есть, что Если это условие не выполнено, система уравнений несовместна и не имеет решения. Если условие выполнено, система совместна и существует хотя бы одно решение. Например, в вышеупомянутом случае, когда A квадратное и имеет полный ранг, просто равно и общее уравнение решения упрощается до
как уже говорилось ранее, где полностью выпал из решения, оставив только одно решение. Однако в других случаях остается и, следовательно, бесконечность потенциальных значений вектора свободных параметров дают бесконечное число решений уравнения.
Другие методы
[ редактировать ]Хотя системы из трех или четырех уравнений можно легко решить вручную (см. Краковский ), для более крупных систем часто используются компьютеры. Стандартный алгоритм решения системы линейных уравнений основан на методе исключения Гаусса с некоторыми модификациями. Во-первых, важно избегать деления на небольшие числа, что может привести к неточным результатам. Это можно сделать, если необходимо, переупорядочив уравнения — процесс, известный как поворот . Во-вторых, алгоритм не выполняет исключение по Гауссу, а вычисляет разложение матрицы A. LU - В основном это организационный инструмент, но он гораздо быстрее, если нужно решить несколько систем с одной и той же матрицей A, но разными векторами b .
Если матрица A имеет особую структуру, это можно использовать для получения более быстрых и точных алгоритмов. Например, системы с симметричной положительно определенной матрицей можно решать в два раза быстрее с помощью разложения Холецкого . Рекурсия Левинсона — быстрый метод для матриц Теплица . Существуют также специальные методы для матриц со многими нулевыми элементами (так называемые разреженные матрицы ), которые часто встречаются в приложениях.
Совершенно другой подход часто применяется для очень больших систем, которые в противном случае заняли бы слишком много времени или памяти. Идея состоит в том, чтобы начать с начального приближения решения (которое вообще не обязательно должно быть точным) и в несколько шагов изменить это приближение, чтобы приблизить его к истинному решению. Если приближение становится достаточно точным, оно считается решением системы. Это приводит к классу итерационных методов . Для некоторых разреженных матриц введение случайности повышает скорость итерационных методов. [10] Одним из примеров итерационного метода является метод Якоби , где матрица разбивается на диагональную составляющую и его недиагональная составляющая . Первоначальное предположение используется в начале алгоритма. Каждое последующее предположение вычисляется с использованием итеративного уравнения:
Когда разница между догадками и достаточно мал, то говорят, что алгоритм сошелся к решению. [11]
Существует также квантовый алгоритм для линейных систем уравнений . [12]
Гомогенные системы
[ редактировать ]Система линейных уравнений является однородной, если все постоянные члены равны нулю:
Однородная система эквивалентна матричному уравнению вида
где A — матрица размера m × n , x — вектор-столбец с n элементами, а 0 — нулевой вектор с m элементами.
Однородный набор решений
[ редактировать ]Каждая однородная система имеет по крайней мере одно решение, известное как нулевое (или тривиальное ) решение, которое получается путем присвоения значения нуля каждой из переменных. Если система имеет неособую матрицу ( det( A ) ≠ 0 ), то это также единственное решение. Если система имеет сингулярную матрицу, то существует множество решений с бесконечным числом решений. Этот набор решений имеет следующие дополнительные свойства:
- Если u и v — два вектора, представляющие решения однородной системы, то векторная сумма u + v также является решением этой системы.
- Если u — вектор, представляющий решение однородной системы, а r — любой скаляр , то ru также является решением системы.
Это именно те свойства, которые необходимы для того, чтобы множество решений было линейным подпространством в R. н . В частности, набор решений однородной системы такой же, как нулевое пространство соответствующей матрицы A .
Отношение к неоднородным системам
[ редактировать ]Существует тесная связь между решениями линейной системы и решениями соответствующей однородной системы:
В частности, если p — какое-либо конкретное решение линейной системы A x = b , то весь набор решений можно описать как
Геометрически это говорит о том, что набор решений для A x = b является сдвигом набора решений для A x = 0 . В частности, плоскость для первой системы можно получить путем перевода линейного подпространства однородной системы на вектор p .
Это рассуждение применимо только в том случае, если система A x = b имеет хотя бы одно решение. когда вектор b лежит в образе линейного преобразования A. Это происходит тогда и только тогда ,
См. также
[ редактировать ]- Расположение гиперплоскостей
- Итеративное уточнение
- Граф Коутса
- LAPACK (бесплатный стандартный пакет для численного решения линейных уравнений; доступен на Fortran , C , C++ )
- Линейное уравнение над кольцом
- Линейный метод наименьших квадратов
- Разложение матрицы
- Расщепление матрицы
- Числовая библиотека NAG (версии решателей LAPACK из библиотеки NAG)
- Алгоритм Рыбицкого Пресса
- Одновременные уравнения
Ссылки
[ редактировать ]- ^ Антон (1987) , с. 2; Бремя и ярмарки (1993) , с. 324; Голуб и Ван Лоан (1996) , с. 87; Харпер (1976) , с. 57.
- ^ https://www.britanica.com/science/system-of-equations
- ^ Борегар и Фрели (1973) , с. 65.
- ^ Борегар и Фрели (1973) , стр. 65–66.
- ^ «Системы линейных уравнений» (PDF) . math.berkeley.edu .
- ^ Каллен (1990) , с. 3.
- ^ Уайтлоу (1991) , с. 70 .
- ^ Jump up to: а б Борегар и Фрели (1973) , с. 68.
- ^ Стерлинг (2009) , с. 235 .
- ^ Хартнетт, Кевин (8 марта 2021 г.). «Новый алгоритм превышает предел скорости решения линейных уравнений» . Журнал Кванта . Проверено 9 марта 2021 г.
- ^ «Метод Якоби» .
- ^ Харроу, хасиды и Ллойд (2009) .
Библиография
[ редактировать ]- Антон, Ховард (1987), Элементарная линейная алгебра (5-е изд.), Нью-Йорк: Wiley , ISBN 0-471-84819-0
- Борегар, Раймонд А.; Фрэли, Джон Б. (1973), Первый курс линейной алгебры: с дополнительным введением в группы, кольца и поля , Бостон: Houghton Mifflin Company , ISBN 0-395-14017-Х
- Берден, Ричард Л.; Фейрес, Дж. Дуглас (1993), Численный анализ (5-е изд.), Бостон: Приндл, Вебер и Шмидт , ISBN 0-534-93219-3
- Каллен, Чарльз Г. (1990), Матрицы и линейные преобразования , Массачусетс: Дувр, ISBN 978-0-486-66328-9
- Голуб, Джин Х.; Ван Лоан, Чарльз Ф. (1996), Матричные вычисления (3-е изд.), Балтимор: Издательство Университета Джона Хопкинса , ISBN 0-8018-5414-8
- Харпер, Чарли (1976), Введение в математическую физику , Нью-Джерси: Прентис-Холл , ISBN 0-13-487538-9
- Харроу, Арам В.; хасидим, Авинатан; Ллойд, Сет (2009), «Квантовый алгоритм для линейных систем уравнений», Physical Review Letters , 103 (15): 150502, arXiv : 0811.3171 , Bibcode : 2009PhRvL.103o0502H , doi : 10.1103/PhysRevLett.103.1 50502 , ПМИД 19905613 , С2КИД 5187993
- Стерлинг, Мэри Дж. (2009), Линейная алгебра для чайников , Индианаполис, Индиана: Wiley, ISBN 978-0-470-43090-3
- Уайтлоу, Т. А. (1991), Введение в линейную алгебру (2-е изд.), CRC Press, ISBN 0-7514-0159-5
Дальнейшее чтение
[ редактировать ]- Экслер, Шелдон Джей (1997). Линейная алгебра сделана правильно (2-е изд.). Спрингер-Верлаг. ISBN 0-387-98259-0 .
- Лэй, Дэвид К. (22 августа 2005 г.). Линейная алгебра и ее приложения (3-е изд.). Эддисон Уэсли. ISBN 978-0-321-28713-7 .
- Мейер, Карл Д. (15 февраля 2001 г.). Матричный анализ и прикладная линейная алгебра . Общество промышленной и прикладной математики (SIAM). ISBN 978-0-89871-454-8 . Архивировано из оригинала 1 марта 2001 года.
- Пул, Дэвид (2006). Линейная алгебра: современное введение (2-е изд.). Брукс/Коул. ISBN 0-534-99845-3 .
- Антон, Ховард (2005). Элементарная линейная алгебра (версия для приложений) (9-е изд.). Уайли Интернэшнл.
- Леон, Стивен Дж. (2006). Линейная алгебра с приложениями (7-е изд.). Пирсон Прентис Холл.
- Стрэнг, Гилберт (2005). Линейная алгебра и ее приложения .
- Пэн, Ричард; Вемпала, Сантош С. (2024). «Решение разреженных линейных систем быстрее, чем умножение матриц». Комм. АКМ . 67 (7): 79–86. arXiv : 2007.10254 . дои : 10.1145/3615679 .
Внешние ссылки
[ редактировать ]- СМИ, связанные с системой линейных уравнений , на Викискладе?