Метод Качмажа
Метод Качмажа или алгоритм Качмажа — это итерационный алгоритм решения систем линейных уравнений. . Впервые его открыл польский математик Стефан Качмарж . [1] и был заново открыт в области реконструкции изображений по проекциям Ричардом Гордоном , Робертом Бендером и Габором Херманом в 1970 году, где он получил название «Техника алгебраической реконструкции» (ART). [2] ART включает ограничение положительности, что делает его нелинейным. [3]
Метод Качмажа применим к любой линейной системе уравнений, но его вычислительное преимущество по сравнению с другими методами зависит от разреженности системы . Было продемонстрировано, что в некоторых приложениях биомедицинской визуализации он превосходит другие методы, такие как метод фильтрованной обратной проекции . [4]
Он имеет множество применений: от компьютерной томографии (КТ) до обработки сигналов . Его можно получить также, применив к гиперплоскостям, описываемым линейной системой, метод последовательных проекций на выпуклые множества (ПОКС). [5] [6]
Алгоритм 1: алгоритм Качмажа
[ редактировать ]Позволять — система линейных уравнений , пусть быть числом строк A , быть строка комплексной матрицы -я , и пусть — произвольное комплексное начальное приближение решения задачи . Для вычислить:
( 1 ) |
где и обозначает комплексное сопряжение .
Если система непротиворечива, сходится к решению минимальной нормы при условии, что итерации начинаются с нулевого вектора.
Более общий алгоритм можно определить с помощью релаксации параметра
Существуют версии метода, которые сходятся к регуляризованному взвешенному решению наименьших квадратов при применении к системе несовместных уравнений и, по крайней мере, что касается начального поведения, с меньшими затратами, чем другие итерационные методы, такие как метод сопряженных градиентов. . [7]
Алгоритм 2: Рандомизированный алгоритм Качмажа
[ редактировать ]рандомизированную версию метода Качмажа для переопределенных линейных систем. В 2009 году Томас Стромер и Роман Вершинин представили [8] в котором i -е уравнение выбирается случайным образом с вероятностью, пропорциональной
Этот метод можно рассматривать как частный случай стохастического градиентного спуска . [9]
При таких обстоятельствах экспоненциально быстро сходится к решению задачи и скорость сходимости зависит только от масштабированного числа обусловленности .
- Теорема. Позволять быть решением Тогда алгоритм 2 сходится к в ожидании, со средней ошибкой:
Доказательство
[ редактировать ]У нас есть
( 2 ) |
С использованием
мы можем написать ( 2 ) как
( 3 ) |
Основная суть доказательства состоит в том, чтобы рассматривать левую часть в ( 3 ) как математическое ожидание некоторой случайной величины. А именно, напомним, что пространство решений задачи уравнение это гиперплоскость
чья норма Определим случайный вектор Z , значения которого являются нормалями ко всем уравнениям , с вероятностями, как в нашем алгоритме:
- с вероятностью
Тогда ( 3 ) говорит, что
( 4 ) |
Ортогональная проекция на пространство решений случайного уравнения дается
Теперь мы готовы проанализировать наш алгоритм. Мы хотим показать, что ошибка уменьшается на каждом шаге в среднем (обусловленном предыдущими шагами) не менее чем в раз Следующее приближение рассчитывается из как где являются независимыми реализациями случайной проекции Вектор находится в ядре Оно ортогонально пространству решений уравнения, на которое проекты, который содержит вектор (напомним, что является решением всех уравнений). Тогда ортогональность этих двух векторов дает
Для завершения доказательства нам нужно оценить снизу. По определению , у нас есть
где являются независимыми реализациями случайного вектора
Таким образом
Теперь мы считаем ожидание обеих сторон обусловленным выбором случайных векторов (следовательно, мы фиксируем выбор случайных проекций и, следовательно, случайные векторы и мы усредняем по случайному вектору ). Затем
Ввиду ( 4 ) и независимости
Учитывая все ожидания обеих сторон, мы приходим к выводу, что
Превосходство этого выбора было проиллюстрировано реконструкцией функции с ограниченной полосой частот по ее неравномерно расположенным значениям выборки. Однако было указано [10] что успех, о котором сообщают Стромер и Вершинин, зависит от конкретного выбора, который был сделан при переводе основной задачи, геометрическая природа которой заключается в поиске общей точки набора гиперплоскостей , в систему алгебраических уравнений. Всегда будут законные алгебраические представления основной проблемы, для которых метод выбора в [8] будет работать хуже. [8] [10] [11]
Итерация Качмажа ( 1 ) имеет чисто геометрическую интерпретацию: алгоритм последовательно проецирует текущую итерацию на гиперплоскость, определяемую следующим уравнением. Следовательно, любое масштабирование уравнений не имеет значения; ) также видно из ( 1 , что любое (ненулевое) масштабирование уравнений отменяется. Таким образом, в РК можно использовать или любые другие веса, которые могут иметь значение. В частности, в вышеупомянутом примере реконструкции уравнения были выбраны с вероятностью, пропорциональной среднему расстоянию каждой точки выборки от двух ее ближайших соседей — концепция, введенная Файхтингером и Грёхенигом . Дополнительную информацию по этой теме см. [12] [13] и ссылки в нем.
Алгоритм 3: Алгоритм Гауэра-Рихтарика
[ редактировать ]В 2015 году Роберт М. Гауэр и Питер Рихтарик [14] разработал универсальный рандомизированный итерационный метод решения совместной системы линейных уравнений который включает в себя рандомизированный алгоритм Качмажа как частный случай. Другие особые случаи включают рандомизированный спуск по координатам, рандомизированный гауссовский спуск и рандомизированный метод Ньютона. Блочные версии и версии с выборкой по важности всех этих методов также возникают как частные случаи. Показано, что этот метод демонстрирует экспоненциальное затухание скорости (в ожидании), также известное как линейная сходимость, при очень мягких условиях на пути попадания случайности в алгоритм. Метод Гауэра-Рихтарика — это первый алгоритм, раскрывающий «родственные» отношения между этими методами, некоторые из которых были независимо предложены ранее, а многие из них были новыми.
Информация о рандомизированном Качмаже
[ редактировать ]Интересные новые сведения о рандомизированном методе Качмажа, которые можно получить в результате анализа метода, включают:
- Общая скорость алгоритма Гауэра-Рихтарика точно восстанавливает скорость рандомизированного метода Качмажа в частном случае, когда он сведен к ней.
- Выбор вероятностей, для которых изначально был сформулирован и проанализирован рандомизированный алгоритм Качмажа (вероятности, пропорциональные квадратам норм строк), не является оптимальным. Оптимальные вероятности являются решением некоторой полуопределённой программы. Теоретическая сложность рандомизированного Качмажа с оптимальными вероятностями может быть сколь угодно лучше, чем сложность для стандартных вероятностей. Однако степень, на которую оно лучше, зависит от матрицы . Существуют задачи, для которых стандартные вероятности оптимальны.
- Применительно к системе с матрицей который является положительно определенным, рандомизированный метод Качмажа эквивалентен методу стохастического градиентного спуска (SGD) (с очень особым размером шага) для минимизации сильно выпуклой квадратичной функции. Обратите внимание, что поскольку является выпуклым, минимизаторы должен удовлетворить , что эквивалентно «Специальный размер шага» — это размер шага, который приводит к точке, которая на одномерной линии, натянутой стохастическим градиентом, минимизирует евклидово расстояние от неизвестного (!) минимизатора , а именно из Это понимание достигается благодаря двойному взгляду на итеративный процесс (ниже описанный как «Точка зрения оптимизации: ограничение и аппроксимация»).
Шесть эквивалентных составов
[ редактировать ]Метод Гауэра-Рихтарика имеет шесть, казалось бы, разных, но эквивалентных формулировок, проливающих дополнительный свет на то, как его интерпретировать (и, как следствие, как интерпретировать его многочисленные варианты, включая рандомизированный метод Качмажа):
- 1. Точка зрения эскиза: эскиз и проект
- 2. Точка зрения оптимизации: ограничение и приближение
- 3. Геометрическая точка зрения: случайное пересечение.
- 4. Алгебраическая точка зрения 1: случайное линейное решение
- 5. Алгебраическая точка зрения 2: случайное обновление
- 6. Аналитическая точка зрения: случайная фиксированная точка.
Опишем некоторые из этих точек зрения. Метод зависит от 2 параметров:
- положительно определенная матрица что приводит к взвешенному евклидову внутреннему продукту и индуцированная норма
- и случайная матрица с таким количеством строк, как (и, возможно, случайное количество столбцов).
1. Эскиз и проект
[ редактировать ]Учитывая предыдущую итерацию новая точка вычисляется путем рисования случайной матрицы (в духе iid из некоторого фиксированного дистрибутива) и установив
То есть, получается как проекция на случайно нарисованную систему . Идея этого метода состоит в том, чтобы выбрать таким образом, что проекция на нарисованную систему существенно проще, чем решение исходной системы. . Рандомизированный метод Качмажа получается путем выбора быть единичной матрицей, и быть единичный вектор координат с вероятностью Различные варианты и приводят к различным вариантам метода.
2. Ограничить и приблизить
[ редактировать ]Казалось бы, другая, но полностью эквивалентная формулировка метода (полученная с помощью лагранжевой двойственности):
где также допускается варьировать, и где любое решение системы Следовательно, получается путем сначала ограничения обновления линейным подпространством, охватываемым столбцами случайной матрицы , то есть, чтобы
а затем выбираем точку из этого подпространства, которое лучше всего аппроксимирует . Эта формулировка может показаться неожиданной, поскольку выполнить этап аппроксимации кажется невозможным из-за того, что неизвестно (ведь это мы и пытаемся вычислить!). Однако это все еще возможно сделать просто потому, что вычисленный таким образом, аналогичен рассчитывается по эскизу и формулировке проекта, и поскольку там не появляется.
5. Случайное обновление
[ редактировать ]Обновление также можно записать явно как
где мы обозначаем псевдообратную матрицу Мура-Пенроуза . Следовательно, метод можно записать в виде , где — случайный вектор обновления .
Сдача в аренду можно показать, что система всегда есть решение , и что для всех таких решений вектор то же самое. Следовательно, не имеет значения, какое из этих решений выбрано, и метод также можно записать в виде . Псевдообратное приводит только к одному частному решению. Роль псевдообратного двояка:
- Это позволяет записать метод в явной форме «случайного обновления», как указано выше:
- Это упрощает анализ благодаря последней, шестой формулировке.
6. Случайная фиксированная точка
[ редактировать ]Если мы вычтем с обеих сторон формулы случайного обновления обозначим
и использовать тот факт, что мы приходим к последней формулировке:
где является единичной матрицей. Итерационная матрица, случайна, отсюда и название этой формулировки.
Конвергенция
[ редактировать ]Взяв условные ожидания в 6-й формулировке (условно ), получаем
Снова взяв ожидание и используя свойство башни ожиданий, мы получаем
Гауэр и Рихтарик [14] покажи это
где матричная норма определяется выражением
Более того, без каких-либо предположений о у одного есть Взяв нормы и развернув рекуррентность, получаем
Теорема [Gower & Richtarik 2015]
[ редактировать ]Замечание . Достаточным условием сходимости ожидаемых остатков к 0 является Этого можно достичь, если имеет полный ранг столбца и находится в очень мягких условиях на Сходимость метода можно установить и без предположения полного ранга столбца другим способом. [15]
Также возможно показать более сильный результат:
Теорема [Gower & Richtarik 2015]
[ редактировать ]Ожидаемые квадраты норм (а не нормы ожиданий) сходятся с одинаковой скоростью:
Замечание . Этот второй тип сходимости является более сильным благодаря следующему тождеству [14] что справедливо для любого случайного вектора и любой фиксированный вектор :
Конвергенция рандомизированного Качмажа
[ редактировать ]Мы видели, что рандомизированный метод Качмажа является частным случаем метода Гауэра-Рихтарика для и быть единичный вектор координат с вероятностью где это ряд Непосредственным расчетом можно проверить, что
Дальнейшие особые случаи
[ редактировать ]Алгоритм 4: PLSS-Качмарц
[ редактировать ]Поскольку сходимость (рандомизированного) метода Качмажа зависит от скорости сходимости, метод может медленно прогрессировать в решении некоторых практических задач. [10] Чтобы обеспечить конечное завершение метода, Йоханнес Бруст и Майкл Сондерс (академический) [16] разработали процесс, который обобщает (рандомизированную) итерацию Качмажа и заканчивается не более чем через итерации к решению для согласованной системы . Процесс основан на уменьшении размерности или проекциях. на пространства более низких измерений, отсюда и название PLSS (Проецируемый линейный решатель систем). Итерацию PLSS-Качмарца можно рассматривать как обобщение
где это выбор строк с 1 по и все столбцы . Рандомизированная версия метода использует неповторяющиеся индексы строк на каждой итерации: где каждый находится в . Итерация сходится к решению, когда . В частности, поскольку он утверждает, что
и поэтому является решением линейной системы. Вычисление итераций в PLSS-Kaczmarz можно упростить и эффективно организовать. Полученный алгоритм требует только матрично-векторных произведений и имеет прямой вид
algorithm PLSS-Kaczmarz is input: matrix A right hand side b output: solution x such that Ax=b x := 0, P = [0] for k in 1,2,...,m do a := A(ik,:)' // Select an index ik in 1,...,m without resampling d := P' * a c1 := norm(a) c2 := norm(d) c3 := (bik-x'*a)/((c1-c2)*(c1+c2)) p := c3*(a - P*(P'*a)) P := [ P, p/norm(p) ] // Append a normalized update x := x + p return x
Примечания
[ редактировать ]- ^ Качмарж (1937)
- ^ Гордон, Бендер и Герман (1970)
- ^ Гордон (2011)
- ^ Герман (2009)
- ^ Цензор и Зениос (1997)
- ^ Астер, Борчерс и Тербер (2004)
- ^ См . Herman (2009) и ссылки в нем.
- ^ Перейти обратно: а б с Стромер и Вершинин (2009)
- ^ Ниделл, Сребро и Уорд (2015)
- ^ Перейти обратно: а б с Цензор, Герман и Цзян (2009)
- ^ Стромер и Вершинин (2009б)
- ^ Бас и Грёхениг (2013)
- ^ Гордон (2017)
- ^ Перейти обратно: а б с Гауэр и Рихтарик (2015a)
- ^ Гауэр и Рихтарик (2015b)
- ^ Браст и Сондерс (2023)
Ссылки
[ редактировать ]- Качмарц, Стефан (1937), «Angenäherte Auflösung von Systemen Linearer Gleichungen» (PDF) , Международный бюллетень Польской академии наук и литературы. Класс математики и естественных наук. Серия А, Математические науки , вып. 35, с. 355–357
- Чонг, Эдвин КП; Зак, Станислав Х. (2008), Введение в оптимизацию (3-е изд.), John Wiley & Sons, стр. 226–230.
- Гордон, Ричард ; Бендер, Роберт ; Герман, Габор (1970), «Методы алгебраической реконструкции (ART) для трехмерной электронной микроскопии и рентгеновской фотографии», Journal of Theoretical Biology , 29 (3): 471–481, Bibcode : 1970JThBi..29..471G , doi : 10.1016/0022-5193(70)90109-8 , PMID 5492997
- Гордон, Ричард (2011), Остановите рак груди сейчас! Представляя пути визуализации для поиска, уничтожения, лечения и бдительного ожидания преметастазного рака молочной железы. В: Рак молочной железы – долевая болезнь, редактор: Тибор Тот , Спрингер, стр. 167–203.
- Герман, Габор (2009), Основы компьютерной томографии: реконструкция изображения по проекции (2-е изд.), Springer, ISBN 9781846287237
- Цензор, Яир ; Зениос, С.А. (1997), Параллельная оптимизация: теория, алгоритмы и приложения , Нью-Йорк: Oxford University Press.
- Астер, Ричард; Борчерс, Брайан; Тербер, Клиффорд (2004), Оценка параметров и обратные задачи , Elsevier
- Стромер, Томас; Вершинин, Роман (2009), «Рандомизированный алгоритм Качмарца для линейных систем с экспоненциальной сходимостью» (PDF) , Журнал анализа и приложений Фурье , 15 (2): 262–278, arXiv : math/0702226 , doi : 10.1007/s00041 -008-9030-4 , S2CID 1903919
- Ниделл, Дина; Сребро, Нати; Уорд, Рэйчел (2015), «Стохастический градиентный спуск, взвешенная выборка и рандомизированный алгоритм Качмарца», Mathematical Programming , 155 (1–2): 549–573, arXiv : 1310.5715 , doi : 10.1007/s10107-015-0864- 7 , С2КИД 2370209
- Цензор, Яир; Герман, Габор ; Цзян, М. (2009), «Заметка о поведении рандомизированного алгоритма Качмарца Стромера и Вершинина», Journal of Fourier Analysis and Applications , 15 (4): 431–436, doi : 10.1007/s00041-009-9077 -x , PMC 2872793 , PMID 20495623
- Стромер, Томас; Вершинин, Роман (2009b), «Комментарии к рандомизированному методу Качмажа», Журнал анализа и приложений Фурье , 15 (4): 437–440, doi : 10.1007/s00041-009-9082-0 , S2CID 14806325
- Басс, Ричард Ф .; Грехениг, Карлхайнц (2013), «Соответствующая выборка функций с ограниченной полосой», Illinois Journal of Mathematics , 57 (1): 43–58, arXiv : 1203.0146 , doi : 10.1215/ijm/1403534485 , S2CID 42705738
- Гордон, Дэн (2017), «Подход к дерандомизации для восстановления сигналов с ограниченной полосой пропускания в широком диапазоне частот случайной выборки», Numerical Algorithms , 77 (4): 1141–1157, doi : 10.1007/s11075-017-0356-3 , S2CID 1794974
- Винь Нгуен, Куанг; Лумбанская тюрьма, Форд (2011), Труды 2-го Международного конгресса по компьютерным приложениям и вычислительной науке 2011 г. , том. 2, Спрингер, стр. 465–469.
- Гауэр, Роберт; Рихтарик, Питер (2015a), «Рандомизированные итеративные методы для линейных систем», SIAM Journal on Matrix Analysis and Applications , 36 (4): 1660–1690, arXiv : 1506.03296 , doi : 10.1137/15M1025487 , S2CID 8215294
- Гауэр, Роберт; Рихтарик, Питер (2015b), «Стохастическое двойное восхождение для решения линейных систем», arXiv : 1512.06890 [ math.NA ]
- Бруст, Йоханнес Дж; Сондерс, Майкл А. (2023), «PLSS: проектируемый решатель линейных систем», SIAM Journal on Scientific Computing , 45 (2): A1012–A1037, arXiv : 2207.07615 , Bibcode : 2023SJSC...45A1012B , doi : 10.1137/22M1509783