Jump to content

Низкоранговое приближение

В математике аппроксимация низкого ранга — это задача минимизации , в которой функция стоимости измеряет соответствие между заданной матрицей (данными) и аппроксимирующей матрицей (переменной оптимизации) при условии, что аппроксимирующая матрица имеет пониженный ранг . Задача используется для математического моделирования и сжатия данных . Ограничение ранга связано с ограничением сложности модели, соответствующей данным. В приложениях часто существуют другие ограничения на аппроксимирующую матрицу, помимо ограничения ранга, например, неотрицательность и структура Ганкеля .

Низкоранговая аппроксимация тесно связана со многими другими методами, включая анализ главных компонентов , факторный анализ , общий метод наименьших квадратов , скрытый семантический анализ , ортогональную регрессию и декомпозицию по динамическому моду .

Определение

[ редактировать ]

Данный

  • спецификация структуры ,
  • вектор параметров структуры ,
  • норма , и
  • желаемый ранг ,

Приложения

[ редактировать ]

Основная задача аппроксимации низкого ранга

[ редактировать ]

Неструктурированная задача с подгонкой, измеряемой нормой Фробениуса , т. е.

имеет аналитическое решение в терминах по сингулярным значениям разложения матрицы данных . Результат называется леммой о матричной аппроксимации или теоремой Эккарта–Янга–Мирского . Первоначально эту проблему решил Эрхард Шмидт. [1] в бесконечномерном контексте интегральных операторов (хотя его методы легко обобщаются на произвольные компактные операторы в гильбертовых пространствах) и позже переоткрыты К. Эккартом и Г. Янгом . [2] Л. Мирский обобщил результат на произвольные унитарно-инвариантные нормы. [3] Позволять

быть разложением по сингулярным значениям , где это прямоугольная диагональная матрица с сингулярными значениями . Для данного , раздел , , и следующее:

где является , является , и является . Тогда ранг- матрица, полученная в результате усеченного разложения по сингулярным значениям

таков, что

Минимизатор уникально тогда и только тогда, когда .

Доказательство теоремы Эккарта–Янга–Мирского (для спектральной нормы )

[ редактировать ]

Позволять быть вещественной (возможно, прямоугольной) матрицей с . Предположим, что

представляет собой по сингулярным значениям разложение . Напомним, что и являются ортогональными матрицами, а это диагональная матрица с элементами такой, что .

Мы утверждаем, что лучший ранг- приближение к в спектральной норме, обозначаемой , определяется

где и обозначают й столбец и , соответственно.

Во-первых, обратите внимание, что мы имеем

Следовательно, нам нужно показать, что если где и иметь столбцы тогда .

С имеет столбцов, то должна существовать нетривиальная линейная комбинация первых столбцы , то есть,

такой, что . Без потери общности мы можем масштабировать так что или (эквивалентно) . Поэтому,

Результат получается, если извлечь квадратный корень из обеих частей приведенного выше неравенства.

Доказательство теоремы Эккарта–Янга–Мирского (для нормы Фробениуса )

[ редактировать ]

Позволять быть вещественной (возможно, прямоугольной) матрицей с . Предположим, что

представляет собой по сингулярным значениям разложение .

Мы утверждаем, что лучший ранг приближение к в норме Фробениуса, обозначаемой , определяется

где и обозначают й столбец и , соответственно.

Во-первых, обратите внимание, что мы имеем

Следовательно, нам нужно показать, что если где и иметь столбцы тогда

По неравенству треугольника со спектральной нормой, если затем . Предполагать и соответственно обозначают ранг приближение к и методом СВД, описанным выше. Тогда для любого

С , когда и мы заключаем, что для

Поэтому,

по мере необходимости.

Взвешенные задачи аппроксимации низкого ранга

[ редактировать ]

Норма Фробениуса равномерно взвешивает все элементы ошибки аппроксимации. . Предварительные знания о распределении ошибок можно принять во внимание, рассматривая задачу взвешенной аппроксимации низкого ранга.

где векторизует матрицу столбец мудрый и — заданная положительно (полу)определенная весовая матрица.

Общая задача взвешенной аппроксимации низкого ранга не допускает аналитического решения в терминах разложения по сингулярным значениям и решается методами локальной оптимизации, не дающими гарантии нахождения глобально оптимального решения.

В случае некоррелированных весов задачу взвешенной аппроксимации низкого ранга также можно сформулировать следующим образом: [4] [5] для неотрицательной матрицы и матрица мы хотим свести к минимуму над матрицами, , ранга не более .

По входу L p задачи аппроксимации низкого ранга

[ редактировать ]

Позволять . Для , самый быстрый алгоритм работает в время. [6] [7] Одна из важных использованных идей называется Oblivious Subspace Embedding (OSE), она впервые была предложена Сарлосом. [8]

Для , известно, что эта норма L1 по входу более устойчива, чем норма Фробениуса при наличии выбросов, и указывается в моделях, где гауссовские предположения о шуме могут не применяться. Естественно стремиться свести к минимуму . [9] Для и , существуют алгоритмы с доказуемыми гарантиями. [10] [11]

Задача аппроксимации низкого ранга по расстоянию

[ редактировать ]

Позволять и — два множества точек в произвольном метрическом пространстве. Позволять представлять матрица где . Такие матрицы расстояний обычно вычисляются в пакетах программного обеспечения и применяются для изучения многообразий изображений, распознавания рукописного текста и многомерного развертывания. Пытаясь уменьшить размер описания, [12] [13] можно изучать аппроксимацию таких матриц низкого ранга.

Распределенная/потоковая задача аппроксимации низкого ранга

[ редактировать ]

Рассмотрены задачи аппроксимации низкого ранга в распределенной и потоковой постановке. [14]

Представления изображений и ядер ограничений ранга

[ редактировать ]

Используя эквивалентности

и

задача взвешенной аппроксимации низкого ранга становится эквивалентной задачам оптимизации параметров

и

где - единичная матрица размера .

Алгоритм альтернативных проекций

[ редактировать ]

Изображение ограничения ранга предлагает метод оптимизации параметров, в котором функция стоимости минимизируется альтернативно по одной из переменных ( или ) с другим фиксированным. Хотя одновременная минимизация по обоим и представляет собой сложную задачу двояковыпуклой оптимизации , минимизация только по одной из переменных представляет собой линейную задачу наименьших квадратов и может быть решена глобально и эффективно.

Полученный алгоритм оптимизации (называемый альтернативными проекциями) глобально сходится с линейной скоростью сходимости к локально оптимальному решению взвешенной задачи аппроксимации низкого ранга. Начальное значение для (или ) параметр должен быть задан. Итерация останавливается, когда удовлетворяется определенное пользователем условие сходимости.

Реализация в Matlab алгоритма переменных проекций для взвешенной низкоранговой аппроксимации:

function [dh, f] = wlra_ap(d, w, p, tol, maxiter)
[m, n] = size(d); r = size(p, 2); f = inf;
for i = 2:maxiter
    % minimization over L
    bp = kron(eye(n), p);
    vl = (bp' * w * bp) \ bp' * w * d(:);
    l  = reshape(vl, r, n);
    % minimization over P
    bl = kron(l', eye(m));
    vp = (bl' * w * bl) \ bl' * w * d(:);
    p  = reshape(vp, m, r);
    % check exit condition
    dh = p * l; dd = d - dh;
    f(i) = dd(:)' * w * dd(:);
    if abs(f(i - 1) - f(i)) < tol, break, end
endfor

Алгоритм переменных проекций

[ редактировать ]

Алгоритм альтернативных проекций использует тот факт, что задача аппроксимации низкого ранга, параметризованная в форме изображения, является билинейной по переменным или . Билинейный характер задачи эффективно используется в альтернативном подходе, называемом переменными проекциями. [15]

Рассмотрим снова взвешенную задачу аппроксимации низкого ранга, параметризованную в форме изображения. Минимизация по отношению к переменной (линейная задача наименьших квадратов) приводит к замкнутому выражению ошибки аппроксимации как функции

Таким образом, исходная задача эквивалентна нелинейной задаче наименьших квадратов минимизации относительно . стандартные методы оптимизации, например алгоритм Левенберга-Марквардта Для этой цели можно использовать .

Реализация в Matlab алгоритма переменных проекций для взвешенной низкоранговой аппроксимации:

function [dh, f] = wlra_varpro(d, w, p, tol, maxiter)
prob = optimset(); prob.solver = 'lsqnonlin';
prob.options = optimset('MaxIter', maxiter, 'TolFun', tol); 
prob.x0 = p; prob.objective = @(p) cost_fun(p, d, w);
[p, f ] = lsqnonlin(prob); 
[f, vl] = cost_fun(p, d, w); 
dh = p * reshape(vl, size(p, 2), size(d, 2));

function [f, vl] = cost_fun(p, d, w)
bp = kron(eye(size(d, 2)), p);
vl = (bp' * w * bp) \ bp' * w * d(:);
f = d(:)' * w * (d(:) - bp * vl);

Подход переменных проекций может быть применен также к задачам аппроксимации низкого ранга, параметризованным в форме ядра. Метод эффективен, когда количество исключаемых переменных значительно превышает количество переменных оптимизации, оставшихся на этапе нелинейной минимизации методом наименьших квадратов. Такие проблемы возникают при идентификации системы, параметризованной в форме ядра, где исключенные переменные являются аппроксимирующей траекторией, а оставшиеся переменные являются параметрами модели. В контексте линейных стационарных систем шаг исключения эквивалентен сглаживанию Калмана .

Вариант: выпукло-ограниченная аппроксимация низкого ранга.

[ редактировать ]

Обычно мы хотим, чтобы наше новое решение не только имело низкий ранг, но и удовлетворяло другим выпуклым ограничениям, связанным с требованиями приложения. Наша интересующая проблема будет заключаться в следующем:

Эта задача имеет множество реальных приложений, в том числе для восстановления хорошего решения из неточного (полуопределенного программирования) релаксации. Если дополнительное ограничение является линейным, поскольку мы требуем, чтобы все элементы были неотрицательными, проблема называется структурированной аппроксимацией низкого ранга. [16] Более общая форма называется выпукло-ограниченной аппроксимацией низкого ранга.

Эта задача помогает решить многие проблемы. Однако это сложно из-за сочетания выпуклых и невыпуклых (низкоранговых) ограничений. Различные методы были разработаны на основе различных реализаций . Однако метод множителей чередующегося направления (ADMM) можно применить для решения невыпуклой задачи с выпуклой целевой функцией, ранговыми ограничениями и другими выпуклыми ограничениями. [17] и, таким образом, подходит для решения нашей вышеуказанной проблемы. Более того, в отличие от общих невыпуклых задач, ADMM гарантирует сходимость допустимого решения, если его двойственная переменная сходится на итерациях.

См. также

[ редактировать ]
  1. ^ Э. Шмидт, К теории линейных и нелинейных интегральных уравнений, Math. 63 (1907), 433-476. два : 10.1007/BF01449770
  2. ^ К. Эккарт, Г. Янг, Приближение одной матрицы другой более низкого ранга. Психометрика, том 1, 1936, страницы 211–8. дои : 10.1007/BF02288367
  3. ^ Л. Мирский, Симметричные калибровочные функции и унитарно-инвариантные нормы, QJ Math. 11 (1960), 50–59. дои : 10.1093/qmath/11.1.50
  4. ^ Сребро, Натан; Яаккола, Томми (2003). Взвешенные низкоранговые аппроксимации (PDF) . ICML'03.
  5. ^ Разенштейн, Илья; Сун, Чжао; Вудрафф, Дэвид П. (2016). Взвешенные аппроксимации низкого ранга с доказуемыми гарантиями . STOC '16 Материалы сорок восьмого ежегодного симпозиума ACM по теории вычислений.
  6. ^ Кларксон, Кеннет Л.; Вудрафф, Дэвид П. (2013). Низкоранговая аппроксимация и регрессия во времени разреженности входных данных . STOC '13 Материалы сорок пятого ежегодного симпозиума ACM по теории вычислений. arXiv : 1207.6365 .
  7. ^ Нельсон, Джелани; Нгуен, Хай Л. (2013). OSNAP: более быстрые алгоритмы числовой линейной алгебры с помощью более разреженных вложений подпространства . ФОКС '13. arXiv : 1211.1002 .
  8. ^ Сарлос, Тамас (2006). Улучшенные алгоритмы аппроксимации больших матриц с помощью случайных проекций . ФОКС'06.
  9. ^ Сун, Чжао; Вудрафф, Дэвид П.; Чжун, Пейлинь (2017). Аппроксимация низкого ранга с погрешностью нормы L1 . STOC '17 Материалы сорок девятого ежегодного симпозиума ACM по теории вычислений. arXiv : 1611.00898 .
  10. ^ Брингманн, Карл; Колев, Павел; Вудрафф, Дэвид П. (2017). Алгоритмы аппроксимации L0-низкоранговой аппроксимации . НИПС'17. arXiv : 1710.11253 .
  11. ^ Кьерикетти, Флавио; Голлапуди, Шринивас; Кумар, Рави; Латтанци, Сильвио; Паниграхи, Рина; Вудрафф, Дэвид П. (2017). Алгоритмы Lp-аппроксимации низкого ранга . ICML'17. arXiv : 1705.06730 .
  12. ^ Бакши, Айнеш Л.; Вудрафф, Дэвид П. (2018). Низкоранговая аппроксимация матриц расстояний сублинейным временем . НейрИПС. arXiv : 1809.06986 .
  13. ^ Индик, Петр; Вакилиан, Али; Вагнер, Таль; Вудрафф, Дэвид П. (2019). Выборочно-оптимальная низкоранговая аппроксимация матриц расстояний . КОЛЬТ.
  14. ^ Буцидис, Христос; Вудрафф, Дэвид П.; Чжун, Пейлинь (2016). Оптимальный анализ главных компонентов в распределенных и потоковых моделях . СТОК. arXiv : 1504.06729 .
  15. ^ Г. Голуб и В. Перейра, Сепарабельный нелинейный метод наименьших квадратов: метод переменной проекции и его приложения, Институт физики, обратные задачи, том 19, 2003, страницы 1-26.
  16. ^ Чу, Муди Т.; Фундерлик, Роберт Э.; Племмонс, Роберт Дж. (2003). «структурированное низкоранговое приближение» . Линейная алгебра и ее приложения . 366 : 157–172. дои : 10.1016/S0024-3795(02)00505-0 .
  17. ^ «Общая система эвристического решения выпуклых задач над невыпуклыми множествами» (PDF) .
  • М. Т. Чу, Р. Э. Фундерлик, Р. Дж. Племмонс, Структурированная аппроксимация низкого ранга, Линейная алгебра и ее приложения, том 366, 1 июня 2003 г., страницы 157–172 два : 10.1016/S0024-3795(02)00505-0
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 636c9d678efd538f47718bd089ea9beb__1720284240
URL1:https://arc.ask3.ru/arc/aa/63/eb/636c9d678efd538f47718bd089ea9beb.html
Заголовок, (Title) документа по адресу, URL1:
Low-rank approximation - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)