Аппроксимация матрицы CUR
Аппроксимация матрицы CUR — это набор из трех матриц , которые при умножении вместе точно аппроксимируют данную матрицу. [1] [2] [3] Приближение CUR можно использовать так же, как аппроксимацию низкого ранга сингулярного разложения (SVD). Приближения CUR менее точны, чем SVD, но они предлагают два ключевых преимущества, оба из которых связаны с тем, что строки и столбцы берутся из исходной матрицы (а не из левого и правого сингулярных векторов):
- Существуют методы его расчета с меньшей асимптотической временной сложностью по сравнению с SVD.
- Матрицы более интерпретируемы; Значения строк и столбцов в разложенной матрице по существу такие же, как и их значения в исходной матрице.
Формально, аппроксимация матрицы CUR матрицы A — это три матрицы C , U и R, такие, что C состоит из столбцов A , R состоит из строк A и что произведение CUR близко аппроксимирует A. , Обычно CUR выбирается как аппроксимация ранга - k , что означает, что содержит k столбцов A , R содержит k строк A , а U - матрица k -k C . Существует множество возможных аппроксимаций матрицы CUR и множество аппроксимаций матрицы CUR для данного ранга.
Приближение матрицы CUR часто [ нужна ссылка ] используется вместо низкоранговой аппроксимации SVD в анализе главных компонент . CUR менее точен, но столбцы матрицы C берутся из A а строки R — из A. , В PCA каждый столбец A содержит выборку данных; таким образом, матрица C состоит из подмножества выборок данных. Это гораздо легче интерпретировать, чем левые сингулярные векторы SVD, которые представляют данные во повернутом пространстве. Аналогично, матрица R состоит из подмножества переменных, измеренных для каждой выборки данных. Это легче понять, чем правые сингулярные векторы SVD, которые представляют собой еще одно вращение данных в пространстве.
Математическое определение
[ редактировать ]Хамм и Хуанг [4] дает следующую теорему, описывающую основы CUR-разложения матрицы со званием :
Теорема: рассмотрим индексы строк и столбцов. с .Обозначим подматрицы и .Если ранг( ) = ранг( ), затем , где обозначает псевдообратную функцию Мура–Пенроуза .
Другими словами, если имеет низкий ранг, мы можем взять подматрицу одного и того же ранга вместе с некоторыми рядами и столбцы из и использовать их для восстановления .
Алгоритмы
[ редактировать ]Приближение матрицы CUR не уникально, и существует несколько алгоритмов его вычисления. Один из них — АЛГОРИТМКУР. [1]
Алгоритм «Линейное время CUR» [5] просто выбирает J путем случайной выборки столбцов (с заменой) с вероятностью, пропорциональной нормам столбцов в квадрате, ; и аналогичным образом выборка I пропорциональна нормам квадратов строк, .Авторы показывают, чтопринимая и где , алгоритм достигает границы ошибки Фробениуса , где — оптимальное приближение ранга k .
Тензор
[ редактировать ]Разложение тензора-CURT [6] является обобщением разложения матрицы по CUR. Формально тензорная аппроксимация CURT тензора A представляет собой три матрицы и (ядерный) тензор C , R , T и U такой, что C состоит из столбцов A , R состоит из строк A , T состоит из трубок A U(C,R, T и что произведение ) (где -я запись это ) близко приближается к A . Обычно CURT выбирается как аппроксимация ранга - k , что означает, что содержит k столбцов A , R содержит k строк A , T содержит трубки A и U собой k -k -k C представляет (ядро -)тензор.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б Майкл В. Махони; Петрос Дринеас. «Разложение матрицы CUR для улучшения анализа данных» . Проверено 26 июня 2012 г.
- ^ Буцидис, Христос; Вудрафф, Дэвид П. (2014). Оптимальные разложения матрицы CUR . STOC '14 Материалы сорок шестого ежегодного симпозиума ACM по теории вычислений.
- ^ Сун, Чжао; Вудрафф, Дэвид П.; Чжун, Пейлинь (2017). Аппроксимация низкого ранга с погрешностью нормы L1 . STOC '17 Материалы сорок девятого ежегодного симпозиума ACM по теории вычислений. arXiv : 1611.00898 .
- ^ Китон Хэмм и Лунсю Хуан. Перспективы разложения CUR. Прикладной и вычислительный гармонический анализ, 48(3):1088–1099, 2020.
- ^ Дриней, Петрос; Каннан, Рави; Махони, Майкл В. (1 января 2006 г.). «Алгоритмы быстрого Монте-Карло для матриц I: аппроксимация умножения матриц» . SIAM Journal по вычислительной технике . 36 (1): 132–157. дои : 10.1137/S0097539704442684 . ISSN 0097-5397 .
- ^ Сун, Чжао; Вудрафф, Дэвид П.; Чжун, Пейлинь (2017). «Приближение низкого ранга относительного тензора ошибок». arXiv : 1704.08246 [ cs.DS ].