Jump to content

Аппроксимация матрицы CUR

Аппроксимация матрицы CUR — это набор из трех матриц , которые при умножении вместе точно аппроксимируют данную матрицу. [1] [2] [3] Приближение CUR можно использовать так же, как аппроксимацию низкого ранга сингулярного разложения (SVD). Приближения CUR менее точны, чем SVD, но они предлагают два ключевых преимущества, оба из которых связаны с тем, что строки и столбцы берутся из исходной матрицы (а не из левого и правого сингулярных векторов):

  • Существуют методы его расчета с меньшей асимптотической временной сложностью по сравнению с SVD.
  • Матрицы более интерпретируемы; Значения строк и столбцов в разложенной матрице по существу такие же, как и их значения в исходной матрице.

Формально, аппроксимация матрицы CUR матрицы A — это три матрицы C , U и R, такие, что C состоит из столбцов A , R состоит из строк A и что произведение CUR близко аппроксимирует A. , Обычно CUR выбирается как аппроксимация ранга - k , что означает, что содержит k столбцов A , R содержит k строк A , а U - матрица k -k C . Существует множество возможных аппроксимаций матрицы CUR и множество аппроксимаций матрицы CUR для данного ранга.

Приближение матрицы CUR часто [ нужна ссылка ] используется вместо низкоранговой аппроксимации SVD в анализе главных компонент . CUR менее точен, но столбцы матрицы C берутся из A а строки R — из A. , В PCA каждый столбец A содержит выборку данных; таким образом, матрица C состоит из подмножества выборок данных. Это гораздо легче интерпретировать, чем левые сингулярные векторы SVD, которые представляют данные во повернутом пространстве. Аналогично, матрица R состоит из подмножества переменных, измеренных для каждой выборки данных. Это легче понять, чем правые сингулярные векторы SVD, которые представляют собой еще одно вращение данных в пространстве.

Математическое определение

[ редактировать ]

Хамм и Хуанг [4] дает следующую теорему, описывающую основы CUR-разложения матрицы со званием :

Теорема: рассмотрим индексы строк и столбцов. с .Обозначим подматрицы и .Если ранг( ) = ранг( ), затем , где обозначает псевдообратную функцию Мура–Пенроуза .

Другими словами, если имеет низкий ранг, мы можем взять подматрицу одного и того же ранга вместе с некоторыми рядами и столбцы из и использовать их для восстановления .

Алгоритмы

[ редактировать ]

Приближение матрицы CUR не уникально, и существует несколько алгоритмов его вычисления. Один из них — АЛГОРИТМКУР. [1]

Алгоритм «Линейное время CUR» [5] просто выбирает J путем случайной выборки столбцов (с заменой) с вероятностью, пропорциональной нормам столбцов в квадрате, ; и аналогичным образом выборка I пропорциональна нормам квадратов строк, .Авторы показывают, чтопринимая и где , алгоритм достигает границы ошибки Фробениуса , где — оптимальное приближение ранга k .

Разложение тензора-CURT [6] является обобщением разложения матрицы по CUR. Формально тензорная аппроксимация CURT тензора A представляет собой три матрицы и (ядерный) тензор C , R , T и U такой, что C состоит из столбцов A , R состоит из строк A , T состоит из трубок A U(C,R, T и что произведение ) (где -я запись это ) близко приближается к A . Обычно CURT выбирается как аппроксимация ранга - k , что означает, что содержит k столбцов A , R содержит k строк A , T содержит трубки A и U собой k -k -k C представляет (ядро -)тензор.

См. также

[ редактировать ]
  1. ^ Jump up to: а б Майкл В. Махони; Петрос Дринеас. «Разложение матрицы CUR для улучшения анализа данных» . Проверено 26 июня 2012 г.
  2. ^ Буцидис, Христос; Вудрафф, Дэвид П. (2014). Оптимальные разложения матрицы CUR . STOC '14 Материалы сорок шестого ежегодного симпозиума ACM по теории вычислений.
  3. ^ Сун, Чжао; Вудрафф, Дэвид П.; Чжун, Пейлинь (2017). Аппроксимация низкого ранга с погрешностью нормы L1 . STOC '17 Материалы сорок девятого ежегодного симпозиума ACM по теории вычислений. arXiv : 1611.00898 .
  4. ^ Китон Хэмм и Лунсю Хуан. Перспективы разложения CUR. Прикладной и вычислительный гармонический анализ, 48(3):1088–1099, 2020.
  5. ^ Дриней, Петрос; Каннан, Рави; Махони, Майкл В. (1 января 2006 г.). «Алгоритмы быстрого Монте-Карло для матриц I: аппроксимация умножения матриц» . SIAM Journal по вычислительной технике . 36 (1): 132–157. дои : 10.1137/S0097539704442684 . ISSN   0097-5397 .
  6. ^ Сун, Чжао; Вудрафф, Дэвид П.; Чжун, Пейлинь (2017). «Приближение низкого ранга относительного тензора ошибок». arXiv : 1704.08246 [ cs.DS ].
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 32c498eebed4067c9d2ba21f9edcfad4__1708868640
URL1:https://arc.ask3.ru/arc/aa/32/d4/32c498eebed4067c9d2ba21f9edcfad4.html
Заголовок, (Title) документа по адресу, URL1:
CUR matrix approximation - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)