к -СВД
Часть серии о |
Машинное обучение и интеллектуальный анализ данных |
---|
В прикладной математике k - SVD — это алгоритм обучения словаря для создания словаря для разреженных представлений с помощью подхода разложения по сингулярным значениям . k -SVD — это обобщение k метода кластеризации -means , и он работает путем итеративного чередования между разреженным кодированием входных данных на основе текущего словаря и обновлением атомов в словаре для лучшего соответствия данным. Он структурно связан с алгоритмом ожидания-максимизации (EM) . [1] [2] k -SVD широко используется в таких приложениях, как обработка изображений, обработка звука, биология и анализ документов.
k алгоритм -SVD [ править ]
k -SVD является своего рода обобщением k -средних следующим образом. Кластеризацию k -средних можно также рассматривать как метод разреженного представления . То есть поиск наилучшей кодовой книги для представления образцов данных. по ближайшему соседу , решив
что почти эквивалентно
что является k-средством, допускающим «веса».
Буква F обозначает норму Фробениуса . Разреженный термин представления заставляет алгоритм k -means использовать только один атом (столбец) в словаре . Чтобы ослабить это ограничение, цель алгоритма k -SVD состоит в том, чтобы представить сигнал как линейную комбинацию атомов в .
Алгоритм k -SVD следует последовательности построения алгоритма k -means. Однако, в отличие от k -средних, для достижения линейной комбинации атомов в , член разреженности ограничения ослабляется так, что количество ненулевых записей каждого столбца может быть больше 1, но меньше числа .
Таким образом, целевая функция становится
или в другой объективной форме
В алгоритме k -SVD сначала фиксированная и лучшая матрица коэффициентов найден. Как найти действительно оптимальный сложно, мы используем метод поиска аппроксимации. Для расчета коэффициентов можно использовать любой алгоритм, такой как OMP, поиск ортогонального сопоставления , если он может предоставить решение с фиксированным и заранее определенным количеством ненулевых записей. .
После задачи разреженного кодирования следующей задачей является поиск лучшего словаря. . Однако найти весь словарь за раз невозможно, поэтому процесс заключается в обновлении только одного столбца словаря. каждый раз, исправляя . Обновление -й столбец делается путем переписывания срока штрафа как
где обозначает k ю строку X. -
Разложив умножение в сумму матрицы ранга 1, мы можем предположить, что другие условия предполагаются фиксированными, а -th остается неизвестным. После этого шага мы можем решить задачу минимизации, аппроксимировав термин с матрица с использованием разложения по сингулярным значениям , затем обновление с этим. Однако новое решение для вектора не гарантированно будет разреженным.
Чтобы решить эту проблему, определите как
что указывает на примеры которые используют атом (также записи это не ноль). Затем определите как матрица размера , с теми, что на записи и нули в противном случае. При умножении , это сжимает вектор-строку путем отбрасывания нулевых записей. Аналогично, умножение представляет собой подмножество текущих примеров с использованием атом. Тот же эффект можно увидеть на .
Таким образом, проблема минимизации, упомянутая ранее, становится
и это можно сделать напрямую с помощью SVD. СВД разлагается в . Решение для - первый столбец U, вектор коэффициентов в качестве первого столбца . После обновления всего словаря процесс переходит к итеративному решению X, а затем итерационному решению D.
Ограничения [ править ]
Выбор подходящего «словаря» для набора данных является невыпуклой проблемой, и k -SVD работает путем итеративного обновления, которое не гарантирует нахождение глобального оптимума. [2] Однако это характерно для других алгоритмов этой цели, и k -SVD работает на практике довольно хорошо. [2] [ нужен лучший источник ]
См. также [ править ]
- Разреженное приближение
- Разложение по сингулярным значениям
- Матрица норма
- k - означает кластеризацию
- Низкоранговое приближение
Ссылки [ править ]
- ^ Михал Аарон ; Майкл Элад; Альфред Брукштейн (2006), «K-SVD: алгоритм проектирования сверхполных словарей для разреженного представления» (PDF) , IEEE Transactions on Signal Processing , 54 (11): 4311–4322, Bibcode : 2006ITSP...54.4311A , doi : 10.1109/TSP.2006.881199 , S2CID 7477309
- ↑ Перейти обратно: Перейти обратно: а б с Рубинштейн Р., Брукштейн А.М. и Элад М. (2010), «Словари для моделирования разреженных представлений», Proceedings of the IEEE , 98 (6): 1045–1057, CiteSeerX 10.1.1.160.527 , doi : 10.1109 /JPROC.2010.2040551 , S2CID 2176046
{{citation}}
: CS1 maint: несколько имен: список авторов ( ссылка )