Разреженное приближение
разреженного приближения (также известная как разреженное представление Теория ) имеет дело с разреженными решениями для систем линейных уравнений . Методы поиска этих решений и их использования в приложениях нашли широкое применение в обработке изображений , обработке сигналов , машинном обучении , медицинской визуализации и многом другом.
Разреженное разложение
[ редактировать ]Бесшумные наблюдения
[ редактировать ]Рассмотрим линейную систему уравнений , где является недоопределенным матрица и . Матрица (обычно считается полным рангом) называется словарем, а является сигналом интереса. Основная проблема разреженного представления определяется как поиск максимально разреженного представления. удовлетворяющий . В связи с неопределённостью характера , эта линейная система допускает, вообще говоря, бесконечно много возможных решений, и среди них мы ищем решение с наименьшим количеством ненулевых значений. Формально мы решаем
где это псевдонорма, которая подсчитывает количество ненулевых компонентов . Эта задача, как известно, является NP-трудной со сведением к NP-полным задачам выбора подмножества в комбинаторной оптимизации .
Редкость подразумевается, что лишь немногие ( ) компоненты в нем ненулевые. Основной мотивацией столь разреженной декомпозиции является желание дать как можно более простое объяснение происходящему. как линейная комбинация как можно меньшего количества столбцов из , также называемые атомами. Таким образом, сигнал можно рассматривать как молекулу, состоящую из нескольких фундаментальных элементов, взятых из .
Хотя поставленная выше задача действительно является NP-сложной, ее решение часто можно найти с помощью аппроксимационных алгоритмов. Одним из таких вариантов является выпуклая релаксация задачи, полученная с помощью -норма вместо , где просто суммирует абсолютные значения записей в . Это известно как алгоритм поиска базиса (BP), который можно обрабатывать с помощью любого решателя линейного программирования . Альтернативный метод аппроксимации — это жадный метод, такой как поиск совпадений (MP), который находит местоположение ненулевых значений по одному.
Удивительно, но в мягких условиях на (используя искру (математика) , взаимную когерентность или свойство ограниченной изометрии ) и уровень разреженности решения, , можно показать, что проблема разреженного представления имеет единственное решение, и BP и MP гарантированно найдут его идеально. [1] [2] [3]
Шумные наблюдения
[ редактировать ]Часто наблюдаемый сигнал шумно. Ослабляя ограничение равенства и вводя -норма для термина подгонки данных, проблема разреженной декомпозиции становится
или представить в лагранжевой форме:
где заменяет .
Как и в бесшумном случае, эти две задачи в целом являются NP-сложными, но их можно аппроксимировать с помощью алгоритмов преследования. Точнее, изменение к -норма, получаем
который известен как базовое подавление шума . Точно так же поиск совпадений можно использовать для аппроксимации решения вышеупомянутых задач, находя местоположения ненулевых значений по одному, пока не будет достигнут порог ошибки. Здесь также теоретические гарантии предполагают, что BP и MP приводят к почти оптимальным решениям в зависимости от свойств и мощность решения . [4] [5] [6] Другой интересный теоретический результат относится к случаю, когда является унитарной матрицей . В этом предположении поставленные выше задачи (как с или ) допускают решения замкнутой формы в виде нелинейной усадки. [4]
Вариации
[ редактировать ]Существует несколько вариантов основной задачи разреженной аппроксимации.
Структурированная разреженность : в исходной версии задачи можно выбрать любой атом в словаре. В структурированной (блочной) модели разреженности вместо индивидуального выбора атомов необходимо выбирать группы из них. Эти группы могут пересекаться и иметь разный размер. Цель состоит в том, чтобы представлять так что он разрежен при создании этой блочной структуры. [7]
Совместное (совместное) разреженное кодирование : исходная версия проблемы определена для одного сигнала. . В модели совместного (совместного) разреженного кодирования доступен набор сигналов, каждый из которых, как полагают, возникает из (почти) одного и того же набора атомов из . В этом случае задача преследования направлена на восстановление набора разреженных представлений, которые лучше всего описывают данные, одновременно заставляя их использовать одну и ту же (или близкую) поддержку. [8]
Другие структуры . В более широком смысле, проблема разреженной аппроксимации может быть поставлена путем навязывания конкретной желаемой структуры шаблону ненулевых местоположений в . Двумя интересными случаями, которые были тщательно изучены, являются древовидная структура и, в более общем плане, распределенная поддержка Больцмана. [9]
Алгоритмы
[ редактировать ]Как уже упоминалось выше, существуют различные алгоритмы аппроксимации (также называемые алгоритмами преследования ), которые были разработаны для решения проблемы разреженного представления:
Ниже мы упомянем некоторые из этих основных методов.
- Поиск совпадений — это жадный итерационный алгоритм для приблизительного решения вышеуказанной проблемы. Он работает путем постепенного поиска местоположений ненулевых значений в по одному. Основная идея состоит в том, чтобы на каждом этапе найти столбец (атом) в который лучше всего коррелирует с текущим остатком (инициализированным ), а затем обновляем этот остаток, чтобы учесть новый атом и его коэффициент. Соответствующее преследование может выбрать один и тот же атом несколько раз.
- Поиск ортогонального сопоставления очень похож на поиск сопоставления, с одним существенным отличием: на каждом этапе алгоритма все ненулевые коэффициенты обновляются методом наименьших квадратов . Как следствие, остаток ортогонален уже выбранным атомам, и, следовательно, атом нельзя выбрать более одного раза.
- Поэтапные жадные методы: улучшенные варианты вышеперечисленных представляют собой алгоритмы, которые работают жадно, добавляя две важные функции: (i) возможность добавлять группы ненулевых значений за раз (вместо одного ненулевого числа за раунд); и (ii) включение этапа обрезки в каждом раунде, на котором несколько атомов удаляются с носителя. Представителями этого подхода являются алгоритм Subspace-Pursuit и CoSaMP. [10]
- Преследование базиса решает выпуклую расслабленную версию задачи, заменяя путем -норм. Обратите внимание, что это только определяет новую цель, оставляя открытым вопрос об алгоритме, который будет использоваться для получения желаемого решения. Обычно такими алгоритмами считаются IRLS , LARS и итеративные методы мягкого сжатия. [11]
- Существует несколько других методов решения задач разреженной декомпозиции: гомотопический метод, координатный спуск , итеративный жесткий порог, проксимальные методы первого порядка , которые родственны вышеупомянутым итеративным алгоритмам мягкого сжатия, и селектор Данцига.
Приложения
[ редактировать ]Идеи и алгоритмы разреженной аппроксимации широко используются в обработке сигналов , обработке изображений , машинном обучении , медицинской визуализации , обработке массивов , интеллектуальном анализе данных и многом другом. В большинстве этих приложений интересующий неизвестный сигнал моделируется как разреженная комбинация нескольких атомов из заданного словаря, и это используется для регуляризации проблемы. Эти проблемы обычно сопровождаются механизмом изучения словаря , который призван соответствовать для наилучшего соответствия модели заданным данным. Использование моделей, основанных на разреженности, привело к получению самых современных результатов в широком спектре приложений. [12] [13] [14] Недавние работы показывают, что существует тесная связь между моделированием разреженного представления и глубоким обучением. [15]
См. также
[ редактировать ]- Сжатое зондирование
- Редкое изучение словаря
- К-СВД
- Лассо (статистика)
- Регуляризация (математика) и обратные задачи
Ссылки
[ редактировать ]- ^ Донохо Д.Л. и Элад М. (2003). «Оптимально разреженное представление в общих (неортогональных) словарях посредством минимизации L1» (PDF) . Труды Национальной академии наук . 100 (5): 2197–2202. Бибкод : 2003PNAS..100.2197D . дои : 10.1073/pnas.0437847100 . ПМК 153464 . ПМИД 16576749 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Тропп, Дж. А. (2004). «Жадность — это хорошо: алгоритмические результаты для разреженной аппроксимации» (PDF) . Транзакции IEEE по теории информации . 50 (10): 2231–2242. CiteSeerX 10.1.1.321.1443 . дои : 10.1109/TIT.2004.834793 . S2CID 675692 .
- ^ Донохо, Д.Л. (2006). «Для большинства больших недоопределенных систем линейных уравнений минимальное решение с нормой l1 также является самым редким решением» (PDF) . Сообщения по чистой и прикладной математике . 56 (6): 797–829. дои : 10.1002/cpa.20132 . S2CID 8510060 .
- ^ Перейти обратно: а б Элад, М. (2010). Разреженные и избыточные представления: от теории к приложениям в обработке сигналов и изображений . Спрингер. CiteSeerX 10.1.1.331.8963 . дои : 10.1007/978-1-4419-7011-4 . ISBN 978-1441970107 .
- ^ Донохо Д.Л., Элад М. и Темпляков В. (2006). «Стабильное восстановление разреженных сверхполных представлений в присутствии шума» (PDF) . Транзакции IEEE по теории информации . 52 (1): 6–18. CiteSeerX 10.1.1.125.5610 . дои : 10.1109/TIT.2005.860430 . S2CID 14813938 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Тропп, Дж. А. (2006). «Просто расслабьтесь: методы выпуклого программирования для выявления редких сигналов в шуме» (PDF) . Транзакции IEEE по теории информации . 52 (3): 1030–1051. CiteSeerX 10.1.1.184.2957 . дои : 10.1109/TIT.2005.864420 . S2CID 6496872 .
- ^ Эльдар Ю.К., Куппингер П. и Больскей Х. (2009). «Разреженные блоки сигналов: отношения неопределенности и эффективное восстановление». Транзакции IEEE по обработке сигналов . 58 (6): 3042–3054. arXiv : 0906.3173 . Бибкод : 2010ITSP...58.3042E . дои : 10.1109/TSP.2010.2044837 . S2CID 335122 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Тропп, Дж. А., Гилберт, А. С. и Штраус, М. Дж. (2006). «Алгоритмы одновременного разреженного приближения. Часть I: Жадное преследование». Обработка сигналов . 86 (3): 572–588. дои : 10.1016/j.sigpro.2005.05.030 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Пелег Т. Эльдар Ю.К. и Элад М. (2012). «Использование статистических зависимостей в разреженных представлениях для восстановления сигналов». Транзакции IEEE по обработке сигналов . 60 (5): 2286–2303. arXiv : 1010.5734 . Бибкод : 2012ITSP...60.2286P . дои : 10.1109/TSP.2012.2188520 . S2CID 3179803 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Ниделл Д. и Тропп Дж. А. (2009). «CoSaMP: итеративное восстановление сигнала из неполных и неточных выборок». Прикладной и вычислительный гармонический анализ . 26 (3): 301–321. arXiv : 0803.2392 . дои : 10.1016/j.acha.2008.07.002 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Зибулевский М. и Элад М. (2010). «Оптимизация L1-L2 при обработке сигналов и изображений» (PDF) . Журнал обработки сигналов IEEE . 27 (3): 76–88. Бибкод : 2010ISPM...27...76Z . дои : 10.1109/MSP.2010.936023 . S2CID 2783691 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Баранюк, Р.Г. Кандес, Э. Элад, М. и Ма, Ю. (2010). «Применение разреженного представления и измерения сжатия». Труды IEEE . 98 (6): 906–909. дои : 10.1109/JPROC.2010.2047424 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Элад, М. Фигейредо, MAT, и Ма, Ю. (2010). «О роли разреженных и избыточных представлений в обработке изображений» (PDF) . Труды IEEE . 98 (6): 972–982. CiteSeerX 10.1.1.160.465 . дои : 10.1109/JPROC.2009.2037655 . S2CID 10992685 . Архивировано из оригинала (PDF) 17 января 2018 г.
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Пламбли, доктор медицинских наук Блюменсат, Т. Доде, Л. Грибонваль, Р. и Дэвис, Мэн (2010). «Разреженные представления в аудио и музыке: от кодирования до разделения источников». Труды IEEE . 98 (6): 995–1005. CiteSeerX 10.1.1.160.1607 . дои : 10.1109/JPROC.2009.2030345 . S2CID 4461063 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Папян, В. Романо, Ю. и Элад, М. (2017). «Анализ сверточных нейронных сетей с помощью сверточного разреженного кодирования» (PDF) . Журнал исследований машинного обучения . 18 (83): 1–52. arXiv : 1607.08194 . Бибкод : 2016arXiv160708194P .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка )