Анализ главных компонент L1-нормы
Анализ главных компонент L1-нормы (L1-PCA) — это общий метод многомерного анализа данных. [1] L1-PCA часто предпочтительнее стандартного анализа главных компонентов (PCA) L2-нормы, когда анализируемые данные могут содержать выбросы (ошибочные значения или искажения). [2] [3] [4]
И L1-PCA, и стандартный PCA ищут набор ортогональных направлений (главных компонентов), которые определяют подпространство , в котором представление данных максимизируется в соответствии с выбранным критерием. [5] [6] [7] Стандартный PCA количественно определяет представление данных как совокупность L2-нормы точек данных проекций в подпространство или, что эквивалентно, совокупное евклидово расстояние исходных точек от их представлений, спроецированных в подпространство. Вместо этого L1-PCA использует совокупность L1-нормы проекций точек данных в подпространство. [8] В PCA и L1-PCA количество главных компонент (ПК) меньше ранга анализируемой матрицы, что совпадает с размерностью пространства, определяемого исходными точками данных. Поэтому PCA или L1-PCA обычно используются для уменьшения размерности с целью шумоподавления или сжатия данных. Среди преимуществ стандартного PCA, которые способствовали его высокой популярности, - дешевая вычислительная реализация с помощью разложения по сингулярным значениям (SVD). [9] и статистическая оптимальность, когда набор данных генерируется на основе настоящего многомерного нормального источника данных.
Однако в современных больших наборах данных данные часто содержат поврежденные, ошибочные точки, обычно называемые выбросами. [10] Известно, что стандартный PCA чувствителен к выбросам, даже если они составляют небольшую часть обработанных данных. [11] Причина в том, что формулировка L2-PCA с нормой L2 уделяет особое внимание величине каждой координаты каждой точки данных, в конечном итоге переоценивая периферийные точки, такие как выбросы. С другой стороны, следуя формулировке нормы L1, L1-PCA уделяет линейное внимание координатам каждой точки данных, эффективно ограничивая выбросы. [12]
Формулировка
[ редактировать ]Рассмотрим любую матрицу состоящий из -мерные точки данных. Определять . Для целого числа такой, что , L1-PCA формулируется как: [1]
| ( 1 ) |
Для , ( 1 ) упрощается до нахождения главного компонента L1-нормы (L1-PC) к
| ( 2 ) |
В ( 1 )-( 2 ) L1-норма возвращает сумму абсолютных записей своего аргумента и нормы L2 возвращает сумму квадратов записей своего аргумента. Если заменить в ( 2 ) по норме Фробениуса /L2 , то задача становится стандартной PCA и решается матрицей который содержит доминирующие сингулярные векторы (т.е. сингулярные векторы, соответствующие высшие сингулярные значения ).
Метрику максимизации в ( 2 ) можно расширить как
| ( 3 ) |
Решение
[ редактировать ]Для любой матрицы с , определять как ближайшую (в смысле L2-нормы) матрицу к который имеет ортонормированные столбцы. То есть определить
| ( 4 ) |
Теорема Прокруста [13] [14] утверждает, что если есть СВД , затем .
Маркопулос, Каристинос и Падос [1] показал, что если является точным решением проблемы максимизации бинарной ядерной нормы (BNM).
| ( 5 ) |
затем
| ( 6 ) |
является точным решением L1-PCA в ( 2 ). Ядерная норма in ( 2 ) возвращает сумму сингулярных значений своего матричного аргумента и может быть рассчитана с помощью стандартного SVD. Более того, считается, что для решения L1-PCA , решение БНМ можно получить как
| ( 7 ) |
где возвращает -знаковая матрица своего матричного аргумента (без ограничения общности можно считать ). Кроме того, отсюда следует, что . БНМ в ( 5 ) представляет собой комбинаторную задачу над антиподальными двоичными переменными. Следовательно, ее точное решение может быть найдено путем исчерпывающей оценки всех элементы его набора осуществимости с асимптотической стоимостью . Таким образом, L1-PCA также можно решить с помощью BNM, но с затратами. (экспонента от произведения количества точек данных на количество искомых компонентов). Оказывается, L1-PCA можно решить оптимально (точно) с полиномиальной сложностью по для фиксированного размера данных , . [1]
Для частного случая (один L1-ПК ), BNM принимает форму двоично-квадратичной максимизации (BQM).
| ( 8 ) |
Переход от ( 5 ) к ( 8 ) для верно, поскольку уникальное сингулярное значение равно , для каждого . Тогда, если является решением БКМ в ( 7 ), то верно, что
| ( 9 ) |
это точный L1-ПК , как определено в ( 1 ). Кроме того, он утверждает, что и .
Алгоритмы
[ редактировать ]Точное решение экспоненциальной сложности
[ редактировать ]Как показано выше, точное решение L1-PCA можно получить с помощью следующего двухэтапного процесса:
1. Solve the problem in (5) to obtain . 2. Apply SVD on to obtain .
БНМ в ( 5 ) может быть решена перебором в области со стоимостью .
Точное решение полиномиальной сложности
[ редактировать ]Кроме того, L1-PCA может быть решена оптимально с меньшими затратами. , когда является постоянным относительно (всегда верно для конечной размерности данных ). [1] [15]
Приближенные эффективные решатели
[ редактировать ]В 2008 году Квак [12] предложил итерационный алгоритм приближенного решения L1-PCA для . Позднее этот итерационный метод был обобщен для компоненты. [16] Другой приближенный эффективный решатель был предложен Маккоем и Троппом. [17] с помощью полуопределенного программирования (СДП). Совсем недавно L1-PCA (и BNM в ( 5 )) были эффективно решены с помощью итераций с переворотом битов (алгоритм L1-BF). [8]
Алгоритм L1-BF
[ редактировать ]1 function L1BF(, ): 2 Initialize and 3 Set and 4 Until termination (or iterations) 5 , 6 For 7 , 8 // flip bit 9 // calculated by SVD or faster (see[8]) 10 if 11 , 12 13 end 14 if // no bit was flipped 15 if 16 terminate 17 else 18
Вычислительная стоимость L1-BF составляет . [8]
Сложные данные
[ редактировать ]L1-PCA также был распространен для обработки сложных данных. Для сложного L1-PCA в 2018 году были предложены два эффективных алгоритма. [18]
Тензорные данные
[ редактировать ]L1-PCA также был расширен для анализа тензорных данных в форме L1-Tucker, устойчивого аналога стандартного разложения Такера по норме L1 . [19] Два алгоритма решения задачи L1-Такера — это L1-HOSVD и L1-HOOI. [19] [20] [21]
Код
[ редактировать ]Код MATLAB для L1-PCA доступен в MathWorks. [22]
Ссылки
[ редактировать ]- ^ Перейти обратно: а б с д и Маркопулос, Панос П.; Каристинос, Джордж Н.; Падос, Димитрис А. (октябрь 2014 г.). «Оптимальные алгоритмы обработки сигналов в L1-подпространстве». Транзакции IEEE по обработке сигналов . 62 (19): 5046–5058. arXiv : 1405.6785 . Бибкод : 2014ITSP...62.5046M . дои : 10.1109/TSP.2014.2338077 . S2CID 1494171 .
- ^ Барродейл, И. (1968). «Аппроксимация L1 и анализ данных». Прикладная статистика . 17 (1): 51–57. дои : 10.2307/2985267 . JSTOR 2985267 .
- ^ Барнетт, Вик; Льюис, Тоби (1994). Выбросы в статистических данных (3-е изд.). Чичестер [ua]: Уайли. ISBN 978-0471930945 .
- ^ Канаде, Т.; Ке, Цифа (июнь 2005 г.). «Надежная факторизация нормы L₁ при наличии выбросов и отсутствующих данных с помощью альтернативного выпуклого программирования». 2005 Конференция IEEE Computer Society по компьютерному зрению и распознаванию образов (CVPR'05) . Том. 1. ИИЭР. стр. 739–746. CiteSeerX 10.1.1.63.4605 . дои : 10.1109/CVPR.2005.309 . ISBN 978-0-7695-2372-9 . S2CID 17144854 .
- ^ Джоллифф, IT (2004). Анализ главных компонентов (2-е изд.). Нью-Йорк: Спрингер. ISBN 978-0387954424 .
- ^ Бишоп, Кристофер М. (2007). Распознавание образов и машинное обучение (Корр. полиграфия. Под ред.). Нью-Йорк: Спрингер. ISBN 978-0-387-31073-2 .
- ^ Пирсон, Карл (8 июня 2010 г.). «О линиях и плоскостях, наиболее близких к системам точек пространства» . Лондонский, Эдинбургский и Дублинский философский журнал и научный журнал . 2 (11): 559–572. дои : 10.1080/14786440109462720 . S2CID 125037489 .
- ^ Перейти обратно: а б с д Маркопулос, Панос П.; Кунду, Сандипан; Чамадия, Шубхам; Падос, Димитрис А. (15 августа 2017 г.). «Эффективный анализ главных компонентов L1-нормы посредством перестановки битов». Транзакции IEEE по обработке сигналов . 65 (16): 4252–4264. arXiv : 1610.01959 . Бибкод : 2017ИТСП...65.4252М . дои : 10.1109/TSP.2017.2708023 . S2CID 7931130 .
- ^ Голуб, Джин Х. (апрель 1973 г.). «Некоторые проблемы с модифицированными собственными значениями матрицы». Обзор СИАМ . 15 (2): 318–334. CiteSeerX 10.1.1.454.9868 . дои : 10.1137/1015032 .
- ^ Барнетт, Вик; Льюис, Тоби (1994). Выбросы в статистических данных (3-е изд.). Чичестер [ua]: Уайли. ISBN 978-0471930945 .
- ^ Кандес, Эммануэль Ж.; Ли, Сяодун; Могу ли я; Райт, Джон (1 мая 2011 г.). «Надежный анализ главных компонент?». Журнал АКМ . 58 (3): 1–37. arXiv : 0912.3599 . дои : 10.1145/1970392.1970395 . S2CID 7128002 .
- ^ Перейти обратно: а б Квак, Н. (сентябрь 2008 г.). «Анализ главных компонентов на основе максимизации нормы L1». Транзакции IEEE по анализу шаблонов и машинному интеллекту . 30 (9): 1672–1680. CiteSeerX 10.1.1.333.1176 . дои : 10.1109/TPAMI.2008.114 . ПМИД 18617723 . S2CID 11882870 .
- ^ Элден, Ларс; Пак, Хэсун (1 июня 1999 г.). «Задача Прокруста на многообразии Штифеля». Нумерическая математика . 82 (4): 599–619. CiteSeerX 10.1.1.54.3580 . дои : 10.1007/s002110050432 . S2CID 206895591 .
- ^ Шенеманн, Питер Х. (март 1966 г.). «Обобщенное решение ортогональной проблемы Прокруста». Психометрика . 31 (1): 1–10. дои : 10.1007/BF02289451 . hdl : 10338.dmlcz/103138 . S2CID 121676935 .
- ^ Маркопулос, ПП; Кунду, С; Чамадия, С; Цагкаракис, Н; Падос, Д.А. (2018). «Обработка данных, устойчивая к выбросам, с анализом главных компонентов L1-нормы». Достижения в анализе главных компонентов . стр. 121–135. дои : 10.1007/978-981-10-6704-4_6 . ISBN 978-981-10-6703-7 .
- ^ Не, Ф; Хуанг, Х; Дин, К; Ло, Дицзюнь; Ван, Х. (июль 2011 г.). «Надежный анализ главных компонент с нежадной максимизацией l1-нормы». 22-я Международная совместная конференция по искусственному интеллекту : 1433–1438.
- ^ Маккой, Майкл; Тропп, Джоэл А. (2011). «Два предложения по созданию надежного PCA с использованием полуопределенного программирования». Электронный статистический журнал . 5 : 1123–1160. arXiv : 1012.1086 . дои : 10.1214/11-EJS636 . S2CID 14102421 .
- ^ Цагкаракис, Николас; Маркопулос, Панос П.; Сливанитис, Георгий; Падос, Димитрис А. (15 июня 2018 г.). «Анализ главных компонентов L1-Norm сложных данных». Транзакции IEEE по обработке сигналов . 66 (12): 3256–3267. arXiv : 1708.01249 . Бибкод : 2018ITSP...66.3256T . дои : 10.1109/TSP.2018.2821641 . S2CID 21011653 .
- ^ Перейти обратно: а б Чачлакис, Димитрис Г.; Пратер-Беннетт, Эшли; Маркопулос, Панос П. (22 ноября 2019 г.). «Разложение тензора Такера по норме L1» . Доступ IEEE . 7 : 178454–178465. arXiv : 1904.06455 . дои : 10.1109/ACCESS.2019.2955134 .
- ^ Маркопулос, Панос П.; Чачлакис, Димитрис Г.; Пратер-Беннетт, Эшли (21 февраля 2019 г.). «Разложение по сингулярным значениям высшего порядка L1-нормы». Глобальная конференция IEEE по обработке сигналов и информации (GlobalSIP) 2018 года . стр. 1353–1357. дои : 10.1109/GlobalSIP.2018.8646385 . ISBN 978-1-7281-1295-4 . S2CID 67874182 .
- ^ Маркопулос, Панос П.; Чачлакис, Димитрис Г.; Папалексакис, Евангелос (апрель 2018 г.). «Точное решение разложения TUCKER2 L1-нормы ранга 1». Письма об обработке сигналов IEEE . 25 (4): 511–515. arXiv : 1710.11306 . Бибкод : 2018ISPL...25..511M . дои : 10.1109/ЛСП.2018.2790901 . S2CID 3693326 .
- ^ «L1-PCA Toolbox» . Проверено 21 мая 2018 г.