Jump to content

Анализ главных компонент L1-нормы

L1-PCA по сравнению с PCA. Номинальные данные (синие точки); выброс (красная точка); ПК (черная линия); L1-ПК (красная линия); номинальная линия максимального отклонения (пунктирная линия).

Анализ главных компонент L1-нормы (L1-PCA) — это общий метод многомерного анализа данных. [1] L1-PCA часто предпочтительнее стандартного анализа главных компонентов (PCA) L2-нормы, когда анализируемые данные могут содержать выбросы (ошибочные значения или искажения). [2] [3] [4]

И L1-PCA, и стандартный PCA ищут набор ортогональных направлений (главных компонентов), которые определяют подпространство , в котором представление данных максимизируется в соответствии с выбранным критерием. [5] [6] [7] Стандартный PCA количественно определяет представление данных как совокупность L2-нормы точек данных проекций в подпространство или, что эквивалентно, совокупное евклидово расстояние исходных точек от их представлений, спроецированных в подпространство. Вместо этого L1-PCA использует совокупность L1-нормы проекций точек данных в подпространство. [8] В PCA и L1-PCA количество главных компонент (ПК) меньше ранга анализируемой матрицы, что совпадает с размерностью пространства, определяемого исходными точками данных. Поэтому PCA или L1-PCA обычно используются для уменьшения размерности с целью шумоподавления или сжатия данных. Среди преимуществ стандартного PCA, которые способствовали его высокой популярности, - дешевая вычислительная реализация с помощью разложения по сингулярным значениям (SVD). [9] и статистическая оптимальность, когда набор данных генерируется на основе настоящего многомерного нормального источника данных.

Однако в современных больших наборах данных данные часто содержат поврежденные, ошибочные точки, обычно называемые выбросами. [10] Известно, что стандартный PCA чувствителен к выбросам, даже если они составляют небольшую часть обработанных данных. [11] Причина в том, что формулировка L2-PCA с нормой L2 уделяет особое внимание величине каждой координаты каждой точки данных, в конечном итоге переоценивая периферийные точки, такие как выбросы. С другой стороны, следуя формулировке нормы L1, L1-PCA уделяет линейное внимание координатам каждой точки данных, эффективно ограничивая выбросы. [12]

Формулировка

[ редактировать ]

Рассмотрим любую матрицу состоящий из -мерные точки данных. Определять . Для целого числа такой, что , L1-PCA формулируется как: [1]

( 1 )

Для , ( 1 ) упрощается до нахождения главного компонента L1-нормы (L1-PC) к

( 2 )

В ( 1 )-( 2 ) L1-норма возвращает сумму абсолютных записей своего аргумента и нормы L2 возвращает сумму квадратов записей своего аргумента. Если заменить в ( 2 ) по норме Фробениуса /L2 , то задача становится стандартной PCA и решается матрицей который содержит доминирующие сингулярные векторы (т.е. сингулярные векторы, соответствующие высшие сингулярные значения ).

Метрику максимизации в ( 2 ) можно расширить как

( 3 )

Для любой матрицы с , определять как ближайшую (в смысле L2-нормы) матрицу к который имеет ортонормированные столбцы. То есть определить

( 4 )

Теорема Прокруста [13] [14] утверждает, что если есть СВД , затем .

Маркопулос, Каристинос и Падос [1] показал, что если является точным решением проблемы максимизации бинарной ядерной нормы (BNM).

( 5 )

затем

( 6 )

является точным решением L1-PCA в ( 2 ). Ядерная норма in ( 2 ) возвращает сумму сингулярных значений своего матричного аргумента и может быть рассчитана с помощью стандартного SVD. Более того, считается, что для решения L1-PCA , решение БНМ можно получить как

( 7 )

где возвращает -знаковая матрица своего матричного аргумента (без ограничения общности можно считать ). Кроме того, отсюда следует, что . БНМ в ( 5 ) представляет собой комбинаторную задачу над антиподальными двоичными переменными. Следовательно, ее точное решение может быть найдено путем исчерпывающей оценки всех элементы его набора осуществимости с асимптотической стоимостью . Таким образом, L1-PCA также можно решить с помощью BNM, но с затратами. (экспонента от произведения количества точек данных на количество искомых компонентов). Оказывается, L1-PCA можно решить оптимально (точно) с полиномиальной сложностью по для фиксированного размера данных , . [1]

Для частного случая (один L1-ПК ), BNM принимает форму двоично-квадратичной максимизации (BQM).

( 8 )

Переход от ( 5 ) к ( 8 ) для верно, поскольку уникальное сингулярное значение равно , для каждого . Тогда, если является решением БКМ в ( 7 ), то верно, что

( 9 )

это точный L1-ПК , как определено в ( 1 ). Кроме того, он утверждает, что и .

Алгоритмы

[ редактировать ]

Точное решение экспоненциальной сложности

[ редактировать ]

Как показано выше, точное решение L1-PCA можно получить с помощью следующего двухэтапного процесса:

1. Solve the problem in (5) to obtain .
2. Apply SVD on  to obtain .

БНМ в ( 5 ) может быть решена перебором в области со стоимостью .

Точное решение полиномиальной сложности

[ редактировать ]

Кроме того, L1-PCA может быть решена оптимально с меньшими затратами. , когда является постоянным относительно (всегда верно для конечной размерности данных ). [1] [15]

Приближенные эффективные решатели

[ редактировать ]

В 2008 году Квак [12] предложил итерационный алгоритм приближенного решения L1-PCA для . Позднее этот итерационный метод был обобщен для компоненты. [16] Другой приближенный эффективный решатель был предложен Маккоем и Троппом. [17] с помощью полуопределенного программирования (СДП). Совсем недавно L1-PCA (и BNM в ( 5 )) были эффективно решены с помощью итераций с переворотом битов (алгоритм L1-BF). [8]

Алгоритм L1-BF

[ редактировать ]
 1  function L1BF(, ):
 2      Initialize  and 
 3      Set  and 
 4      Until termination (or  iterations)
 5          , 
 6          For 
 7              , 
 8                              // flip bit
 9                             // calculated by SVD or faster (see[8])
10              if 
11                  , 
12                  
13              end
14              if                     // no bit was flipped
15                  if 
16                      terminate
17                  else
18                      

Вычислительная стоимость L1-BF составляет . [8]

Сложные данные

[ редактировать ]

L1-PCA также был распространен для обработки сложных данных. Для сложного L1-PCA в 2018 году были предложены два эффективных алгоритма. [18]

Тензорные данные

[ редактировать ]

L1-PCA также был расширен для анализа тензорных данных в форме L1-Tucker, устойчивого аналога стандартного разложения Такера по норме L1 . [19] Два алгоритма решения задачи L1-Такера — это L1-HOSVD и L1-HOOI. [19] [20] [21]

Код MATLAB для L1-PCA доступен в MathWorks. [22]

  1. ^ Перейти обратно: а б с д и Маркопулос, Панос П.; Каристинос, Джордж Н.; Падос, Димитрис А. (октябрь 2014 г.). «Оптимальные алгоритмы обработки сигналов в L1-подпространстве». Транзакции IEEE по обработке сигналов . 62 (19): 5046–5058. arXiv : 1405.6785 . Бибкод : 2014ITSP...62.5046M . дои : 10.1109/TSP.2014.2338077 . S2CID   1494171 .
  2. ^ Барродейл, И. (1968). «Аппроксимация L1 и анализ данных». Прикладная статистика . 17 (1): 51–57. дои : 10.2307/2985267 . JSTOR   2985267 .
  3. ^ Барнетт, Вик; Льюис, Тоби (1994). Выбросы в статистических данных (3-е изд.). Чичестер [ua]: Уайли. ISBN  978-0471930945 .
  4. ^ Канаде, Т.; Ке, Цифа (июнь 2005 г.). «Надежная факторизация нормы L₁ при наличии выбросов и отсутствующих данных с помощью альтернативного выпуклого программирования». 2005 Конференция IEEE Computer Society по компьютерному зрению и распознаванию образов (CVPR'05) . Том. 1. ИИЭР. стр. 739–746. CiteSeerX   10.1.1.63.4605 . дои : 10.1109/CVPR.2005.309 . ISBN  978-0-7695-2372-9 . S2CID   17144854 .
  5. ^ Джоллифф, IT (2004). Анализ главных компонентов (2-е изд.). Нью-Йорк: Спрингер. ISBN  978-0387954424 .
  6. ^ Бишоп, Кристофер М. (2007). Распознавание образов и машинное обучение (Корр. полиграфия. Под ред.). Нью-Йорк: Спрингер. ISBN  978-0-387-31073-2 .
  7. ^ Пирсон, Карл (8 июня 2010 г.). «О линиях и плоскостях, наиболее близких к системам точек пространства» . Лондонский, Эдинбургский и Дублинский философский журнал и научный журнал . 2 (11): 559–572. дои : 10.1080/14786440109462720 . S2CID   125037489 .
  8. ^ Перейти обратно: а б с д Маркопулос, Панос П.; Кунду, Сандипан; Чамадия, Шубхам; Падос, Димитрис А. (15 августа 2017 г.). «Эффективный анализ главных компонентов L1-нормы посредством перестановки битов». Транзакции IEEE по обработке сигналов . 65 (16): 4252–4264. arXiv : 1610.01959 . Бибкод : 2017ИТСП...65.4252М . дои : 10.1109/TSP.2017.2708023 . S2CID   7931130 .
  9. ^ Голуб, Джин Х. (апрель 1973 г.). «Некоторые проблемы с модифицированными собственными значениями матрицы». Обзор СИАМ . 15 (2): 318–334. CiteSeerX   10.1.1.454.9868 . дои : 10.1137/1015032 .
  10. ^ Барнетт, Вик; Льюис, Тоби (1994). Выбросы в статистических данных (3-е изд.). Чичестер [ua]: Уайли. ISBN  978-0471930945 .
  11. ^ Кандес, Эммануэль Ж.; Ли, Сяодун; Могу ли я; Райт, Джон (1 мая 2011 г.). «Надежный анализ главных компонент?». Журнал АКМ . 58 (3): 1–37. arXiv : 0912.3599 . дои : 10.1145/1970392.1970395 . S2CID   7128002 .
  12. ^ Перейти обратно: а б Квак, Н. (сентябрь 2008 г.). «Анализ главных компонентов на основе максимизации нормы L1». Транзакции IEEE по анализу шаблонов и машинному интеллекту . 30 (9): 1672–1680. CiteSeerX   10.1.1.333.1176 . дои : 10.1109/TPAMI.2008.114 . ПМИД   18617723 . S2CID   11882870 .
  13. ^ Элден, Ларс; Пак, Хэсун (1 июня 1999 г.). «Задача Прокруста на многообразии Штифеля». Нумерическая математика . 82 (4): 599–619. CiteSeerX   10.1.1.54.3580 . дои : 10.1007/s002110050432 . S2CID   206895591 .
  14. ^ Шенеманн, Питер Х. (март 1966 г.). «Обобщенное решение ортогональной проблемы Прокруста». Психометрика . 31 (1): 1–10. дои : 10.1007/BF02289451 . hdl : 10338.dmlcz/103138 . S2CID   121676935 .
  15. ^ Маркопулос, ПП; Кунду, С; Чамадия, С; Цагкаракис, Н; Падос, Д.А. (2018). «Обработка данных, устойчивая к выбросам, с анализом главных компонентов L1-нормы». Достижения в анализе главных компонентов . стр. 121–135. дои : 10.1007/978-981-10-6704-4_6 . ISBN  978-981-10-6703-7 .
  16. ^ Не, Ф; Хуанг, Х; Дин, К; Ло, Дицзюнь; Ван, Х. (июль 2011 г.). «Надежный анализ главных компонент с нежадной максимизацией l1-нормы». 22-я Международная совместная конференция по искусственному интеллекту : 1433–1438.
  17. ^ Маккой, Майкл; Тропп, Джоэл А. (2011). «Два предложения по созданию надежного PCA с использованием полуопределенного программирования». Электронный статистический журнал . 5 : 1123–1160. arXiv : 1012.1086 . дои : 10.1214/11-EJS636 . S2CID   14102421 .
  18. ^ Цагкаракис, Николас; Маркопулос, Панос П.; Сливанитис, Георгий; Падос, Димитрис А. (15 июня 2018 г.). «Анализ главных компонентов L1-Norm сложных данных». Транзакции IEEE по обработке сигналов . 66 (12): 3256–3267. arXiv : 1708.01249 . Бибкод : 2018ITSP...66.3256T . дои : 10.1109/TSP.2018.2821641 . S2CID   21011653 .
  19. ^ Перейти обратно: а б Чачлакис, Димитрис Г.; Пратер-Беннетт, Эшли; Маркопулос, Панос П. (22 ноября 2019 г.). «Разложение тензора Такера по норме L1» . Доступ IEEE . 7 : 178454–178465. arXiv : 1904.06455 . дои : 10.1109/ACCESS.2019.2955134 .
  20. ^ Маркопулос, Панос П.; Чачлакис, Димитрис Г.; Пратер-Беннетт, Эшли (21 февраля 2019 г.). «Разложение по сингулярным значениям высшего порядка L1-нормы». Глобальная конференция IEEE по обработке сигналов и информации (GlobalSIP) 2018 года . стр. 1353–1357. дои : 10.1109/GlobalSIP.2018.8646385 . ISBN  978-1-7281-1295-4 . S2CID   67874182 .
  21. ^ Маркопулос, Панос П.; Чачлакис, Димитрис Г.; Папалексакис, Евангелос (апрель 2018 г.). «Точное решение разложения TUCKER2 L1-нормы ранга 1». Письма об обработке сигналов IEEE . 25 (4): 511–515. arXiv : 1710.11306 . Бибкод : 2018ISPL...25..511M . дои : 10.1109/ЛСП.2018.2790901 . S2CID   3693326 .
  22. ^ «L1-PCA Toolbox» . Проверено 21 мая 2018 г.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 381965ecdc5c82fc063ba565f7681fed__1715207340
URL1:https://arc.ask3.ru/arc/aa/38/ed/381965ecdc5c82fc063ba565f7681fed.html
Заголовок, (Title) документа по адресу, URL1:
L1-norm principal component analysis - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)