Полуопределенное вложение
Развертывание максимальной дисперсии (MVU) , также известное как полуопределенное встраивание (SDE), представляет собой алгоритм в информатике , который использует полуопределенное программирование для выполнения нелинейного уменьшения размерности многомерных векторных входных данных. [1] [2] [3]
Это мотивировано наблюдением, что анализ главных компонентов ядра (kPCA) не уменьшает размерность данных. [4] поскольку он использует трюк ядра для нелинейного отображения исходных данных в пространство внутреннего продукта .
Алгоритм
[ редактировать ]MVU создает отображение входных векторов высокой размерности в некоторое евклидово векторное пространство низкой размерности в следующих шагах: [5]
- окрестности . Создается граф Каждый вход связан со своими k-ближайшими входными векторами (согласно евклидовой метрике расстояния), а все k-ближайшие соседи связаны друг с другом. Если данные выбраны достаточно хорошо, результирующий график представляет собой дискретную аппроксимацию основного многообразия.
- Граф окрестности «разворачивается» с помощью полуопределенного программирования. Вместо непосредственного изучения выходных векторов полуопределенное программирование направлено на поиск матрицы внутреннего произведения, которая максимизирует попарные расстояния между любыми двумя входными данными, которые не связаны в графе соседства, сохраняя при этом расстояния до ближайших соседей.
- В конечном итоге низкоразмерное вложение получается путем применения многомерного масштабирования к изученной матрице внутреннего продукта.
Шаги применения полуопределенного программирования с последующим шагом уменьшения линейной размерности для восстановления низкомерного вложения в евклидово пространство были впервые предложены Линиалом , Лондоном и Рабиновичем. [6]
Формулировка оптимизации
[ редактировать ]Позволять быть исходным входом и быть вложением. Если являются двумя соседями, то ограничение локальной изометрии, которое должно быть удовлетворено, следующее: [7] [8] [9]
Позволять быть Грама матрицами и (т.е.: ). Мы можем выразить вышеуказанное ограничение для каждой соседней точки. с точки зрения : [10] [11]
Кроме того, мы также хотим ограничить встраивание центрировать в начале координат: [12] [13] [14]
Как описано выше, за исключением того, что расстояния до соседних точек сохраняются, алгоритм стремится максимизировать попарное расстояние каждой пары точек. Целевая функция, которую необходимо максимизировать, равна: [15] [16] [17]
Интуитивно, максимизация вышеуказанной функции эквивалентна оттягиванию точек как можно дальше друг от друга и, следовательно, «развертыванию» многообразия. Ограничение локальной изометрии [18]
Позволять где
предотвращает расхождение целевой функции (уход в бесконечность).
Поскольку на графике N точек, расстояние между любыми двумя точками . Затем мы можем ограничить целевую функцию следующим образом: [19] [20]
Целевую функцию можно переписать чисто в виде матрицы Грама: [21] [22] [23]
Наконец, оптимизацию можно сформулировать так: [24] [25] [26]
После матрицы Грама изучается с помощью полуопределенного программирования, результат можно получить с помощью разложения Холецкого .
В частности, матрицу Грама можно записать как где — i-й элемент собственного вектора собственного значения . [27] [28]
Отсюда следует, что -й элемент вывода является . [29] [30]
См. также
[ редактировать ]- Локально линейное вложение
- Изометрия (значения)
- Выравнивание локального касательного пространства
- Риманово многообразие
- Минимизация энергии
Примечания
[ редактировать ]- ^ Вайнбергер, Ша и Саул, 2004a.
- ^ Вайнбергер и Сол 2004b
- ^ Вайнбергер и Сол 2006 г.
- ^ Лоуренс 2012 , стр. 1612.
- ^ Вайнбергер, Ша и Саул 2004a , стр. 7.
- ^ Linial, London and Rabinovich 1995
- ^ Вайнбергер, Ша и Саул, 2004a , стр. 3, уравнение 8.
- ^ Вайнбергер и Саул 2004b , стр. 3, уравнение 2.
- ^ Вайнбергер и Саул, 2006 , стр. 4, уравнение 2.
- ^ Вайнбергер, Ша и Саул 2004a , стр. 3, уравнение 9
- ^ Вайнбергер и Саул 2004b , стр. 3, уравнение 3.
- ^ Вайнбергер, Ша и Саул 2004a , стр. 3, уравнение 6
- ^ Вайнбергер и Саул, 2004b , стр. 3, уравнение 5.
- ^ Вайнбергер и Саул, 2006 , стр. 5, уравнение 8.
- ^ Вайнбергер, Ша и Саул, 2004a , стр. 4, уравнение 10.
- ^ Вайнбергер и Саул, 2004b , стр. 4, уравнение 6.
- ^ Вайнбергер и Саул, 2006 , стр. 5, уравнение 4.
- ^ Вайнбергер и Саул 2004b , стр. 4, уравнение 7.
- ^ Вайнбергер и Саул 2004b , стр. 4, уравнение 8
- ^ Вайнбергер и Саул, 2006 , стр. 5, уравнение 6.
- ^ Вайнбергер, Ша и Саул, 2004a , стр. 4, уравнение 11.
- ^ Вайнбергер и Саул 2004b , стр. 4, уравнение 9
- ^ Вайнбергер и Саул, 2006 , стр. 6, уравнения с 10 по 13.
- ^ Вайнбергер, Ша и Саул 2004a , стр. 4, раздел 3.3.
- ^ Вайнбергер и Саул 2004b , стр. 4, уравнение 9
- ^ Вайнбергер и Саул, 2006 , стр. 6, уравнения с 10 по 13.
- ^ Вайнбергер и Саул 2004b , стр. 4, уравнение 10.
- ^ Вайнбергер и Саул, 2006 , стр. 7, уравнения 14.
- ^ Вайнбергер и Саул 2004b , стр. 4, уравнение 11.
- ^ Вайнбергер и Саул, 2006 , стр. 7, уравнения 15.
Ссылки
[ редактировать ]- Линиал, Лондон и Рабинович, Натан, Эран и Юрий (1995). «Геометрия графов и некоторые ее алгоритмические приложения» . Комбинаторика . 15 (2): 215–245. дои : 10.1007/BF01200757 . S2CID 5071936 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - Вайнбергер, Ша и Сол, Килиан К., Фей и Лоуренс К. (4 июля 2004 г.a). Изучение матрицы ядра для нелинейного уменьшения размерности . Материалы двадцать первой международной конференции по машинному обучению (ICML, 2004). Банф, Альберта , Канада.
{{cite conference}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - Вайнбергер и Сол, Килиан К. и Лоуренс К. (27 июня 2004 г.b). Неконтролируемое обучение многообразий изображений посредством полуопределенного программирования . 2004 Конференция IEEE Computer Society по компьютерному зрению и распознаванию образов. Том. 2.
- Вайнбергер и Сол, Килиан К. и Лоуренс К. (1 мая 2006 г.). «Обучение многообразий изображений без учителя с помощью полуопределенного программирования» (PDF) . Международный журнал компьютерного зрения . 70 : 77–90. дои : 10.1007/s11263-005-4939-z . S2CID 291166 .
- Лоуренс, Нил Д. (2012). «Объединяющая вероятностная перспектива уменьшения спектральной размерности: идеи и новые модели» . Журнал исследований машинного обучения . 13 (май): 1612. arXiv : 1010.4830 . Бибкод : 2010arXiv1010.4830L .