Jump to content

Лемма Джонсона – Линденштрауса.

В математике лемма Джонсона-Линденштрауса представляет собой результат, названный в честь Уильяма Б. Джонсона и Йорама Линденштрауса точек с низкими искажениями , касающийся вложения из многомерного в низкомерное евклидово пространство . Лемма утверждает, что набор точек в многомерном пространстве может быть вложен в пространство гораздо меньшей размерности таким образом, что расстояния между точками практически сохраняются . В классическом доказательстве леммы вложение представляет собой случайный ортогональный проектор .

Лемма находит применение в сжатом распознавании , обучении многообразий , уменьшении размерности и встраивании графов . Большая часть данных, хранящихся и обрабатываемых на компьютерах, включая текст и изображения, может быть представлена ​​в виде точек в многомерном пространстве ( см. Модель векторного пространства для случая текста ). Однако основные алгоритмы работы с такими данными имеют тенденцию очень быстро увязнуть в работе по мере увеличения размерности. [1] Поэтому желательно уменьшить размерность данных таким образом, чтобы сохранить их соответствующую структуру. Лемма Джонсона-Линденштрауса является классическим результатом в этом направлении.

Кроме того, лемма точна с точностью до постоянного множителя, т. е. существует набор точек размера m , которому требуется размерность

чтобы сохранить расстояния между всеми парами точек в пределах коэффициента . [2] [3]

Данный , набор из указывает на и целое число , [4] есть линейная карта такой, что

для всех .

Формулу можно переставить:

Альтернативно, для любого и любое целое число [Примечание 1] существует линейная функция такое, что ограничение является - билипшиц . [Примечание 2]

Классическое доказательство леммы предполагает, что ƒ является скаляром, кратным ортогональной проекции. на случайное подпространство размерности в . Ортогональная проекция сжимает некоторые измерения пространства, к которому она применяется, что уменьшает длину всех векторов, а также расстояние между векторами в пространстве. В условиях леммы концентрация меры обеспечивает ненулевую вероятность того, что случайная ортогональная проекция уменьшит попарные расстояния между всеми точками в примерно с постоянным коэффициентом . Поскольку вероятность не равна нулю, такие проекции должны существовать, поэтому мы можем выбрать одну и установить .

Для алгоритмического получения проекции достаточно с высокой вероятностью многократно случайным образом отбирать ортогональные проекционные матрицы. Если вы продолжите бросать кости, вы в конечном итоге получите один за полиномиальное случайное время.

Альтернативное заявление

[ редактировать ]

Связанная с ней лемма — это лемма JL о распределении. Эта лемма утверждает, что для любого и положительное целое число , существует распределение по из которого матрица нарисовано так, что для и для любого вектора единичной длины , то утверждение ниже справедливо. [5]

Лемму JL можно получить из дистрибутивной версии, положив и для некоторой пары u , v, из X. оба Тогда лемма JL следует из оценки объединения всех таких пар.

Ускорение преобразования JL

[ редактировать ]

Учитывая A , вычисление произведения матрицы-вектора занимает время. Была проведена некоторая работа по получению распределений, для которых произведение матрицы-вектора можно вычислить менее чем за время.

Есть два основных направления работы. Первое, быстрое преобразование Джонсона-Линденштрауса (FJLT), [6] был представлен Эйлоном и Шазель в 2006 году.Этот метод позволяет вычислить произведение матрицы-вектора всего за для любой константы .

Другой подход заключается в построении распределения, поддерживаемого разреженными матрицами. [7] Этот метод позволяет сохранить только часть элементов в матрице, что означает, что вычисление может быть выполнено всего за время.Более того, если вектор имеет только ненулевые записи, Sparse JL требует времени , что может быть значительно меньше, чем время, использованное Fast JL.

Тензоризованные случайные проекции

[ редактировать ]

Объединить две матрицы JL можно, взяв так называемое произведение граней , которое определяется как тензорное произведение строк (предложено В. Слюсарем [8] в 1996 году [9] [10] [11] [12] [13] для радаров и цифровых антенных решеток ).Более прямо, пусть и быть две матрицы.Тогда продукт, расщепляющий лицо является [9] [10] [11] [12] [13]

Эту идею тензоризации использовали Касивисванатан и др. для дифференциальной конфиденциальности . [14]

Матрицы JL, определенные таким образом, используют меньше случайных битов и могут быстро применяться к векторам, имеющим тензорную структуру, благодаря следующему тождеству: [11]

,

где является поэлементным произведением ( Адамара ).Такие вычисления использовались для эффективного вычисления полиномиальных ядер и многих других алгоритмов линейной алгебры. [ нужны разъяснения ] . [15]

В 2020 году [16] было показано, что если матрицы независимы или гауссовские матрицы, комбинированная матрица удовлетворяет лемме о распределении JL, если количество строк не менее

.

Для больших это ничуть не хуже совершенно случайного Джонсона-Линденштрауса, носоответствующая нижняя оценка в той же статье показывает, что эта экспоненциальная зависимость от необходимо.Чтобы обойти это, предлагаются альтернативные конструкции JL.

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ Или любое целое число
  2. ^ Этот результат следует из приведенного выше результата. Схема доказательства: Примечание. и для всех . Выполните анализ для 1= m и 1< m , применив приведенный выше результат к в последнем случае, отметив
  1. ^ Например, описывая поиск ближайшего соседа в многомерных наборах данных, Джон Кляйнберг пишет: «Более сложные алгоритмы обычно достигают логарифмического по n времени запроса за счет экспоненциальной зависимости от размерности d ; действительно, даже Анализ среднего случая эвристик, таких как деревья kd, обнаруживает экспоненциальную зависимость от d во времени запроса. Кляйнберг, Джон М. (1997), «Два алгоритма поиска ближайших соседей в больших измерениях», Труды двадцать девятого ежегодного симпозиума ACM по теории вычислений , STOC '97, Нью-Йорк, Нью-Йорк, США: ACM, стр. . 599–608, номер домена : 10.1145/258533.258653 , ISBN.  0-89791-888-6 .
  2. ^ Ларсен, Каспер Грин; Нельсон, Джелани (2017), «Оптимальность леммы Джонсона-Линденштрауса», Труды 58-го ежегодного симпозиума IEEE по основам компьютерных наук (FOCS) , стр. 633–638, arXiv : 1609.02094 , doi : 10.1109/FOCS.2017.64 , S2CID   16745
  3. ^ Нильсен, Франк (2016), «10. Быстрая аппроксимационная оптимизация в больших размерностях с использованием базовых наборов и быстрое уменьшение размерностей» , Введение в HPC с MPI для науки о данных , Springer, стр. 259–272, ISBN  978-3-319-21903-5
  4. ^ Фернандес-Гранда, Карлос. «Конспекты лекций 5: Случайные прогнозы» (PDF) . п. 6. Лемма 2.6 (лемма Джонсона-Линденштрауса)
  5. ^ Джонсон, Уильям Б .; Линденштраусс, Йорам (1984), «Расширения липшицевых отображений в гильбертово пространство», в Билсе, Ричарде; Бек, Анатоль; Беллоу, Александра; и др. (ред.), Конференция по современному анализу и вероятности (Нью-Хейвен, Коннектикут, 1982) , Современная математика, том. 26, Провиденс, Род-Айленд: Американское математическое общество, стр. 189–206 , doi : 10.1090/conm/026/737400 , ISBN  0-8218-5030-Х , МР   0737400 , S2CID   117819162
  6. ^ Эйлон, Нир; Шазель, Бернар (2006), «Приблизительные ближайшие соседи и быстрое преобразование Джонсона – Линденштрауса», Труды 38-го ежегодного симпозиума ACM по теории вычислений , Нью-Йорк: ACM Press, стр. 557–563, doi : 10.1145/1132516.1132597 , ISBN  1-59593-134-1 , МР   2277181 , S2CID   490517
  7. ^ Кейн, Дэниел М.; Нельсон, Джелани (2014), «Разреженные преобразования Джонсона-Линденштрауса», Журнал ACM , 61 (1): 1, arXiv : 1012.1577 , doi : 10.1145/2559902 , MR   3167920 , S2CID   7821848 . Предварительная версия этой статьи была опубликована в Трудах двадцать третьего ежегодного симпозиума ACM-SIAM по дискретным алгоритмам , 2012.
  8. ^ Эстев, Анна; Бой, Ева; Фортиана, Хосеп (2009), «Условия взаимодействия в регрессии на основе расстояния», Communications in Статистика , 38 (18–20): 3498–3509, doi : 10.1080/03610920802592860 , MR   2589790 , S2CID   122303508
  9. ^ Jump up to: а б Слюсарь В.И. (27 декабря 1996 г.), "Конечные продукты в матрицах в радиолокационных приложениях". (PDF) , Радиоэлектроника и системы связи , 41 (3): 50–53
  10. ^ Jump up to: а б Слюсарь В.И. (20 мая 1997 г.), "Аналитическая модель цифровой антенной решетки на основе матричных произведений лицевого разделения". (PDF) , Учеб. ICATT-97, Киев : 108–109.
  11. ^ Jump up to: а б с Слюсарь, В.И. (15 сентября 1997 г.), "Новые операции матричного произведения для применения в радиолокации" (PDF) , Учеб. Прямые и обратные задачи теории электромагнитных и акустических волн (ДИПЕД-97), Львов. : 73–74
  12. ^ Jump up to: а б Слюсарь В.И. (13 марта 1998 г.), "Семейство граничных произведений матриц и его свойства" (PDF) , Кибернетика и системный анализ К/К Кибернетика и Системный анализ.- 1999. , 35 (3): 379– 384, номер документа : 10.1007/BF02733426 , S2CID   119661450
  13. ^ Jump up to: а б Слюсарь, В.И. (2003), "Обобщенные грани-произведения матриц в моделях цифровых антенных решеток с неидентичными каналами" (PDF) , Радиоэлектроника и системы связи , 46 (10): 9–17
  14. ^ Касивишванатан, Шива Прасад; Рудельсон, Марк; Смит, Адам Д.; Уллман, Джонатан Р. (2010), «Цена частного выпуска таблиц непредвиденных обстоятельств и спектров случайных матриц с коррелированными строками», в Шульман, Леонард Дж. (ред.), Труды 42-го симпозиума ACM по теории вычислений, STOC 2010, Кембридж, Массачусетс, США, 5–8 июня 2010 г., Ассоциация вычислительной техники, стр. 775–784, doi : 10.1145/1806689.1806795 , S2CID   5714334
  15. ^ Вудрафф, Дэвид П. (2014), Эскизы как инструмент числовой линейной алгебры , Основы и тенденции в теоретической информатике, том. 10, arXiv : 1411.4357 , doi : 10.1561/0400000060 , MR   3285427 , S2CID   51783444
  16. ^ Але, Томас; Капралов, Михаил; Кнудсен, Якоб; Паг, Расмус ; Велинкер, Амейя; Вудрафф, Дэвид; Занди, Амир (2020), «Забывчивое набросок полиномиальных ядер высокой степени», Симпозиум ACM-SIAM по дискретным алгоритмам , Ассоциация вычислительной техники, arXiv : 1909.01410 , doi : 10.1137/1.9781611975994.9

Дальнейшее чтение

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 6138c27045594eb6fb1e731ae7045788__1712593560
URL1:https://arc.ask3.ru/arc/aa/61/88/6138c27045594eb6fb1e731ae7045788.html
Заголовок, (Title) документа по адресу, URL1:
Johnson–Lindenstrauss lemma - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)