Тензорный эскиз

В статистике , машинном обучении и алгоритмах тензорный эскиз — это тип уменьшения размерности , который особенно эффективен при применении к векторам , имеющим тензорную структуру. ^{[ 1 ]}^{[ 2 ]} Такой эскиз может использоваться для ускорения явных методов ядра , билинейного пулинга в нейронных сетях и является краеугольным камнем во многих алгоритмах численной линейной алгебры . ^{[ 3 ]}

Математическое определение

Математически матрица уменьшения размерности или эскиза представляет собой матрицу $M\in \mathbb {R} ^{k\times d}$ , где $k<d$ , такой, что для любого вектора $x\in \mathbb {R} ^{d}$

|\|Mx\|_{2}-\|x\|_{2}|<\varepsilon \|x\|_{2}

с высокой вероятностью. Другими словами, $M$ сохраняет норму векторов с точностью до небольшой ошибки.

Тензорный эскиз обладает дополнительным свойством: если $x=y\otimes z$ для некоторых векторов $y\in \mathbb {R} ^{d_{1}},z\in \mathbb {R} ^{d_{2}}$ такой, что $d_{1}d_{2}=d$ , преобразование $M(y\otimes z)$ можно вычислить более эффективно. Здесь $\otimes$ обозначает произведение Кронекера , а не внешнее произведение , хотя они связаны сглаживанием .

Ускорение достигается предварительной перезаписью $M(y\otimes z)=M'y\circ M''z$ , где $\circ$ обозначает поэлементное ( Адамара ) произведение. Каждый из $M'y$ и $M''z$ можно вычислить во времени $O(kd_{1})$ и $O(kd_{2})$ , соответственно; включая произведение Адамара, дает общее время $O(d_{1}d_{2}+kd_{1}+kd_{2})$ . В большинстве случаев использования этот метод значительно быстрее, чем полный $M(y\otimes z)$ требующий $O(kd)=O(kd_{1}d_{2})$ время.

Для тензоров более высокого порядка, таких как $x=y\otimes z\otimes t$ , экономия еще более впечатляющая.

История

Термин «тензорный эскиз» был придуман в 2013 году. ^{[ 4 ]} описание техники Расмуса Пага ^{[ 5 ]} с того же года. Первоначально предполагалось использовать быстрое преобразование Фурье для быстрой свертки эскизов подсчета . Более поздние исследовательские работы обобщили его на гораздо более широкий класс уменьшений размерности с помощью случайных вложений тензора.

Тензорные случайные вложения были представлены в 2010 году в статье ^{[ 6 ]} на дифференциальную конфиденциальность и впервые были проанализированы Rudelson et al. в 2012 году в условиях редкого восстановления. ^{[ 7 ]}

Аврон и др. ^{[ 8 ]} были первыми, кто изучил свойства встраивания тензорных эскизов в подпространство, уделяя особое внимание приложениям к полиномиальным ядрам . В этом контексте от скетча требуется не только сохранять норму каждого отдельного вектора с определенной вероятностью, но и сохранять норму всех векторов в каждом отдельном линейном подпространстве . Это гораздо более сильное свойство, требующее больших размеров эскиза, но оно позволяет использовать методы ядра очень широко, как это описано в книге Дэвида Вудраффа. ^{[ 3 ]}

Тензорные случайные проекции

Произведение граневого расщепления определяется как тензорное произведение строк (предложено В. Слюсарем ^{[ 9 ]} в 1996 году ^{[ 10 ]}^{[ 11 ]}^{[ 12 ]}^{[ 13 ]}^{[ 14 ]} для радаров и цифровых антенных решеток ). Более прямо, пусть $\mathbf {C} \in \mathbb {R} ^{3\times 3}$ и $\mathbf {D} \in \mathbb {R} ^{3\times 3}$ быть две матрицы. Тогда продукт, расщепляющий лицо $\mathbf {C} \bullet \mathbf {D}$ является ^{[ 10 ]}^{[ 11 ]}^{[ 12 ]}^{[ 13 ]} $\mathbf {C} \bullet \mathbf {D} =\left[{\begin{array}{c }\mathbf {C} _{1}\otimes \mathbf {D} _{1}\\\hline \mathbf {C} _{2}\otimes \mathbf {D} _{2}\\\hline \mathbf {C} _{3}\otimes \mathbf {D} _{3}\\\end{array}}\right]=\left[{\begin{array}{c c c c c c c c c }\mathbf {C} _{1,1}\mathbf {D} _{1,1}&\mathbf {C} _{1,1}\mathbf {D} _{1,2}&\mathbf {C} _{1,1}\mathbf {D} _{1,3}&\mathbf {C} _{1,2}\mathbf {D} _{1,1}&\mathbf {C} _{1,2}\mathbf {D} _{1,2}&\mathbf {C} _{1,2}\mathbf {D} _{1,3}&\mathbf {C} _{1,3}\mathbf {D} _{1,1}&\mathbf {C} _{1,3}\mathbf {D} _{1,2}&\mathbf {C} _{1,3}\mathbf {D} _{1,3}\\\hline \mathbf {C} _{2,1}\mathbf {D} _{2,1}&\mathbf {C} _{2,1}\mathbf {D} _{2,2}&\mathbf {C} _{2,1}\mathbf {D} _{2,3}&\mathbf {C} _{2,2}\mathbf {D} _{2,1}&\mathbf {C} _{2,2}\mathbf {D} _{2,2}&\mathbf {C} _{2,2}\mathbf {D} _{2,3}&\mathbf {C} _{2,3}\mathbf {D} _{2,1}&\mathbf {C} _{2,3}\mathbf {D} _{2,2}&\mathbf {C} _{2,3}\mathbf {D} _{2,3}\\\hline \mathbf {C} _{3,1}\mathbf {D} _{3,1}&\mathbf {C} _{3,1}\mathbf {D} _{3,2}&\mathbf {C} _{3,1}\mathbf {D} _{3,3}&\mathbf {C} _{3,2}\mathbf {D} _{3,1}&\mathbf {C} _{3,2}\mathbf {D} _{3,2}&\mathbf {C} _{3,2}\mathbf {D} _{3,3}&\mathbf {C} _{3,3}\mathbf {D} _{3,1}&\mathbf {C} _{3,3}\mathbf {D} _{3,2}&\mathbf {C} _{3,3}\mathbf {D} _{3,3}\end{array}}\right].$ Причина полезности этого продукта заключается в следующем:

(\mathbf {C} \bullet \mathbf {D} )(x\otimes y)=\mathbf {C} x\circ \mathbf {D} y=\left[{\begin{array}{c }(\mathbf {C} x)_{1}(\mathbf {D} y)_{1}\\(\mathbf {C} x)_{2}(\mathbf {D} y)_{2}\\\vdots \end{array}}\right],

где $\circ$ является поэлементным произведением ( Адамара ). Поскольку эту операцию можно вычислить за линейное время, $\mathbf {C} \bullet \mathbf {D}$ можно умножить на векторы с тензорной структурой гораздо быстрее, чем на обычные матрицы.

Построение с быстрым преобразованием Фурье

Тензорный эскиз Фама и Пага ^{[ 4 ]} вычисляет $C^{(1)}x\ast C^{(2)}y$ , где $C^{(1)}$ и $C^{(2)}$ являются независимыми матрицами эскизов счета и $\ast$ векторная свертка . Они показывают, что, как ни удивительно, это равно $C(x\otimes y)$ – счетный эскиз тензорного произведения!

Оказывается, это соотношение можно рассматривать в терминах произведения разделения граней как

C^{(1)}x\ast C^{(2)}y={\mathcal {F}}^{-1}({\mathcal {F}}C^{(1)}x\circ {\mathcal {F}}C^{(2)}y)

, где

{\mathcal {F}}

– матрица преобразования Фурье .

С ${\mathcal {F}}$ является ортонормированной матрицей, ${\mathcal {F}}^{-1}$ не влияет на норму $Cx$ и его можно игнорировать. Осталось только это $C\sim {\mathcal {C}}^{(1)}\bullet {\mathcal {C}}^{(2)}$ .

С другой стороны,

{\mathcal {F}}(C^{(1)}x\ast C^{(2)}y)={\mathcal {F}}C^{(1)}x\circ {\mathcal {F}}C^{(2)}y=({\mathcal {F}}C^{(1)}\bullet {\mathcal {F}}C^{(2)})(x\otimes y)

.

Приложение к общим матрицам

Проблема с первоначальным алгоритмом тензорного эскиза заключалась в том, что он использовал матрицы эскизов с количеством элементов , которые не всегда обеспечивают хорошее уменьшение размерности.

В 2020 году ^{[ 15 ]} было показано, что для создания тензорного эскиза достаточно любых матриц со случайными независимыми строками. Это позволяет использовать матрицы с более сильными гарантиями, такие как настоящие гауссовские матрицы Джонсона-Линденштрауса .

В частности, мы получаем следующую теорему

Рассмотрим матрицу

T

с iid строками

T_{1},\dots ,T_{m}\in \mathbb {R} ^{d}

, такой, что

E[(T_{1}x)^{2}]=\|x\|_{2}^{2}

и

E[(T_{1}x)^{p}]^{1/p}\leq {\sqrt {ap}}\|x\|_{2}

. Позволять

T^{(1)},\dots ,T^{(c)}

быть независимым, состоящим из

T

и

M=T^{(1)}\bullet \dots \bullet T^{(c)}

.

Затем

|\|Mx\|_{2}-\|x\|_{2}|<\varepsilon \|x\|_{2}

с вероятностью

1-\delta

для любого вектора

x

если

m=(4a)^{2c}\varepsilon ^{-2}\log 1/\delta +(2ae)\varepsilon ^{-1}(\log 1/\delta )^{c}

.

В частности, если записи $T$ являются $\pm 1$ мы получаем $m=O(\varepsilon ^{-2}\log 1/\delta +\varepsilon ^{-1}({\tfrac {1}{c}}\log 1/\delta )^{c})$ что соответствует нормальной Джонсона Линденштрауса теореме $m=O(\varepsilon ^{-2}\log 1/\delta )$ когда $\varepsilon$ мал.

Бумага ^{[ 15 ]} также показывает, что зависимость от $\varepsilon ^{-1}({\tfrac {1}{c}}\log 1/\delta )^{c}$ необходим для конструкций, использующих тензорные рандомизированные проекции с гауссовыми элементами.

Вариации

Рекурсивная конструкция

Из-за экспоненциальной зависимости от $c$ в тензорных скетчах на основе произведения разбиения граней в 2020 году был разработан другой подход ^{[ 15 ]} что применимо

M(x\otimes y\otimes \cdots )=M^{(1)}(x\otimes (M^{(2)}y\otimes \cdots ))

Мы можем добиться такого $M$ позволяя

M=M^{(c)}(M^{(c-1)}\otimes I_{d})(M^{(c-2)}\otimes I_{d^{2}})\cdots (M^{(1)}\otimes I_{d^{c-1}})

.

С помощью этого метода мы применяем общий метод тензорного эскиза только к тензорам второго порядка, что позволяет избежать экспоненциальной зависимости количества строк.

Это можно доказать ^{[ 15 ]} это объединение $c$ подобные уменьшения размерности только увеличиваются $\varepsilon$ по фактору ${\sqrt {c}}$ .

Быстрые конструкции

Быстрое преобразование Джонсона – Линденштрауса представляет собой матрицу уменьшения размерности.

Дана матрица $M\in \mathbb {R} ^{k\times d}$ , вычисление матричного векторного произведения $Mx$ берет $kd$ время. Быстрое преобразование Джонсона-Линденштрауса (FJLT), ^{[ 16 ]} был представлен Эйлоном и Шазель в 2006 году.

Версия этого метода принимает $M=\operatorname {SHD}$ где

$D$ представляет собой диагональную матрицу , где каждый диагональный элемент $D_{i,i}$ является $\pm 1$ независимо.

Умножение матрицы на вектор $Dx$ можно вычислить в $O(d)$ время.

$H$ — матрица Адамара , допускающая умножение матрицы на вектор во времени $O(d\log d)$
$S$ это $k\times d$ матрица выборки , состоящая из всех нулей, за исключением одной единицы в каждой строке.

Если заменить диагональную матрицу на матрицу, имеющую тензорное произведение $\pm 1$ значения на диагонали, вместо того, чтобы быть полностью независимыми, можно вычислить $\operatorname {SHD} (x\otimes y)$ быстрый.

В качестве примера позвольте $\rho ,\sigma \in \{-1,1\}^{2}$ быть двумя независимыми $\pm 1$ векторы и пусть $D$ быть диагональной матрицей с $\rho \otimes \sigma$ по диагонали. Тогда мы можем расстаться $\operatorname {SHD} (x\otimes y)$ следующее:

{\begin{aligned}&\operatorname {SHD} (x\otimes y)\\&\quad ={\begin{bmatrix}1&0&0&0\\0&0&1&0\\0&1&0&0\end{bmatrix}}{\begin{bmatrix}1&1&1&1\\1&-1&1&-1\\1&1&-1&-1\\1&-1&-1&1\end{bmatrix}}{\begin{bmatrix}\sigma _{1}\rho _{1}&0&0&0\\0&\sigma _{1}\rho _{2}&0&0\\0&0&\sigma _{2}\rho _{1}&0\\0&0&0&\sigma _{2}\rho _{2}\\\end{bmatrix}}{\begin{bmatrix}x_{1}y_{1}\\x_{2}y_{1}\\x_{1}y_{2}\\x_{2}y_{2}\end{bmatrix}}\\[5pt]&\quad =\left({\begin{bmatrix}1&0\\0&1\\1&0\end{bmatrix}}\bullet {\begin{bmatrix}1&0\\1&0\\0&1\end{bmatrix}}\right)\left({\begin{bmatrix}1&1\\1&-1\end{bmatrix}}\otimes {\begin{bmatrix}1&1\\1&-1\end{bmatrix}}\right)\left({\begin{bmatrix}\sigma _{1}&0\\0&\sigma _{2}\\\end{bmatrix}}\otimes {\begin{bmatrix}\rho _{1}&0\\0&\rho _{2}\\\end{bmatrix}}\right)\left({\begin{bmatrix}x_{1}\\x_{2}\end{bmatrix}}\otimes {\begin{bmatrix}y_{1}\\y_{2}\end{bmatrix}}\right)\\[5pt]&\quad =\left({\begin{bmatrix}1&0\\0&1\\1&0\end{bmatrix}}\bullet {\begin{bmatrix}1&0\\1&0\\0&1\end{bmatrix}}\right)\left({\begin{bmatrix}1&1\\1&-1\end{bmatrix}}{\begin{bmatrix}\sigma _{1}&0\\0&\sigma _{2}\\\end{bmatrix}}{\begin{bmatrix}x_{1}\\x_{2}\end{bmatrix}}\,\otimes \,{\begin{bmatrix}1&1\\1&-1\end{bmatrix}}{\begin{bmatrix}\rho _{1}&0\\0&\rho _{2}\\\end{bmatrix}}{\begin{bmatrix}y_{1}\\y_{2}\end{bmatrix}}\right)\\[5pt]&\quad ={\begin{bmatrix}1&0\\0&1\\1&0\end{bmatrix}}{\begin{bmatrix}1&1\\1&-1\end{bmatrix}}{\begin{bmatrix}\sigma _{1}&0\\0&\sigma _{2}\\\end{bmatrix}}{\begin{bmatrix}x_{1}\\x_{2}\end{bmatrix}}\,\circ \,{\begin{bmatrix}1&0\\1&0\\0&1\end{bmatrix}}{\begin{bmatrix}1&1\\1&-1\end{bmatrix}}{\begin{bmatrix}\rho _{1}&0\\0&\rho _{2}\\\end{bmatrix}}{\begin{bmatrix}y_{1}\\y_{2}\end{bmatrix}}.\end{aligned}}

Другими словами, $\operatorname {SHD} =S^{(1)}HD^{(1)}\bullet S^{(2)}HD^{(2)}$ , распадается на два быстрых преобразования Джонсона–Линденштрауса, и полное приведение требует времени $O(d_{1}\log d_{1}+d_{2}\log d_{2})$ скорее, чем $d_{1}d_{2}\log(d_{1}d_{2})$ как и при прямом подходе.

Тот же подход можно распространить на вычисление произведений более высокой степени, таких как $\operatorname {SHD} (x\otimes y\otimes z)$

Ахле и др. ^{[ 15 ]} показывает, что если $\operatorname {SHD}$ имеет $\varepsilon ^{-2}(\log 1/\delta )^{c+1}$ ряды, затем $|\|\operatorname {SHD} x\|_{2}-\|x\||\leq \varepsilon \|x\|_{2}$ для любого вектора $x\in \mathbb {R} ^{d^{c}}$ с вероятностью $1-\delta$ , позволяя при этом быстро умножать со степенью $c$ тензоры.

Джин и др., ^{[ 17 ]} в том же году показал аналогичный результат для более общего класса матриц под названием RIP , который включает в себя субдискретные матрицы Адамара. Они показали, что эти матрицы допускают разбиение на тензоры при условии, что количество строк равно $\varepsilon ^{-2}(\log 1/\delta )^{2c-1}\log d$ . В случае $c=2$ это соответствует предыдущему результату.

Эти быстрые конструкции можно снова объединить с упомянутым выше рекурсивным подходом, чтобы получить самый быстрый общий тензорный эскиз.

Создание эскизов с учетом данных

Также возможно создавать так называемые тензорные эскизы с учетом данных. Вместо умножения случайной матрицы на данные точки данных выбираются независимо с определенной вероятностью, зависящей от нормы точки. ^{[ 18 ]}

Приложения

Явные полиномиальные ядра

Методы ядра популярны в машинном обучении , поскольку они дают разработанному алгоритму свободу создавать «пространство признаков», в котором можно измерять сходство точек данных. Простой двоичный классификатор на основе ядра основан на следующих вычислениях:

{\hat {y}}(\mathbf {x'} )=\operatorname {sgn} \sum _{i=1}^{n}y_{i}k(\mathbf {x} _{i},\mathbf {x'} ),

где $\mathbf {x} _{i}\in \mathbb {R} ^{d}$ являются точками данных, $y_{i}$ это этикетка $i$ -я точка (либо -1, либо +1), и ${\hat {y}}(\mathbf {x'} )$ это предсказание класса $\mathbf {x'}$ . Функция $k:\mathbb {R} ^{d}\times \mathbb {R} ^{d}\to \mathbb {R}$ это ядро. Типичными примерами являются ядро радиальной базисной функции , $k(x,x')=\exp(-\|x-x'\|_{2}^{2})$ и полиномиальные ядра , такие как $k(x,x')=(1+\langle x,x'\rangle )^{2}$ .

При таком использовании метод ядра называется «неявным». Иногда быстрее сделать «явный» метод ядра, в котором пара функций $f,g:\mathbb {R} ^{d}\to \mathbb {R} ^{D}$ находятся такие, что $k(x,x')=\langle f(x),g(x')\rangle$ . Это позволяет выразить приведенные выше вычисления как

{\hat {y}}(\mathbf {x'} )=\operatorname {sgn} \sum _{i=1}^{n}y_{i}\langle f(\mathbf {x} _{i}),g(\mathbf {x'} )\rangle =\operatorname {sgn} \left\langle \left(\sum _{i=1}^{n}y_{i}f(\mathbf {x} _{i})\right),g(\mathbf {x'} )\right\rangle ,

где значение $\sum _{i=1}^{n}y_{i}f(\mathbf {x} _{i})$ можно рассчитать заранее.

Проблема этого метода в том, что пространство признаков может быть очень большим. То есть $D>>d$ . Например, для полиномиального ядра $k(x,x')=\langle x,x'\rangle ^{3}$ мы получаем $f(x)=x\otimes x\otimes x$ и $g(x')=x'\otimes x'\otimes x'$ , где $\otimes$ – тензорное произведение и $f(x),g(x')\in \mathbb {R} ^{D}$ где $D=d^{3}$ . Если $d$ уже большой, $D$ может быть намного больше, чем количество точек данных ( $n$ ), поэтому явный метод неэффективен.

Идея тензорного эскиза заключается в том, что мы можем вычислять приближенные функции $f',g':\mathbb {R} ^{d}\to \mathbb {R} ^{t}$ где $t$ может быть даже меньше, чем $d$ , и которые все еще обладают свойством, $\langle f'(x),g'(x')\rangle \approx k(x,x')$ .

Этот метод был показан в 2020 году ^{[ 15 ]} работать даже с полиномами высокой степени и ядрами радиальных базисных функций.

Умножение сжатой матрицы

Предположим, у нас есть два больших набора данных, представленных в виде матриц. $X,Y\in \mathbb {R} ^{n\times d}$ , и мы хотим найти строки $i,j$ с крупнейшими внутренними продуктами $\langle X_{i},Y_{j}\rangle$ . Мы могли бы вычислить $Z=XY^{T}\in \mathbb {R} ^{n\times n}$ и просто посмотри на все $n^{2}$ возможности. Однако для этого потребуется как минимум $n^{2}$ времени и, вероятно, ближе к $n^{2}d$ используя стандартные методы матричного умножения.

Идея умножения сжатых матриц — это общее тождество.

XY^{T}=\sum _{i=1}^{d}X_{i}\otimes Y_{i}

где $\otimes$ – тензорное произведение . Поскольку мы можем вычислить ( линейное ) приближение к $X_{i}\otimes Y_{i}$ эффективно, мы можем суммировать их, чтобы получить приближение для полного продукта.

Компактное многолинейное объединение

Билинейное объединение — это метод получения двух входных векторов. $x,y$ из разных источников и используя тензорное произведение $x\otimes y$ в качестве входного слоя нейронной сети.

В ^{[ 19 ]} авторы рассматривали возможность использования тензорного эскиза, чтобы уменьшить количество необходимых переменных.

В 2017 году еще одна статья ^{[ 20 ]} выполняет БПФ входных объектов перед их объединением с использованием поэлементного произведения. Это снова соответствует исходному эскизу тензора.

Ссылки

^ «Разложение больших тензоров по Такеру низкого ранга с использованием: Tensor Sketch» (PDF) . amath.colorado.edu . Боулдер, Колорадо: Университет Колорадо в Боулдере .
^ Але, Томас; Кнудсен, Якоб (3 сентября 2019 г.). «Почти оптимальный тензорный эскиз» . Исследовательские ворота . Проверено 11 июля 2020 г.
^ Jump up to: ^а ^б Вудрафф, Дэвид П. « Зарисовки как инструмент числовой линейной алгебры. Архивировано 22 октября 2022 г. в Wayback Machine ». Теоретическая информатика 10.1-2 (2014): 1–157.
^ Jump up to: ^а ^б Нинь, Фам; Паг, Расмус (2013). Быстрые и масштабируемые полиномиальные ядра с помощью явных карт признаков . Международная конференция SIGKDD по открытию знаний и интеллектуальному анализу данных. Ассоциация вычислительной техники. дои : 10.1145/2487575.2487591 .
^ Паг, Расмус (2013). «Умножение сжатых матриц». Транзакции ACM по теории вычислений . 5 (3). Ассоциация вычислительной техники: 1–17. arXiv : 1108.1320 . дои : 10.1145/2493252.2493254 . S2CID 47560654 .
^ Касивишванатан, Шива Прасад и др. « Цена частной публикации таблиц непредвиденных обстоятельств и спектров случайных матриц с коррелированными строками . Архивировано 22 октября 2022 г. в Wayback Machine ». Труды сорок второго симпозиума ACM по теории вычислений. 2010.
^ Рудельсон, Марк и Шухэн Чжоу. « Реконструкция на основе анизотропных случайных измерений. Архивировано 17 октября 2022 г. в Wayback Machine ». Конференция по теории обучения. 2012.
^ Аврон, Хаим; Нгуен, Хай; Вудрафф, Дэвид (2014). «Вложения подпространства для полиномиального ядра» (PDF) . Достижения в области нейронных систем обработки информации . S2CID 16658740 .
^ Анна Эстев, Ева Бой и Хосеп Фортиана (2009): Условия взаимодействия в дистанционной регрессии, Коммуникации в статистике - теория и методы, 38:19, стр. 3501 [1]. Архивировано 26 апреля 2021 г. в Wayback Machine.
^ Jump up to: ^а ^б Слюсарь, В.И. (1998). «Конечные продукты в матрицах радиолокационных приложений» (PDF) . Радиоэлектроника и системы связи . 41 (3): 50–53.
^ Jump up to: ^а ^б Слюсарь, В.И. (20 мая 1997 г.). «Аналитическая модель цифровой антенной решетки на основе изделий из матриц с разделением граней» (PDF) . Учеб. ICATT-97, Киев : 108–109.
^ Jump up to: ^а ^б Слюсарь, В.И. (15 сентября 1997 г.). «Новые операции с матрицами для применения в радарах» (PDF) . Учеб. Прямые и обратные задачи теории электромагнитных и акустических волн (ДИПЕД-97), Львов. : 73–74.
^ Jump up to: ^а ^б Слюсарь В.И. (13 марта 1998 г.). «Семейство лицевых продуктов матриц и его свойства» (PDF) . Кибернетика и системный анализ ПК Кибернетика и Системный анализ. – 1999 . 35 (3): 379–384. дои : 10.1007/BF02733426 . S2CID 119661450 .
^ Слюсарь, В.И. (2003). «Обобщенные грани-произведения матриц в моделях цифровых антенных решеток с неидентичными каналами» (PDF) . Радиоэлектроника и системы связи . 46 (10): 9–17.
^ Jump up to: ^а ^б ^с ^д ^и ^ж Але, Томас; Капралов, Михаил; Кнудсен, Якоб; Паг, Расмус ; Велинкер, Амейя; Вудрафф, Дэвид; Зандие, Амир (2020). Забывчивое рисование ядер полиномов высокой степени . Симпозиум ACM-SIAM по дискретным алгоритмам. Ассоциация вычислительной техники. arXiv : 1909.01410 . дои : 10.1137/1.9781611975994.9 .
^ Эйлон, Нир; Шазель, Бернар (2006). «Приблизительные ближайшие соседи и быстрое преобразование Джонсона – Линденштрауса». Материалы 38-го ежегодного симпозиума ACM по теории вычислений . Нью-Йорк: ACM Press. стр. 557–563. дои : 10.1145/1132516.1132597 . ISBN 1-59593-134-1 . МР 2277181 . S2CID 490517 .
^ Джин, Рухуи, Тамара Г. Колда и Рэйчел Уорд. «Более быстрое преобразование Джонсона-Линденштрауса с помощью продуктов Кронекера». Препринт arXiv arXiv:1909.04801 (2019).
^ Ван, Инин; Дун, Сяо-Ю; Смола, Александр; Анандкумар, Анима. Быстрое и гарантированное разложение тензора посредством эскизов . Достижения в области нейронных систем обработки информации 28 (NIPS 2015). arXiv : 1506.04448 .
^ Гао, Ян и др. « Компактное билинейное объединение. Архивировано 20 января 2022 г. в Wayback Machine ». Материалы конференции IEEE по компьютерному зрению и распознаванию образов. 2016.
^ Альгашаам, Фейсал М. и др. « Мультиспектральная периокулярная классификация с мультимодальным компактным многолинейным объединением ». IEEE Access 5 (2017): 14572–14578.

Дальнейшее чтение

Але, Томас; Кнудсен, Якоб (3 сентября 2019 г.). «Почти оптимальный тензорный эскиз» . Исследовательские ворота . Проверено 11 июля 2020 г.
Слюсарь, В.И. (1998). «Конечные продукты в матрицах радиолокационных приложений» (PDF) . Радиоэлектроника и системы связи . 41 (3): 50–53.
Слюсарь, В.И. (20 мая 1997 г.). «Аналитическая модель цифровой антенной решетки на основе изделий из матриц с разделением граней» (PDF) . Учеб. ICATT-97, Киев : 108–109.
Слюсарь, В.И. (15 сентября 1997 г.). «Новые операции с матрицами для применения в радарах» (PDF) . Учеб. Прямые и обратные задачи теории электромагнитных и акустических волн (ДИПЕД-97), Львов. : 73–74.
Слюсарь В.И. (13 марта 1998 г.). «Семейство лицевых продуктов матриц и его свойства» (PDF) . Кибернетика и системный анализ К/С Кибернетика и Системный Анализ.- 1999 . 35 (3): 379–384. дои : 10.1007/BF02733426 . S2CID 119661450 .

[1] «Разложение больших тензоров по Такеру низкого ранга с использованием: Tensor Sketch» (PDF) . amath.colorado.edu . Боулдер, Колорадо: Университет Колорадо в Боулдере .

[2] Але, Томас; Кнудсен, Якоб (3 сентября 2019 г.). «Почти оптимальный тензорный эскиз» . Исследовательские ворота . Проверено 11 июля 2020 г.

[woodruff-3] Jump up to: ^а ^б Вудрафф, Дэвид П. « Зарисовки как инструмент числовой линейной алгебры. Архивировано 22 октября 2022 г. в Wayback Machine ». Теоретическая информатика 10.1-2 (2014): 1–157.

[ninh-4] Jump up to: ^а ^б Нинь, Фам; Паг, Расмус (2013). Быстрые и масштабируемые полиномиальные ядра с помощью явных карт признаков . Международная конференция SIGKDD по открытию знаний и интеллектуальному анализу данных. Ассоциация вычислительной техники. дои : 10.1145/2487575.2487591 .

[pagh-5] Паг, Расмус (2013). «Умножение сжатых матриц». Транзакции ACM по теории вычислений . 5 (3). Ассоциация вычислительной техники: 1–17. arXiv : 1108.1320 . дои : 10.1145/2493252.2493254 . S2CID 47560654 .

[6] Касивишванатан, Шива Прасад и др. « Цена частной публикации таблиц непредвиденных обстоятельств и спектров случайных матриц с коррелированными строками . Архивировано 22 октября 2022 г. в Wayback Machine ». Труды сорок второго симпозиума ACM по теории вычислений. 2010.

[7] Рудельсон, Марк и Шухэн Чжоу. « Реконструкция на основе анизотропных случайных измерений. Архивировано 17 октября 2022 г. в Wayback Machine ». Конференция по теории обучения. 2012.

[avron-8] Аврон, Хаим; Нгуен, Хай; Вудрафф, Дэвид (2014). «Вложения подпространства для полиномиального ядра» (PDF) . Достижения в области нейронных систем обработки информации . S2CID 16658740 .

[Fortiana-9] Анна Эстев, Ева Бой и Хосеп Фортиана (2009): Условия взаимодействия в дистанционной регрессии, Коммуникации в статистике - теория и методы, 38:19, стр. 3501 [1]. Архивировано 26 апреля 2021 г. в Wayback Machine.

[slyusar-10] Jump up to: ^а ^б Слюсарь, В.И. (1998). «Конечные продукты в матрицах радиолокационных приложений» (PDF) . Радиоэлектроника и системы связи . 41 (3): 50–53.

[slyusar1-11] Jump up to: ^а ^б Слюсарь, В.И. (20 мая 1997 г.). «Аналитическая модель цифровой антенной решетки на основе изделий из матриц с разделением граней» (PDF) . Учеб. ICATT-97, Киев : 108–109.

[DIPED-12] Jump up to: ^а ^б Слюсарь, В.И. (15 сентября 1997 г.). «Новые операции с матрицами для применения в радарах» (PDF) . Учеб. Прямые и обратные задачи теории электромагнитных и акустических волн (ДИПЕД-97), Львов. : 73–74.

[slyusar2-13] Jump up to: ^а ^б Слюсарь В.И. (13 марта 1998 г.). «Семейство лицевых продуктов матриц и его свойства» (PDF) . Кибернетика и системный анализ ПК Кибернетика и Системный анализ. – 1999 . 35 (3): 379–384. дои : 10.1007/BF02733426 . S2CID 119661450 .

[general-14] Слюсарь, В.И. (2003). «Обобщенные грани-произведения матриц в моделях цифровых антенных решеток с неидентичными каналами» (PDF) . Радиоэлектроника и системы связи . 46 (10): 9–17.

[highdeg-15] Jump up to: ^а ^б ^с ^д ^и ^ж Але, Томас; Капралов, Михаил; Кнудсен, Якоб; Паг, Расмус ; Велинкер, Амейя; Вудрафф, Дэвид; Зандие, Амир (2020). Забывчивое рисование ядер полиномов высокой степени . Симпозиум ACM-SIAM по дискретным алгоритмам. Ассоциация вычислительной техники. arXiv : 1909.01410 . дои : 10.1137/1.9781611975994.9 .

[16] Эйлон, Нир; Шазель, Бернар (2006). «Приблизительные ближайшие соседи и быстрое преобразование Джонсона – Линденштрауса». Материалы 38-го ежегодного симпозиума ACM по теории вычислений . Нью-Йорк: ACM Press. стр. 557–563. дои : 10.1145/1132516.1132597 . ISBN 1-59593-134-1 . МР 2277181 . S2CID 490517 .

[jin-17] Джин, Рухуи, Тамара Г. Колда и Рэйчел Уорд. «Более быстрое преобразование Джонсона-Линденштрауса с помощью продуктов Кронекера». Препринт arXiv arXiv:1909.04801 (2019).

[18] Ван, Инин; Дун, Сяо-Ю; Смола, Александр; Анандкумар, Анима. Быстрое и гарантированное разложение тензора посредством эскизов . Достижения в области нейронных систем обработки информации 28 (NIPS 2015). arXiv : 1506.04448 .

[19] Гао, Ян и др. « Компактное билинейное объединение. Архивировано 20 января 2022 г. в Wayback Machine ». Материалы конференции IEEE по компьютерному зрению и распознаванию образов. 2016.

[20] Альгашаам, Фейсал М. и др. « Мультиспектральная периокулярная классификация с мультимодальным компактным многолинейным объединением ». IEEE Access 5 (2017): 14572–14578.

[ 1 ]

[ 2 ]

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]

[ 9 ]

[ 10 ]

[ 11 ]

[ 12 ]

[ 13 ]

[ 14 ]

[ 15 ]

[ 16 ]

[ 17 ]

[ 18 ]

[ 19 ]

[ 20 ]