ЛОБПКГ

Локально оптимальный блочный предварительно обусловленный сопряженный градиент ( LOBPCG ) — это безматричный метод поиска наибольших (или наименьших) собственных значений и соответствующих собственных векторов симметричной обобщенной задачи собственных значений.

Ax=\lambda Bx,

для данной пары $(A,B)$ комплексных эрмитовых или действительных симметричных матриц, гдематрица $B$ также предполагается положительно-определенным .

Фон

Канторович в 1948 году предложил вычислять наименьшее собственное значение. $\lambda _{1}$ симметричной матрицы $A$ по наискорейшему спуску по направлению $r=Ax-\lambda (x)x$ масштабированного градиента коэффициента Рэлея $\lambda (x)=(x,Ax)/(x,x)$ в скалярном произведении $(x,y)=x'y$ , с размером шага, вычисляемым путем минимизации коэффициента Рэлея в линейной области векторов $x$ и $w$ , то есть локально оптимальным образом. Самокиш ^[1] предложил применить предобуславливатель $T$ вектору остатков $r$ для создания заранее обусловленного направления $w=Tr$ и выведена асимптотика, как $x$ приближается к собственному вектору , границам скорости сходимости. Дьяконов предложил ^[2] спектрально эквивалентная предобусловливание и полученные неасимптотические границы скорости сходимости. Блочный локально оптимальный многошаговый наискорейший спуск для задач на собственные значения описан в . ^[3] В 2007 году появилась локальная минимизация фактора Рэлея на подпространстве, натянутом текущим приближением, текущей невязкой и предыдущим приближением, а также его блочный вариант. ^[4] Предварительно обусловленная версия была проанализирована в ^[5] и. ^[6]

Основные особенности ^[7]

Безматрицный , т.е. не требует явного хранения матрицы коэффициентов, но может получить доступ к матрице путем оценки произведений матрицы-вектора.
Не требует факторизации , т.е. не требует какого-либо матричного разложения даже для обобщенной задачи на собственные значения .
Затраты на итерацию и использование памяти конкурентоспособны по сравнению с методом Ланцоша , вычисляющим одну крайнюю собственную пару симметричной матрицы.
Линейная сходимость теоретически гарантирована и практически наблюдается.
Ускоренная сходимость за счет прямой предобуславливания , в отличие от метода Ланцоша , включая переменную и несимметричную, а также фиксированную и положительно определенную предобусловливание .
Позволяет тривиально использовать эффективную декомпозицию домена и многосеточные методы посредством предварительной подготовки.
Теплый старт и вычисление аппроксимации собственного вектора на каждой итерации.
Более численно стабилен по сравнению с методом Ланцоша и может работать в компьютерной арифметике низкой точности.
Легко реализовать, уже появилось много версий.
Блокировка позволяет использовать высокоэффективные матрично-матричные операции, например BLAS 3.
Размер блока можно настроить, чтобы сбалансировать скорость сходимости и компьютерные затраты на ортогонализацию и метод Рэлея-Ритца на каждой итерации.

Алгоритм

Одновекторная версия

Предварительные сведения: Градиентный спуск для задач на собственные значения

Метод выполняет итеративную максимизацию (или минимизацию) обобщенного коэффициента Рэлея.

\rho (x):=\rho (A,B;x):={\frac {x^{T}Ax}{x^{T}Bx}},

что приводит к нахождению наибольших (или наименьших) собственных пар $Ax=\lambda Bx.$

Направление наибольшего подъема, которое представляет собой градиент обобщенного фактора Рэлея , положительно пропорционально вектору

r:=Ax-\rho (x)Bx,

называется остатком собственного вектора . Если предобуславливатель $T$ доступен, он применяется к остатку и дает вектор

w:=Tr,

называется предобусловленным остатком. Без предобуславливания положим $T:=I$ и так $w:=r$ . Итерационный метод

x^{i+1}:=x^{i}+\alpha ^{i}T(Ax^{i}-\rho (x^{i})Bx^{i}),

или, короче говоря,

x^{i+1}:=x^{i}+\alpha ^{i}w^{i},\,

w^{i}:=Tr^{i},\,

r^{i}:=Ax^{i}-\rho (x^{i})Bx^{i},

известен как предварительно обусловленный крутой подъем (или спуск), где скаляр $\alpha ^{i}$ называется размером шага. Оптимальный размер шага можно определить путем максимизации коэффициента Рэлея, т.е.

x^{i+1}:=\arg \max _{y\in span\{x^{i},w^{i}\}}\rho (y)

(или $\arg \min$ в случае минимизации), в этом случае метод называется локально оптимальным.

Трехкратный рецидив

Чтобы значительно ускорить сходимость локально оптимального заранее обусловленного наискорейшего подъема (или спуска), к двухчленному рекуррентному соотношению можно добавить один дополнительный вектор , чтобы сделать его трехчленным:

x^{i+1}:=\arg \max _{y\in span\{x^{i},w^{i},x^{i-1}\}}\rho (y)

(использовать $\arg \min$ в случае минимизации). Максимизация/минимизация фактора Рэлея в трехмерном подпространстве может быть выполнена численно с помощью метода Рэлея–Ритца . Добавление дополнительных векторов, см., например, экстраполяцию Ричардсона , не приводит к значительному ускорению. ^[8] но увеличивает затраты на вычисления, поэтому обычно не рекомендуется.

Улучшения численной стабильности

По мере сходимости итераций векторы $x^{i}$ и $x^{i-1}$ становятся почти линейно зависимыми , что приводит к потере точности и делает метод Рэлея-Ритца численно нестабильным при наличии ошибок округления. Потери точности можно избежать, заменив вектор $x^{i-1}$ с вектором $p^{i}$ , который может быть дальше от $x^{i}$ , в базисе трехмерного подпространства $span\{x^{i},w^{i},x^{i-1}\}$ , сохраняя при этом подпространство неизменным и избегая ортогонализации или любых других дополнительных операций. ^[8] Кроме того, ортогонализация базиса трехмерного подпространства может потребоваться для плохо обусловленных задач на собственные значения для повышения устойчивости и достижимой точности.

Krylov subspace analogs

Это одновекторная версия метода LOBPCG — одно из возможных обобщений линейных решателей с предварительно обусловленными сопряженными градиентами на случай симметричных задач на собственные значения . ^[8] Даже в тривиальном случае $T=I$ и $B=I$ полученное приближение с $i>3$ будет отличаться от полученного алгоритмом Ланцоша , хотя обе аппроксимации будут принадлежать одному и тому же подпространству Крылова .

Сценарии практического использования

Чрезвычайная простота и высокая эффективность одновекторной версии LOBPCG делают ее привлекательной для приложений, связанных с собственными значениями, в условиях жестких аппаратных ограничений, начиная от спектральной кластеризации в реальном времени на основе обнаружения аномалий через разделение графа на встроенных ASIC или FPGA до моделирования физических явлений записи. сложность вычислений на экзафлопсных суперкомпьютерах TOP500 .

Блок версия

Краткое содержание

Последующие собственные пары могут быть вычислены одна за другой с помощью одновекторного LOBPCG, дополненного ортогональным дефляцией, или одновременно как блок. В первом подходе неточности в уже вычисленных приближенных собственных векторах аддитивно влияют на точность вычисленных впоследствии собственных векторов, тем самым увеличивая ошибку с каждым новым вычислением. Итерация нескольких приближенных собственных векторов вместе в блоке локально оптимальным способом в блочной версии LOBPCG. ^[8] позволяет быстро, точно и надежно вычислить собственные векторы, в том числе те, которые соответствуют почти множеству собственных значений, где одновекторный LOBPCG страдает от медленной сходимости. Размер блока можно настроить, чтобы сбалансировать численную стабильность, скорость сходимости и компьютерные затраты на ортогонализацию и метод Рэлея-Ритца на каждой итерации.

Основная конструкция

Блочный подход в LOBPCG заменяет одновекторный подход. $x^{i},\,w^{i},$ и $p^{i}$ с блок-векторами, т.е. матрицами $X^{i},\,W^{i},$ и $P^{i}$ , где, например, каждый столбец $X^{i}$ аппроксимирует один из собственных векторов. Все столбцы повторяются одновременно, и следующая матрица приближенных собственных векторов $X^{i+1}$ определяется методом Рэлея–Ритца на подпространстве, натянутом на все столбцы матриц $X^{i},\,W^{i},$ и $P^{i}$ . Каждый столбец $W^{i}$ вычисляется просто как предварительно обусловленный остаток для каждого столбца $X^{i}.$ Матрица $P^{i}$ определяется так, что подпространства, охватываемые столбцами $[X^{i},\,P^{i}]$ и из $[X^{i},\,X^{i-1}]$ одинаковы.

Численная стабильность против эффективности

Результат метода Рэлея – Ритца определяется подпространством, охватываемым всеми столбцами матриц. $X^{i},\,W^{i},$ и $P^{i}$ , где базис подпространства теоретически может быть произвольным. Однако в неточной компьютерной арифметике метод Рэлея-Ритца становится численно неустойчивым, если некоторые из базисных векторов приблизительно линейно зависимы. Численная нестабильность обычно возникает, например, если некоторые из собственных векторов в итерационном блоке уже достигают достижимой точности для заданной компьютерной точности и особенно заметны при низкой точности, например, одинарной точности .

Искусство множественной реализации LOBPCG заключается в обеспечении численной устойчивости метода Рэлея-Ритца при минимальных вычислительных затратах за счет выбора хорошего базиса подпространства. Вероятно, наиболее стабильный подход к ортогонализации базисных векторов, например, с помощью процесса Грама – Шмидта , также является самым дорогостоящим в вычислительном отношении. Например, реализации LOBPCG, ^[9]^[10] использовать нестабильное, но эффективное разложение Холецкого нормальной матрицы , которое выполняется только на отдельных матрицах $W^{i}$ и $P^{i}$ , а не на всем подпространстве. Постоянно увеличивающийся объем компьютерной памяти позволяет в настоящее время использовать типичные размеры блоков. $10^{3}-10^{4}$ диапазон, в котором процент вычислительного времени, затрачиваемый на ортогонализацию, и метод Рэлея-Ритца начинает доминировать.

Блокировка ранее сошедшихся собственных векторов

Блочные методы для задач собственных значений, которые перебирают подпространства, обычно имеют некоторые из итеративных собственных векторов, сходящихся быстрее, чем другие, что мотивирует блокировку уже сошедшихся собственных векторов, т. е. удаление их из итеративного цикла, чтобы исключить ненужные вычисления и улучшить численную стабильность. Простое удаление собственного вектора, вероятно, может привести к образованию его дубликата в повторяющихся векторах. Тот факт, что собственные векторы симметричных задач на собственные значения попарно ортогональны, предполагает сохранение всех итерационных векторов ортогональными заблокированным векторам.

Блокировку можно реализовать по-разному, сохраняя числовую точность и стабильность при минимизации вычислительных затрат. Например, реализации LOBPCG, ^[9]^[10] следовать, ^[8]^[11] отделение жесткой блокировки, т. е. дефляции путем ограничения, когда заблокированные собственные векторы служат входными данными кода и не изменяются, от мягкой блокировки, когда заблокированные векторы не участвуют в обычно самом дорогостоящем итеративном этапе вычисления остатков, однако полностью участвуют в методе Рэлея-Ритца и, таким образом, могут быть изменены методом Рэлея-Ритца.

Модификации, LOBPCG II

LOBPCG включает все столбцы матриц. $X^{i},\,W^{i},$ и $P^{i}$ в метод Рэлея-Ритца, что приводит к $3k$ -к- $3k$ проблему собственных значений, которую необходимо решить, и до $9k^{2}$ скалярные произведения для вычисления на каждой итерации, где $k$ обозначает размер блока — количество столбцов. Для блоков большого размера $k$ это начинает преобладать над затратами на вычисления и ввод-вывод и ограничивать распараллеливание, когда несколько вычислительных устройств работают одновременно.

Оригинальная бумага LOBPCG. ^[8] описывает модификацию, названную LOBPCG II, для решения такой проблемы, использующую одновекторную версию метода LOBPCG для каждой желаемой собственной пары с решением процедуры Рэлея-Ритца. $k$ прогнозируемых проблем собственных значений 3х3. Глобальная процедура Рэлея-Ритца для всех $k$ собственные пары есть на каждой итерации, но только в столбцах матрицы $X^{i}$ , тем самым уменьшая количество необходимых скалярных произведений до $k^{2}+3k$ от $9k^{2}$ и размер глобальной прогнозируемой проблемы собственных значений $k$ -к- $k$ от $3k$ -к- $3k$ на каждой итерации. Ссылка ^[12] идет дальше, применяя алгоритм LOBPCG к каждому аппроксимированному собственному вектору отдельно, т. е. запуская разблокированную версию метода LOBPCG для каждой желаемой собственной пары в течение фиксированного числа итераций. Процедуры Рэлея-Ритца в этих запусках должны решить только набор задач на проецируемые собственные значения 3 × 3. Глобальная процедура Рэлея-Ритца для всех желаемых собственных пар применяется только периодически в конце фиксированного числа разблокированных итераций LOBPCG.

Такие модификации могут быть менее надежными по сравнению с исходным LOBPCG. Индивидуально выполняемые ветви одновекторной LOBPCG не могут следовать непрерывным итеративным путям, вместо этого переворачиваясь и создавая дублированные аппроксимации одного и того же собственного вектора. Одновекторная LOBPCG может быть непригодна для кластеризованных собственных значений, но отдельные прогоны LOBPCG с малыми блоками требуют автоматического определения размеров их блоков в процессе итераций, поскольку количество кластеров собственных значений и их размеры могут быть априори неизвестны.

Теория и практика конвергенции

LOBPCG по конструкции гарантируется ^[8] минимизировать коэффициент Рэлея не медленнее, чем блок наикрутейшего градиентного спуска , который имеет всеобъемлющую теорию сходимости. Каждый собственный вектор является стационарной точкой фактора Рэлея , где градиент исчезает. Таким образом, градиентный спуск может замедлиться в окрестности любого собственного вектора , однако он гарантированно либо сходится к собственному вектору с линейной скоростью сходимости, либо, если этот собственный вектор является седловой точкой , итеративный коэффициент Рэлея с большей вероятностью упадет. ниже соответствующего собственного значения и начните линейно сходиться к следующему собственному значению ниже. Определено наихудшее значение скорости линейной сходимости. ^[8] и зависит от относительного разрыва между собственным значением и остальной частью матричного спектра и качества предобуславливателя , если он присутствует.

Для общей матрицы, очевидно, не существует способа предсказать собственные векторы и, таким образом, сгенерировать начальные приближения, которые всегда работают хорошо. Итерационное решение с помощью LOBPCG может быть чувствительным к начальным аппроксимациям собственных векторов, например, для сходимости требуется больше времени, а при прохождении промежуточных собственных пар оно замедляется. Более того, теоретически нельзя гарантировать сходимость обязательно к наименьшей собственной паре, хотя вероятность промаха равна нулю. хорошего качества Случайная функция Гаусса с нулевым средним значением обычно используется в LOBPCG по умолчанию для генерации начальных приближений. Чтобы зафиксировать начальные приближения, можно выбрать фиксированное начальное число для генератора случайных чисел .

В отличие от метода Ланцоша редко демонстрирует асимптотическую суперлинейную сходимость , LOBPCG на практике .

Частичный анализ главных компонент (PCA) и разложение по сингулярным значениям (SVD)

LOBPCG можно тривиально адаптировать для вычисления нескольких наибольших сингулярных значений и соответствующих сингулярных векторов (частичных SVD), например, для итеративного вычисления PCA для матрицы данных $D$ с нулевым средним значением, без явного вычисления ковариационной матрицы $D. Т D$ , то есть безматрицным способом . Основным расчетом является оценка функции произведения $D Т (DX)$ ковариационной матрицы $D Т D$ и блочный вектор $X$ , который итеративно аппроксимирует нужные сингулярные векторы. PCA требует наибольших собственных значений ковариационной матрицы, тогда как LOBPCG обычно реализуется для расчета наименьших. Простой обходной путь — отменить функцию, заменив $-D Т (DX)$ для $D Т (DX)$ и, таким образом, меняя порядок собственных значений на противоположный, поскольку LOBPCG не заботится о том, является ли матрица задачи собственных значений положительно определенной или нет. ^[9]

LOBPCG для PCA и SVD реализован в SciPy начиная с версии 1.4.0. ^[13]

Общие реализации программного обеспечения

Изобретатель LOBPCG, Андрей Князев , опубликовал эталонную реализацию под названием Block Locally Optimal Preconditional Eigenvalue Xolvers (BLOPEX). ^[14]^[15] с интерфейсами к PETSc , hypre и параллельному иерархическому адаптивному многоуровневому методу (PHAML). ^[16] Другие реализации доступны, например, в GNU Octave . ^[17] MATLAB (в том числе для распределенных или мозаичных массивов), ^[9] Ява , ^[18] Анасази ( Трилинос ), ^[19] СЛЕПк , ^[20]^[21] SciPy , ^[10] Юлия , ^[22] МАГМА, ^[23] Пайторч , ^[24] Ржавчина , ^[25] OpenMP и OpenACC , ^[26] CuPy ( NumPy -совместимая библиотека массивов, ускоряемая с помощью CUDA ), ^[27]Гугл Джакс , ^[28]и NVIDIA AMGX. ^[29] LOBPCG реализован, ^[30] но не включен в TensorFlow .

Приложения

Интеллектуальный анализ данных

Пакеты программного обеспечения scikit-learn и Megaman ^[31] используйте LOBPCG для масштабирования спектральной кластеризации ^[32] и разнообразное обучение ^[33] через собственные карты Лапласа к большим наборам данных. NVIDIA реализовала ^[34] LOBPCG в своей библиотеке nvGRAPH, представленной в CUDA 8. Sphynx, ^[35] гибридный параллельный разделитель графов с распределенной и общей памятью — первый инструмент разделения графов, который работает на графических процессорах с настройками распределенной памяти — использует спектральную кластеризацию для разделения графа , вычисляя собственные векторы на матрице Лапласа графа с использованием LOBPCG из Анасази упаковка.

Материальные науки

LOBPCG реализован в ABINIT. ^[36] (включая CUDA версию ) и Octopus . ^[37] использовали его для создания матриц размером в несколько миллиардов Финалисты премии Гордона Белла на Earth Simulator суперкомпьютере в Японии. ^[38]^[39]Модель Хаббарда для сильно коррелированных электронных систем для понимания механизма сверхпроводимости использует LOBPCG для расчета основного состояния гамильтониана . на K-компьютере ^[40] и системы с несколькими графическими процессорами. ^[41]

Есть МАТЛАБ ^[42] и Джулия ^[43]^[44]версии LOBPCG для уравнений Кона-Шэма и теории функционала плотности (DFT) с использованием базиса плоских волн.Последние реализации включают TTPY, ^[45] Утконос-QM, ^[46] МФД, ^[47] ACE-Молекула, ^[48] ЛАКОНИЧНЫЙ. ^[49]

Механика и жидкости

LOBPCG от BLOPEX используется для настройки прекондиционера в библиотеке решателей многоуровневого балансирующего доменного разложения по ограничениям (BDDC) BDDCML, которая включена в OpenFTL (открытая библиотека шаблонов конечных элементов ) и симулятор Flow123d потока подземных вод, переноса растворенных веществ и тепла в трещиноватых пористых средах. . LOBPCG реализован ^[50] в LS-DYNA и косвенно в ANSYS . ^[51]

Уравнения Максвелла

LOBPCG — один из основных решателей собственных значений в PYFEMax и высокопроизводительном мультифизическом программном обеспечении конечных элементов Netgen/NGSolve. LOBPCG от hypre включен в с открытым исходным кодом облегченную масштабируемую C++ библиотеку конечных элементов для методов MFEM , которая используется во многих проектах, включая BLAST , XBraid, VisIt , xSDK, институт FASTMath в SciDAC и Центр совместного проектирования эффективной экзафлопсной дискретизации. (CEED) в проекте экзафлопсных вычислений .

шумоподавление

на основе LOBPCG итеративный приблизительный фильтр нижних частот можно использовать Для шумоподавления ; видеть, ^[52] например, для ускорения общего шумоподавления .

Сегментация изображений

Сегментация изображения посредством спектральной кластеризации выполняет низкоразмерное встраивание с использованием матрицы сродства между пикселями с последующей кластеризацией компонентов собственных векторов в низкомерном пространстве, например, с использованием графа Лапласа для двустороннего фильтра . Сегментация изображений спектральных посредством разделения графов с помощью LOBPCG с многосеточной предварительной обработкой была впервые предложена в ^[53] и фактически протестировано в ^[54] и. ^[55] Последний подход был позже реализован в Python scikit-learn. ^[56] который использует LOBPCG из SciPy с алгебраической многосеточной предварительной обуславливанием для решения проблемы собственных значений для лапласиана графа.

Ссылки

^ Самокиш, Б.А. (1958). «Метод наискорейшего спуска для задачи собственных значений с полуограниченными операторами». Известия Вузов, Матем. (5): 105–114.
^ Дьяконов Е.Г. (1996). Оптимизация при решении эллиптических задач . ЦРК-Пресс. п. 592. ИСБН 978-0-8493-2872-5 .
^ Каллум, Джейн К .; Уиллоуби, Ральф А. (2002). Алгоритмы Ланцоша для больших симметричных вычислений собственных значений. Том. 1 (Перепечатка оригинала 1985 года) . Общество промышленной и прикладной математики .
^ Князев, Андрей Васильевич (1987). «Оценки скорости сходимости итерационных методов решения сеточной симметричной задачи собственных значений». Советский журнал численного анализа и математического моделирования . 2 (5): 371–396. дои : 10.1515/rnam.1987.2.5.371 . S2CID 121473545 .
^ Князев, А.В. (1991). «Метод сопряженных градиентов с предварительным условием для задач собственных значений и его реализация в подпространстве». В Альбрехте, Дж.; Коллатц, Л.; Хагедорн, П.; Велте, В. (ред.). Численное решение задач на собственные значения Vol. 5 . Международная серия по числовой математике. Том. 96. стр. 143–154. дои : 10.1007/978-3-0348-6332-2_11 . ISBN 978-3-0348-6334-6 .
^ Князев, Андрей Васильевич (1998). «Предварительно обусловленные собственные решатели - оксюморон?». Электронные труды по численному анализу . 7 : 104–123.
^ Князев, Андрей (2017). «Последние реализации, приложения и расширения метода локально оптимального блочного предварительно обусловленного сопряженного градиента (LOBPCG)». arXiv : 1708.08354 [ cs.NA ].
^ Jump up to: ^а ^б ^с ^д ^и ^ж ^г ^час Князев, Андрей Васильевич (2001). «На пути к оптимальному предварительно обусловленному собственному решателю: локально оптимальный блочный предварительно обусловленный метод сопряженных градиентов». SIAM Журнал по научным вычислениям . 23 (2): 517–541. Бибкод : 2001ГАК...23..517К . дои : 10.1137/S1064827500366124 . S2CID 7077751 .
^ Jump up to: ^а ^б ^с ^д MATLAB LOBPCG Функция обмена файлами
^ Jump up to: ^а ^б ^с Функция разреженной линейной алгебры SciPy lobpcg
^ Князев, А. (2004). Жесткая и мягкая блокировка в итерационных методах решения симметричных задач на собственные значения . Восьмая конференция Copper Mountain по итерационным методам, 28 марта — 2 апреля 2004 г. doi : 10.13140/RG.2.2.11794.48327 .
^ Вечеринский, Э.; Ян, К.; Паск, Дж. Э. (2015). «Планируемый алгоритм сопряженного градиента с предварительным условием для вычисления множества крайних собственных пар эрмитовой матрицы» . Дж. Компьютер. Физ . 290 : 73–89. arXiv : 1407.7506 . Бибкод : 2015JCoPh.290...73В . дои : 10.1016/j.jcp.2015.02.030 . S2CID 43741860 .
^ LOBPCG для SVDS в SciPy
^ GitHub БЛОПЭКС
^ Князев А.В.; Арджентати, Мэн; Лащук И.; Овчинников, Э.Э. (2007). «Блокировка локально оптимальных предварительно обусловленных Xolvers собственных значений (BLOPEX) в Hypre и PETSc». SIAM Журнал по научным вычислениям . 29 (5): 2224. arXiv : 0705.2626 . Бибкод : 2007arXiv0705.2626K . дои : 10.1137/060661624 . S2CID 266 .
^ Интерфейс PHAML BLOPEX для LOBPCG
^ Октавная функция линейной алгебры lobpcg
^ Java LOBPCG в Google Code
^ Анасази Трилинос LOBPCG на GitHub
^ Родной SLEPc LOBPCG
^ SLEPc BLOPEX для LOBPCG Интерфейс
^ Джулия LOBPCG на GitHub
^ Анцт, Хартвиг; Томов, Станимир; Донгарра, Джек (2015). «Ускорение метода LOBPCG на графических процессорах с использованием векторного произведения с блокированной разреженной матрицей» . Материалы симпозиума по высокопроизводительным вычислениям (HPC '15). Международное общество компьютерного моделирования, Сан-Диего, Калифорния, США . HPC '15: 75–82. ISBN 9781510801011 .
^ Pytorch LOBPCG на GitHub
^ Rust LOBPCG на GitHub
^ Раввин Фазлай; Дейли, Кристофер С.; Актулга, Хасан М.; Райт, Николас Дж. (2019). Оценка моделей программирования графического процессора на основе директив на блочном решателе собственных чисел с учетом больших разреженных матриц (PDF) . Седьмой семинар по программированию ускорителей с использованием директив, SC19: Международная конференция по высокопроизводительным вычислениям, сетям, хранению и анализу .
^ CuPy: NumPy -совместимая библиотека массивов, ускоренная CUDA LOBPCG на GitHub
^ Google JAX Первоначальное слияние LOBPCG на GitHub
^ NVIDIA AMGX LOBPCG на GitHub
^ Рахуба, Максим; Новиков, Александр; Оседелец, Иван (2019). «Риманов собственный решатель низкого ранга для многомерных гамильтонианов» . Журнал вычислительной физики . 396 : 718–737. arXiv : 1811.11049 . Бибкод : 2019JCoPh.396..718R . дои : 10.1016/j.jcp.2019.07.003 . S2CID 119679555 .
^ МакКуин, Джеймс; и др. (2016). «Мегамен: масштабируемое многообразное обучение на Python» . Журнал исследований машинного обучения . 17 (148): 1–5. Бибкод : 2016JMLR...17..148M .
^ «Sklearn.cluster.SpectralClustering — документация scikit-learn 0.22.1» .
^ «Sklearn.manifold.spectral_embedding — документация scikit-learn 0.22.1» .
^ Наумов, Максим (2016). «Быстрое разбиение спектрального графа на графических процессорах» . Блог разработчиков NVIDIA .
^ «Разбиение SGraph с помощью Spynx» .
^ Документы ABINIT: АЛГОРИТМ оптимизации WaveFunction
^ «Руководство разработчика Octopus:LOBPCG» . Архивировано из оригинала 29 июля 2018 г. Проверено 29 июля 2018 г.
^ Ямада, С.; Имамура, Т.; Мачида, М. (2005). 16,447 терафлопс и точная диагонализация размером 159 миллиардов измерений для модели захваченного фермиона-Хаббарда в симуляторе Земли . Учеб. Конференция ACM/IEEE по суперкомпьютерам (SC'05) . п. 44. дои : 10.1109/SC.2005.1 . ISBN 1-59593-061-2 .
^ Ямада, С.; Имамура, Т.; Кано, Т.; Мачида, М. (2006). Финалисты Гордона Белла I — Высокопроизводительные вычисления для точных численных подходов к квантовым задачам многих тел на симуляторе Земли . Учеб. Конференция ACM/IEEE по суперкомпьютерам (SC '06). п. 47. дои : 10.1145/1188455.1188504 . ISBN 0769527000 .
^ Ямада, С.; Имамура, Т.; Мачида, М. (2018). Высокопроизводительный метод LOBPCG для решения множественных собственных значений модели Хаббарда: эффективность связи, позволяющая избежать предобуславливателя расширения Неймана . Азиатская конференция по перспективам суперкомпьютеров. Ёкота Р., Ву В. (ред.) «Передовые рубежи суперкомпьютеров». SCFA 2018. Конспекты лекций по информатике, том 10776. Springer, Cham . стр. 243–256. дои : 10.1007/978-3-319-69953-0_14 .
^ Ямада, С.; Имамура, Т.; Мачида, М. (2022). Высокопроизводительный параллельный метод LOBPCG для большого гамильтониана, полученного на основе модели Хаббарда в системах с несколькими графическими процессорами . Суперкомпьютерная Азия (SCA).
^ Ян, К.; Меза, JC; Ли, Б.; Ван, Л.-В. (2009). «KSSOLV - набор инструментов MATLAB для решения уравнений Кона-Шэма». АКМ Транс. Математика. Программное обеспечение . 36 (2): 1–35. дои : 10.1145/1499096.1499099 . S2CID 624897 .
^ Фатуррахман, Фаджар; Агуста, Мохаммад Кемаль; Сапутро, Адхитья Гандариус; Дипохоно, Хермаван Кресно (2020). «PWDFT.jl: пакет Julia для расчета электронной структуры с использованием теории функционала плотности и базиса плоских волн». Компьютерная физика. Коммуникации . 256 : 107372. Бибкод : 2020CoPhC.25607372F . дои : 10.1016/j.cpc.2020.107372 . S2CID 219517717 .
^ Набор инструментов функционала плотности (DFTK). Теория функционала плотности плоских волн в Джулии
^ Рахуба, Максим; Оселедец, Иван (2016). «Расчет колебательных спектров молекул с использованием разложения тензорного поезда». Дж. Хим. Физ . 145 (12): 124101. arXiv : 1605.08422 . Бибкод : 2016JChPh.145l4101R . дои : 10.1063/1.4962420 . ПМИД 27782616 . S2CID 44797395 .
^ Такано, Ю; Наката, Кадзуто; Ёнэдзава, Ясусигэ; Накамура, Харуки (2016). «Разработка масштабной многоуровневой программы моделирования молекулярной динамики утконоса (PLATform для унифицированного моделирования динамических белков) для выяснения функций белков» . Дж. Компьютер. Хим . 37 (12): 1125–1132. дои : 10.1002/jcc.24318 . ПМЦ 4825406 . ПМИД 26940542 .
^ Шао, Мэйюэ; и др. (2018). «Ускорение расчетов взаимодействия ядерных конфигураций с помощью заранее подготовленного блочного итеративного собственного решателя». Компьютерная физика. Коммуникации . 222 (1): 1–13. arXiv : 1609.01689 . Бибкод : 2018CoPhC.222....1S . дои : 10.1016/j.cpc.2017.09.004 . S2CID 13996642 .
^ Кан, Сону; и др. (2020). «ACE-Molecule: пакет квантовой химии с открытым исходным кодом в реальном пространстве» . Журнал химической физики . 152 (12): 124110. Бибкод : 2020ЖЧФ.152л4110К . дои : 10.1063/5.0002959 . ПМИД 32241122 . S2CID 214768088 .
^ Бачевски, Эндрю Дэвид; Бриксон, Митчелл Ян; Кэмпбелл, Куинн; Джейкобсон, Ной Тобиас; Маурер, Леон (01 сентября 2020 г.). Квантовый аналоговый сопроцессор для моделирования коррелированных электронных систем (Отчет). США: Национальная лаборатория Сандии. (СНЛ-НМ). дои : 10.2172/1671166 . ОСТИ 1671166 .
^ Обзор методов собственных решений в LS-DYNA . 15-я Международная конференция LS-DYNA, Детройт. 2018.
^ «Последние разработки LS-DYNA 2024R1 (R15.0)» (PDF) . 2024. с. 15.
^ Князев А.; Малышев, А. (2015). Ускоренные фильтры спектральных полиномов на основе графов . 2015 25-й международный семинар IEEE по машинному обучению для обработки сигналов (MLSP), Бостон, Массачусетс. стр. 1–6. arXiv : 1509.02468 . дои : 10.1109/MLSP.2015.7324315 .
^ Князев, Андрей Васильевич (2003). Боли; Диллон; Гоша; Коган (ред.). Современные предварительно подготовленные собственные решатели для спектральной сегментации изображений и деления графа пополам . Кластеризация больших наборов данных; Третья Международная конференция IEEE по интеллектуальному анализу данных (ICDM 2003) Мельбурн, Флорида: Компьютерное общество IEEE. стр. 59–62.
^ Князев, Андрей В. (2006). Многомасштабная сегментация спектрального изображения. Многомасштабная предварительная подготовка для вычисления собственных значений лапласианов графа при сегментации изображений . Семинар по быстрому изучению многообразий, В.М. Вильямбург, Вирджиния. дои : 10.13140/RG.2.2.35280.02565 .
^ Князев, Андрей В. (2006). Многомасштабное разбиение спектрального графа и сегментация изображений . Семинар по алгоритмам обработки современных массивных наборов данных Стэнфордского университета и Yahoo! Исследовать.
^ «Спектральная кластеризация — учебная документация» .

Внешние ссылки

[S58-1] Самокиш, Б.А. (1958). «Метод наискорейшего спуска для задачи собственных значений с полуограниченными операторами». Известия Вузов, Матем. (5): 105–114.

[D-2] Дьяконов Е.Г. (1996). Оптимизация при решении эллиптических задач . ЦРК-Пресс. п. 592. ИСБН 978-0-8493-2872-5 .

[CW-3] Каллум, Джейн К .; Уиллоуби, Ральф А. (2002). Алгоритмы Ланцоша для больших симметричных вычислений собственных значений. Том. 1 (Перепечатка оригинала 1985 года) . Общество промышленной и прикладной математики .

[K87-4] Князев, Андрей Васильевич (1987). «Оценки скорости сходимости итерационных методов решения сеточной симметричной задачи собственных значений». Советский журнал численного анализа и математического моделирования . 2 (5): 371–396. дои : 10.1515/rnam.1987.2.5.371 . S2CID 121473545 .

[K91-5] Князев, А.В. (1991). «Метод сопряженных градиентов с предварительным условием для задач собственных значений и его реализация в подпространстве». В Альбрехте, Дж.; Коллатц, Л.; Хагедорн, П.; Велте, В. (ред.). Численное решение задач на собственные значения Vol. 5 . Международная серия по числовой математике. Том. 96. стр. 143–154. дои : 10.1007/978-3-0348-6332-2_11 . ISBN 978-3-0348-6334-6 .

[K98-6] Князев, Андрей Васильевич (1998). «Предварительно обусловленные собственные решатели - оксюморон?». Электронные труды по численному анализу . 7 : 104–123.

[K2017-7] Князев, Андрей (2017). «Последние реализации, приложения и расширения метода локально оптимального блочного предварительно обусловленного сопряженного градиента (LOBPCG)». arXiv : 1708.08354 [ cs.NA ].

[AK2001-8] Jump up to: ^а ^б ^с ^д ^и ^ж ^г ^час Князев, Андрей Васильевич (2001). «На пути к оптимальному предварительно обусловленному собственному решателю: локально оптимальный блочный предварительно обусловленный метод сопряженных градиентов». SIAM Журнал по научным вычислениям . 23 (2): 517–541. Бибкод : 2001ГАК...23..517К . дои : 10.1137/S1064827500366124 . S2CID 7077751 .

[matlab-9] Jump up to: ^а ^б ^с ^д MATLAB LOBPCG Функция обмена файлами

[scipy-10] Jump up to: ^а ^б ^с Функция разреженной линейной алгебры SciPy lobpcg

[11] Князев, А. (2004). Жесткая и мягкая блокировка в итерационных методах решения симметричных задач на собственные значения . Восьмая конференция Copper Mountain по итерационным методам, 28 марта — 2 апреля 2004 г. doi : 10.13140/RG.2.2.11794.48327 .

[PPCG2015-12] Вечеринский, Э.; Ян, К.; Паск, Дж. Э. (2015). «Планируемый алгоритм сопряженного градиента с предварительным условием для вычисления множества крайних собственных пар эрмитовой матрицы» . Дж. Компьютер. Физ . 290 : 73–89. arXiv : 1407.7506 . Бибкод : 2015JCoPh.290...73В . дои : 10.1016/j.jcp.2015.02.030 . S2CID 43741860 .

[13] LOBPCG для SVDS в SciPy

[14] GitHub БЛОПЭКС

[15] Князев А.В.; Арджентати, Мэн; Лащук И.; Овчинников, Э.Э. (2007). «Блокировка локально оптимальных предварительно обусловленных Xolvers собственных значений (BLOPEX) в Hypre и PETSc». SIAM Журнал по научным вычислениям . 29 (5): 2224. arXiv : 0705.2626 . Бибкод : 2007arXiv0705.2626K . дои : 10.1137/060661624 . S2CID 266 .

[16] Интерфейс PHAML BLOPEX для LOBPCG

[17] Октавная функция линейной алгебры lobpcg

[18] Java LOBPCG в Google Code

[19] Анасази Трилинос LOBPCG на GitHub

[20] Родной SLEPc LOBPCG

[21] SLEPc BLOPEX для LOBPCG Интерфейс

[22] Джулия LOBPCG на GitHub

[23] Анцт, Хартвиг; Томов, Станимир; Донгарра, Джек (2015). «Ускорение метода LOBPCG на графических процессорах с использованием векторного произведения с блокированной разреженной матрицей» . Материалы симпозиума по высокопроизводительным вычислениям (HPC '15). Международное общество компьютерного моделирования, Сан-Диего, Калифорния, США . HPC '15: 75–82. ISBN 9781510801011 .

[24] Pytorch LOBPCG на GitHub

[25] Rust LOBPCG на GitHub

[26] Раввин Фазлай; Дейли, Кристофер С.; Актулга, Хасан М.; Райт, Николас Дж. (2019). Оценка моделей программирования графического процессора на основе директив на блочном решателе собственных чисел с учетом больших разреженных матриц (PDF) . Седьмой семинар по программированию ускорителей с использованием директив, SC19: Международная конференция по высокопроизводительным вычислениям, сетям, хранению и анализу .

[27] CuPy: NumPy -совместимая библиотека массивов, ускоренная CUDA LOBPCG на GitHub

[28] Google JAX Первоначальное слияние LOBPCG на GitHub

[29] NVIDIA AMGX LOBPCG на GitHub

[30] Рахуба, Максим; Новиков, Александр; Оседелец, Иван (2019). «Риманов собственный решатель низкого ранга для многомерных гамильтонианов» . Журнал вычислительной физики . 396 : 718–737. arXiv : 1811.11049 . Бибкод : 2019JCoPh.396..718R . дои : 10.1016/j.jcp.2019.07.003 . S2CID 119679555 .

[31] МакКуин, Джеймс; и др. (2016). «Мегамен: масштабируемое многообразное обучение на Python» . Журнал исследований машинного обучения . 17 (148): 1–5. Бибкод : 2016JMLR...17..148M .

[32] «Sklearn.cluster.SpectralClustering — документация scikit-learn 0.22.1» .

[33] «Sklearn.manifold.spectral_embedding — документация scikit-learn 0.22.1» .

[34] Наумов, Максим (2016). «Быстрое разбиение спектрального графа на графических процессорах» . Блог разработчиков NVIDIA .

[35] «Разбиение SGraph с помощью Spynx» .

[36] Документы ABINIT: АЛГОРИТМ оптимизации WaveFunction

[37] «Руководство разработчика Octopus:LOBPCG» . Архивировано из оригинала 29 июля 2018 г. Проверено 29 июля 2018 г.

[38] Ямада, С.; Имамура, Т.; Мачида, М. (2005). 16,447 терафлопс и точная диагонализация размером 159 миллиардов измерений для модели захваченного фермиона-Хаббарда в симуляторе Земли . Учеб. Конференция ACM/IEEE по суперкомпьютерам (SC'05) . п. 44. дои : 10.1109/SC.2005.1 . ISBN 1-59593-061-2 .

[39] Ямада, С.; Имамура, Т.; Кано, Т.; Мачида, М. (2006). Финалисты Гордона Белла I — Высокопроизводительные вычисления для точных численных подходов к квантовым задачам многих тел на симуляторе Земли . Учеб. Конференция ACM/IEEE по суперкомпьютерам (SC '06). п. 47. дои : 10.1145/1188455.1188504 . ISBN 0769527000 .

[40] Ямада, С.; Имамура, Т.; Мачида, М. (2018). Высокопроизводительный метод LOBPCG для решения множественных собственных значений модели Хаббарда: эффективность связи, позволяющая избежать предобуславливателя расширения Неймана . Азиатская конференция по перспективам суперкомпьютеров. Ёкота Р., Ву В. (ред.) «Передовые рубежи суперкомпьютеров». SCFA 2018. Конспекты лекций по информатике, том 10776. Springer, Cham . стр. 243–256. дои : 10.1007/978-3-319-69953-0_14 .

[41] Ямада, С.; Имамура, Т.; Мачида, М. (2022). Высокопроизводительный параллельный метод LOBPCG для большого гамильтониана, полученного на основе модели Хаббарда в системах с несколькими графическими процессорами . Суперкомпьютерная Азия (SCA).

[42] Ян, К.; Меза, JC; Ли, Б.; Ван, Л.-В. (2009). «KSSOLV - набор инструментов MATLAB для решения уравнений Кона-Шэма». АКМ Транс. Математика. Программное обеспечение . 36 (2): 1–35. дои : 10.1145/1499096.1499099 . S2CID 624897 .

[43] Фатуррахман, Фаджар; Агуста, Мохаммад Кемаль; Сапутро, Адхитья Гандариус; Дипохоно, Хермаван Кресно (2020). «PWDFT.jl: пакет Julia для расчета электронной структуры с использованием теории функционала плотности и базиса плоских волн». Компьютерная физика. Коммуникации . 256 : 107372. Бибкод : 2020CoPhC.25607372F . дои : 10.1016/j.cpc.2020.107372 . S2CID 219517717 .

[44] Набор инструментов функционала плотности (DFTK). Теория функционала плотности плоских волн в Джулии

[45] Рахуба, Максим; Оселедец, Иван (2016). «Расчет колебательных спектров молекул с использованием разложения тензорного поезда». Дж. Хим. Физ . 145 (12): 124101. arXiv : 1605.08422 . Бибкод : 2016JChPh.145l4101R . дои : 10.1063/1.4962420 . ПМИД 27782616 . S2CID 44797395 .

[46] Такано, Ю; Наката, Кадзуто; Ёнэдзава, Ясусигэ; Накамура, Харуки (2016). «Разработка масштабной многоуровневой программы моделирования молекулярной динамики утконоса (PLATform для унифицированного моделирования динамических белков) для выяснения функций белков» . Дж. Компьютер. Хим . 37 (12): 1125–1132. дои : 10.1002/jcc.24318 . ПМЦ 4825406 . ПМИД 26940542 .

[47] Шао, Мэйюэ; и др. (2018). «Ускорение расчетов взаимодействия ядерных конфигураций с помощью заранее подготовленного блочного итеративного собственного решателя». Компьютерная физика. Коммуникации . 222 (1): 1–13. arXiv : 1609.01689 . Бибкод : 2018CoPhC.222....1S . дои : 10.1016/j.cpc.2017.09.004 . S2CID 13996642 .

[48] Кан, Сону; и др. (2020). «ACE-Molecule: пакет квантовой химии с открытым исходным кодом в реальном пространстве» . Журнал химической физики . 152 (12): 124110. Бибкод : 2020ЖЧФ.152л4110К . дои : 10.1063/5.0002959 . ПМИД 32241122 . S2CID 214768088 .

[49] Бачевски, Эндрю Дэвид; Бриксон, Митчелл Ян; Кэмпбелл, Куинн; Джейкобсон, Ной Тобиас; Маурер, Леон (01 сентября 2020 г.). Квантовый аналоговый сопроцессор для моделирования коррелированных электронных систем (Отчет). США: Национальная лаборатория Сандии. (СНЛ-НМ). дои : 10.2172/1671166 . ОСТИ 1671166 .

[50] Обзор методов собственных решений в LS-DYNA . 15-я Международная конференция LS-DYNA, Детройт. 2018.

[51] «Последние разработки LS-DYNA 2024R1 (R15.0)» (PDF) . 2024. с. 15.

[52] Князев А.; Малышев, А. (2015). Ускоренные фильтры спектральных полиномов на основе графов . 2015 25-й международный семинар IEEE по машинному обучению для обработки сигналов (MLSP), Бостон, Массачусетс. стр. 1–6. arXiv : 1509.02468 . дои : 10.1109/MLSP.2015.7324315 .

[53] Князев, Андрей Васильевич (2003). Боли; Диллон; Гоша; Коган (ред.). Современные предварительно подготовленные собственные решатели для спектральной сегментации изображений и деления графа пополам . Кластеризация больших наборов данных; Третья Международная конференция IEEE по интеллектуальному анализу данных (ICDM 2003) Мельбурн, Флорида: Компьютерное общество IEEE. стр. 59–62.

[54] Князев, Андрей В. (2006). Многомасштабная сегментация спектрального изображения. Многомасштабная предварительная подготовка для вычисления собственных значений лапласианов графа при сегментации изображений . Семинар по быстрому изучению многообразий, В.М. Вильямбург, Вирджиния. дои : 10.13140/RG.2.2.35280.02565 .

[55] Князев, Андрей В. (2006). Многомасштабное разбиение спектрального графа и сегментация изображений . Семинар по алгоритмам обработки современных массивных наборов данных Стэнфордского университета и Yahoo! Исследовать.

[56] «Спектральная кластеризация — учебная документация» .

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

[42]

[43]

[44]

[45]

[46]

[47]

[48]

[49]

[50]

[51]

[52]

[53]

[54]

[55]

[56]

v т и Численная линейная алгебра
Ключевые понятия	Плавающая точка Численная стабильность
Проблемы	Система линейных уравнений Матричное разложение Умножение матриц ( алгоритмы ) Расщепление матрицы Редкие проблемы
Аппаратное обеспечение	Кэш процессора TLB Алгоритм, не обращающий внимания на кэш SIMD Многопроцессорность
Программное обеспечение	АТЛАС МАТЛАБ Базовые подпрограммы линейной алгебры (BLAS) ЛАПАК Специализированные библиотеки Программное обеспечение общего назначения

Фон

Основные особенности [7]