Теорема Синкхорна
Теорема Синкхорна утверждает, что каждую квадратную матрицу с положительными элементами можно записать в определенной стандартной форме.
Теорема
[ редактировать ]Если A — размера n × n матрица со строго положительными элементами, то существуют диагональные матрицы D 1 и D 2 со строго положительными диагональными элементами такие, что D 1 AD 2 является дважды стохастической . Матрицы D 1 и D 2 уникальны по модулю умножения первой матрицы на положительное число и деления второй на то же число. [ 1 ] [ 2 ]
Алгоритм Синкхорна – Кноппа
[ редактировать ]Простой итерационный метод приближения к двойной стохастической матрице состоит в поочередном масштабировании всех строк и всех столбцов A до суммы, равной 1. Синкхорн и Кнопп представили этот алгоритм и проанализировали его сходимость. [ 3 ] По сути, это то же самое, что итеративный алгоритм пропорциональной аппроксимации , хорошо известный в статистике опросов.
Аналоги и расширения
[ редактировать ]Верен также следующий аналог для унитарных матриц: для каждой унитарной матрицы U существуют две диагональные унитарные матрицы L и R такие, что LUR равна 1. сумма всех столбцов и строк [ 4 ]
Верно также следующее расширение на отображения между матрицами (см. теорему 5 [ 5 ] а также теорема 4.7 [ 6 ] ): с учетом оператора Крауса которая представляет собой квантовую операцию Φ, отображающую одну матрицу плотности в другую,
это сохранение следов,
и, кроме того, чей диапазон находится внутри положительно определенного конуса (строгая положительность), существуют масштабирования x j для j в {0,1}, которые являются положительно определенными, так что перемасштабированный оператор Крауса
является вдвойне стохастическим. Другими словами, ситуация такова, что оба,
а также для сопряженного,
где I обозначает тождественный оператор.
Приложения
[ редактировать ]В 2010-х годах теорема Синкхорна стала использоваться для поиска решений энтропийно-регуляризованных задач оптимального транспорта . [ 7 ] Это представляет интерес для машинного обучения , поскольку такие «расстояния Синхорна» можно использовать для оценки разницы между распределениями данных и перестановками. [ 8 ] [ 9 ] [ 10 ] Это улучшает обучение алгоритмов машинного обучения в ситуациях, когда обучение методом максимального правдоподобия может быть не лучшим методом.
Ссылки
[ редактировать ]- ^ Синкхорн, Ричард. (1964). «Связь между произвольными положительными матрицами и дважды стохастическими матрицами». Энн. Математика. Статист. 35 , 876–879. два : 10.1214/aoms/1177703591
- ^ Маршалл, А.В., и Олкин, И. (1967). «Масштабирование матриц для достижения заданных сумм строк и столбцов». Числовая математика . 12 (1) , 83–90. дои : 10.1007/BF02170999
- ^ Синкхорн, Ричард, и Кнопп, Пол. (1967). «О неотрицательных матрицах и дважды стохастических матрицах». Пасифик Дж. Математика. 21 , 343–348.
- ^ Идель, Мартин; Вольф, Майкл М. (2015). «Нормальная форма Синкхорна для унитарных матриц». Линейная алгебра и ее приложения . 471 : 76–84. arXiv : 1408.5728 . дои : 10.1016/j.laa.2014.12.031 . S2CID 119175915 .
- ^ Георгиу, Трифон; Павон, Мишель (2015). «Положительные сжимающие отображения для классических и квантовых систем Шрёдингера». Журнал математической физики . 56 (3): 033301–1–24. arXiv : 1405.6650 . Бибкод : 2015JMP....56c3301G . дои : 10.1063/1.4915289 . S2CID 119707158 .
- ^ Гурвиц, Леонид (2004). «Классическая сложность и квантовая запутанность» . Журнал вычислительной науки . 69 (3): 448–484. дои : 10.1016/j.jcss.2004.06.003 .
- ^ Кутури, Марко (2013). «Расстояния Синкхорна: расчет скорости света для оптимального транспорта». Достижения в области нейронных систем обработки информации . стр. 2292–2300.
- ^ Менш, Артур; Блондель, Матье; Пейр, Габриэль (2019). «Геометрические потери для распределенного обучения». Процесс ICML 2019 . arXiv : 1905.06005 .
- ^ Мена, Гонсало; Беланджер, Дэвид; Муньос, Гонсало; Снук, Джаспер (2017). «Сети Синкхорна: использование оптимальных методов транспортировки для изучения перестановок». Семинар NIPS по оптимальному транспорту и машинному обучению .
- ^ Когкалидис, Константинос; Моортгат, Майкл; Мут, Ричард (2020). «Нейронные сети доказательств» . Материалы 24-й конференции по компьютерному изучению естественного языка .