Информационная метрика Фишера
В информационной геометрии информационная метрика Фишера [1] — это частная риманова метрика , которая может быть определена на гладком статистическом многообразии , т. е . на гладком многообразии , точки которого являются вероятностными мерами, определенными на общем вероятностном пространстве . Его можно использовать для расчета информационной разницы между измерениями. [ нужны разъяснения ]
Этот показатель интересен в нескольких аспектах. По теореме Ченцова информационная метрика Фишера на статистических моделях является единственной римановой метрикой (с точностью до масштабирования), инвариантной при достаточной статистике . [2] [3]
Его также можно понимать как бесконечно малую форму относительной энтропии ( т. е. расхождение Кульбака – Лейблера ); в частности, это гессиан дивергенции. С другой стороны, ее можно понимать как метрику, индуцированную евклидовой метрикой плоского пространства после соответствующих замен переменной. При расширении до комплексного проективного гильбертова пространства оно становится метрикой Фубини–Студи ; когда оно записано в терминах смешанных состояний , это квантовая метрика Бюреса .
Рассматриваемая исключительно как матрица, она известна как информационная матрица Фишера . Рассматриваемый как метод измерения, в котором он используется для оценки скрытых параметров с точки зрения наблюдаемых случайных величин, он известен как наблюдаемая информация .
Определение [ править ]
Учитывая статистическое многообразие с координатами , пишет один для плотности вероятности как функции . Здесь извлекается из пространства значений R для (дискретной или непрерывной) величины X. случайной Вероятность нормируется где это распределение .
Тогда информационная метрика Фишера принимает форму: [ нужны разъяснения ]
Интеграл выполняется по всем значениям x в R . Переменная теперь является координатой на римановом многообразии . Метки j и k индексируют локальные оси координат на многообразии.
Когда вероятность выводится из меры Гиббса , как это было бы для любого марковского процесса , тогда также можно понимать как множитель Лагранжа ; Множители Лагранжа используются для обеспечения соблюдения ограничений, таких как сохранение математического ожидания некоторой постоянной величины. Если существует n ограничений, удерживающих константы n различных математических ожиданий, то размерность многообразия на n измерений меньше исходного пространства. В этом случае метрика может быть явно получена из статистической суммы ; там представлены вывод и обсуждение.
Замена Из теории информации эквивалентной формой приведенного выше определения является:
Чтобы показать, что эквивалентная форма соответствует приведенному выше определению, обратите внимание, что
и применить с обеих сторон.
Кульбака – с расхождением Связь Лейблера
Альтернативно, метрика может быть получена как вторая производная относительной энтропии или дивергенции Кульбака – Лейблера . [4] Чтобы получить это, рассмотрим два распределения вероятностей и , которые бесконечно близки друг к другу, так что
с бесконечно малое изменение в направлении j . Тогда, поскольку расходимость Кульбака–Лейблера имеет абсолютный минимум 0, когда , имеет разложение до второго порядка по формы
- .
Симметричная матрица положительно (полу)определена и представляет собой матрицу Гессе функции в последней точке . Интуитивно это можно представить так: «Расстояние между двумя бесконечно близкими точками на статистическом дифференциальном многообразии является информационной разницей между ними».
с Руппейнера Связь геометрией
Метрика Руппейнера и метрика Вейнхольда — это информационная метрика Фишера, рассчитанная для распределений Гиббса , которые встречаются в равновесной статистической механике. [5] [6]
Изменение свободной энтропии [ править ]
Действие формулой кривой на римановом многообразии задается
Параметр пути здесь — время t ; это действие можно понимать как изменение свободной энтропии системы по мере ее перемещения от момента времени a ко времени b . [6] В частности, у человека есть
как изменение свободной энтропии. Это наблюдение привело к практическому применению в химической и перерабатывающей промышленности. [ нужна ссылка ] : чтобы минимизировать изменение свободной энтропии системы, следует следовать минимальному геодезическому пути между желаемыми конечными точками процесса. Геодезическая минимизирует энтропию из-за неравенства Коши – Шварца , которое утверждает, что действие ограничено снизу длиной кривой в квадрате.
Дженсена- с расхождением Связь Шеннона
Метрика Фишера также позволяет связать действие и длину кривой с расхождением Дженсена-Шеннона . [6] В частности, у человека есть
где под подынтегральным выражением dJSD понимается бесконечно малое изменение расходимости Дженсена–Шеннона на пройденном пути. Аналогично, для длины кривой имеем
То есть квадратный корень из дивергенции Дженсена-Шеннона представляет собой просто метрику Фишера (деленную на квадратный корень из 8).
Как евклидова метрика
Для дискретного вероятностного пространства , то есть вероятностного пространства конечного набора объектов, метрику Фишера можно понимать просто как евклидову метрику, ограниченную положительным ортантом (например, «квадрантом» в ) единичной сферы после соответствующих замен переменной. [7]
Рассмотрим плоское евклидово пространство размерности N +1 , параметризованное точками . Метрика евклидова пространства задается формулой
где являются 1-формами ; они являются базисными векторами кокасательного пространства . Письмо в качестве базисных векторов касательного пространства , так что
- ,
евклидову метрику можно записать как
Надстрочный индекс «плоский» напоминает, что при написании в координатной форме эта метрика относится к координате плоского пространства. .
N как -мерная единичная сфера, вложенная в ( N + 1)-мерное евклидово пространство, может быть определена
Это вложение индуцирует метрику на сфере, она наследуется непосредственно от евклидовой метрики объемлющего пространства. Он принимает точно такую же форму, как и выше, с заботой о том, чтобы координаты лежали на поверхности сферы. Это можно сделать, например, с помощью техники множителей Лагранжа .
Рассмотрим теперь замену переменной . Условие сферы теперь становится условием нормализации вероятности.
в то время как метрика становится
Последнюю можно признать одной четвертой информационной метрики Фишера. Для завершения процесса напомним, что вероятности являются параметрическими функциями переменных многообразия. , то есть у человека есть . Таким образом, вышеизложенное индуцирует метрику на многообразии параметров:
или, в координатной форме, информационная метрика Фишера:
где, как и прежде,
Надстрочный индекс «рыболов» присутствует, чтобы напомнить, что это выражение применимо для координат ; тогда как некоординатная форма такая же, как евклидова метрика (плоского пространства). То есть информационная метрика Фишера на статистическом многообразии представляет собой просто (в четыре раза) евклидову метрику, ограниченную положительным ортантом сферы после соответствующих замен переменной.
Когда случайная величина не дискретно, а непрерывно, аргумент остается в силе. Это можно увидеть одним из двух разных способов. Один из способов — тщательно переделать все вышеперечисленные шаги в бесконечномерном пространстве, уделяя особое внимание правильному определению пределов и т. д., чтобы убедиться, что все манипуляции четко определены, сходятся и т. д. Другой способ — отметил Громов , [7] заключается в использовании теоретико-категорного подхода; то есть отметить, что приведенные выше манипуляции остаются справедливыми и в категории вероятностей. Здесь следует отметить, что такая категория будет обладать свойством Радона–Никодима , т. е. в этой категории справедлива теорема Радона–Никодима . Сюда входят гильбертовы пространства ; они интегрируемы с квадратом, и в описанных выше манипуляциях этого достаточно, чтобы безопасно заменить сумму по квадратам интегралом по квадратам.
Фубини Исследования Как метрика –
Вышеописанные манипуляции по выводу метрики Фишера из евклидовой метрики могут быть распространены на комплексные проективные гильбертовы пространства . В этом случае получается метрика Фубини–Студи . [8] Возможно, это не должно вызывать удивления, поскольку метрика Фубини-Студи обеспечивает средства измерения информации в квантовой механике. Метрика Буреса , также известная как метрика Хелстрема , идентична метрике Фубини-Студи. [8] хотя последнее обычно записывается в терминах чистых состояний , как показано ниже, тогда как метрика Буреса записывается для смешанных состояний . Установив фазу комплексной координаты равной нулю, можно получить ровно одну четверть информационной метрики Фишера, точно так же, как указано выше.
Начинаем с того же трюка: построения амплитуды вероятности , записанной в полярных координатах , так:
Здесь, – комплексная амплитуда вероятности ; и строго реальны. Предыдущие расчеты получены путем параметр . Обычное условие того, что вероятности лежат внутри симплекса , а именно то, что
эквивалентно выражается идеей нормализации квадратной амплитуды:
Когда реально, это поверхность сферы.
Метрика Фубини–Студи , записанная в бесконечно малой форме с использованием квантово-механической нотации Бракета , равна
В этих обозначениях имеем а интегрирование по всему пространству меры X записывается как
Выражение можно понимать как бесконечно малую вариацию; то же самое можно понимать как 1-форму в кокасательном пространстве . Используя бесконечно малые обозначения, полярная форма приведенной выше вероятности выглядит просто:
Вставка вышеизложенного в метрику Фубини – Исследования дает:
Параметр из приведенного выше ясно дает понять, что первый член составляет (одну четверть) информационной метрики Фишера. Полную форму вышесказанного можно сделать немного понятнее, изменив обозначения на обозначения стандартной римановой геометрии, так что метрика становится симметричной 2-формой, действующей в касательном пространстве . Изменение обозначений производится простой заменой и и отмечая, что интегралы представляют собой всего лишь ожидаемые значения; так:
Мнимый член представляет собой симплектическую форму , это фаза Берри или геометрическая фаза . В индексной записи метрика имеет вид:
Опять же, можно ясно видеть, что первый член равен (одной четверти) информационной метрики Фишера, установив . Эквивалентно, метрику Фубини–Студи можно понимать как метрику комплексного проективного гильбертова пространства, индуцированную комплексным расширением плоской евклидовой метрики. Разница между ней и метрикой Буреса состоит в том, что метрика Буреса записана в терминах смешанных состояний.
Непрерывнозначные вероятности [ править ]
Можно дать несколько более формальное, абстрактное определение: [9]
Пусть X — ориентируемое многообразие и пусть быть мерой на X . Эквивалентно, пусть быть вероятностным пространством на , с сигма-алгеброй и вероятность .
Статистическое многообразие S ( X ) пространства X определяется как пространство всех мер на X (с сигма-алгеброй остается фиксированным). Обратите внимание, что это пространство бесконечномерно и обычно считается пространством Фреше . Точки S ( X ) являются мерами.
Выберите точку и рассмотрим касательное пространство . Информационная метрика Фишера тогда является внутренним произведением касательного пространства. С некоторым злоупотреблением обозначениями это можно записать так:
Здесь, и – векторы в касательном пространстве; то есть, . Злоупотребление обозначениями состоит в том, чтобы писать касательные векторы так, как если бы они были производными, и вставлять лишний d при записи интеграла: предполагается, что интегрирование будет осуществляться с использованием меры всем пространстве X. во На самом деле такое злоупотребление обозначениями считается совершенно нормальным в теории меры ; это стандартное обозначение производной Радона – Никодима .
Чтобы интеграл был четко определен, пространство S ( X ) должно обладать свойством Радона – Никодима , и, более конкретно, касательное пространство ограничено теми векторами, которые интегрируются с квадратом . Квадратная интегрируемость эквивалентна утверждению, что последовательность Коши сходится к конечному значению в слабой топологии : пространство содержит свои предельные точки. Заметим, что этим свойством обладают гильбертовы пространства .
Можно считать, что это определение метрики эквивалентно предыдущему и состоит из нескольких этапов. первых, выбирают подмногообразие S Во - ( X ), рассматривая только те меры которые параметризуются некоторым плавно меняющимся параметром . Тогда, если конечномерно, то и подмногообразие конечномерно; аналогично, касательное пространство имеет ту же размерность, что и .
С некоторым дополнительным злоупотреблением языком отметим, что экспоненциальное отображение обеспечивает отображение векторов в касательном пространстве в точки лежащего в основе многообразия. Таким образом, если вектор в касательном пространстве, то — соответствующая вероятность, связанная с точкой (после параллельного переноса экспоненциального отображения в .) И наоборот, учитывая точку , логарифм дает точку в касательном пространстве (грубо говоря, так как опять же надо переносить из начала координат в точку ; подробности см. в первоисточниках). Таким образом, мы имеем вид логарифмов в более простом определении, данном ранее.
См. также [ править ]
Примечания [ править ]
- ^ Нильсен, Франк (2023). «Простой метод аппроксимации расстояния Фишера – Рао между многомерными нормальными распределениями» . Энтропия . 25 (4): 654. arXiv : 2302.08175 . Бибкод : 2023Entrp..25..654N . дои : 10.3390/e25040654 . ПМЦ 10137715 . ПМИД 37190442 .
- ^ Амари, Сюн-ичи; Нагаока, Хориси (2000). «Теорема Ченцова и некоторые исторические замечания» . Методы информационной геометрии . Нью-Йорк: Издательство Оксфордского университета. стр. 37–40. ISBN 0-8218-0531-2 .
- ^ Даути, Джеймс Г. (2018). «Теорема Ченцова для показательных семейств». Информационная геометрия . 1 (1): 117–135. arXiv : 1701.08895 . дои : 10.1007/s41884-018-0006-4 . S2CID 5954036 .
- ^ Обложка, Томас М.; Томас, Джой А. (2006). Элементы теории информации (2-е изд.). Хобокен: Джон Уайли и сыновья. ISBN 0-471-24195-4 .
- ^ Броды, Дордже; Крюк, Дэниел (2008). «Информационная геометрия в парожидкостном равновесии». Журнал физики А. 42 (2): 023001. arXiv : 0809.1166 . дои : 10.1088/1751-8113/42/2/023001 . S2CID 118311636 .
- ↑ Перейти обратно: Перейти обратно: а б с Крукс, Гэвин Э. (2009). «Измерение термодинамической длины». Письма о физических отзывах . 99 (10): 100602. arXiv : 0706.0559 . doi : 10.1103/PhysRevLett.99.100602 . ПМИД 17930381 . S2CID 7527491 .
- ↑ Перейти обратно: Перейти обратно: а б Громов, Миша (2013). «В поисках структуры. Часть 1: Об энтропии» . Европейский математический конгресс . Цюрих: Европейское математическое общество. стр. 51–78. дои : 10.4171/120-1/4 . ISBN 978-3-03719-120-0 . МР 3469115 .
- ↑ Перейти обратно: Перейти обратно: а б Факки, Паоло; и др. (2010). «Классическая и квантовая информация Фишера в геометрической формулировке квантовой механики». Буквы по физике А. 374 (48): 4801–4803. arXiv : 1009.5219 . Бибкод : 2010PhLA..374.4801F . дои : 10.1016/j.physleta.2010.10.005 . S2CID 55558124 .
- ^ Ито, Мицухиро; Шишидо, Юичи (2008). «Информационная метрика Фишера и ядра Пуассона» (PDF) . Дифференциальная геометрия и ее приложения . 26 (4): 347–356. дои : 10.1016/j.difgeo.2007.11.027 . hdl : 2241/100265 .
Ссылки [ править ]
- Гарвеш Раскутти Саян Мукерджи, (2014). Информационная геометрия зеркального спуска https://arxiv.org/pdf/1310.7780.pdf
- Фэн, Эдвард Х.; Крукс, Гэвин Э. (2009). «Далеко от равновесных измерений термодинамической длины». Физический обзор E . 79 (1 Pt 1): 012104. arXiv : 0807.0621 . Бибкод : 2009PhRvE..79a2104F . дои : 10.1103/PhysRevE.79.012104 . ПМИД 19257090 . S2CID 8210246 .
- Шуничи Амари (1985) Дифференциально-геометрические методы в статистике , Конспекты лекций по статистике, Springer-Verlag, Берлин.
- Шуничи Амари, Хироши Нагаока (2000) Методы информационной геометрии , Переводы математических монографий; т. 191, Американское математическое общество.
- Паоло Джилиско, Ева Риккоманьо, Мария Пьера Рогантин и Генри П. Винн, (2009) Алгебраические и геометрические методы в статистике , Кембриджский университет Пресс, Кембридж.