Jump to content

Обобщенная фильтрация

Обобщенная фильтрация — это общая схема байесовской фильтрации для нелинейных моделей в пространстве состояний. [1] В его основе лежит вариационный принцип наименьшего действия , сформулированный в обобщенных координатах движения. [2] Обратите внимание, что «обобщенные координаты движения» связаны с обобщенными координатами , используемыми в анализе (многотельных) динамических систем, но отличаются от них. Обобщенная фильтрация обеспечивает апостериорные плотности скрытых состояний (и параметров), генерируя наблюдаемые данные с использованием обобщенного градиентного спуска вариационной свободной энергии в соответствии с предположением Лапласа . В отличие от классической фильтрации (например, Калмана-Бьюси или фильтрации частиц ), обобщенная фильтрация избегает марковских предположений о случайных флуктуациях. Более того, он работает в режиме онлайн, усваивая данные для аппроксимации апостериорной плотности по неизвестным величинам без необходимости обратного прохода. Особые случаи включают вариационную фильтрацию , [3] динамическая максимизация ожидания [4] и обобщенное предсказательное кодирование .

Определение

[ редактировать ]

Определение : Обобщенная фильтрация опирается на кортеж. :

  • Образец пространства от чего случайные колебания нарисованы
  • Состояния управления – которые действуют как внешние причины, входные или вынуждающие условия
  • Скрытые состояния – которые вызывают сенсорные состояния и зависят от состояний управления
  • Состояния датчика – вероятностное отображение скрытых и контрольных состояний
  • Генеративная плотность – над сенсорными, скрытыми и контрольными состояниями в рамках генеративной модели
  • Вариационная плотность – над скрытыми и контролирующими состояниями со средним значением


Здесь ~ обозначает переменную в обобщенных координатах движения:

Обобщенная фильтрация

[ редактировать ]

Цель состоит в том, чтобы аппроксимировать апостериорную плотность по скрытым и контрольным состояниям, учитывая состояния датчиков и генеративную модель, и оценить (интеграл по траектории) свидетельства модели. для сравнения разных моделей. Обычно это предполагает непреодолимую маргинализацию скрытых состояний, поэтому свидетельства модели (или предельное правдоподобие) заменяются вариационной границей свободной энергии. [5] Учитывая следующие определения:

Обозначим энтропию Шеннона плотности к . Тогда мы можем записать вариационную свободную энергию двумя способами:

Второе равенство показывает, что минимизация вариационной свободной энергии (i) минимизирует расхождение Кульбака-Лейблера между вариационной и истинной апостериорной плотностью и (ii) делает вариационную свободную энергию (связанное приближение) отрицательным логарифмическим свидетельством (поскольку расхождение никогда не может быть меньше нуля). [6] По предположению Лапласа плотность вариаций является гауссовой, а точность, минимизирующая свободную энергию, равна . Это означает, что свободная энергия может быть выражена через вариационное среднее [7] (без констант):

Вариационные средства, минимизирующие (интеграл по траекториям) свободной энергии, теперь могут быть восстановлены путем решения обобщенного фильтра:

где - оператор производной блочной матрицы идентификационных матриц такой, что

Вариационный базис

[ редактировать ]

Обобщенная фильтрация основана на следующей лемме: Самосогласованное решение удовлетворяет вариационному принципу стационарного действия , где действие представляет собой интеграл по траектории вариационной свободной энергии.

Доказательство : самосогласованность требует, чтобы движение среднего было средним значением движения и (по фундаментальной лемме вариационного исчисления )

Проще говоря, небольшие возмущения пути среднего не меняют вариационную свободную энергию и оказывают наименьшее влияние из всех возможных (локальных) путей.

Примечания . Эвристически обобщенная фильтрация выполняет градиентный спуск вариационной свободной энергии в движущейся системе отсчета: , где сама система минимизирует вариационную свободную энергию. Соответствующий пример из статистической физики см. в статье Керра и Грэма. [8] которые используют динамику ансамбля в обобщенных координатах, чтобы предоставить обобщенную версию Ланжевена и связанных с ним уравнений Фоккера-Планка в фазовом пространстве.

На практике обобщенная фильтрация использует локальную линеаризацию. [9] через интервалы восстановить дискретные обновления

Это обновляет средние значения скрытых переменных на каждом интервале (обычно интервале между наблюдениями).

Генеративные модели (пространства состояний) в обобщенных координатах

[ редактировать ]

Обычно генеративная плотность или модель задается в терминах нелинейной модели входного состояния-выхода с непрерывными нелинейными функциями:

Соответствующая обобщенная модель (при предположениях локальной линейности) получает из цепного правила

Гауссовские предположения о случайных флуктуациях затем пропишите вероятность и эмпирические априоры движения скрытых состояний

Ковариации факторизовать в ковариацию между переменными и корреляциями среди обобщенных флуктуаций, кодирующих их автокорреляцию :

Здесь, — вторая производная автокорреляционной функции, оцененная по нулю. Это повсеместная мера грубости в теории случайных процессов . [10] Важно отметить, что точность (обратная дисперсия) производных высокого порядка довольно быстро падает до нуля, а это означает, что необходимо моделировать обобщенное движение только относительно низкого порядка (обычно от двух до восьми) для любой заданной или параметризованной автокорреляционной функции.

Особые случаи

[ редактировать ]

Фильтрация дискретных временных рядов

[ редактировать ]

Когда временные ряды рассматриваются как дискретная последовательность наблюдений неявная выборка рассматривается как часть генеративного процесса, где (используя теорему Тейлора )

В принципе, всю последовательность можно использовать для оценки скрытых переменных в каждый момент времени. Однако точность образцов в прошлом и будущем быстро падает, и ее можно игнорировать. Это позволяет схеме усваивать данные в режиме онлайн, используя локальные наблюдения в каждый момент времени (обычно от двух до восьми).

Обобщенная фильтрация и параметры модели

[ редактировать ]

Для любых медленно меняющихся модельных параметров уравнений движения или точность обобщенная фильтрация принимает следующий вид (где соответствует вариационному среднему параметров)

Здесь решение минимизирует вариационную свободную энергию, когда движение среднего невелико. Это можно увидеть, заметив . Несложно показать, что это решение соответствует классическому обновлению Ньютона . [11]

Связь с байесовской фильтрацией и прогнозирующим кодированием

[ редактировать ]

Обобщенная фильтрация и фильтрация Калмана

[ редактировать ]

Классическая фильтрация в рамках марковских или винеровских предположений эквивалентна предположению, что точность движения случайных флуктуаций равна нулю. В этом предельном случае остается рассматривать только состояния и их первую производную. . Это означает, что обобщенная фильтрация принимает форму фильтра Калмана-Бьюси с условиями прогнозирования и коррекции:

Замена этой фильтрации первого порядка в приведенную выше схему дискретного обновления дает эквивалент (расширенной) фильтрации Калмана. [12]

Обобщенная фильтрация и фильтрация частиц

[ редактировать ]

Фильтрация частиц — это схема, основанная на выборке, которая ослабляет предположения о форме вариационной или приблизительной апостериорной плотности. Соответствующая схема обобщенной фильтрации называется вариационной фильтрацией . [3] При вариационной фильтрации ансамбль частиц диффундирует по ландшафту свободной энергии в системе отсчета, которая движется вместе с ожидаемым (обобщенным) движением ансамбля. Это обеспечивает относительно простую схему, которая избегает гауссовских (унимодальных) предположений. В отличие от фильтрации частиц, он не требует плотности предложений, а также удаления или создания частиц.

Обобщенная фильтрация и вариационный Байес

[ редактировать ]

Вариационный байесовский метод основан на разбиении среднего поля вариационной плотности:

Это разделение вызывает вариационное обновление или шаг для каждой предельной плотности, которое обычно решается аналитически с использованием сопряженных априорных значений. В обобщенной фильтрации это приводит к динамической максимизации ожидания . [4] который включает в себя D-шаг, который оптимизирует достаточную статистику неизвестных состояний, E-шаг для параметров и M-шаг для точности.

Обобщенная фильтрация и прогнозирующее кодирование

[ редактировать ]

Обобщенная фильтрация обычно используется для инвертирования иерархических моделей следующего вида:

Последовавший за этим обобщенный градиентный спуск свободной энергии может быть компактно выражен через ошибки прогнозирования, где (опуская члены высокого порядка):

Здесь, — точность случайных колебаний на i -м уровне. Это известно как кодирование с обобщенным прогнозированием [11], при этом кодирование с линейным прогнозированием является частным случаем.

Приложения

[ редактировать ]

Обобщенная фильтрация в первую очередь применялась к биологическим временным рядам, в частности к данным функциональной магнитно-резонансной томографии и электрофизиологическим данным. Обычно это происходит в контексте динамического причинно-следственного моделирования, позволяющего сделать выводы о базовой архитектуре (нейронных) систем, генерирующих данные. [13] Он также используется для моделирования вывода с точки зрения обобщенного (иерархического) прогнозирующего кодирования в мозге. [14]

См. также

[ редактировать ]
  1. ^ К. Фристон, К. Стефан, Б. Ли и Дж. Даунизо, « Обобщенная фильтрация », «Математические проблемы в инженерии » , том. том, 2010, с. 621670, 2010.
  2. ^ Б. Баладжи и К. Фристон, « Оценка байесовского состояния с использованием обобщенных координат », Proc. ШПАЙ, с. 80501Y, 2011 г.
  3. ^ Перейти обратно: а б К.Дж. Фристон, « Вариационная фильтрация », Neuroimage, vol. 41, нет. 3, стр. 747–66, 2008 г.
  4. ^ Перейти обратно: а б К. Дж. Фристон, Н. Трухильо-Баррето и Дж. Даунизо, « DEM: вариационная трактовка динамических систем », Neuroimage, vol. 41, нет. 3, стр. 849-85, 2008 г.
  5. ^ Р. П. Фейнман, Статистическая механика. Ридинг MA: Бенджамин, 1972 г.
  6. ^ М. Дж. Бил, « Вариационные алгоритмы для приближенного байесовского вывода », доктор философии. Диссертация, Университетский колледж Лондона, 2003 г.
  7. ^ К. Фристон, Дж. Мэттаут, Н. Трухильо-Баррето, Дж. Эшбернер и В. Пенни, « Вариационная свободная энергия и приближение Лапласа », NeuroImage, vol. 34, нет. 1, стр. 220–34, 2007 г.
  8. ^ WC Kerr и AJ Graham, « Обобщенная версия уравнений Ланжевена в фазовом пространстве и связанные с ними уравнения Фоккера-Планка », Eur. Физ. JB, вып. 15, стр. 305–11, 2000.
  9. ^ Т. Одзаки, « Мост между нелинейными моделями временных рядов и нелинейными стохастическими динамическими системами: подход локальной линеаризации », Statistica Sin., vol. 2, стр. 113-135, 1992 г.
  10. ^ Д. Р. Кокс и Х. Д. Миллер, Теория случайных процессов. Лондон: Метуэн, 1965.
  11. ^ К. Фристон, К. Стефан, Б. Ли и Дж. Даунизо, «Обобщенная фильтрация», Математические проблемы в инженерии, том. том, 2010, с. 621670, 2010.
  12. ^ К. Дж. Фристон, Н. Трухильо-Баррето и Дж. Даунизо, «DEM: вариационная трактовка динамических систем», Neuroimage, vol. 41, нет. 3, стр. 849-85, 2008 г.
  13. ^ Дж. Донизо, О. Дэвид и К. Э. Стефан, « Динамическое причинно-следственное моделирование: критический обзор биофизических и статистических основ. Архивировано 7 декабря 2012 г. в Wayback Machine », Neuroimage, vol. 58, нет. 2, стр. 312-22, 2011 г.
  14. ^ К. Фристон, « Иерархические модели в мозге », PLoS Comput. Биол., вып. 4, нет. 11, с. е1000211, 2008.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 785dbdb779caac28f07d32c215d2e0b0__1705508040
URL1:https://arc.ask3.ru/arc/aa/78/b0/785dbdb779caac28f07d32c215d2e0b0.html
Заголовок, (Title) документа по адресу, URL1:
Generalized filtering - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)