Редукция байесовской модели
Редукция байесовской модели — это метод вычисления доказательств и апостериорных значений параметров байесовских моделей, которые различаются своими априорными значениями . [1] [2] Полная модель подгоняется к данным с использованием стандартных подходов. Затем гипотезы проверяются путем определения одной или нескольких «сокращенных» моделей с альтернативными (и обычно более ограничительными) априорными значениями, которые обычно – в пределе – отключают определенные параметры. Доказательства и параметры сокращенных моделей затем могут быть вычислены на основе фактических данных и оцененных ( апостериорных ) параметров полной модели с использованием сокращения байесовской модели. Если априорные и апостериорные значения распределены нормально , то существует аналитическое решение, которое можно быстро вычислить. Это имеет множество научных и инженерных применений: к ним относятся очень быстрая оценка доказательств для большого количества моделей и облегчение оценки иерархических моделей ( параметрический эмпирический Байес ).
Теория
[ редактировать ]Рассмотрим некоторую модель с параметрами и априорная плотность вероятности этих параметров . Апостериорное убеждение о после просмотра данных определяется правилом Байеса :
(1) |
Вторая строка уравнения 1 — это свидетельство модели, то есть вероятность наблюдения данных с учетом модели. На практике апостериорную величину обычно невозможно вычислить аналитически из-за сложности вычисления интеграла по параметрам. Поэтому апостериорные данные оцениваются с использованием таких подходов, как выборка MCMC или вариационный Байес . Затем сокращенную модель можно определить с помощью альтернативного набора априорных значений. :
(2) |
Целью редукции байесовской модели является вычисление апостериорного и доказательства уменьшенной модели сзади и доказательства полной модели. Объединив уравнение 1 и уравнение 2 и перестроив, уменьшенную заднюю часть можно выразить как произведение полного апостериорного соотношения априорных событий и соотношения доказательств:
(3) |
Доказательства сокращенной модели получаются путем интегрирования параметров каждой стороны уравнения:
(4) |
И по перестановке:
(5) |
Гауссовские априорные и апостериорные значения
[ редактировать ]При гауссовых априорных и апостериорных плотностях, которые используются в контексте вариационного Байеса , редукция байесовской модели имеет простое аналитическое решение. [1] Сначала определите нормальные плотности для априоров и апостериоров:
(6) |
где символ тильды (~) указывает на величины, относящиеся к сокращенной модели, а нижний индекс равен нулю, например: – указывает параметры приоры. Для удобства мы также определяем матрицы точности, которые являются обратными каждой ковариационной матрице:
(7) |
Свободная энергия полной модели является аппроксимацией (нижней границей) данных модели каротажа: который явно оптимизируется в вариационном Байесе (или может быть восстановлен из аппроксимаций выборки). Свободная энергия приведенной модели и параметры тогда задаются выражениями:
(8) |
Пример
[ редактировать ]Рассмотрим модель с параметром и гауссовский априор , которое представляет собой нормальное распределение со средним нулевым значением и стандартным отклонением 0,5 (показано на рисунке слева). В этом априоре говорится, что без каких-либо данных ожидается, что параметр будет иметь нулевое значение, но мы готовы принимать положительные или отрицательные значения (с 99% доверительным интервалом [-1,16,1,16]). Модель с этим априором подгоняется к данным, чтобы дать оценку параметра и модельные доказательства .
Чтобы оценить, способствовал ли параметр доказательству модели, т. е. узнали ли мы что-нибудь об этом параметре, указывается альтернативная «сокращенная» модель, в которой параметр имеет априорное значение с гораздо меньшей дисперсией: например . Это показано на рисунке (справа). Этот априор эффективно «отключает» параметр, говоря, что мы почти уверены, что он имеет нулевое значение. Параметр и доказательства для этой сокращенной модели быстро вычисляются из полной модели с использованием сокращения байесовской модели.
Гипотеза о том, что параметр внес вклад в модель, затем проверяется путем сравнения полной и сокращенной моделей с помощью фактора Байеса , который представляет собой соотношение доказательств модели:
Чем больше это соотношение, тем больше доказательств для полной модели, в которой параметр включен в качестве свободного параметра. И наоборот, чем сильнее доказательства в пользу сокращенной модели, тем больше мы можем быть уверены в том, что этот параметр не внес никакого вклада. Обратите внимание, что этот метод не предназначен для сравнения «включенных» или «выключенных» параметров, и любая промежуточная настройка априорных значений также может быть оценена.
Приложения
[ редактировать ]Нейровизуализация
[ редактировать ]Редукция байесовской модели изначально была разработана для использования в нейровизуализационном анализе. [1] [3] в контексте моделирования связей мозга, как часть структуры динамического причинно-следственного моделирования (где это первоначально называлось апостериорным выбором байесовской модели). [1] Динамические причинно-следственные модели (DCM) представляют собой модели дифференциальных уравнений динамики мозга. [4] Экспериментатор указывает несколько конкурирующих моделей, которые различаются своими априорными значениями – например, выбором параметров, которые фиксируются при их априорном ожидании, равном нулю. Подогнав единую «полную» модель со всеми интересующими параметрами, полученными на основе данных, редукция байесовской модели позволяет быстро вычислить доказательства и параметры конкурирующих моделей для проверки гипотез. Экспериментатор может указать эти модели вручную или выполнить автоматический поиск, чтобы «отсеять» любые избыточные параметры, которые не способствуют получению доказательств.
Редукция байесовской модели впоследствии была обобщена и применена к другим формам байесовских моделей, например, к параметрическим эмпирическим байесовским моделям групповых эффектов (PEB). [2] Здесь он используется для вычисления доказательств и параметров для любого заданного уровня иерархической модели при ограничениях (эмпирических априорах), налагаемых вышестоящим уровнем.
Нейробиология
[ редактировать ]Редукция байесовской модели использовалась для объяснения функций мозга. По аналогии с его использованием при исключении избыточных параметров из моделей экспериментальных данных было предложено, чтобы мозг устранял избыточные параметры внутренних моделей мира в автономном режиме (например, во время сна). [5] [6]
Реализации программного обеспечения
[ редактировать ]Сокращение байесовской модели реализовано в наборе инструментов Statistical Parametric Mapping , в Matlab функции spm_log_evidence_reduce.m .
Ссылки
[ редактировать ]- ^ Jump up to: а б с д Фристон, Карл; Пенни, Уилл (июнь 2011 г.). «Последующий выбор байесовской модели» . НейроИмидж . 56 (4): 2089–2099. doi : 10.1016/j.neuroimage.2011.03.062 . ISSN 1053-8119 . ПМК 3112494 . ПМИД 21459150 .
- ^ Jump up to: а б Фристон, Карл Дж.; Литвак, Владимир; Осваль, Ашвини; Рази, Адил; Стефан, Клаас Э.; ван Вейк, Бернадетт К.М.; Зиглер, Габриэль; Зейдман, Питер (март 2016 г.). «Редукция байесовской модели и эмпирические байесовские исследования для групп (DCM)» . НейроИмидж . 128 : 413–431. doi : 10.1016/j.neuroimage.2015.11.015 . ISSN 1053-8119 . ПМЦ 4767224 . ПМИД 26569570 .
- ^ Роза, MJ; Фристон, К.; Пенни, В. (июнь 2012 г.). «Последующий выбор динамических причинных моделей» . Журнал методов нейробиологии . 208 (1): 66–78. doi : 10.1016/j.jneumeth.2012.04.013 . ISSN 0165-0270 . ПМК 3401996 . ПМИД 22561579 .
- ^ Фристон, Кей Джей; Харрисон, Л.; Пенни, В. (август 2003 г.). «Динамическое причинно-следственное моделирование». НейроИмидж . 19 (4): 1273–1302. дои : 10.1016/s1053-8119(03)00202-7 . ISSN 1053-8119 . ПМИД 12948688 . S2CID 2176588 .
- ^ Фристон, Карл Дж.; Лин, Марко; Фрит, Кристофер Д.; Пеццуло, Джованни; Хобсон, Дж. Аллан; Ондобака, Саша (октябрь 2017 г.). «Активный вывод, любопытство и проницательность» (PDF) . Нейронные вычисления . 29 (10): 2633–2683. дои : 10.1162/neco_a_00999 . ISSN 0899-7667 . ПМИД 28777724 . S2CID 13354308 .
- ^ Тонони, Джулио; Чирелли, Кьяра (февраль 2006 г.). «Функция сна и синаптический гомеостаз». Обзоры медицины сна . 10 (1): 49–62. дои : 10.1016/j.smrv.2005.05.002 . ISSN 1087-0792 . ПМИД 16376591 .