Вариационная передача сообщений
Эта статья может быть слишком технической для понимания большинства читателей . ( февраль 2024 г. ) |
Вариационная передача сообщений ( VMP ) — это метод приближенного вывода с непрерывными или дискретными значениями для байесовских сетей , с сопряженно-экспоненциальными родителями, разработанный Джоном Винном. VMP был разработан как средство обобщения приближенных вариационных методов, используемых такими методами, как скрытое распределение Дирихле узла , и работает путем обновления приблизительного распределения в каждом узле посредством сообщений в марковском бланкете .
Нижняя граница вероятности
[ редактировать ]Учитывая некоторый набор скрытых переменных и наблюдаемые переменные , цель приближенного вывода — максимизировать нижнюю границу вероятности того, что графическая модель находится в конфигурации . Над некоторым распределением вероятностей (будет определено позже),
- .
Итак, если мы определим нашу нижнюю границу как
- ,
тогда вероятность равна просто этой границе плюс относительная энтропия между и . Поскольку относительная энтропия неотрицательна, функция определенное выше, действительно является нижней границей логарифмической вероятности нашего наблюдения . Распределение будет иметь более простой характер, чем у потому что маргинализация сверх неразрешима для всех, кроме самых простых графических моделей . В частности, VMP использует факторизованное распределение.
где является непересекающейся частью графической модели.
Определение правила обновления
[ редактировать ]Оценка правдоподобия должна быть как можно большей; потому что это нижняя граница, приближающаяся улучшает аппроксимацию логарифма правдоподобия. Подставив в факторизованную версию , , параметризованный по скрытым узлам как указано выше, это просто отрицательная относительная энтропия между и плюс другие условия, независимые от если определяется как
- ,
где это математическое ожидание по всем распределениям кроме . Таким образом, если мы установим быть , граница максимизируется.
Сообщения при вариационной передаче сообщений
[ редактировать ]Родители отправляют своим детям ожидание достаточной статистики, в то время как дети отправляют родителям свой естественный параметр , который также требует отправки сообщений от родителей узла.
Связь с экспоненциальными семействами
[ редактировать ]Поскольку все узлы в VMP происходят из экспоненциальных семейств , а все родительские узлы сопряжены со своими дочерними узлами, ожидание достаточной статистики можно вычислить с помощью коэффициента нормализации .
Алгоритм ВМП
[ редактировать ]Алгоритм начинается с вычисления ожидаемого значения достаточной статистики для этого вектора. Затем, пока вероятность не достигнет стабильного значения (обычно это достигается путем установки небольшого порогового значения и запуска алгоритма до тех пор, пока оно не увеличится меньше этого порогового значения), выполните следующие действия на каждом узле:
- Получите все сообщения от родителей.
- Получить все сообщения от детей (для этого может потребоваться, чтобы дети получали сообщения от других родителей).
- Вычислите ожидаемое значение узлов достаточной статистики.
Ограничения
[ редактировать ]Поскольку каждый дочерний элемент должен быть сопряжен со своим родителем, это ограничивает типы распределений, которые можно использовать в модели. Например, родительскими элементами распределения Гаусса должны быть распределение Гаусса (соответствующее среднему значению ) и гамма-распределение (соответствующее точности или в более распространенных параметризациях). Дискретные переменные могут иметь Дирихле родителей , а узлы Пуассона и экспоненциальные узлы должны иметь родительских гамм . Совсем недавно VMP был расширен для работы с моделями, нарушающими это ограничение условной сопряженности. [1]
Ссылки
[ редактировать ]- ^ Ноулз, Дэвид А.; Минка, Томас П. (2011). «Несопряженная вариационная передача сообщений для полиномиальной и бинарной регрессии» (PDF) . НейрИПС .
- Винн, Дж. М.; Бишоп, К. (2005). «Вариационная передача сообщений» (PDF) . Журнал исследований машинного обучения . 6 : 661–694.
- Бил, MJ (2003). Вариационные алгоритмы для приближенного байесовского вывода (PDF) (доктор философии). Отделение вычислительной нейронауки «Гэтсби», Университетский колледж Лондона. Архивировано из оригинала (PDF) 28 апреля 2005 г. Проверено 15 февраля 2007 г.
Внешние ссылки
[ редактировать ]- Infer.NET : среда вывода, включающая реализацию VMP с примерами.
- dimple : система вывода с открытым исходным кодом, поддерживающая VMP.
- Старая реализация VMP с примерами использования.