Приближение Лапласа
Часть серии о |
Байесовская статистика |
---|
Апостериорный = Вероятность × Априорный ÷ Доказательства |
Фон |
Модельное здание |
Апостериорное приближение |
Оценщики |
Приближение доказательств |
Оценка модели |
Аппроксимация Лапласа обеспечивает аналитическое выражение апостериорного распределения вероятностей путем аппроксимации распределения Гаусса со средним значением, равным решению MAP , и точностью, равной наблюдаемой информации Фишера . [1] [2] Аппроксимация оправдывается теоремой Бернштейна-фон Мизеса , которая утверждает, что в условиях регулярности ошибка аппроксимации стремится к 0, поскольку количество точек данных стремится к бесконечности. [3] [4]
Например, рассмотрим модель регрессии или классификации с набором данных. включающий входные данные и результаты с (неизвестным) вектором параметров длины . Вероятность обозначается и параметр до . Предположим, кто-то хочет аппроксимировать совместную плотность результатов и параметров. . Формула Байеса гласит:
Совместное значение равно произведению правдоподобия и априорного значения и по правилу Байеса равно произведению предельного правдоподобия . и задний . Рассматривается как функция сустав имеет ненормализованную плотность.
В приближении Лапласа мы аппроксимируем сустав ненормированной гауссовой , где мы используем для обозначения приблизительной плотности, для ненормализованной плотности и константа нормализации (независимо от ). Поскольку предельная вероятность не зависит от параметра и задняя часть нормализуется мы можем сразу идентифицировать их по и нашего приближения соответственно.
Приближение Лапласа
где мы определили
где это местоположение моды совместной целевой плотности, также известной как максимальная апостериорная точка или точка MAP, и это положительно определенная матрица вторых производных целевой плотности отрицательного логарифмического соединения в режиме . Таким образом, гауссово приближение соответствует значению и логарифмической кривизне ненормализованной целевой плотности в режиме. Стоимость обычно находится с использованием метода, основанного на градиенте .
Подводя итог, мы имеем
для приблизительного заднего конца и приблизительное логарифмическое предельное правдоподобие соответственно.
Основные недостатки приближения Лапласа заключаются в том, что оно симметрично относительно моды и очень локально: все приближение выводится из свойств в одной точке целевой плотности. Метод Лапласа широко используется и был впервые использован в контексте нейронных сетей Дэвидом Маккеем. [5] и для гауссовских процессов Уильямса и Барбера. [6]
Ссылки
[ редактировать ]- ^ Касс, Роберт Э.; Тирни, Люк; Кадане, Джозеф Б. (1991). «Метод Лапласа в байесовском анализе». Статистическое множественное интегрирование . Современная математика. Том. 115. С. 89–100. дои : 10.1090/conm/115/07 . ISBN 0-8218-5122-5 .
- ^ Маккей, Дэвид Дж. К. (2003). «Теория информации, логический вывод и алгоритмы обучения, глава 27: метод Лапласа» (PDF) .
- ^ Хартиган, Дж. А. (1983). «Асимптотическая нормальность апостериорных распределений». Теория Байеса . Серия Спрингера по статистике. Нью-Йорк: Спрингер. стр. 107–118. дои : 10.1007/978-1-4613-8242-3_11 . ISBN 978-1-4613-8244-7 .
- ^ Касс, Роберт Э.; Тирни, Люк; Кадане, Джозеф Б. (1990). «Достоверность апостериорных разложений на основе метода Лапласа». В Гейссер, С.; Ходжес, Дж. С.; Пресс, С.Дж.; Зеллнер, А. (ред.). Байесовские методы и методы правдоподобия в статистике и эконометрике . Эльзевир. стр. 473–488. ISBN 0-444-88376-2 .
- ^ Маккей, Дэвид Дж. К. (1992). «Байесовская интерполяция» (PDF) . Нейронные вычисления . 4 (3). Массачусетский технологический институт Пресс: 415–447. дои : 10.1162/neco.1992.4.3.415 . S2CID 1762283 .
- ^ Уильямс, Кристофер К.И.; Барбер, Дэвид (1998). «Байесовская классификация с гауссовскими процессами» (PDF) . ПАМИ . 20 (12). IEEE: 1342–1351. дои : 10.1109/34.735807 .