Jump to content

Байесовская квадратура

Байесовская квадратура [1] [2] [3] [4] [5] это метод аппроксимации трудноразрешимых задач интеграции. Он относится к классу вероятностных численных методов . Байесовская квадратура рассматривает численное интегрирование как задачу байесовского вывода , где оценки функции используются для оценки интеграла этой функции. По этой причине его иногда также называют «байесовским вероятностным численным интегрированием» или «байесовским численным интегрированием». Название «байесовская кубатура» также иногда используется, когда подынтегральная функция является многомерной. Потенциальным преимуществом этого подхода является то, что он обеспечивает количественную оценку вероятностной неопределенности значения интеграла.

Байесовская квадратура

[ редактировать ]

Численное интегрирование

[ редактировать ]

Позволять быть функцией, определенной в домене (где обычно ).При численном интегрировании оценки функций в разных местах в используются для оценки интеграла от против меры : то есть Учитывая веса , квадратурное правило является оценкой формы

Байесовская квадратура состоит из указания предварительного распределения по , обуславливая это предварительно чтобы получить апостериорное распределение , затем вычисляем подразумеваемое апостериорное распределение на . Название «квадратура» происходит от того, что задние означают на иногда принимает форму квадратурного правила, веса которого определяются выбором априора.

Байесовская квадратура с гауссовскими процессами

[ редактировать ]

Наиболее распространенный выбор предварительного распределения для является гауссовским процессом , поскольку он позволяет сделать сопряженный вывод для получения апостериорного распределения в замкнутой форме на . Предположим, у нас есть гауссов процесс с априорной средней функцией и функция ковариации (или функция ядра) . Тогда апостериорное распределение по представляет собой гауссов процесс со средним и ядро предоставлено: где , , и .

Кроме того, апостериорное распределение на представляет собой одномерное распределение Гаусса со средним значением и дисперсия данный Функция является ядром среднего вложения и обозначает интеграл от относительно обоих входов.В частности, обратите внимание, что апостериорное среднее представляет собой квадратурное правило с весами а апостериорная дисперсия дает количественную оценку неопределенности пользователя относительно значения .

В более сложных задачах интеграции, когда на априорное распределение нельзя полагаться как на значимое представление эпистемической неопределенности, необходимо использовать данные установить гиперпараметры ядра, используя, например, оценку максимального правдоподобия . Оценка гиперпараметров ядра вводит адаптивность в байесовскую квадратуру. [6] [7]

Иллюстрация байесовской квадратуры для оценки где . Апостериорное распределение (синий) концентрируется на истинном интеграле, когда о подынтегральном выражении получено больше данных (красные точки). .

Рассмотрим оценку интеграла используя правило байесовской квадратуры, основанное на априорном гауссовском процессе с нулевым средним с ковариационной функцией гладкости Матерна и длина корреляции .Эта ковариационная функция Это несложно (хотя и утомительно) вычислить. Сходимость байесовской квадратурной точечной оценки и концентрация задней массы, количественно определяемая , вокруг истинного интеграла как оценивается во все большем количестве баллов и отображается в сопровождающей анимации.

Преимущества и недостатки

[ редактировать ]

Поскольку байесовская квадратура является примером вероятностных чисел , она наследует определенные преимущества по сравнению с традиционными методами численного интегрирования :

  • Это позволяет количественно оценить неопределенность и распространить ее на все последующие вычисления, чтобы явно смоделировать влияние числовой ошибки. [8]
  • Он обеспечивает принципиальный способ включения предшествующих знаний путем разумного выбора предшествующих распределений для , который может быть более сложным по сравнению с только что описанным стандартным гауссовским процессом. [7]
  • Это позволяет более эффективно использовать информацию, например, совместно делать выводы о нескольких связанных количествах, представляющих интерес. [9] или используя активное обучение, чтобы уменьшить необходимое количество баллов. [10]

Несмотря на эти достоинства, байесовские квадратурные методы обладают следующими ограничениями:

  • Хотя байесовская парадигма допускает принципиальную трактовку количественной оценки неопределенности, апостериорный вывод по сравнению с не всегда поддается решению, поэтому требуется оценка второго уровня. Например, для байесовской квадратуры с гауссовскими процессами вложение среднего ядра имеет не выражения в замкнутой форме для общего ядра и измерить .
  • Вычислительные затраты на байесовские квадратурные методы, основанные на гауссовских процессах, в целом составляют из-за стоимости инвертирования матрицы, которые могут не поддаваться их применению для решения крупномасштабных задач.

Алгоритмическое проектирование

[ редактировать ]

Предыдущие дистрибутивы

[ редактировать ]

Чаще всего используется до является априорным гауссовским процессом. Это главным образом связано с преимуществом, обеспечиваемым гауссовой сопряженностью, и тем фактом, что гауссовские процессы могут кодировать широкий спектр априорных знаний, включая гладкость, периодичность и разреженность, посредством тщательного выбора априорной ковариации. Однако был также предложен ряд других предшествующих распределений. Сюда входят гауссовские процессы с несколькими выходами , [9] которые особенно полезны при одновременном или последовательном решении нескольких связанных задач численного интегрирования, а также априорных методов на основе деревьев, таких как деревья байесовской аддитивной регрессии, [10] которые хорошо подходят для прерывистого . Кроме того, процессы Дирихле . для меры интеграции также были предложены априорные . [11]

Выбор точки

[ редактировать ]

Очки либо считаются заданными, либо могут быть выбраны так, чтобы обеспечить заднюю часть концентрируется быстрее. Один подход состоит в использовании наборов точек из других правил квадратур. Например, взяв независимые и одинаково распределенные реализации из восстанавливает байесовский подход к Монте-Карло , [3] тогда как использование определенных детерминированных наборов точек, таких как последовательности с низким расхождением или решетки, восстанавливает байесовскую альтернативу квази-Монте-Карло . [4] [12] Конечно, также возможно использовать наборы точек, специально разработанные для байесовской квадратуры; см., например, работу [13] который использовал симметрию в множествах точек для получения масштабируемых байесовских квадратурных оценок. Альтернативно, точки также могут быть выбраны адаптивно, следуя принципам активного обучения и байесовского экспериментального планирования, чтобы напрямую минимизировать апостериорную неопределенность. [14] [15] в том числе для многовыходных гауссовских процессов. [16]

Среднее значение ядра и начальная ошибка

[ редактировать ]

Одной из проблем при реализации байесовской квадратуры является необходимость вычисления функции и константа . Первое обычно называют средним значением ядра и представляет собой величину, которая является ключевой для расчета расстояний на основе ядра, таких как максимальное среднее несоответствие. Последнюю обычно называют начальной ошибкой, поскольку она обеспечивает верхнюю границу ошибки интегрирования до того, как будут наблюдаться какие-либо значения функции. К сожалению, среднее значение ядра и начальная ошибка могут быть вычислены только для небольшого числа пары; см., например, Таблицу 1 в. [4]

Был получен ряд теоретических гарантий для байесовской квадратуры. Обычно для этого требуются свойства гладкости по Соболеву подынтегрального выражения: [4] [17] [18] хотя недавние работы также распространяются на подынтегральные выражения в гильбертовом пространстве воспроизводящего ядра гауссовского ядра. [19] Большинство результатов применимо к случаю Монте-Карло или детерминированных наборов точек сетки, но некоторые результаты также распространяются и на адаптивные проекты. [20]

Программное обеспечение

[ редактировать ]
  • ProbNum : вероятностные численные методы в Python, включая реализацию байесовских квадратур.
  • Emukit : Эмуляция и принятие решений в условиях неопределенности в Python.
  • QMCPy : байесовская квадратура с наборами точек QMC в Python.
  1. ^ Диаконис, П. (1988). «Байесовский численный анализ». Статистическая теория принятия решений и смежные темы IV : 163–175. дои : 10.1007/978-1-4613-8768-8_20 . ISBN  978-1-4613-8770-1 .
  2. ^ О'Хаган, А. (2002). «Квадратура Байеса – Эрмита». Журнал статистического планирования и выводов (29): 245–260.
  3. ^ Jump up to: а б Расмуссен, К.; Гахрамани, З. (2002). «Байесовский Монте-Карло». Нейронные системы обработки информации : 489–496.
  4. ^ Jump up to: а б с д Бриоль, Ф.-Х.; Оутс, CJ; Джиролами, М.; Осборн, Массачусетс; Сейдинович, Д. (2019). «Вероятностная интеграция: роль в статистических вычислениях? (с обсуждением и ответом)». Статистическая наука . 34 (1): 1–22.
  5. ^ Хенниг, П.; Осборн, Массачусетс; Керстинг, HP (2022). Вероятностные числа (PDF) . Издательство Кембриджского университета. стр. 63–122. ISBN  978-1107163447 .
  6. ^ Джагадисваран, Р.; Хикернелл, Фред Дж. (10 сентября 2019 г.). «Быстрая автоматическая байесовская кубатура с использованием решетчатой ​​выборки» . Статистика и вычисления . 29 (6): 1215–1229. arXiv : 1809.09803 . дои : 10.1007/s11222-019-09895-9 . ISSN   0960-3174 . S2CID   119709309 .
  7. ^ Jump up to: а б Фишер, Мэтью; Оутс, Крис; Пауэлл, Кэтрин; Текцентрруп, Арета (3 июня 2020 г.). «Локально адаптивный байесовский кубатурный метод» . Международная конференция по искусственному интеллекту и статистике . ПМЛР: 1265–1275. arXiv : 1910.02995 .
  8. ^ Кокейн, Джон; Оутс, Крис; Салливан, Тим; Джиролами, Марк (2017). «Вероятностные численные методы для решения байесовских обратных задач с ограничениями PDE» . Байесовский вывод и методы максимальной энтропии в науке и технике . Материалы конференции AIP. 1853 (1). Автор(ы): 060001. arXiv : 1701.04006 . Бибкод : 2017AIPC.1853f0001C . дои : 10.1063/1.4985359 . hdl : 10044/1/66123 . S2CID   17349210 .
  9. ^ Jump up to: а б Си, Х.; Бриоль, Ф.-Х.; Джиролами, М. (2018). «Байесова квадратура для нескольких связанных интегралов». Международная конференция по машинному обучению : 8533–8564. arXiv : 1801.04153 .
  10. ^ Jump up to: а б Чжу, Х.; Лю, X.; Канг, Р.; Шен, З.; Флаксман, С.; Бриоль, Ф.-Х. (2020). «Байесовская вероятностная численная интеграция с древовидными моделями». Нейронные системы обработки информации : 5837–5849. arXiv : 2006.05371 .
  11. ^ Оутс, CJ; Нидерер, С.; Ли, А.; Бриоль, Ф.-Х.; Джиролами, М. (2017). «Вероятностные модели ошибки интегрирования при оценке функциональных моделей сердца». Нейронные системы обработки информации : 110–118. arXiv : 1606.06841 .
  12. ^ Джагадисваран, Р.; Хикернелл, Ф.Дж. (2019). «Быстрая автоматическая байесовская кубатура с использованием решетчатой ​​выборки». Статистика и вычисления . 29 (6): 1215–1229. arXiv : 1809.09803 . дои : 10.1007/s11222-019-09895-9 . S2CID   119709309 .
  13. ^ Карвонен, Т.; Сярккя, С. (2018). «Полностью симметричное ядро ​​квадратуры» . Журнал SIAM по научным вычислениям . 40 (2): 697–720. arXiv : 1703.06359 . Бибкод : 2018ГАО...40А.697К . дои : 10.1137/17M1121779 . S2CID   9707762 .
  14. ^ Гюнтер, Т.; Гарнетт, Р.; Осборн, Массачусетс; Хенниг, П.; Робертс, С. (2014). «Выборка для вывода в вероятностных моделях с быстрой байесовской квадратурой». Нейронные системы обработки информации : 2789–2797. arXiv : 1411.0439 .
  15. ^ Бриоль, Ф.-Х.; Оутс, CJ; Джиролами, М.; Осборн, Массачусетс (2015). «Байесовская квадратура Франка-Вульфа: вероятностное интегрирование с теоретическими гарантиями». Нейронные системы обработки информации : 1162–1170. arXiv : 1506.02681 .
  16. ^ Гесснер, А.; Гонсалес Дж.; Махсеречи, М. (2019). «Активный многоинформационный источник Байесовской квадратуры». Неопределенность в искусственном интеллекте . arXiv : 1903.11331 .
  17. ^ Канагава, М.; Шриперумбудур, Британская Колумбия; Фукумидзу, К. (2020). «Анализ сходимости детерминированных правил квадратур на основе ядра в неправильно заданных настройках» . Основы вычислительной математики . 20 : 155–194. arXiv : 1709.00147 . дои : 10.1007/s10208-018-09407-7 . S2CID   11717907 .
  18. ^ Винн, Г.; Бриоль, Ф.-Х.; Джиролами, М. (2020). «Гарантии сходимости для средств гауссовского процесса с неверно заданной вероятностью и гладкостью». Журнал исследований машинного обучения . 22 (123): 1–40. arXiv : 2001.10818 .
  19. ^ Карвонен, Т.; Оутс, CJ; Джиролами, М. (2021). «Интегрирование при воспроизведении ядерных гильбертовых пространств гауссовских ядер» . Математика вычислений . 90 (331): 2209–2233. arXiv : 2004.12654 . дои : 10.1090/mcom/3659 . S2CID   216552869 .
  20. ^ Канагава, М.; Хенниг, П. (2019). «Гарантии сходимости адаптивных байесовских квадратурных методов». Нейронные системы обработки информации : 6237–6248. arXiv : 1905.10271 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 0bc779b0b34a9a89ca5a3f3d3dae7a73__1716120960
URL1:https://arc.ask3.ru/arc/aa/0b/73/0bc779b0b34a9a89ca5a3f3d3dae7a73.html
Заголовок, (Title) документа по адресу, URL1:
Bayesian quadrature - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)