Приближение Веккья
![]() | Эта статья требует внимания эксперта по статистике . Конкретная проблема такова: необходимо проверить содержание и источники. ( октябрь 2020 г. ) |
Аппроксимация Веккья — это гауссовских процессов метод аппроксимации , первоначально разработанный Альдо Веккья , статистиком из Геологической службы США . [1] Это одна из первых попыток использовать гауссовы процессы в многомерных условиях. С тех пор оно было широко обобщено, что привело к появлению множества современных приближений.
Интуиция
[ редактировать ]Совместное распределение вероятностей событий , и , обозначенный , можно выразить как
Приближение Веккья принимает, например, вид:
и является точным, когда события и близки к условно независимым при условии знания . Конечно, можно было бы альтернативно выбрать приближение
и поэтому использование приближения требует некоторых знаний о том, какие события близки к условно независимым с учетом других. Более того, мы могли бы выбрать другой порядок, например
К счастью, во многих случаях существуют хорошие эвристики, принимающие решения о том, как построить аппроксимацию.
С технической точки зрения, общие версии аппроксимации приводят к разреженному фактору Холецкого в матрице точности. Использование стандартной факторизации Холецкого дает записи, которые можно интерпретировать. [2] как условные корреляции с нулями, указывающими на отсутствие независимости (поскольку модель является гауссовской). Эти отношения независимости могут быть альтернативно выражены с использованием графических моделей, и существуют теоремы, связывающие структуру графа и порядок вершин с нулями в факторе Холецкого. В частности, известно [3] что независимости, закодированные в моральном графе, приводят к факторам Холецкого матрицы точности, которые не имеют заполнения .
Формальное описание
[ редактировать ]Проблема
[ редактировать ]Позволять быть гауссовским процессом, индексируемым со средней функцией и ковариационная функция . Предположим, что является конечным подмножеством и представляет собой вектор значений оценивается в , то есть для . Предположим далее, что наблюдается где с . В этом контексте две наиболее распространенные задачи вывода включают оценку вероятности
или делать прогнозы значений для и , то есть вычисление
Оригинальная формула
[ редактировать ]Оригинальный метод Веккья начинается с наблюдения, что совместная плотность наблюдений можно записать как произведение условных распределений
Вместо этого приближение Веккья предполагает, что для некоторых
Веккья также предложил применять вышеуказанное приближение к наблюдениям, которые лексикографически переупорядочены с использованием их пространственных координат. Хотя его простой метод имеет много недостатков, он снизил сложность вычислений до . Многие из его недостатков были устранены последующими обобщениями.
Общая формулировка
[ редактировать ]Несмотря на концептуальную простоту, предположение о приближении Веккья часто оказывается довольно ограничительным и неточным. [4] Это вдохновило на важные обобщения и улучшения, внесенные в базовую версию на протяжении многих лет: включение скрытых переменных, более сложные условия и лучший порядок. Различные частные случаи общего приближения Веккья можно описать с точки зрения того, как выбираются эти три элемента. [5]
Скрытые переменные
[ редактировать ]Чтобы описать расширения метода Веккья в его наиболее общей форме, определите и обратите внимание, что для это справедливо, как и в предыдущем разделе
потому что дано все остальные переменные не зависят от .
Заказ
[ редактировать ]Широко отмечено, что первоначальный лексикографический порядок, основанный на координатах, когда является двумерным, дает плохие результаты. [6] Совсем недавно были предложены другие варианты упорядочения, некоторые из которых гарантируют, что точки располагаются квазислучайным образом. Было показано, что они обладают высокой масштабируемостью и значительно повышают точность. [4]
Кондиционирование
[ редактировать ]Подобно базовой версии, описанной выше, для данного порядка общее приближение Веккья можно определить как
где . С отсюда следует, что с тех пор как предложил, чтобы условия быть заменен на . Однако оказывается, что иногда обусловленность некоторыми наблюдениями увеличивает разреженность фактора Холецкого матрицы точности . Поэтому вместо этого можно рассматривать множества и такой, что и выразить как
Несколько способов выбора и были предложены, в первую очередь Гауссов процесс ближайшего соседа (NNGP), [7] сетчатый гауссов процесс [8] и подходы аппроксимации с несколькими разрешениями (MRA), использующие , стандартное старое использование и редкий генерал Веккья, где оба и не пусты. [5]
Программное обеспечение
[ редактировать ]Было разработано несколько пакетов, реализующих некоторые варианты приближения Веккья.
- GPvecchia — это пакет R, доступный через CRAN , который реализует большинство версий приближения Vecchia.
- GpGp — это пакет R, доступный через CRAN, который реализует масштабируемый метод упорядочивания пространственных задач, что значительно повышает точность.
- spNNGP — это пакет R, доступный через CRAN, который реализует скрытую аппроксимацию Веккья.
- pyMRA — это пакет Python, доступный через pyPI, реализующий аппроксимацию с несколькими разрешениями, частный случай общего метода Веккья, используемого в динамических моделях в пространстве состояний.
- meshed — это пакет R, доступный через CRAN, который реализует байесовские пространственные или пространственно-временные модели многомерной регрессии на основе скрытого сетчатого гауссовского процесса (MGP) с использованием аппроксимаций Веккья на разделенных доменах.
Примечания
[ редактировать ]- ^ Веккья, А.В. (1988). «Оценка и идентификация моделей непрерывных пространственных процессов» . Журнал Королевского статистического общества, серия B (методологический) . 50 (2): 297–312. дои : 10.1111/j.2517-6161.1988.tb01729.x .
- ^ Пурахмади, М. (2007). «Разложения Холецкого и оценка ковариационной матрицы: ортогональность параметров дисперсионной корреляции». Биометрика . 94 (4): 1006–1013. дои : 10.1093/biomet/asm073 . ISSN 0006-3444 .
- ^ Харе, Кшитидж; Раджаратнам, Бала (2011). «Распределения Уишарта для моделей разложимых ковариационных графов» . Анналы статистики . 39 (1): 514–555. arXiv : 1103.1768 . дои : 10.1214/10-AOS841 . ISSN 0090-5364 .
- ^ Перейти обратно: а б Гиннесс, Джозеф (2018). «Методы перестановки и группировки для уточнения аппроксимаций гауссовского процесса» . Технометрика . 60 (4): 415–429. дои : 10.1080/00401706.2018.1437476 . ISSN 0040-1706 . ПМК 6707751 . ПМИД 31447491 .
- ^ Перейти обратно: а б Кацфусс, Матиас; Гиннесс, Джозеф (2021). «Общая основа аппроксимации Веккья гауссовских процессов». Статистическая наука . 36 . arXiv : 1708.06302 . дои : 10.1214/19-STS755 . S2CID 88522976 .
- ^ Судипто Банерджи; Брэдли П. Карлин; Алан Э. Гельфанд (12 сентября 2014 г.). Иерархическое моделирование и анализ пространственных данных, второе издание . ЦРК Пресс. ISBN 978-1-4398-1917-3 .
- ^ Датта, Абхируп; Банерджи, Судипто; Финли, Эндрю; Гельфанд, Алан (2016). «Иерархические модели гауссовских процессов ближайших соседей для больших пространственных данных» . Журнал Американской статистической ассоциации . 111 (514): 800–812. дои : 10.1080/01621459.2015.1044091 . ПМЦ 5927603 . ПМИД 29720777 .
- ^ Перуцци, Микеле; Банерджи, Судипто; Финли, Эндрю (2020). «Высокомасштабируемое байесовское геостатистическое моделирование с помощью сетчатых гауссовских процессов в разделенных областях» . Журнал Американской статистической ассоциации . 117 (538): 969–982. arXiv : 2003.11208 . дои : 10.1080/01621459.2020.1833889 . ПМЦ 9354857 . ПМИД 35935897 .