Отбраковочная выборка
В численном анализе и статистике вычислительной отбраковочная выборка является основным методом, используемым для получения наблюдений из распределения . Его также часто называют методом принятия-отклонения или «алгоритмом принятия-отклонения», и он представляет собой разновидность метода точного моделирования. Метод работает для любого дистрибутива в с плотностью .
Отбраковочная выборка основана на наблюдении, что для выборки случайной величины в одном измерении можно выполнить равномерно случайную выборку двумерного декартова графика и хранить выборки в области под графиком ее функции плотности. [1] [2] [3] Обратите внимание, что это свойство можно распространить на N -мерные функции.
Описание
[ редактировать ]Чтобы визуализировать мотивацию отбраковки выборки, представьте себе, что вы строите график функции плотности вероятности (PDF) случайной величины на большой прямоугольной доске и бросаете в нее дротики. Предположим, что дротики равномерно распределены по доске. Теперь удалите все вытачки, находящиеся за пределами области под кривой. Остальные дротики будут равномерно распределены внутри области под кривой, а ‑положения этих дротиков будут распределены в соответствии с плотностью случайной величины. Это связано с тем, что дротикам больше всего места для приземления там, где кривая самая высокая, и, следовательно, плотность вероятности наибольшая.
Только что описанная визуализация эквивалентна особой форме выборки отклонений, при которой «распределение предложений» является равномерным. Следовательно, его график представляет собой прямоугольник. Общая форма выборки отклонений предполагает, что доска не обязательно имеет прямоугольную форму, а имеет форму, соответствующую плотности некоторого распределения предложений (не обязательно нормализованного к ), из которого мы знаем, как производить выборку (например, с помощью инверсионной выборки ). Его форма должна быть в каждой точке по крайней мере такой же высокой, как распределение, из которого мы хотим выполнить выборку, чтобы первое полностью охватывало второе. В противном случае были бы части изогнутой области, из которых мы хотим получить образец, и которые никогда не были бы доступны.
Отбраковочная выборка работает следующим образом:
- Образец точки на — ось распределения предложений.
- Нарисуйте здесь вертикальную линию -положение, вплоть до максимального значения y функции плотности вероятности распределения предложений.
- Выполняйте выборку равномерно вдоль этой линии от 0 до максимума функции плотности вероятности. Если выбранное значение больше значения желаемого распределения на этой вертикальной линии, отклоните —оценить и вернуться к шагу 1; еще ‑value — это выборка из желаемого распределения.
Этот алгоритм можно использовать для выборки из области под любой кривой, независимо от того, интегрируется ли функция до 1. Фактически, масштабирование функции по константе не влияет на выборку. -позиции . Таким образом, алгоритм можно использовать для выборки из распределения, нормализующая константа которого неизвестна, что часто встречается в вычислительной статистике .
Теория
[ редактировать ]Метод бракованной выборки генерирует значения выборки из целевого распределения. с произвольной функцией плотности вероятности с помощью распределения предложений с плотностью вероятности . Идея состоит в том, что можно сгенерировать выборочное значение из вместо этого осуществляя выборку из и принятие образца от с вероятностью , повторяя розыгрыши из пока значение не будет принято. вот постоянная, конечная граница отношения правдоподобия , удовлетворяя из- поддержки за ; другими словами, M должно удовлетворять для всех значений . Обратите внимание, что для этого требуется поддержка должна включать поддержку -другими словами, в любое время .
Валидацией этого метода является принцип конверта: при моделировании пары , производится однородное моделирование по подграфу . Принимаем только такие пары, что затем создает пары равномерно распределены по подграфу и таким образом, в некоторой степени, симуляция из
Это означает, что при достаточном количестве повторов алгоритм генерирует выборку из желаемого распределения. . Существует ряд расширений этого алгоритма, например алгоритм Метрополиса .
Этот метод относится к общей области методов Монте-Карло , включая алгоритмы Монте-Карло с цепями Маркова , которые также используют прокси-распределение для достижения моделирования на основе целевого распределения. . Он формирует основу для таких алгоритмов, как алгоритм Метрополиса .
Вероятность безусловного принятия — это доля принятых предложенных образцов, которая равна где , и значение каждый раз генерируется под функцией плотности распределения предложения .
Количество образцов, требуемое от таким образом, чтобы получить принятое значение, следует геометрическое распределение с вероятностью , что имеет в виду . Интуитивно, — ожидаемое количество необходимых итераций как мера вычислительной сложности алгоритма.
Перепишите приведенное выше уравнение, Обратите внимание, что , по приведенной выше формуле, где вероятность, которая может принимать значения только в интервале . Когда выбирается ближе к единице, то вероятность безусловного принятия тем выше, чем меньше изменяется это отношение, поскольку это верхняя граница отношения правдоподобия . На практике значение значение ближе к 1 является предпочтительным, поскольку оно предполагает в среднем меньшее количество отклоненных выборок и, следовательно, меньшее количество итераций алгоритма. В этом смысле предпочитают иметь как можно меньше (но при этом удовлетворяя , что говорит о том, что в целом должен напоминать каким-то образом. Однако обратите внимание, что не может быть равно 1: это означало бы, что , т. е. целевое и предлагаемое распределения на самом деле являются одним и тем же распределением.
Отбраковочная выборка чаще всего применяется в тех случаях, когда форма затрудняет выборку. Одна итерация алгоритма отклонения требует выборки из распределения предложений, извлечения из равномерного распределения и оценки выражение. Таким образом, отбраковочная выборка более эффективна, чем какой-либо другой метод, если стоимость этих операций, умноженная на M (которая представляет собой ожидаемую стоимость получения выборки с помощью браковочной выборки), ниже, чем стоимость получения выборки с использованием другого метода.
Алгоритм
[ редактировать ]Алгоритм, который использовал Джон фон Нейман [4] и восходит к Бюффону и его игле , [5] получает образец из распределения с плотностью используя образцы из раздачи с плотностью следующее:
- Получить образец от распространения и образец от (равномерное распределение на единичном интервале).
- Проверьте, если .
- Если это так, примите как образец, взятый из ;
- если нет, отклоните значение и вернитесь к этапу выборки.
Алгоритм будет принимать в среднем итерации для получения образца. [6]
Преимущества перед выборкой с использованием наивных методов
[ редактировать ]В некоторых ситуациях отбраковочная выборка может быть гораздо более эффективной по сравнению с наивными методами. Например, при такой задаче, как выборка условно на учитывая набор , то есть, , иногда можно легко смоделировать, используя наивные методы (например, путем выборки обратного преобразования ):
- Образец независимо и принимать те, которые удовлетворяют
- Выход: (см. также усечение (статистика) )
Проблема в том, что выборка может быть сложной и неэффективной, если . Ожидаемое количество итераций будет , которая может быть близка к бесконечности. Более того, даже если вы применяете метод выборки «Отбраковка», всегда сложно оптимизировать границу. для отношения правдоподобия. Чаще всего, велик, а процент отказов высок, алгоритм может быть очень неэффективным. Семейство естественных экспонент (если оно существует), также известное как экспоненциальный наклон, представляет собой класс распределений предложений, которые могут снизить сложность вычислений, ценность и ускорить вычисления (см. примеры: работа с натуральными экспоненциальными семействами).
Отбраковочная выборка с использованием экспоненциального наклона
[ редактировать ]Учитывая случайную величину , является целевым распределением. Предположим для простоты, что функцию плотности можно явно записать как . Выберите предложение как
где и . Четко, , принадлежит к естественному экспоненциальному семейству . Более того, отношение правдоподобия
Обратите внимание, что подразумевает, что это действительно функция генерации кумулянта , то есть
- .
Легко вывести функцию генерации кумулянта предложения и, следовательно, кумулянты предложения.
В качестве простого примера предположим, что под , , с . Цель – взять образец , где . Анализ происходит следующим образом:
- Выберите форму распространения предложения , с кумулянт-генерирующей функцией как
- ,
- что далее означает, что это нормальное распределение .
- Решите, что хорошо выбрано для распространения предложения. В этой настройке интуитивный способ выбора это установить
- ,
- то есть Распределение предложений таким образом .
- Четко запишите цель, предложение и отношение правдоподобия.
- Выведите границу для отношения правдоподобия , что является убывающей функцией для , поэтому
- Критерий браковки: для , если
выполняется, примите значение ; если нет, продолжайте пробовать новые и новый до принятия.
Для приведенного выше примера в качестве измерения эффективности, ожидаемого числа итераций, имеет порядок отбраковочная выборка на основе естественного экспоненциального семейства. , то есть , а при наивном методе ожидаемое количество итераций равно , что гораздо более неэффективно.
В общем, экспоненциальный наклон параметрического класса распределения предложений удобно решает задачи оптимизации благодаря своим полезным свойствам, которые непосредственно характеризуют распределение предложений. Для такого типа задач, чтобы смоделировать условно на В классе простых распределений хитрость заключается в использовании натурального экспоненциального семейства, которое помогает получить некоторый контроль над сложностью и значительно ускорить вычисления. Действительно, существуют глубокие математические причины для использования натурального экспоненциального семейства.
Недостатки
[ редактировать ]Отбраковочная выборка требует знания целевого распределения (в частности, способности оценить целевой PDF-файл в любой момент).
Отбраковочная выборка может привести к взятию большого количества нежелательных выборок, если выборка функции сильно сконцентрирована в определенной области, например функция, имеющая пик в каком-то месте. Для многих распределений эту проблему можно решить с помощью адаптивного расширения (см. адаптивную браковочную выборку ), либо соответствующей заменой переменных методом отношения униформ . Кроме того, по мере увеличения размеров задачи отношение внедренного объема к «углам» внедренного объема стремится к нулю, поэтому до того, как будет сгенерирован полезный образец, может произойти множество отказов, что делает алгоритм неэффективно и непрактично. См. проклятие размерности . В больших размерностях необходимо использовать другой подход, обычно метод Монте-Карло с цепью Маркова, такой как выборка Метрополиса или выборка Гиббса . (Однако выборка Гиббса, которая разбивает задачу многомерной выборки на серию выборок низкой размерности, может использовать браковочную выборку в качестве одного из этапов.)
Адаптивная отбраковочная выборка
[ редактировать ]Для многих дистрибутивов сложно найти дистрибутив предложения, включающий данный дистрибутив и не занимающий много места. Расширение браковочной выборки, которое можно использовать для преодоления этой трудности и эффективной выборки из широкого спектра распределений (при условии, что они имеют логарифмически вогнутые функции плотности, что фактически справедливо для большинства распространенных распределений, даже тех, плотность которых функции сами по себе не вогнуты) известен как адаптивная режекционная выборка (ARS) .
В этой технике есть три основные идеи, которые в конечном итоге предложил Гилкс в 1992 году: [7]
- Если это поможет, вместо этого определите распределение конвертов в пространстве журнала (например, логарифмическую вероятность или логарифмическую плотность). То есть работать с вместо напрямую.
- Часто распределения, которые имеют алгебраически беспорядочные функции плотности, имеют достаточно простые функции логарифмической плотности (т.е. когда это грязно, может быть проще работать или, по крайней мере, ближе к кусочно-линейному).
- Вместо единственной функции однородной плотности оболочки используйте в качестве оболочки кусочно-линейную функцию плотности.
- Каждый раз, когда вам приходится отклонять образец, вы можете использовать значение что вы оценили, чтобы улучшить кусочное приближение . Таким образом, это снижает вероятность того, что ваша следующая попытка будет отклонена. Асимптотически вероятность того, что вам придется отклонить вашу выборку, должна стремиться к нулю, и на практике часто очень быстро.
- Как предложено, каждый раз, когда мы выбираем отвергнутую точку, мы сжимаем огибающую другим отрезком линии, касательным к кривой в точке с той же координатой x, что и выбранная точка.
- Кусочно-линейная модель распределения журнала предложений приводит к набору кусочно -экспоненциальных распределений (т.е. сегментов одного или нескольких экспоненциальных распределений, соединенных встык). Экспоненциальные распределения хорошо себя ведут и хорошо понятны. Логарифм экспоненциального распределения представляет собой прямую линию, и, следовательно, этот метод по существу включает в себя заключение логарифма плотности в ряд отрезков линии. Это источник логарифмически вогнутого ограничения: если распределение логарифмически вогнутое, то его логарифм вогнутый (имеет форму перевернутой буквы U), а это означает, что отрезок прямой, касательный к кривой, всегда будет проходить над кривой.
- Если вы не работаете в логарифмическом пространстве, кусочно-линейную функцию плотности также можно выбрать с помощью треугольных распределений. [8]
- Мы можем еще больше воспользоваться требованием (логарифмической) вогнутости, чтобы потенциально избежать затрат на оценку Когда ваш образец будет принят.
- Точно так же, как мы можем построить кусочно-линейную верхнюю границу (функцию «огибающая»), используя значения которые нам пришлось оценить в текущей цепочке отклонений, мы также можем построить кусочно-линейную нижнюю границу («сжимающую» функцию), используя также эти значения.
- Прежде чем оценивать (потенциально дорогое) Чтобы узнать, будет ли принят ваш образец, мы, возможно, уже узнаем , будет ли он принят, путем сравнения с (в идеале более дешевым) (или в данном случае) функция сжатия, которая есть в наличии.
- Этот этап сжатия не является обязательным, даже если он предложен Гилксом. В лучшем случае это избавит вас от одной дополнительной оценки вашей (беспорядочной и/или дорогостоящей) целевой плотности. Однако, по-видимому, для особенно дорогих функций плотности (и при условии быстрого стремления процента брака к нулю) это может существенно повлиять на конечное время выполнения.
По сути, этот метод включает в себя последовательное определение огибающей сегментов прямых, которая все лучше и лучше аппроксимирует логарифм, оставаясь при этом над кривой, начиная с фиксированного количества сегментов (возможно, только одной касательной). Выборка из усеченной экспоненциальной случайной величины проста. Просто возьмите журнал равномерной случайной величины (с соответствующим интервалом и соответствующим усечением).
К сожалению, ARS можно применять только для отбора проб из логарифмически вогнутых целевых плотностей. По этой причине в литературе было предложено несколько расширений ARS для решения задач нелогарифмически вогнутых целевых распределений. [9] [10] [11] Кроме того, были разработаны различные комбинации ARS и метода Метрополиса-Гастингса, чтобы получить универсальный пробоотборник, который создает самонастраивающуюся плотность предложений (т. е. предложение автоматически создается и адаптируется к цели). Этот класс методов часто называют алгоритмами Adaptive Rejection Metropolis Sampling (ARMS) . [12] [13] Полученные адаптивные методы можно применять всегда, но в этом случае сгенерированные выборки коррелируют (хотя корреляция быстро исчезает до нуля по мере роста числа итераций).
См. также
[ редактировать ]- Выборка обратного преобразования
- Соотношение униформы
- Выборка псевдослучайных чисел
- Алгоритм зиккурата
Ссылки
[ редактировать ]- ^ Казелла, Джордж; Роберт, Кристиан П.; Уэллс, Мартин Т. (2004). Обобщенные схемы выборки «Принять-Отклонить» . Институт математической статистики. стр. 342–347. дои : 10.1214/lnms/1196285403 . ISBN 9780940600614 .
- ^ Нил, Рэдфорд М. (2003). «Срезовая выборка» . Анналы статистики . 31 (3): 705–767. дои : 10.1214/aos/1056562461 . МР 1994729 . Збл 1051.65007 .
- ^ Бишоп, Кристофер (2006). «11.4: Выборка срезов». Распознавание образов и машинное обучение . Спрингер . ISBN 978-0-387-31073-2 .
- ^ Форсайт, Джордж Э. (1972). «Метод сравнения фон Неймана для случайной выборки из нормального и других распределений» . Математика вычислений . 26 (120): 817–826. дои : 10.2307/2005864 . ISSN 0025-5718 . JSTOR 2005864 .
- ^ Лего, Джеффри; Мельбурн, Бретт А. (01 марта 2019 г.). «Учет изменений окружающей среды в стохастических моделях населения в непрерывном времени» . Теоретическая экология . 12 (1): 31–48. дои : 10.1007/s12080-018-0386-z . ISSN 1874-1746 .
- ^ Томопулос, Ник Т. (19 декабря 2012 г.). Основы моделирования Монте-Карло: статистические методы построения имитационных моделей (изд. 2013 г.). Нью-Йорк, Нью-Йорк Гейдельберг: Springer. ISBN 978-1-4614-6021-3 .
- ^ Гилкс, WR; Уайлд, П. (1992). «Адаптивная отбраковочная выборка для выборки Гиббса». Журнал Королевского статистического общества . Серия C (Прикладная статистика). 41 (2): 337–348. дои : 10.2307/2347565 . JSTOR 2347565 .
- ^ Томас, Д.Б.; Люк, В. (2007). «Генерация неравномерных случайных чисел посредством кусочно-линейных аппроксимаций». IET Компьютеры и цифровая техника . 1 (4): 312–321. doi : 10.1049/iet-cdt:20060188 .
- ^ Хёрманн, Вольфганг (1 июня 1995 г.). «Техника отклонения выборки из Т-вогнутых распределений». АКМ Транс. Математика. Программное обеспечение . 21 (2): 182–193. CiteSeerX 10.1.1.56.6055 . дои : 10.1145/203082.203089 . ISSN 0098-3500 .
- ^ Эванс, М.; Шварц, Т. (1 декабря 1998 г.). «Генерация случайных переменных с использованием свойств вогнутости преобразованных плотностей». Журнал вычислительной и графической статистики . 7 (4): 514–528. CiteSeerX 10.1.1.53.9001 . дои : 10.2307/1390680 . JSTOR 1390680 .
- ^ Гёрюр, Дилан; Да, Йи Уай (1 января 2011 г.). «Вогнуто-выпуклая адаптивная отбраковочная выборка». Журнал вычислительной и графической статистики . 20 (3): 670–691. дои : 10.1198/jcgs.2011.09058 . ISSN 1061-8600 .
- ^ Гилкс, WR; Бест, Нью-Йорк ; Тан, KKC (1 января 1995 г.). «Выборка мегаполиса с адаптивным отклонением в рамках выборки Гиббса». Журнал Королевского статистического общества . Серия C (Прикладная статистика). 44 (4): 455–472. дои : 10.2307/2986138 . JSTOR 2986138 .
- ^ Мейер, Рената; Кай, Бо; Перрон, Франсуа (15 марта 2008 г.). «Адаптивная отбраковка выборки Метрополиса с использованием интерполяционных полиномов Лагранжа 2-й степени». Вычислительная статистика и анализ данных . 52 (7): 3408–3423. дои : 10.1016/j.csda.2008.01.005 .
Дальнейшее чтение
[ редактировать ]- Роберт, CP; Казелла, Г. (2004). Статистические методы Монте-Карло (второе изд.). Нью-Йорк: Springer-Verlag.