Процесс Бернулли
Эта статья включает список общих ссылок , но в ней отсутствуют достаточные соответствующие встроенные цитаты . ( сентябрь 2011 г. ) |
Часть серии по статистике. |
Теория вероятностей |
---|
В теории вероятности и статистике процесс Бернулли (названный в честь Якоба Бернулли ) представляет собой конечную или бесконечную последовательность двоичных случайных величин , поэтому это случайный процесс с дискретным временем , который принимает только два значения, канонически 0 и 1. Компонентные переменные Бернулли X Я одинаково распределен и независим . Прозаично, процесс Бернулли — это многократное подбрасывание монеты , возможно, с нечестной монетой (но с постоянной несправедливостью). Каждая переменная X i в последовательности связана с испытанием или экспериментом Бернулли . Все они имеют одинаковое распределение Бернулли . Многое из того, что можно сказать о процессе Бернулли, можно также обобщить на более чем два результата (например, процесс для шестигранной игральной кости); это обобщение известно как схема Бернулли .
Проблему определения процесса, учитывая лишь ограниченную выборку испытаний Бернулли, можно назвать проблемой проверки того, честна ли монета .
Определение
[ редактировать ]Процесс Бернулли — это конечная или бесконечная последовательность независимых случайных величин X 1 , X 2 , X 3 , ..., такая, что
- для каждого i значение X i равно 0 или 1;
- для всех значений , вероятность p того, что X i = 1, та же самая.
Другими словами, процесс Бернулли — это последовательность независимых одинаково распределенных испытаний Бернулли .
Независимость испытаний подразумевает, что процесс не имеет памяти . Учитывая, что вероятность p известна, прошлые результаты не дают информации о будущих результатах. (Однако если p неизвестно, прошлое сообщает о будущем косвенно, через выводы о p .)
Если процесс бесконечен, то с любой точки будущие испытания представляют собой процесс Бернулли, идентичный всему процессу, - свойство нового начала.
Интерпретация
[ редактировать ]Два возможных значения каждого X i часто называют «успехом» и «неудачей». Таким образом, если результат выражен числом 0 или 1, его можно назвать количеством успехов в i -м «испытании».
Две другие распространенные интерпретации значений: истина или ложь и да или нет. При любой интерпретации этих двух значений отдельные переменные X i можно назвать испытаниями Бернулли с параметром p.
Во многих приложениях время между испытаниями проходит по мере увеличения индекса i. По сути, испытания X 1 , X 2 , ... X i , ... происходят в «моменты времени» 1, 2, ..., i , .... Этот ход времени и связанные с ним понятия Однако «прошлое» и «будущее» не являются необходимыми. В большинстве случаев любые X i и X j в процессе — это просто две из набора случайных величин, индексированных {1, 2, ..., n }, конечные случаи, или {1, 2, 3, .. .}, бесконечные случаи.
Один эксперимент только с двумя возможными результатами, часто называемыми «успехом» и «неудачей», обычно кодируемыми как 1 и 0, можно смоделировать как распределение Бернулли . [1] Несколько случайных величин и распределений вероятностей , помимо Бернулли, могут быть получены из процесса Бернулли:
- Число успехов в первых n испытаниях, имеющее биномиальное распределение B( n , p )
- Число неудач, необходимых для получения r успехов, которое имеет отрицательное биномиальное распределение NB( r , p )
- Число неудач, необходимых для достижения одного успеха, имеет геометрическое распределение NB(1, p ), частный случай отрицательного биномиального распределения.
Отрицательные биномиальные переменные можно интерпретировать как случайное время ожидания .
Формальное определение
[ редактировать ]Процесс Бернулли можно формализовать на языке вероятностных пространств как случайную последовательность независимых реализаций случайной величины, которая может принимать значения «орел» или «решка». Пространство состояний для отдельного значения обозначается
Борелевская алгебра
[ редактировать ]Рассмотрим счетное бесконечное прямое произведение копий . Обычно рассматривают либо одностороннее множество или двусторонний набор . В этом пространстве существует естественная топология , называемая топологией произведения . Множества в этой топологии представляют собой конечные последовательности подбрасываний монеты, то есть строки конечной длины из H и T ( H означает орел, а T означает решку), а остальная часть (бесконечно длинной) последовательности принимается как «не забота». Эти наборы конечных последовательностей называются множествами цилиндров в топологии произведения. Набор всех таких строк образует сигма-алгебру , в частности, борелевскую алгебру . Тогда эта алгебра обычно записывается как где элементы — последовательности подбрасываний монеты конечной длины (множества цилиндров).
мера Бернулли
[ редактировать ]Если шансы выпадения орла или решки определяются вероятностями , то можно определить естественную меру в пространстве произведений, заданную формулой (или через для двустороннего процесса). Другими словами, если дискретная случайная величина X имеет распределение Бернулли с параметром p , где 0 ≤ p ≤ 1, и ее массовая функция вероятности определяется выражением
- и .
Обозначим это распределение через Ber( p ). [1]
Учитывая набор цилиндров, то есть определенную последовательность результатов подбрасывания монеты. время от времени , вероятность наблюдения этой конкретной последовательности определяется выражением
где k — количество раз, когда H появляется в последовательности, а n − k — количество раз, когда T появляется в последовательности. Для вышеизложенного существует несколько различных типов обозначений; обычное дело - писать
где каждый представляет собой двоичную случайную величину с в скобках Айверсона , что означает либо если или если . Эта вероятность обычно называют мерой Бернулли . [2]
Обратите внимание, что вероятность любой конкретной бесконечно длинной последовательности подбрасываний монеты равна нулю; это потому что , для любого . Вероятность, равная 1, означает, что любая данная бесконечная последовательность имеет нулевую меру . Тем не менее, все же можно сказать, что некоторые классы бесконечных последовательностей подбрасываний монеты гораздо более вероятны, чем другие, это определяется свойством асимптотического равнораспределения .
В заключение формального определения можно сказать, что процесс Бернулли задается тройкой вероятностей , как определено выше.
Закон больших чисел, биномиальное распределение и центральная предельная теорема
[ редактировать ]Предположим, что это канонический процесс с в лице и в лице . Закон больших чисел гласит, что среднее значение последовательности, т. е. , почти наверняка приблизится к ожидаемому значению , то есть события, не удовлетворяющие этому пределу, имеют нулевую вероятность. Ожидаемое значение выпадения орла , которое предполагается равным 1, определяется выражением . Фактически, у человека есть
для любой заданной случайной величины из бесконечной последовательности испытаний Бернулли, составляющих процесс Бернулли.
Часто интересно узнать, как часто можно наблюдать H в последовательности из n подбрасываний монеты. Это определяется простым подсчетом: при n последовательных подбрасываниях монеты, то есть при заданном наборе всех возможных строк длины n , количество N ( k , n ) таких строк, содержащих k вхождений H, определяется биномиальным коэффициентом.
Если вероятность выпадения орла равна p , то общая вероятность увидеть строку длины n с k орлами равна
где . Определенная таким образом вероятностная мера известна как биномиальное распределение .
Как мы видим из приведенной выше формулы, если n=1, биномиальное распределение превратится в распределение Бернулли . Таким образом, мы можем знать, что распределение Бернулли является частным случаем биномиального распределения, когда n равно 1.
Особый интерес представляет вопрос о стоимости для достаточно длинной последовательности подбрасываний монеты, т. е. для предела . В этом случае можно воспользоваться приближением Стирлинга к факториалу и записать
Подставив это в выражение для P ( k , n ), получим нормальное распределение ; таково содержание центральной предельной теоремы , и это ее простейший пример.
Сочетание закона больших чисел вместе с центральной предельной теоремой приводит к интересному и, возможно, удивительному результату: свойству асимптотического равнораспределения . Говоря неформально, можно заметить, что да, при многих подбрасываниях монеты H будет наблюдаться ровно p долю времени, и что это точно соответствует пику гауссианы. Свойство асимптотического равнораспределения по существу утверждает, что этот пик бесконечно острый, с бесконечным спадом с обеих сторон. То есть, учитывая множество всех возможных бесконечно длинных строк H и T, встречающихся в процессе Бернулли, это множество разбивается на две: те строки, которые встречаются с вероятностью 1, и те, которые встречаются с вероятностью 0. Такое разбиение известно как Закон Колмогорова 0-1 .
Размер этого набора также интересен и может быть определен явно: его логарифм в точности равен энтропии процесса Бернулли. Еще раз рассмотрим набор всех строк длины n . Размер этого набора . Из них вероятны только определенные подмножества; размер этого набора для . Используя приближение Стирлинга, поместив его в выражение для P ( k , n ), определив местоположение и ширину пика и, наконец, взяв человек обнаруживает, что
Это значение представляет собой энтропию Бернулли процесса Бернулли. Здесь H означает энтропию; не путать с тем же символом H, обозначающим орел .
Джон фон Нейман поставил вопрос о процессе Бернулли относительно возможности того, что данный процесс изоморфен другому , в смысле изоморфизма динамических систем . Вопрос долго не поддавался анализу, но наконец и полностью был дан ответ с помощью теоремы об изоморфизме Орнштейна . Этот прорыв привел к пониманию того, что процесс Бернулли уникален и универсален ; в определенном смысле это самый случайный процесс; нет ничего «более» случайного, чем процесс Бернулли (хотя с этим неформальным утверждением следует быть осторожным; конечно, системы, которые смешиваются , в определенном смысле «сильнее», чем процесс Бернулли, который является просто эргодическим, но не смешивающим. Однако такие процессы не состоят из независимых случайных величин: действительно, смешиваться могут многие чисто детерминированные, неслучайные системы).
Динамические системы
[ редактировать ]Процесс Бернулли также можно понимать как динамическую систему , как пример эргодической системы и, в частности, динамической системы, сохраняющей меру , одним из нескольких различных способов. Один способ — это пространство смены , а другой — одометр . Они рассматриваются ниже.
сдвиг Бернулли
[ редактировать ]Один из способов создать динамическую систему на основе процесса Бернулли — создать пространство сдвига . В пространстве продукта существует естественная трансляционная симметрия. заданный оператором сдвига
Определенная выше мера Бернулли является трансляционно-инвариантной; то есть при любом наборе цилиндров , у одного есть
и, таким образом, мера Бернулли является мерой Хаара ; это инвариантная мера в пространстве произведений.
Вместо вероятностной меры , рассмотрим вместо этого некоторую произвольную функцию . Продвижение вперед
определяется это снова какая-то функция Таким образом, карта вызывает другую карту на пространстве всех функций То есть, учитывая некоторые , один определяет
Карта является линейным оператором , поскольку (очевидно) имеется и для функций и постоянный . Этот линейный оператор называется оператором переноса или оператором Рюэля–Фробениуса–Перрона . Этот оператор имеет спектр , то есть набор собственных функций и соответствующих им собственных значений. Наибольшее собственное значение — это собственное значение Фробениуса–Перрона , и в данном случае оно равно 1. Соответствующий собственный вектор является инвариантной мерой: в данном случае это мера Бернулли. То есть,
Если кто-то ограничивает действовать на полиномы, то собственными функциями являются (что любопытно) полиномы Бернулли ! [3] [4] Это совпадение названий, по-видимому, не было известно Бернулли.
Карта 2x мод 1
[ редактировать ]Вышеизложенное можно уточнить. Учитывая бесконечную строку двоичных цифр писать
В результате действительное число в единичном интервале Смена индуцирует гомоморфизм , также называемый , на единичном интервале. С это можно увидеть Эта карта называется диадической трансформацией ; для дважды бесконечной последовательности битов индуцированный гомоморфизм есть отображение Бейкера .
Рассмотрим теперь пространство функций из . Учитывая некоторые можно найти это
Ограничение действий оператора к функциям, состоящим из полиномов, обнаруживается, что он имеет дискретный спектр, определяемый формулой
где являются полиномами Бернулли . Действительно, полиномы Бернулли подчиняются тождеству
Набор Кантора
[ редактировать ]Обратите внимание, что сумма
дает функцию Кантора в ее традиционном определении. Это одна из причин, почему набор иногда называют множеством Кантора .
Одометр
[ редактировать ]Другой способ создать динамическую систему — определить одометр . Неформально это звучит именно так: просто «добавьте единицу» в первую позицию, и дайте одометру «перевернуться», используя биты переноса , когда одометр перевернется. Это не что иное, как сложение по основанию два множества бесконечных строк. Поскольку сложение образует группу (математика) , а процессу Бернулли уже была задана топология выше, это дает простой пример топологической группы .
В этом случае преобразование дается
Он оставляет меру Бернулли инвариантной только для частного случая («честная монета»); иначе нет. Таким образом, в этом случае является мерой, сохраняющей динамическую систему , в противном случае это просто консервативная система .
последовательность Бернулли
[ редактировать ]Термин «последовательность Бернулли» часто неофициально используется для обозначения реализации процесса Бернулли. Однако этот термин имеет совершенно другое формальное определение, приведенное ниже.
Предположим, что процесс Бернулли формально определен как одна случайная величина (см. предыдущий раздел). Для каждой бесконечной последовательности x подбрасываний монеты существует последовательность целых чисел
называется последовательностью Бернулли [ нужна проверка ] связан с процессом Бернулли. Например, если x представляет собой последовательность подбрасываний монеты, то связанная с ней последовательность Бернулли представляет собой список натуральных чисел или моментов времени, для которых результатом подбрасывания монеты является орел .
Определенная таким образом последовательность Бернулли также является случайным подмножеством набора индексов, натуральных чисел .
Почти все последовательности Бернулли являются эргодическими последовательностями . [ нужна проверка ]
Извлечение случайности
[ редактировать ]Из любого процесса Бернулли можно получить процесс Бернулли с p = 1/2 с помощью экстрактора фон Неймана , самого раннего экстрактора случайности , который фактически извлекает равномерную случайность.
Базовый экстрактор фон Неймана
[ редактировать ]Представьте наблюдаемый процесс как последовательность нулей и единиц или битов и сгруппируйте этот входной поток в непересекающиеся пары последовательных битов, например (11)(00)(10)... . Тогда для каждой пары
- если биты равны, отбросить;
- если биты не равны, выведите первый бит.
Эта таблица суммирует вычисления.
вход | выход |
---|---|
00 | отказаться |
01 | 0 |
10 | 1 |
11 | отказаться |
Например, входной поток из восьми бит 10011011 будет сгруппирован в пары как (10)(01)(10)(11) . Затем, согласно таблице выше, эти пары транслируются в выходные данные процедуры: (1)(0)(1)() (= 101 ).
В выходном потоке 0 и 1 одинаково вероятны, как 10 и 01 одинаково вероятны в исходном потоке, оба имеют вероятность p (1− p ) = (1− p ) p . Такое извлечение равномерной случайности не требует, чтобы входные испытания были независимыми, а только некоррелированными . В более общем смысле, это работает для любой заменяемой последовательности битов: все последовательности, которые являются конечными перестановками, одинаково вероятны.
Экстрактор фон Неймана использует два входных бита для получения либо нуля, либо одного выходного бита, поэтому выходной сигнал короче входного как минимум в 2 раза. В среднем при вычислении отбрасывается пропорция p. 2 + (1 - п ) 2 входных пар (00 и 11), которое близко к единице, когда p близко к нулю или единице, и минимизируется до 1/4, когда p = 1/2 для исходного процесса (в этом случае выходной поток равен 1/4 длина входного потока в среднем).
основной операции фон Неймана (классический) Псевдокод :
if (Bit1 ≠ Bit2) {
output(Bit1)
}
Итерированный экстрактор фон Неймана
[ редактировать ]Это снижение эффективности или потеря случайности, присутствующей во входном потоке, можно смягчить путем итерации алгоритма по входным данным. Таким образом, результат можно сделать «произвольно близким к границе энтропии». [5]
Итерированная версия алгоритма фон Неймана, также известная как расширенная многоуровневая стратегия (AMLS), [6] был введен Ювалем Пересом в 1992 году. [5] Он работает рекурсивно, перерабатывая «потерянную случайность» из двух источников: последовательности отбрасывания-неотбрасывания и значений отброшенных пар (0 для 00 и 1 для 11). Он основан на том факте, что, учитывая уже сгенерированную последовательность, оба этих источника по-прежнему представляют собой заменяемые последовательности битов и, следовательно, имеют право на следующий раунд извлечения. Хотя такое создание дополнительных последовательностей можно повторять бесконечно, чтобы извлечь всю доступную энтропию, требуется бесконечное количество вычислительных ресурсов, поэтому количество итераций обычно фиксируется на низком значении — это значение либо фиксируется заранее, либо рассчитывается во время выполнения.
Более конкретно, во входной последовательности алгоритм использует входные биты парами, генерируя выходные данные вместе с двумя новыми последовательностями () дает бумажную нотацию AMLS:
вход | выход | новая последовательность 1(А) | новая последовательность 2(1) |
---|---|---|---|
00 | никто | 0 | 0 |
01 | 0 | 1 | никто |
10 | 1 | 1 | никто |
11 | никто | 0 | 1 |
(Если длина входных данных нечетная, последний бит полностью отбрасывается.) Затем алгоритм рекурсивно применяется к каждой из двух новых последовательностей, пока входные данные не станут пустыми.
Пример. Входной поток из документа AMLS, 11001011101110, с использованием 1 для H и 0 для T, обрабатывается следующим образом:
номер шага | вход | выход | новая последовательность 1(А) | новая последовательность 2(1) |
---|---|---|---|---|
0 | (11)(00)(10)(11)(10)(11)(10) | ()()(1)()(1)()(1) | (1)(1)(0)(1)(0)(1)(0) | (1)(0)()(1)()(1)() |
1 | (10)(11)(11)(01)(01)() | (1)()()(0)(0) | (0)(1)(1)(0)(0) | ()(1)(1)()() |
2 | (11)(01)(10)() | ()(0)(1) | (0)(1)(1) | (1)()() |
3 | (10)(11) | (1) | (1)(0) | ()(1) |
4 | (11)() | () | (0) | (1) |
5 | (10) | (1) | (1) | () |
6 | () | () | () | () |
Начиная с шага 1, входные данные представляют собой объединение последовательности 2 и последовательности 1 из предыдущего шага (порядок произволен, но должен быть фиксированным). Окончательный результат: ()()(1)()(1)()(1)(1)()()(0)(0)()(0)(1)(1)()(1) (= 1111000111 ), поэтому из 14 бит входных данных были сгенерированы 10 бит выходных данных, а не 3 бита только с помощью алгоритма фон Неймана. Постоянный вывод ровно 2 бита за раунд на пару бит (по сравнению с переменной от нуля до 1 бита в классической VN) также позволяет реализовать реализации с постоянным временем, устойчивые к атакам по времени .
Псевдокод основной операции Фон Неймана – Переса (итерированный):
if (Bit1 ≠ Bit2) {
output(1, Sequence1)
output(Bit1)
} else {
output(0, Sequence1)
output(Bit1, Sequence2)
}
Еще одна настройка была представлена в 2016 году, основанная на наблюдении, что канал Sequence2 не обеспечивает большую пропускную способность, и аппаратная реализация с конечным числом уровней может выиграть от его более раннего отказа в обмен на обработку большего количества уровней Sequence1. [7]
Ссылки
[ редактировать ]- ^ Jump up to: а б Декинг, FM; Краайкамп, К.; Лопухаа, Х.П.; Мистер, Л.Е. (2005). Современное введение в вероятность и статистику . стр. 100-1 45–46. ISBN 9781852338961 .
- ^ Кленке, Ахим (2006). Теория вероятностей . Спрингер-Верлаг. ISBN 978-1-84800-047-6 .
- ^ Пьер Гаспар, « R -адические одномерные карты и формула суммирования Эйлера», Journal of Physics A , 25 (письмо) L483-L485 (1992).
- ^ Дин Дж. Дрибе, Полностью хаотические карты и нарушенная симметрия времени, (1999) Kluwer Academic Publishers, Дордрехт, Нидерланды ISBN 0-7923-5564-4
- ^ Jump up to: а б Перес, Юваль (март 1992 г.). «Итерация процедуры фон Неймана для извлечения случайных битов» . Анналы статистики . 20 (1): 590–597. дои : 10.1214/aos/1176348543 .
- ^ «Подбрасывание необъективной монеты» (PDF) . eecs.harvard.edu. Архивировано (PDF) из оригинала 31 марта 2010 г. Проверено 28 июля 2018 г.
- ^ Рожич, Владимир; Ян, Бохан; Деэн, Вим; Вербауведе, Ингрид (3–5 мая 2016 г.). Итерация постобработки фон Неймана при аппаратных ограничениях (PDF) . Международный симпозиум IEEE по аппаратно-ориентированной безопасности и доверию (HOST), 2016 г. Маклин, Вирджиния, США. дои : 10.1109/HST.2016.7495553 . Архивировано (PDF) из оригинала 12 февраля 2019 г.
Дальнейшее чтение
[ редактировать ]- Карл В. Хелстром, Вероятность и случайные процессы для инженеров , (1984) Macmillan Publishing Company, Нью-Йорк ISBN 0-02-353560-1 .