Свойство асимптотического равнораспределения
Теория информации |
---|
В теории информации свойство асимптотического равнораспределения ( AEP ) является общим свойством выходных выборок стохастического источника . Это фундаментальное понятие типичного набора, используемое в теориях сжатия данных .
Грубо говоря, теорема утверждает, что, хотя существует множество серий результатов, которые могут быть получены в результате случайного процесса, фактически полученный результат, скорее всего, представляет собой слабо определенный набор результатов, каждый из которых имеет примерно одинаковую вероятность быть фактически реализованным. . (Это следствие закона больших чисел и эргодической теории .) Хотя существуют отдельные исходы, которые имеют более высокую вероятность, чем любой исход в этом наборе, огромное количество исходов в наборе почти гарантирует, что результат будет исходить из набор. Один из способов интуитивно понять это свойство — использовать теорему Крамера о большом отклонении , которая утверждает, что вероятность большого отклонения от среднего значения экспоненциально убывает с увеличением количества выборок. Такие результаты изучаются в теории больших уклонений ; интуитивно понятно, что именно большие отклонения нарушат равнораспределение, но это маловероятно.
В области генерации псевдослучайных чисел кандидат-генератор неопределенного качества, выходная последовательность которого по некоторым статистическим критериям лежит слишком далеко за пределами типичного набора, отклоняется как недостаточно случайный. Таким образом, хотя типичный набор определен слабо, возникают практические представления о достаточной типичности.
Определение
[ редактировать ]Дан стационарный эргодический случайный процесс с дискретным временем. в вероятностном пространстве , свойство асимптотического равнораспределения — это утверждение, что почти наверняка , где или просто обозначает энтропии уровень с дискретным временем, , которое должно существовать для всех стационарных процессов включая эргодические. Свойство асимптотического равнораспределения доказано для конечнозначных (т. е. ) стационарные эргодические случайные процессы в теореме Шеннона–Макмиллана–Бреймана с использованием эргодической теории и для любых иид- источников непосредственно с использованием закона больших чисел как в дискретнозначном случае (где — это просто энтропия символа) и случай с непрерывными значениями (где вместо этого — дифференциальная энтропия). Определение свойства асимптотического равнораспределения также можно распространить на некоторые классы случайных процессов с непрерывным временем, для которых типичный набор существует в течение достаточно длительного времени наблюдения. Сходимость доказана почти наверняка во всех случаях.
Источники идентификаторов дискретного времени
[ редактировать ]Данный это источник iid , который может принимать значения в алфавите , его временной ряд является идентификатором с энтропией . Слабый закон больших чисел дает асимптотическое свойство равнораспределения со сходимостью по вероятности поскольку энтропия равна математическому ожиданию [1]
Усиленный закон больших чисел утверждает более сильную почти уверенную сходимость: Сходимость в смысле L1 утверждает еще более сильное утверждение.
Дискретные по времени конечнозначные стационарные эргодические источники
[ редактировать ]Рассмотрим конечнозначное выборочное пространство , то есть с дискретным временем , для стационарного эргодического процесса определенное в вероятностном пространстве . Теорема Шеннона-Макмиллана-Бреймана , принадлежащая Клоду Шеннону , Брокуэю Макмиллану и Лео Брейману , утверждает, что мы имеем сходимость в смысле L1. [2] Чунг Кай-лай обобщил это на случай, когда может принимать значение в множестве счетной бесконечности при условии, что уровень энтропии все еще конечен. [3]
- Пусть x обозначает некоторое измеримое множество для некоторых
- Параметризуйте совместную вероятность по n и x как
- Параметризуйте условную вероятность i , k и x как
- Возьмем предел условной вероятности при k → ∞ и обозначим его как
- Спорьте о двух понятиях скорости энтропии. существуют и равны для любого стационарного процесса, включая стационарный эргодический X. процесс Обозначим его H. как
- Утверждайте, что оба где i - индекс времени, являются стационарными эргодическими процессами, выборочные средние которых почти наверняка сходятся к некоторым значениям, обозначаемым и соответственно.
- Определим марковское приближение k -го порядка вероятности как
- Утверждайте, что конечно в силу предположения о конечности.
- Выражать с точки зрения выборочного среднего значения и покажем, что оно почти наверняка сходится к H к
- Определите вероятностную меру
- Выражать с точки зрения выборочного среднего значения и покажем, что оно почти наверняка сходится к H ∞ .
- Утверждайте, что при k → ∞, используя стационарность процесса.
- Докажите, что H = H ∞ используя теорему о сходимости мартингала Леви и предположение о конечности значений.
- Покажи это которое конечно, как утверждалось ранее.
- Покажи это обусловленность бесконечным прошлым и повторение ожидания.
- Покажи это используя неравенство Маркова и полученное ранее математическое ожидание.
- Аналогично покажите, что что эквивалентно
- Покажи этот лимсап почти наверняка неположительны, если положить α = n б для любого β > 1 и применения леммы Бореля–Кантелли .
- Покажите, что liminf и limsup снизу и сверху почти наверняка ограничены H ∞ и Х к соответственно, разбивая логарифмы в предыдущем результате.
- Завершите доказательство, указав, что верхняя и нижняя границы, как было показано ранее, приближаются к H при k → ∞.
Нестационарный источник дискретного времени, создающий независимые символы
[ редактировать ]Предположения о стационарности/эргодичности/идентичности распределения случайных величин не являются существенными для соблюдения свойства асимптотического равнораспределения. Действительно, как совершенно интуитивно ясно, свойство асимптотического равнораспределения требует соблюдения лишь некоторой формы закона больших чисел, который является довольно общим. Однако выражение необходимо соответствующим образом обобщить, а условия необходимо точно сформулировать.
Мы предполагаем, что источник создает независимые символы с возможно различной выходной статистикой в каждый момент времени. Будем считать, что статистика процесса известна полностью, т. е. известно маргинальное распределение процесса, наблюдаемое в каждый момент времени. Совместное распределение — это всего лишь продукт маргиналов. Тогда при условии (которое можно ослабить), что для всех i и некоторого M > 0 справедливо следующее (AEP): где
Доказательство следует из простого применения неравенства Маркова (применительно ко второму моменту .
Очевидно, что доказательство справедливо, если в какой-либо момент равномерно ограничено при r > 1 (опять же по неравенству Маркова, примененному к r -му моменту). КЭД
Даже это условие не является необходимым, но, учитывая нестационарный случайный процесс, не должно составить труда проверить, выполняется ли свойство асимптотического равнораспределения, используя описанный выше метод.
Приложения
[ редактировать ]Свойство асимптотического равнораспределения для нестационарного независимого процесса с дискретным временем приводит нас (среди других результатов) к теореме кодирования источника для нестационарного источника (с независимыми выходными символами) и теореме кодирования канала с шумом для нестационарных каналов без памяти.
Теоретико-мерная форма
[ редактировать ]представляет собой сохраняющее меру отображение вероятностного пространства .
Если является конечным или счетным разбиением , то его энтропия равна с соглашением, что .
Мы рассматриваем только разбиения с конечной энтропией: .
Если является конечным или счетным разбиением , затем строим последовательность разбиений путем итерации карты: где является разделом с наименьшей верхней границей, то есть наименее уточненным разделом, который уточняет оба и : Писать быть установленным в где впадает. Так, например, это -буквенный начальный сегмент -имя .
Писать быть информацией (в единицах nats ) о мы можем восстановить, если знаем, какой элемент в разделе что попадает: Аналогично, условная информация раздела , при условии разделения , о , является энтропия Колмогорова -Синая Другими словами, по определению мы имеем сходимость ожиданий. Теорема SMB утверждает, что когда эргодична, то мы имеем сходимость в L1. [4]
Теорема (эргодический случай) — Если эргодично, то сходится в L1 к постоянной функции .
Другими словами,
В частности, поскольку сходимость L1 предполагает сходимость почти наверняка, с вероятностью 1.
Следствие (свойство равнораспределения энтропии) — , мы можем разделить раздел на две части, «хорошую» часть и «плохая» часть .
Плохая часть небольшая:
Хорошая часть практически равномерно распределена по энтропии:
Если не обязательно эргодично, то базовое вероятностное пространство будет разделено на несколько подмножеств, каждое из которых инвариантно относительно . В этом случае мы все еще имеем сходимость L1 к некоторой функции, но эта функция уже не является постоянной функцией. [5]
Теорема (общий случай) — Пусть быть сигма-алгеброй, порожденной всеми -инвариантные измеримые подмножества , - сходится в L1 к
Когда является эргодическим, тривиально, поэтому функция упрощается до постоянной функции , что по определению равно , что равно по предложению.
Стационарные эргодические источники с непрерывным временем
[ редактировать ]Функции дискретного времени можно интерполировать в функции непрерывного времени. Если такая интерполяция f измерима , мы можем соответственно определить стационарный процесс с непрерывным временем как . Если свойство асимптотического равнораспределения справедливо для процесса с дискретным временем, как в iid или конечнозначных стационарных эргодических случаях, показанных выше, оно автоматически выполняется для стационарного процесса с непрерывным временем, полученного из него с помощью некоторой измеримой интерполяции. т.е. где n соответствует степени свободы во времени τ . nH ( X )/ τ и H ( X ) — энтропия в единицу времени и на степень свободы соответственно, определенная Шенноном .
Важным классом таких стационарных процессов с непрерывным временем является стационарный эргодический процесс с ограниченной полосой пропускания, в котором пространство выборки является подмножеством непрерывного процесса. функции. Свойство асимптотического равнораспределения сохраняется, если процесс белый, и в этом случае временные выборки равны iid, или существует T > 1/2 W , где W — номинальная полоса пропускания , так что временные выборки, разнесенные по T, принимают значения в конечном множество, и в этом случае мы имеем конечнозначный стационарный эргодический процесс с дискретным временем.
Любые стационарные операции также сохраняют свойство асимптотического равнораспределения, стационарность и эргодичность, и мы можем легко превратить стационарный процесс в нестационарный, не теряя свойства асимптотического равнораспределения, обнуляя конечное число временных отсчетов в процессе.
Теория категорий
[ редактировать ]Теоретико -категорное определение свойства равнораспределения дано Громовым . [6] Учитывая последовательность картезианских степеней пространства с мерой P эта последовательность допускает асимптотически эквивалентную последовательность H N однородных пространств с мерой ( т. е. все множества имеют одну и ту же меру; все морфизмы инвариантны относительно группы автоморфизмов и, таким образом, факторизуются как морфизм терминального объекта ).
Вышеизложенное требует определения асимптотической эквивалентности . Это выражается в терминах функции расстояния, показывающей, насколько инъективное соответствие отличается от изоморфизма . Инъективное соответствие — частично определенное отображение , являющееся биекцией ; то есть это биекция между подмножеством и . Затем определите где | С | обозначает меру множества S . В дальнейшем мера P и Q принимается равной 1, так что пространства с мерами являются вероятностными пространствами. Это расстояние широко известно как расстояние землеройного машины или метрика Вассерштейна .
Аналогично определите с принято считать счетной мерой на P . Таким образом, это определение требует, чтобы P было пространством с конечной мерой. Наконец, позвольте
Последовательность инъективных соответствий тогда асимптотически эквивалентны , когда
Дана однородная пространственная последовательность H N , асимптотически эквивалентная P Н , энтропию H ( P ) P можно принять как
См. также
[ редактировать ]- Теорема Крамера (большие уклонения)
- Теорема о кодировании зашумленного канала
- Теорема Шеннона о кодировании исходного кода
Примечания
[ редактировать ]- ^ Обложка и Томас (1991) , с. 51.
- ^ Хокинс, Джейн (2021). Эргодическая динамика: от базовой теории к приложениям . Дипломные тексты по математике. Чам, Швейцария: Springer. п. 204. ИСБН 978-3-030-59241-7 .
- ^ Перейти обратно: а б Алгоет, Пол Х.; Обложка, Томас М. (1988). «Сэндвич-доказательство теоремы Шеннона-Макмиллана-Бреймана» (PDF) . Анналы вероятности . 16 (2): 899–909. дои : 10.1214/aop/1176991794 .
- ^ Петерсен, Карл Э. (1983). «6.2. Теорема Шеннона-Макмиллана-Бреймана». Эргодическая теория . Кембриджские исследования по высшей математике. Кембридж: Издательство Кембриджского университета. ISBN 978-0-521-38997-6 .
- ^ Полликотт, Марк; Юрий, Мичико (1998). «12.4. Теорема Шеннона-Макмиллана-Бримана». Динамические системы и эргодическая теория . Тексты студентов Лондонского математического общества. Кембридж: Издательство Кембриджского университета. ISBN 978-0-521-57294-1 .
- ^ Миша Громов, (2012) « В поисках структуры. Часть 1: Об энтропии ». (См. стр. 5, где свойство равнораспределения называется «аппроксимационной теоремой Бернулли».)
Ссылки
[ редактировать ]Журнальные статьи
[ редактировать ]- Клод Э. Шеннон. « Математическая теория связи ». Технический журнал Bell System , июль/октябрь 1948 г.
- Серджио Верду и Те Сун Хан. «Роль свойства асимптотического равнораспределения в бесшумном исходном кодировании». Транзакции IEEE по теории информации , 43 (3): 847–857, 1997.
Учебники
[ редактировать ]- Обложка, Томас М.; Томас, Джой А. (1991). Элементы теории информации (первое изд.). Хобокен, Нью-Джерси: Уайли. ISBN 978-0-471-24195-9 .
- Маккей, Дэвид Дж. К. (2003). Теория информации, вывод и алгоритмы обучения . Издательство Кембриджского университета. ISBN 0-521-64298-1 .