Свойство асимптотического равнораспределения
Теория информации |
---|
![]() |
В теории информации ( свойство асимптотического равнораспределения AEP ) является общим свойством выходных выборок стохастического источника . Это фундаментальное понятие типичного набора, используемое в теориях сжатия данных .
Грубо говоря, теорема утверждает, что, хотя существует множество серий результатов, которые могут быть получены в результате случайного процесса, фактически полученный результат, скорее всего, представляет собой слабо определенный набор результатов, каждый из которых имеет примерно одинаковую вероятность быть фактически реализованным. . (Это следствие закона больших чисел и эргодической теории .) Хотя существуют отдельные исходы, которые имеют более высокую вероятность, чем любой исход в этом наборе, огромное количество исходов в наборе почти гарантирует, что результат будет исходить из набор. Один из способов интуитивно понять это свойство — использовать теорему Крамера о большом отклонении , которая утверждает, что вероятность большого отклонения от среднего значения экспоненциально убывает с увеличением количества выборок. Такие результаты изучаются в теории больших уклонений ; интуитивно понятно, что именно большие отклонения нарушат равнораспределение, но это маловероятно.
В области генерации псевдослучайных чисел кандидат-генератор неопределенного качества, выходная последовательность которого по некоторым статистическим критериям лежит слишком далеко за пределами типичного набора, отклоняется как недостаточно случайный. Таким образом, хотя типичный набор определен слабо, возникают практические представления о достаточной типичности.
Определение [ править ]
Дан стационарный эргодический случайный процесс с дискретным временем. в вероятностном пространстве , свойство асимптотического равнораспределения — это утверждение, что почти наверняка ,
Источники идентификаторов дискретного времени [ править ]
Данный это источник iid , который может принимать значения в алфавите , его временной ряд является идентификатором с энтропией . Слабый закон больших чисел дает асимптотическое свойство равнораспределения со сходимостью по вероятности
Усиленный закон больших чисел утверждает более сильную почти уверенную сходимость:
конечнозначные, стационарные источники Дискретные , эргодические
Рассмотрим конечнозначное выборочное пространство , то есть дискретным временем , для стационарного эргодического процесса с определенное в вероятностном пространстве . Теорема Шеннона -Макмиллана-Бреймана , принадлежащая Клоду Шеннону , Брокуэю Макмиллану и Лео Брейману , утверждает, что мы имеем сходимость в смысле L1. [2] Чунг Кай-лай обобщил это на случай, когда может принимать значение в множестве счетной бесконечности при условии, что уровень энтропии все еще конечен. [3]
- Пусть x обозначает некоторое измеримое множество для некоторых
- Параметризуйте совместную вероятность по n и x как
- Параметризуйте условную вероятность i , k и x как
- Возьмем предел условной вероятности при k → ∞ и обозначим его как
- Спорьте о двух понятиях скорости энтропии. существуют и равны для любого стационарного процесса, включая стационарный эргодический X. процесс Обозначим его H. как
- Утверждайте, что оба где i - индекс времени, являются стационарными эргодическими процессами, выборочные средние которых почти наверняка сходятся к некоторым значениям, обозначаемым и соответственно.
- Определим марковское приближение k -го порядка вероятности как
- Утверждает, что конечно в силу предположения о конечности.
- Выражать с точки зрения выборочного среднего значения и покажем, что оно почти наверняка сходится к H к
- Определите вероятностную меру
- Выражать с точки зрения выборочного среднего значения и покажем, что оно почти наверняка сходится к H ∞ .
- Утверждает, что при k → ∞, используя стационарность процесса.
- Докажите, что H = H ∞ используя теорему о мартингальной сходимости Леви и предположение о конечности значений.
- Покажи то которое конечно, как утверждалось ранее.
- Покажи то обусловленность бесконечным прошлым и повторение ожидания.
- Покажи то используя неравенство Маркова и полученное ранее математическое ожидание.
- Аналогично покажите, что что эквивалентно
- Покажи этот лимсап почти наверняка неположительны, если положить α = n б для любого β > 1 и применения леммы Бореля–Кантелли .
- Покажите, что liminf и limsup снизу и сверху почти наверняка ограничены H ∞ и Х к соответственно, разбивая логарифмы в предыдущем результате.
- Завершите доказательство, указав, что верхняя и нижняя границы, как было показано ранее, приближаются к H при k → ∞.
Нестационарный источник дискретного времени, создающий независимые символы
Предположения о стационарности/эргодичности/идентичности распределения случайных величин не являются существенными для соблюдения свойства асимптотического равнораспределения. Действительно, как совершенно интуитивно ясно, свойство асимптотического равнораспределения требует соблюдения лишь некоторой формы закона больших чисел, который является довольно общим. Однако выражение необходимо соответствующим образом обобщить, а условия необходимо точно сформулировать.
Мы предполагаем, что источник создает независимые символы с возможно различной выходной статистикой в каждый момент времени. Будем считать, что статистика процесса известна полностью, т. е. известно маргинальное распределение процесса, наблюдаемое в каждый момент времени. Совместное распределение — это всего лишь продукт маргиналов. Тогда при условии (которое можно ослабить), что для всех i и некоторого M > 0 справедливо следующее (AEP):
Доказательство следует из простого применения неравенства Маркова (применительно ко второму моменту .
Очевидно, что доказательство справедливо, если в какой-либо момент равномерно ограничено при r > 1 (опять же по неравенству Маркова, примененному к r -му моменту). КЭД
Даже это условие не является необходимым, но, учитывая нестационарный случайный процесс, не должно составить труда проверить, выполняется ли свойство асимптотического равнораспределения, используя описанный выше метод.
Приложения [ править ]
Свойство асимптотического равнораспределения для нестационарного независимого процесса с дискретным временем приводит нас (среди других результатов) к теореме кодирования источника для нестационарного источника (с независимыми выходными символами) и теореме кодирования канала с шумом для нестационарных каналов без памяти.
Теоретико-мерная форма [ править ]
представляет собой сохраняющее меру отображение вероятностного пространства .
Если является конечным или счетным разбиением , то его энтропия равна с соглашением, что .
Мы рассматриваем только разбиения с конечной энтропией: .
Если является конечным или счетным разбиением , затем строим последовательность разбиений путем итерации карты:
Писать быть информацией (в единицах nats ) о мы можем восстановить, если знаем, какой элемент в разделе что попадает:
Теорема (эргодический случай) — Если эргодично, то
Другими словами,
В частности, поскольку сходимость L1 предполагает сходимость почти наверняка,
Следствие (свойство равнораспределения энтропии) — , мы можем разделить раздел на две части, «хорошую» часть и «плохая» часть .
Плохая часть небольшая:
Хорошая часть практически равномерно распределена по энтропии:
Если не обязательно эргодично, то базовое вероятностное пространство будет разделено на несколько подмножеств, каждое из которых инвариантно относительно . В этом случае мы все еще имеем сходимость L1 к некоторой функции, но эта функция уже не является постоянной функцией. [5]
Теорема (общий случай) — Пусть быть сигма-алгеброй, порожденной всеми -инвариантные измеримые подмножества , -
Когда является эргодическим, тривиально, поэтому функция
непрерывном времени Стационарные эргодические источники , работающие в
Функции дискретного времени можно интерполировать в функции непрерывного времени. Если такая интерполяция f измерима как , мы можем соответственно определить стационарный процесс с непрерывным временем . Если свойство асимптотического равнораспределения справедливо для процесса с дискретным временем, как в iid или конечнозначных стационарных эргодических случаях, показанных выше, оно автоматически выполняется для стационарного процесса с непрерывным временем, полученного из него с помощью некоторой измеримой интерполяции. т.е.
Важным классом таких стационарных процессов с непрерывным временем является стационарный эргодический процесс с ограниченной полосой пропускания, в котором пространство выборки является подмножеством непрерывного процесса. функции. Свойство асимптотического равнораспределения сохраняется, если процесс белый, и в этом случае временные выборки равны iid, или существует T > 1/2 W , где W — номинальная полоса пропускания , так что временные выборки, разнесенные по T , принимают значения в конечном множество, и в этом случае мы имеем конечнозначный стационарный эргодический процесс с дискретным временем.
Любые нестационарные во времени операции также сохраняют свойство асимптотического равнораспределения, стационарность и эргодичность, и мы можем легко превратить стационарный процесс в нестационарный, не теряя свойства асимптотического равнораспределения, обнуляя конечное число временных отсчетов в процессе.
Теория категорий [ править ]
Теоретико -категорное определение свойства равнораспределения дано Громовым . [6] Учитывая последовательность картезианских степеней пространства с мерой P эта последовательность допускает асимптотически эквивалентную последовательность H N однородных пространств с мерой ( т. е. все множества имеют одну и ту же меру; все морфизмы инвариантны относительно группы автоморфизмов и, таким образом, факторизуются как морфизм терминального объекта ).
Вышеизложенное требует определения асимптотической эквивалентности . Это выражается в терминах функции расстояния, показывающей, насколько инъективное соответствие отличается от изоморфизма . Инъективное соответствие — частично определенное отображение , являющееся биекцией ; то есть это биекция между подмножеством и . Затем определите
Аналогично определите
Последовательность инъективных соответствий тогда асимптотически эквивалентны , когда
Дана однородная пространственная последовательность H N , асимптотически эквивалентная P Н , энтропию H ( P ) P можно принять как
См. также [ править ]
- Теорема Крамера (большие уклонения)
- Теорема о кодировании зашумленного канала
- Теорема Шеннона о кодировании исходного кода
Примечания [ править ]
- ^ Обложка и Томас (1991) , с. 51.
- ^ Хокинс, Джейн (2021). Эргодическая динамика: от базовой теории к приложениям . Дипломные тексты по математике. Чам, Швейцария: Springer. п. 204. ИСБН 978-3-030-59241-7 .
- ^ Перейти обратно: а б Алгоет, Пол Х.; Обложка, Томас М. (1988). «Сэндвич-доказательство теоремы Шеннона-Макмиллана-Бреймана» (PDF) . Анналы вероятности . 16 (2): 899–909. дои : 10.1214/aop/1176991794 .
- ^ Петерсен, Карл Э. (1983). «6.2. Теорема Шеннона-Макмиллана-Бреймана». Эргодическая теория . Кембриджские исследования по высшей математике. Кембридж: Издательство Кембриджского университета. ISBN 978-0-521-38997-6 .
- ^ Полликотт, Марк; Юрий, Мичико (1998). «12.4. Теорема Шеннона-Макмиллана-Бримана». Динамические системы и эргодическая теория . Тексты студентов Лондонского математического общества. Кембридж: Издательство Кембриджского университета. ISBN 978-0-521-57294-1 .
- ^ Миша Громов, (2012) « В поисках структуры. Часть 1: Об энтропии ». (См. стр. 5, где свойство равнораспределения называется «аппроксимационной теоремой Бернулли».)
Ссылки [ править ]
Журнальные статьи [ править ]
- Клод Э. Шеннон. « Математическая теория связи ». Технический журнал Bell System , июль/октябрь 1948 г.
- Серджио Верду и Те Сун Хан. «Роль свойства асимптотического равнораспределения в бесшумном исходном кодировании». Транзакции IEEE по теории информации , 43 (3): 847–857, 1997.
Учебники [ править ]
- Обложка, Томас М.; Томас, Джой А. (1991). Элементы теории информации (первое изд.). Хобокен, Нью-Джерси: Уайли. ISBN 978-0-471-24195-9 .
- Маккей, Дэвид Дж. К. (2003). Теория информации, вывод и алгоритмы обучения . Издательство Кембриджского университета. ISBN 0-521-64298-1 .