Jump to content

Типовой набор

В теории информации типичный набор — это набор последовательностей, вероятность которых близка к двум, возведенным в отрицательную степень энтропии их исходного распределения. Тот факт, что это множество имеет полную вероятность, близкую к единице, является следствием свойства асимптотического равнораспределения (AEP), которое является своего рода законом больших чисел . Понятие типичности касается только вероятности последовательности, а не самой фактической последовательности.

Это очень полезно в теории сжатия , поскольку обеспечивает теоретические средства сжатия данных, позволяя нам представить любую последовательность X. н используя в среднем nH ( X ) бит и, следовательно, оправдывая использование энтропии как меры информации из источника.

AEP также можно доказать для большого класса стационарных эргодических процессов , что позволяет определить типичный набор в более общих случаях.

(Слабо) типичные последовательности (слабая типичность, энтропийная типичность)

[ редактировать ]

Если последовательность x 1 , ..., x n получена из независимой одинаково распределенной случайной величины (IID) X , определенной в конечном алфавите , то типичный набор A ε ( н ) ( н ) определяется как те последовательности, которые удовлетворяют:

где

информационная энтропия X. — Вероятность, указанная выше, должна быть в пределах коэффициента 2. п ε . Логарифмируя все стороны и разделив на -n , это определение можно эквивалентно сформулировать как

Для iid-последовательности, поскольку

у нас также есть

По закону больших чисел при достаточно больших n

Характеристики

[ редактировать ]

Существенной характеристикой типичного набора является то, что если извлечь большое количество n из распределения X независимых случайных выборок , то результирующая последовательность ( x 1 , x 2 , ..., x n ) с большой вероятностью будет членом типичного набора, хотя типичный набор включает лишь небольшую часть всех возможных последовательностей. Формально при любом , можно выбрать n такое, что:

  1. Вероятность последовательности из X (н) извлекается из A ε ( н ) больше 1 − ε , т.е.
  2. Если распространение превышает не является однородным, то доля типичных последовательностей равна
поскольку n становится очень большим, поскольку где это мощность .

Для общего случайного процесса { X ( t )} с AEP (слабо) типичный набор может быть определен аналогичным образом с p ( x 1 , x 2 , ..., x n заменой ) на p ( x 0 т ) (т.е. вероятность выборки, ограниченной интервалом времени [0, τ ]), n степень свободы процесса в интервале времени, а H ( X ) — уровень энтропии . Если процесс является непрерывным , дифференциальная энтропия вместо него используется .

Как ни странно, наиболее вероятная последовательность часто не является членом типичного набора. Например, предположим, что X — случайная величина iid Бернулли с p (0) = 0,1 и p (1) = 0,9. В n независимых испытаниях, поскольку p (1) > p (0), наиболее вероятной последовательностью результатов является последовательность всех единиц (1,1,...,1). Здесь энтропия X равна H ( X )=0,469, а

Таким образом, эта последовательность не входит в типичный набор, потому что ее средняя логарифмическая вероятность не может быть сколь угодно близкой к энтропии случайной величины X, независимо от того, насколько большим мы принимаем значение n .

Для случайных величин Бернулли типичный набор состоит из последовательностей со средним числом 0 и 1 в n независимых испытаниях. Это легко продемонстрировать: если p(1) = p и p(0) = 1-p , то для n испытаний с m единицами мы имеем

Среднее количество единиц в последовательности испытаний Бернулли равно m = np . Таким образом, мы имеем

В этом примере, если n = 10, то типичный набор состоит из всех последовательностей, которые имеют один 0 во всей последовательности. В случае p (0)= p (1)=0,5 все возможные двоичные последовательности принадлежат типичному множеству.

Сильно типичные последовательности (сильная типичность, буквенная типичность)

[ редактировать ]

Если последовательность x 1 , ..., x n взята из некоторого заданного совместного распределения, определенного в конечном или бесконечном алфавите , то сильно типичное множество A ε,strong ( н ) определяется как набор последовательностей, которые удовлетворяют

где — количество вхождений определенного символа в последовательность.

Можно показать, что сильно типичные последовательности также являются слабо типичными (с другой константой ε), отсюда и название. Однако эти две формы не эквивалентны. С сильной типичностью часто легче работать при доказательстве теорем для каналов без памяти. Однако, как видно из определения, эта форма типичности определена только для случайных величин, имеющих конечный носитель.

Совместно типичные последовательности

[ редактировать ]

Две последовательности и совместно ε-типичны, если пара является ε-типичным относительно совместного распределения и оба и ε-типичны относительно своих маргинальных распределений и . Множество всех таких пар последовательностей обозначается . Совместно ε-типичные n -кортежные последовательности определяются аналогично.

Позволять и — две независимые последовательности случайных величин с одинаковыми маргинальными распределениями. и . Тогда для любого ε>0 и достаточно больших n совместно типичные последовательности удовлетворяют следующим свойствам:

Применение типичности

[ редактировать ]

Типичная кодировка набора

[ редактировать ]

В теории информации типичное кодирование набора кодирует только последовательности в типичном наборе стохастического источника с блочными кодами фиксированной длины. Поскольку размер типичного набора составляет около 2 нН(Х) , для кодирования требуются только биты nH(X) , в то же время гарантируя, что вероятность ошибки кодирования ограничена ε. Асимптотически, согласно AEP, он не имеет потерь и достигает минимальной скорости, равной скорости энтропии источника.

Декодирование типичного набора

[ редактировать ]

В теории информации типичное множественное декодирование используется в сочетании со случайным кодированием для оценки переданного сообщения как сообщения с кодовым словом, которое совместно ε-типично с наблюдением. т.е.

где — оценка сообщения, кодовое слово сообщения и наблюдение соответственно. определяется относительно совместного распределения где - вероятность перехода, характеризующая статистику канала, и — это некоторое входное распределение, используемое для генерации кодовых слов в случайной кодовой книге.

Универсальная проверка нулевой гипотезы

[ редактировать ]

Универсальный код канала

[ редактировать ]

См. также

[ редактировать ]
  • CE Шеннон , « Математическая теория связи », Технический журнал Bell System , vol. 27, стр. 379–423, 623–656, июль, октябрь 1948 г.
  • Обложка, Томас М. (2006). «Глава 3: Свойство асимптотического равнораспределения, Глава 5: Сжатие данных, Глава 8: Пропускная способность канала». Элементы теории информации . Джон Уайли и сыновья. ISBN  0-471-24195-4 .
  • Дэвид Дж. К. Маккей . Теория информации, вывод и алгоритмы обучения. Кембридж: Издательство Кембриджского университета, 2003. ISBN   0-521-64298-1
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 90feb4694e0b32c859e08f580bb6b1f4__1715837820
URL1:https://arc.ask3.ru/arc/aa/90/f4/90feb4694e0b32c859e08f580bb6b1f4.html
Заголовок, (Title) документа по адресу, URL1:
Typical set - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)