Типовой набор
В теории информации типичный набор — это набор последовательностей, вероятность которых близка к двум, возведенным в отрицательную степень энтропии их исходного распределения. Тот факт, что это множество имеет полную вероятность, близкую к единице, является следствием свойства асимптотического равнораспределения (AEP), которое является своего рода законом больших чисел . Понятие типичности касается только вероятности последовательности, а не самой фактической последовательности.
Это очень полезно в теории сжатия , поскольку обеспечивает теоретические средства сжатия данных, позволяя нам представить любую последовательность X. н используя в среднем nH ( X ) бит и, следовательно, оправдывая использование энтропии как меры информации из источника.
AEP также можно доказать для большого класса стационарных эргодических процессов , что позволяет определить типичный набор в более общих случаях.
(Слабо) типичные последовательности (слабая типичность, энтропийная типичность)
[ редактировать ]Если последовательность x 1 , ..., x n получена из независимой одинаково распределенной случайной величины (IID) X , определенной в конечном алфавите , то типичный набор A ε ( н ) ( н ) определяется как те последовательности, которые удовлетворяют:
где
информационная энтропия X. — Вероятность, указанная выше, должна быть в пределах коэффициента 2. п ε . Логарифмируя все стороны и разделив на -n , это определение можно эквивалентно сформулировать как
Для iid-последовательности, поскольку
у нас также есть
По закону больших чисел при достаточно больших n
Характеристики
[ редактировать ]Существенной характеристикой типичного набора является то, что если извлечь большое количество n из распределения X независимых случайных выборок , то результирующая последовательность ( x 1 , x 2 , ..., x n ) с большой вероятностью будет членом типичного набора, хотя типичный набор включает лишь небольшую часть всех возможных последовательностей. Формально при любом , можно выбрать n такое, что:
- Вероятность последовательности из X (н) извлекается из A ε ( н ) больше 1 − ε , т.е.
- Если распространение превышает не является однородным, то доля типичных последовательностей равна
- поскольку n становится очень большим, поскольку где это мощность .
Для общего случайного процесса { X ( t )} с AEP (слабо) типичный набор может быть определен аналогичным образом с p ( x 1 , x 2 , ..., x n заменой ) на p ( x 0 т ) (т.е. вероятность выборки, ограниченной интервалом времени [0, τ ]), n — степень свободы процесса в интервале времени, а H ( X ) — уровень энтропии . Если процесс является непрерывным , дифференциальная энтропия вместо него используется .
Пример
[ редактировать ]Как ни странно, наиболее вероятная последовательность часто не является членом типичного набора. Например, предположим, что X — случайная величина iid Бернулли с p (0) = 0,1 и p (1) = 0,9. В n независимых испытаниях, поскольку p (1) > p (0), наиболее вероятной последовательностью результатов является последовательность всех единиц (1,1,...,1). Здесь энтропия X равна H ( X )=0,469, а
Таким образом, эта последовательность не входит в типичный набор, потому что ее средняя логарифмическая вероятность не может быть сколь угодно близкой к энтропии случайной величины X, независимо от того, насколько большим мы принимаем значение n .
Для случайных величин Бернулли типичный набор состоит из последовательностей со средним числом 0 и 1 в n независимых испытаниях. Это легко продемонстрировать: если p(1) = p и p(0) = 1-p , то для n испытаний с m единицами мы имеем
Среднее количество единиц в последовательности испытаний Бернулли равно m = np . Таким образом, мы имеем
В этом примере, если n = 10, то типичный набор состоит из всех последовательностей, которые имеют один 0 во всей последовательности. В случае p (0)= p (1)=0,5 все возможные двоичные последовательности принадлежат типичному множеству.
Сильно типичные последовательности (сильная типичность, буквенная типичность)
[ редактировать ]Если последовательность x 1 , ..., x n взята из некоторого заданного совместного распределения, определенного в конечном или бесконечном алфавите , то сильно типичное множество A ε,strong ( н ) определяется как набор последовательностей, которые удовлетворяют
где — количество вхождений определенного символа в последовательность.
Можно показать, что сильно типичные последовательности также являются слабо типичными (с другой константой ε), отсюда и название. Однако эти две формы не эквивалентны. С сильной типичностью часто легче работать при доказательстве теорем для каналов без памяти. Однако, как видно из определения, эта форма типичности определена только для случайных величин, имеющих конечный носитель.
Совместно типичные последовательности
[ редактировать ]Две последовательности и совместно ε-типичны, если пара является ε-типичным относительно совместного распределения и оба и ε-типичны относительно своих маргинальных распределений и . Множество всех таких пар последовательностей обозначается . Совместно ε-типичные n -кортежные последовательности определяются аналогично.
Позволять и — две независимые последовательности случайных величин с одинаковыми маргинальными распределениями. и . Тогда для любого ε>0 и достаточно больших n совместно типичные последовательности удовлетворяют следующим свойствам:
Этот раздел нуждается в расширении . Вы можете помочь, добавив к нему . ( декабрь 2009 г. ) |
Применение типичности
[ редактировать ]Этот раздел нуждается в расширении . Вы можете помочь, добавив к нему . ( декабрь 2009 г. ) |
Типичная кодировка набора
[ редактировать ]В теории информации типичное кодирование набора кодирует только последовательности в типичном наборе стохастического источника с блочными кодами фиксированной длины. Поскольку размер типичного набора составляет около 2 нН(Х) , для кодирования требуются только биты nH(X) , в то же время гарантируя, что вероятность ошибки кодирования ограничена ε. Асимптотически, согласно AEP, он не имеет потерь и достигает минимальной скорости, равной скорости энтропии источника.
Этот раздел нуждается в расширении . Вы можете помочь, добавив к нему . ( декабрь 2009 г. ) |
Декодирование типичного набора
[ редактировать ]В теории информации типичное множественное декодирование используется в сочетании со случайным кодированием для оценки переданного сообщения как сообщения с кодовым словом, которое совместно ε-типично с наблюдением. т.е.
где — оценка сообщения, кодовое слово сообщения и наблюдение соответственно. определяется относительно совместного распределения где - вероятность перехода, характеризующая статистику канала, и — это некоторое входное распределение, используемое для генерации кодовых слов в случайной кодовой книге.
Этот раздел нуждается в расширении . Вы можете помочь, добавив к нему . ( декабрь 2009 г. ) |
Универсальная проверка нулевой гипотезы
[ редактировать ]Этот раздел пуст. Вы можете помочь, добавив к нему . ( декабрь 2009 г. ) |
Универсальный код канала
[ редактировать ]Этот раздел нуждается в расширении . Вы можете помочь, добавив к нему . ( декабрь 2009 г. ) |
См. также
[ редактировать ]- Свойство асимптотического равнораспределения
- Теорема исходного кодирования
- Теорема о кодировании зашумленного канала
Ссылки
[ редактировать ]- CE Шеннон , « Математическая теория связи », Технический журнал Bell System , vol. 27, стр. 379–423, 623–656, июль, октябрь 1948 г.
- Обложка, Томас М. (2006). «Глава 3: Свойство асимптотического равнораспределения, Глава 5: Сжатие данных, Глава 8: Пропускная способность канала». Элементы теории информации . Джон Уайли и сыновья. ISBN 0-471-24195-4 .
- Дэвид Дж. К. Маккей . Теория информации, вывод и алгоритмы обучения. Кембридж: Издательство Кембриджского университета, 2003. ISBN 0-521-64298-1