~~~~~~~~~~~~~~~~~~~~ Arc.Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~ 
Номер скриншота №:
✰ 6E3275118A23DF235F2BC20220D60317__1692277680 ✰
Заголовок документа оригинал.:
✰ Universal code (data compression) - Wikipedia ✰
Заголовок документа перевод.:
✰ Универсальный код (сжатие данных) — Википедия ✰
Снимок документа находящегося по адресу (URL):
✰ https://en.wikipedia.org/wiki/Universal_code_(data_compression) ✰
Адрес хранения снимка оригинал (URL):
✰ https://arc.ask3.ru/arc/aa/6e/17/6e3275118a23df235f2bc20220d60317.html ✰
Адрес хранения снимка перевод (URL):
✰ https://arc.ask3.ru/arc/aa/6e/17/6e3275118a23df235f2bc20220d60317__translat.html ✰
Дата и время сохранения документа:
✰ 18.06.2024 17:56:18 (GMT+3, MSK) ✰
Дата и время изменения документа (по данным источника):
✰ 17 August 2023, at 16:08 (UTC). ✰ 

~~~~~~~~~~~~~~~~~~~~~~ Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~~ 
Сервисы Ask3.ru: 
 Архив документов (Снимки документов, в формате HTML, PDF, PNG - подписанные ЭЦП, доказывающие существование документа в момент подписи. Перевод сохраненных документов на русский язык.)https://arc.ask3.ruОтветы на вопросы (Сервис ответов на вопросы, в основном, научной направленности)https://ask3.ru/answer2questionТоварный сопоставитель (Сервис сравнения и выбора товаров) ✰✰
✰ https://ask3.ru/product2collationПартнерыhttps://comrades.ask3.ru


Совет. Чтобы искать на странице, нажмите Ctrl+F или ⌘-F (для MacOS) и введите запрос в поле поиска.
Arc.Ask3.ru: далее начало оригинального документа

Универсальный код (сжатие данных) — Википедия Jump to content

Универсальный код (сжатие данных)

Из Википедии, бесплатной энциклопедии

Фибоначчи, Элиас Гамма и Элиас Дельта против двоичного кодирования
Рис с k = 2, 3, 4, 5, 8, 16 по сравнению с двоичным

При сжатии данных универсальный код для целых чисел представляет собой префиксный код , который отображает положительные целые числа на двоичные кодовые слова, с дополнительным свойством, заключающимся в том, что независимо от истинного распределения вероятностей целых чисел, пока распределение является монотонным (т. е. p ( i ) ≥ p ( i + 1) для всех положительных i ), ожидаемые длины кодовых слов находятся в пределах постоянного коэффициента ожидаемых длин, которые оптимальный код мог бы назначить для этого распределения вероятностей. Универсальный код является асимптотически оптимальным, если соотношение между фактической и оптимальной ожидаемой длиной ограничено функцией информационной энтропии кода, которая не только ограничена, но и приближается к 1, когда энтропия стремится к бесконечности.

В общем, большинство префиксных кодов для целых чисел присваивают более длинные кодовые слова более крупным целым числам. Такой код можно использовать для эффективной передачи сообщения, полученного из набора возможных сообщений, просто упорядочивая набор сообщений путем уменьшения вероятности, а затем отправляя индекс предполагаемого сообщения. Универсальные коды обычно не используются для точно известных распределений вероятностей, и не известно ни одного универсального кода, который был бы оптимальным для любого распределения, используемого на практике.

Универсальный код не следует путать с универсальным исходным кодированием , в котором метод сжатия данных не обязательно должен быть фиксированным префиксным кодом, а соотношение между фактической и оптимальной ожидаемой длиной должно приближаться к единице. Однако обратите внимание, что асимптотически оптимальный универсальный код может использоваться на независимых одинаково распределенных источниках путем использования все более крупных блоков в качестве метода универсального исходного кодирования.

Универсальные и неуниверсальные коды [ править ]

Это некоторые универсальные коды для целых чисел; звездочка ( * ) указывает на код, который можно тривиально переформулировать в лексикографическом порядке , а двойной крестик ( ) указывает на код, который является асимптотически оптимальным:

Это неуниверсальные:

Их неуниверсальность можно наблюдать, заметив, что, если какой-либо из них используется для кодирования распределения Гаусса – Кузьмина или распределения Дзета с параметром s = 2, ожидаемая длина кодового слова будет бесконечной. Например, использование унарного кодирования для распределения Зета дает ожидаемую длину

С другой стороны, использование универсального гамма-кодирования Элиаса для распределения Гаусса-Кузьмина приводит к ожидаемой длине кодового слова (около 3,51 бита) близкой к энтропии (около 3,43 бита) - Академия Google .

практическим сжатием Связь с

Кодирование Хаффмана и арифметическое кодирование (когда их можно использовать) обеспечивают по меньшей мере такое же хорошее, а зачастую и лучшее сжатие, чем любой универсальный код.

Однако универсальные коды полезны, когда невозможно использовать кодирование Хаффмана — например, когда неизвестна точная вероятность каждого сообщения, а известен только рейтинг их вероятностей.

Универсальные коды также полезны, когда коды Хаффмана неудобны. Например, когда передатчик, но не получатель, знает вероятности сообщений, кодирование Хаффмана требует дополнительных затрат на передачу этих вероятностей получателю. Использование универсального кода не требует таких накладных расходов.

Каждый универсальный код, как и любой другой саморазграничивающийся (префиксный) двоичный код, имеет свое собственное «предполагаемое распределение вероятностей», определяемое P ( i ) = 2. - л ( я ) где l ( i ) — длина i- го кодового слова, а P ( i ) — вероятность соответствующего символа. Если фактические вероятности сообщения равны Q ( i ) и расхождению Кульбака – Лейблера минимизируется кодом с l ( i ) , то оптимальный код Хаффмана для этого набора сообщений будет эквивалентен этому коду. Аналогично, по этому расхождению можно измерить, насколько код близок к оптимальному. Поскольку универсальные коды проще и быстрее кодировать и декодировать, чем коды Хаффмана (что, в свою очередь, проще и быстрее, чем арифметическое кодирование ), универсальный код был бы предпочтительнее в тех случаях, когда достаточно мал. Программа сжатия данных без потерь: Hybrid LZ77 RLE

Для любого геометрического распределения (экспоненциального распределения целых чисел) код Голомба является оптимальным. В случае универсальных кодов неявное распределение представляет собой примерно степенной закон , такой как (точнее, распределение Ципфа ). Для кода Фибоначчи неявное распределение приблизительно равно , с

где это золотое сечение . Для троичного кода с запятой (т. е. кодирования по основанию 3, представленного двумя битами на символ), неявное распределение представляет собой степенной закон с . Таким образом, эти распределения имеют почти оптимальные коды с соответствующими степенными законами.

Внешние ссылки [ править ]


Arc.Ask3.Ru: конец оригинального документа.
Arc.Ask3.Ru
Номер скриншота №: 6E3275118A23DF235F2BC20220D60317__1692277680
URL1:https://en.wikipedia.org/wiki/Universal_code_(data_compression)
Заголовок, (Title) документа по адресу, URL1:
Universal code (data compression) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть, любые претензии не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, денежную единицу можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)