~~~~~~~~~~~~~~~~~~~~ Arc.Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~ 
Номер скриншота №:
✰ 3441355040CD9A940A975C3E0C136AA9__1701930780 ✰
Заголовок документа оригинал.:
✰ Dictionary coder - Wikipedia ✰
Заголовок документа перевод.:
✰ Кодировщик словарей - Википедия ✰
Снимок документа находящегося по адресу (URL):
✰ https://en.wikipedia.org/wiki/Dictionary_coder ✰
Адрес хранения снимка оригинал (URL):
✰ https://arc.ask3.ru/arc/aa/34/a9/3441355040cd9a940a975c3e0c136aa9.html ✰
Адрес хранения снимка перевод (URL):
✰ https://arc.ask3.ru/arc/aa/34/a9/3441355040cd9a940a975c3e0c136aa9__translat.html ✰
Дата и время сохранения документа:
✰ 18.06.2024 17:57:22 (GMT+3, MSK) ✰
Дата и время изменения документа (по данным источника):
✰ 7 December 2023, at 09:33 (UTC). ✰ 

~~~~~~~~~~~~~~~~~~~~~~ Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~~ 
Сервисы Ask3.ru: 
 Архив документов (Снимки документов, в формате HTML, PDF, PNG - подписанные ЭЦП, доказывающие существование документа в момент подписи. Перевод сохраненных документов на русский язык.)https://arc.ask3.ruОтветы на вопросы (Сервис ответов на вопросы, в основном, научной направленности)https://ask3.ru/answer2questionТоварный сопоставитель (Сервис сравнения и выбора товаров) ✰✰
✰ https://ask3.ru/product2collationПартнерыhttps://comrades.ask3.ru


Совет. Чтобы искать на странице, нажмите Ctrl+F или ⌘-F (для MacOS) и введите запрос в поле поиска.
Arc.Ask3.ru: далее начало оригинального документа

Кодировщик словарей - Википедия Jump to content

Словарь-кодер

Из Википедии, бесплатной энциклопедии

, Кодер словаря также иногда известный как кодер подстановки , представляет собой класс алгоритмов сжатия данных без потерь , которые работают путем поиска совпадений между текстом, который нужно сжать, и набором строк , содержащихся в поддерживаемой структуре данных (называемой «словарем»). по кодировщику. Когда кодировщик находит такое совпадение, он заменяет ссылку на позицию строки в структуре данных.

Методы и приложения [ править ]

Некоторые кодировщики словарей используют «статический словарь», полный набор строк которого определяется до начала кодирования и не изменяется в процессе кодирования. Этот подход чаще всего используется, когда сообщение или набор сообщений, подлежащих кодированию, фиксированы и велики; например, приложение , которое хранит содержимое книги в ограниченном пространстве КПК, обычно создает статический словарь на основе согласования текста, а затем использует этот словарь для сжатия стихов. Эта схема использования кодирования Хаффмана для представления индексов в согласовании получила название «Huffword». [1]

В родственном и более общем методе словарь создается на основе избыточности, извлеченной из среды данных (различных входных потоков), и этот словарь затем используется статически для сжатия дальнейшего входного потока. Например, словарь создается из старых английских текстов, а затем используется для сжатия книги. [2]

Более распространены методы, в которых словарь начинается в некотором заранее определенном состоянии, но его содержимое меняется в процессе кодирования на основе уже закодированных данных. Оба алгоритма LZ77 и LZ78 работают по этому принципу. В LZ77 циклический буфер , называемый «скользящим окном», хранит последние N байт обработанных данных. Это окно служит словарем, эффективно сохраняя каждую подстроку, появившуюся за последние N байтов в качестве записей словаря. Вместо одного индекса, идентифицирующего словарную запись, необходимы два значения: длина , указывающая длину совпадающего текста, и смещение (также называемое расстоянием ), указывающее, что совпадение найдено в байтах смещения, начиная с скользящего окна до текущий текст.

LZ78 использует более явную структуру словаря; в начале процесса кодирования словарь пуст. Нулевое значение индекса используется для представления конца строки, поэтому первый индекс словаря равен единице. На каждом этапе процесса кодирования, если совпадений нет, последний совпадающий индекс (или ноль) и символ добавляются в словарь и выводятся в сжатый поток. Если совпадение есть, то рабочий индекс обновляется до соответствующего индекса, и ничего не выводится.

LZW похож на LZ78, но словарь инициализируется всеми возможными символами. Типичная реализация работает с 8-битными символами, поэтому словарные «коды» от шестнадцатеричного 00 до шестнадцатеричного FF (десятичное 255) заранее определены. Записи словаря будут добавляться, начиная с шестнадцатеричного значения кода 100. В отличие от LZ78, если совпадение не найдено (или конец данных), то выводится только код словаря. Это создает потенциальную проблему, поскольку выходные данные декодера отстают на один шаг от словаря. Обратитесь к LZW , чтобы узнать, как это решается. Усовершенствования LZW включают обработку символов размером, отличным от 8 бит, и наличие зарезервированных кодов для сброса словаря и указания конца данных.

Ссылки [ править ]

  1. ^ Ян Х. Виттен, Алистер Моффат и Тимоти К. Белл. Управление гигабайтами . Нью-Йорк: Ван Ностранд Рейнхольд, 1994. ISBN   9780442018634 .
  2. ^ Родни Дж. Смит. Система сжатия потоковой передачи с использованием групп динамических соединений , патент США № 5,748,955, дата приоритета 20 декабря 1993 г.

См. также [ править ]

Arc.Ask3.Ru: конец оригинального документа.
Arc.Ask3.Ru
Номер скриншота №: 3441355040CD9A940A975C3E0C136AA9__1701930780
URL1:https://en.wikipedia.org/wiki/Dictionary_coder
Заголовок, (Title) документа по адресу, URL1:
Dictionary coder - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть, любые претензии не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, денежную единицу можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)