Jump to content

Кодирование Левенштейна

Кодирование Левенштейна универсальный код кодирования целых неотрицательных чисел, разработанный Владимиром Левенштейном . [1] [2]

Кодировка [ править ]

Код нуля — «0»; для кодирования положительного числа :

  1. Инициализируйте переменную количества шагов C значением 1.
  2. Запишите двоичное представление числа без лидирующей «1» в начале кода.
  3. Пусть M — количество битов, записанных на шаге 2.
  4. Если M не 0, увеличьте C и повторите действия, начиная с шага 2, используя M в качестве нового числа.
  5. Запишите бит C «1» и «0» в начало кода.

Код начинается:

Число Кодирование Подразумеваемая вероятность
0 0 1/2
1 10 1/4
2 110 0 1/16
3 110 1 1/16
4 1110 0 00 1/128
5 1110 0 01 1/128
6 1110 0 10 1/128
7 1110 0 11 1/128
8 1110 1 000 1/256
9 1110 1 001 1/256
10 1110 1 010 1/256
11 1110 1 011 1/256
12 1110 1 100 1/256
13 1110 1 101 1/256
14 1110 1 110 1/256
15 1110 1 111 1/256
16 11110 0 00 0000 1/4096
17 11110 0 00 0001 1/4096

Чтобы декодировать целое число, закодированное Левенштейном:

  1. Подсчитайте количество битов «1», пока не встретите «0».
  2. Если счетчик равен нулю, значение равно нулю, в противном случае
  3. Отбросьте только что подсчитанные биты «1» и первый встретившийся «0».
  4. Начните с переменной N , установите для нее значение 1 и повторите счетчик минус 1 раз:
  5. Прочитайте N бит (и удалите их из закодированного целого числа), добавьте к началу «1», присвойте полученное значение N.

Код Левенштейна положительного целого числа всегда на один бит длиннее, чем омега-код Элиаса этого целого числа. Однако существует код Левенштейна для нуля, тогда как кодирование омеги Элиаса потребует сдвига чисел так, чтобы вместо этого ноль представлялся кодом единицы.

Пример кода [ править ]

Кодировка [ править ]

void levenshteinEncode(char* source, char* dest)
{
    IntReader intreader(source);
    BitWriter bitwriter(dest);
    while (intreader.hasLeft())
    {
        int num = intreader.getInt();
        if (num == 0)
            bitwriter.outputBit(0);
        else
        {
            int c = 0;
            BitStack bits;
            do {
                int m = 0;
                for (int temp = num; temp > 1; temp>>=1)  // calculate floor(log2(num))
                    ++m;
                for (int i=0; i < m; ++i)
                    bits.pushBit((num >> i) & 1);
                num = m;
                ++c;
            } while (num > 0);
            for (int i=0; i < c; ++i)
                bitwriter.outputBit(1);
            bitwriter.outputBit(0);
            while (bits.length() > 0)
                bitwriter.outputBit(bits.popBit());
        }
    }
}

Расшифровка [ править ]

void levenshteinDecode(char* source, char* dest)
{
    BitReader bitreader(source);
    IntWriter intwriter(dest);
    while (bitreader.hasLeft())
    {
        int n = 0;
        while (bitreader.inputBit())     // potentially dangerous with malformed files.
            ++n;
        int num;
        if (n == 0)
            num = 0;
        else
        {
            num = 1;
            for (int i = 0; i < n-1; ++i)
            {
                int val = 1;
                for (int j = 0; j < num; ++j)
                    val = (val << 1) | bitreader.inputBit();
                num = val;
            }
        }
        intwriter.putInt(num);           // write out the value
    }
    bitreader.close();
    intwriter.close();
}

См. также [ править ]

Ссылки [ править ]

  1. ^ "Доклад В.И. Левенштейна 1968 года" (PDF) .
  2. ^ Дэвид Саломон (2007). Коды переменной длины для сжатия данных . Спрингер. п. 80. ИСБН  978-1-84628-958-3 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 74483611d76ecb64f040c31ee594a962__1712125680
URL1:https://arc.ask3.ru/arc/aa/74/62/74483611d76ecb64f040c31ee594a962.html
Заголовок, (Title) документа по адресу, URL1:
Levenshtein coding - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)