Теория скорости-искажения
Теория информации |
---|
Эта статья нуждается в дополнительных цитатах для проверки . ( март 2012 г. ) |
Теория скорости-искажения — это основной раздел теории информации , который обеспечивает теоретические основы сжатия данных с потерями ; он решает проблему определения минимального количества битов на символ, измеряемого скоростью R , которое должно передаваться по каналу, чтобы источник (входной сигнал) мог быть приблизительно восстановлен в приемнике (выходной сигнал), не превышая ожидаемое искажение D .
Введение [ править ]
Теория скорости-искажения дает аналитическое выражение того, насколько сильного сжатия можно достичь с помощью методов сжатия с потерями. Многие из существующих методов сжатия звука, речи, изображений и видео имеют процедуры преобразования, квантования и распределения битовой скорости, которые используют общую форму функций скорости-искажения.
Теория скорости-искажения была создана Клодом Шенноном в его основополагающей работе по теории информации.
В теории скорости-искажения под скоростью обычно понимают количество битов на выборку данных, которые необходимо сохранить или передать. Понятие искажения является предметом постоянных дискуссий. [1] В самом простом случае (который на самом деле используется в большинстве случаев) искажение определяется как ожидаемое значение квадрата разности между входным и выходным сигналом (т. е. среднеквадратическая ошибка ). Однако, поскольку мы знаем, что большинство методов сжатия с потерями работают с данными, которые будут восприниматься людьми-потребителями (прослушивание музыки , просмотр изображений и видео), мера искажения предпочтительно должна моделироваться на основе человеческого восприятия и, возможно, эстетики : во многом аналогично использованию вероятности. при сжатии без потерь меры искажения в конечном итоге могут быть идентифицированы с помощью функций потерь , используемых в байесовской оценок и теории решений . При сжатии звука модели восприятия (и, следовательно, меры перцептивных искажений) относительно хорошо разработаны и регулярно используются в таких методах сжатия, как MP3 или Vorbis , но их часто нелегко включить в теорию искажений. При сжатии изображений и видео модели человеческого восприятия менее развиты, и их включение в основном ограничивается ) JPEG и MPEG взвешивания ( квантования , нормализации Матрица .
Функции искажения [ править ]
Функции искажения измеряют стоимость представления символа. приближенным символом . Типичными функциями искажения являются искажение Хэмминга и искажение квадратичной ошибки.
Искажение Хэмминга [ править ]
квадратичной Искажение ошибки
Функции скорости-искажения [ править ]
Функции, связывающие скорость и искажение, находятся как решение следующей задачи минимизации:
Здесь , иногда называемый тестовым каналом, представляет собой условную функцию плотности вероятности (PDF) выхода канала связи (сжатого сигнала) для данного входа (исходный сигнал) , и это взаимная информация между и определяется как
где и – энтропия выходного сигнала Y и условная энтропия выходного сигнала с учетом входного сигнала соответственно:
Задачу также можно сформулировать как функцию скорости искажения, где мы находим минимальную нижнюю границу достижимых искажений для заданного ограничения скорости. Соответствующее выражение:
Две формулировки приводят к функциям, обратным друг другу.
Взаимную информацию можно понимать как меру «априорной» неопределенности, которую получатель имеет относительно сигнала отправителя ( H ( Y )), уменьшенную на неопределенность, оставшуюся после получения информации о сигнале отправителя ( ). Конечно, уменьшение неопределенности происходит за счет сообщаемого количества информации, которая .
Например, если нет , то связи вообще и . Альтернативно, если канал связи идеален и принимаемый сигнал идентичен сигналу у отправителя, то и .
В определении функции скорость-искажение и являются искажениями между и для данного и предписанное максимальное искажение соответственно. Когда мы используем среднеквадратическую ошибку в качестве меры искажения, мы имеем (для амплитуде непрерывных по сигналов ):
Как показывают приведенные выше уравнения, вычисление функции скорости-искажения требует стохастического описания входных данных. с точки зрения PDF , а затем стремится найти условный PDF которые минимизируют скорость для данного искажения . Эти определения могут быть сформулированы с точки зрения теории меры, чтобы учитывать также дискретные и смешанные случайные величины.
Аналитическое зачастую трудно получить , решение этой проблемы минимизации за исключением некоторых случаев, для которых мы далее предлагаем два наиболее известных примера. Известно, что функция скорости-искажения любого источника подчиняется нескольким фундаментальным свойствам, наиболее важным из которых является то, что она представляет собой непрерывную , монотонно убывающую выпуклую (U) функцию , поэтому форма функции в примерах типична (даже измеренная скорость – функции искажения в реальной жизни имеют очень схожие формы).
Хотя аналитических решений этой проблемы мало, существуют верхние и нижние оценки этих функций, включая знаменитую нижнюю границу Шеннона (SLB), которая в случае квадрата ошибки и источников без памяти утверждает, что для произвольных источников с конечной дифференциальной энтропией
где h ( D ) — дифференциальная энтропия гауссовской случайной величины с дисперсией D. Эта нижняя граница распространяется на источники с памятью и другими мерами искажения. Важной особенностью СЛБ является то, что она асимптотически точна в режиме малых искажений для широкого класса источников и в некоторых случаях фактически совпадает с функцией скорость-искажение. Нижние границы Шеннона обычно можно найти, если искажение между любыми двумя числами можно выразить как функцию разницы между значениями этих двух чисел.
Алгоритм Блахута-Аримото , изобретенный совместно с Ричардом Блаутом , представляет собой элегантный итерационный метод для численного получения функций скорости-искажения произвольных конечных источников входного/выходного алфавита, и была проделана большая работа для его распространения на более общие примеры задач.
При работе со стационарными источниками с памятью необходимо видоизменить определение функции скорости искажения и понимать ее в смысле ограничения, принимаемого на последовательности возрастающей длины.
где
и
где верхние индексы обозначают полную последовательность до этого момента, а нижний индекс 0 указывает на начальное состояние.
Гауссов источник без памяти (независимый) с квадратичной ошибки искажением
Если мы предположим, что представляет собой гауссову случайную величину с дисперсией , и если предположить, что последовательные выборки сигнала ( стохастически независимы или, что то же самое, источник не имеет памяти или сигнал некоррелирован ), мы находим следующее аналитическое выражение для функции скорости-искажения:
На следующем рисунке показано, как выглядит эта функция:
Теория скорости-искажения говорит нам, что «не существует системы сжатия, работающей за пределами серой зоны». Чем ближе практическая система сжатия к красной (нижней) границе, тем лучше она работает. Как правило, эта граница может быть достигнута только за счет увеличения параметра длины блока кодирования. Тем не менее, даже при единичных длинах блоков часто можно найти хорошие (скалярные) квантователи , работающие на практически важных расстояниях от функции скорость-искажение. [3]
Эта функция скорости-искажения справедлива только для гауссовских источников без памяти. Известно, что гауссовский источник является самым «сложным» для кодирования источником: для заданной среднеквадратической ошибки он требует наибольшее количество бит. Производительность практической системы сжатия, работающей, скажем, с изображениями, вполне может быть ниже показана нижняя граница.
Безпамятный (независимый) источник Бернулли Хэмминга искажением с
Функция искажения скорости случайной величины Бернулли с искажением Хэмминга определяется выражением:
где обозначает двоичную функцию энтропии .
График функции искажения скорости для :
теории искажения скорости с пропускной способностью канала Связь
Предположим, мы хотим передать пользователю информацию об источнике с искажением, не D. превышающим Теория скорости-искажения говорит нам, что по крайней мере биты/символы информации из источника должны дойти до пользователя. Мы также знаем из теоремы о канальном кодировании Шеннона, что если энтропия источника равна H бит/символ, а пропускная способность канала равна C (где ), затем биты/символ будут потеряны при передаче этой информации по данному каналу. Чтобы у пользователя была хоть какая-то надежда на восстановление с максимальным искажением D , мы должны наложить требование, чтобы информация, теряемая при передаче, не превышала максимально допустимую потерю биты/символ. Это означает, что пропускная способность канала должна быть не менее . [4]
См. также [ править ]
- Алгоритм Блахута – Аримото - Класс алгоритмов в теории информации.
- Сжатие данных – компактное кодирование цифровых данных.
- Декорреляция - процесс уменьшения корреляции внутри одного или нескольких сигналов.
- Оптимизация скорости и искажений — алгоритм принятия решений, используемый при сжатии видео.
- Упаковка сфер – геометрическая структура
- Белый шум – тип сигнала при обработке сигнала
Ссылки [ править ]
- ^ Блау, Ю.; Михаэли, Т. (2019). «Переосмысление сжатия с потерями: компромисс между скоростью, искажением и восприятием» (PDF) . Материалы международной конференции по машинному обучению . ПМЛР. стр. 675–685. arXiv : 1901.07821 .
- ^ Обложка и Томас 2012 , с. 310
- ^ Обложка, Томас М.; Томас, Джой А. (2012) [2006]. «10. Теория искажения скорости» . Элементы теории информации (2-е изд.). Уайли. ISBN 978-1-118-58577-1 .
- ^ Бергер, Тоби (1971). Теория искажения скорости: математическая основа сжатия данных . Прентис Холл. ISBN 978-0-13-753103-5 . LCCN 75-148254 . ОСЛК 156968 .
Внешние ссылки [ править ]
- Марзен, Сара; ДеДео, Саймон. «PyRated: пакет Python для теории искажения скорости» .
PyRated — это очень простой пакет Python для выполнения самых основных вычислений в теории искажений скорости: определения «кодовой книги» и скорости передачи R с учетом функции полезности (матрицы искажений) и бета -множителя Лагранжа .
- Инструмент обучения сжатию изображений и видео VcDemo