Jump to content

Теория скорости-искажения

(Перенаправлено из Теории искажения скорости )

Теория скорости-искажения — это основной раздел теории информации , который обеспечивает теоретические основы сжатия данных с потерями ; он решает проблему определения минимального количества битов на символ, измеряемого скоростью R , которое должно передаваться по каналу, чтобы источник (входной сигнал) мог быть приблизительно восстановлен в приемнике (выходной сигнал), не превышая ожидаемое искажение D .

Введение [ править ]

Кодер и декодер искажений скорости. Кодер кодирует последовательность . Закодированная последовательность затем подается на декодер который выводит последовательность . Мы стараемся минимизировать искажения между исходной последовательностью и восстановленная последовательность .

Теория скорости-искажения дает аналитическое выражение того, насколько сильного сжатия можно достичь с помощью методов сжатия с потерями. Многие из существующих методов сжатия звука, речи, изображений и видео имеют процедуры преобразования, квантования и распределения битовой скорости, которые используют общую форму функций скорости-искажения.

Теория скорости-искажения была создана Клодом Шенноном в его основополагающей работе по теории информации.

В теории скорости-искажения под скоростью обычно понимают количество битов на выборку данных, которые необходимо сохранить или передать. Понятие искажения является предметом постоянных дискуссий. [1] В самом простом случае (который на самом деле используется в большинстве случаев) искажение определяется как ожидаемое значение квадрата разности между входным и выходным сигналом (т. е. среднеквадратическая ошибка ). Однако, поскольку мы знаем, что большинство методов сжатия с потерями работают с данными, которые будут восприниматься людьми-потребителями (прослушивание музыки , просмотр изображений и видео), мера искажения предпочтительно должна моделироваться на основе человеческого восприятия и, возможно, эстетики : во многом аналогично использованию вероятности. при сжатии без потерь меры искажения в конечном итоге могут быть идентифицированы с помощью функций потерь , используемых в байесовской оценок и теории решений . При сжатии звука модели восприятия (и, следовательно, меры перцептивных искажений) относительно хорошо разработаны и регулярно используются в таких методах сжатия, как MP3 или Vorbis , но их часто нелегко включить в теорию искажений. При сжатии изображений и видео модели человеческого восприятия менее развиты, и их включение в основном ограничивается ) JPEG и MPEG взвешивания ( квантования , нормализации Матрица .

Функции искажения [ править ]

Функции искажения измеряют стоимость представления символа. приближенным символом . Типичными функциями искажения являются искажение Хэмминга и искажение квадратичной ошибки.

Искажение Хэмминга [ править ]

квадратичной Искажение ошибки

Функции скорости-искажения [ править ]

Функции, связывающие скорость и искажение, находятся как решение следующей задачи минимизации:

Здесь , иногда называемый тестовым каналом, представляет собой условную функцию плотности вероятности (PDF) выхода канала связи (сжатого сигнала) для данного входа (исходный сигнал) , и это взаимная информация между и определяется как

где и – энтропия выходного сигнала Y и условная энтропия выходного сигнала с учетом входного сигнала соответственно:

Задачу также можно сформулировать как функцию скорости искажения, где мы находим минимальную нижнюю границу достижимых искажений для заданного ограничения скорости. Соответствующее выражение:

Две формулировки приводят к функциям, обратным друг другу.

Взаимную информацию можно понимать как меру «априорной» неопределенности, которую получатель имеет относительно сигнала отправителя ( H ( Y )), уменьшенную на неопределенность, оставшуюся после получения информации о сигнале отправителя ( ). Конечно, уменьшение неопределенности происходит за счет сообщаемого количества информации, которая .

Например, если нет , то связи вообще и . Альтернативно, если канал связи идеален и принимаемый сигнал идентичен сигналу у отправителя, то и .

В определении функции скорость-искажение и являются искажениями между и для данного и предписанное максимальное искажение соответственно. Когда мы используем среднеквадратическую ошибку в качестве меры искажения, мы имеем (для амплитуде непрерывных по сигналов ):

Как показывают приведенные выше уравнения, вычисление функции скорости-искажения требует стохастического описания входных данных. с точки зрения PDF , а затем стремится найти условный PDF которые минимизируют скорость для данного искажения . Эти определения могут быть сформулированы с точки зрения теории меры, чтобы учитывать также дискретные и смешанные случайные величины.

Аналитическое зачастую трудно получить , решение этой проблемы минимизации за исключением некоторых случаев, для которых мы далее предлагаем два наиболее известных примера. Известно, что функция скорости-искажения любого источника подчиняется нескольким фундаментальным свойствам, наиболее важным из которых является то, что она представляет собой непрерывную , монотонно убывающую выпуклую (U) функцию , поэтому форма функции в примерах типична (даже измеренная скорость – функции искажения в реальной жизни имеют очень схожие формы).

Хотя аналитических решений этой проблемы мало, существуют верхние и нижние оценки этих функций, включая знаменитую нижнюю границу Шеннона (SLB), которая в случае квадрата ошибки и источников без памяти утверждает, что для произвольных источников с конечной дифференциальной энтропией

где h ( D ) — дифференциальная энтропия гауссовской случайной величины с дисперсией D. Эта нижняя граница распространяется на источники с памятью и другими мерами искажения. Важной особенностью СЛБ является то, что она асимптотически точна в режиме малых искажений для широкого класса источников и в некоторых случаях фактически совпадает с функцией скорость-искажение. Нижние границы Шеннона обычно можно найти, если искажение между любыми двумя числами можно выразить как функцию разницы между значениями этих двух чисел.

Алгоритм Блахута-Аримото , изобретенный совместно с Ричардом Блаутом , представляет собой элегантный итерационный метод для численного получения функций скорости-искажения произвольных конечных источников входного/выходного алфавита, и была проделана большая работа для его распространения на более общие примеры задач.

При работе со стационарными источниками с памятью необходимо видоизменить определение функции скорости искажения и понимать ее в смысле ограничения, принимаемого на последовательности возрастающей длины.

где

и

где верхние индексы обозначают полную последовательность до этого момента, а нижний индекс 0 указывает на начальное состояние.

Гауссов источник без памяти (независимый) с квадратичной ошибки искажением

Если мы предположим, что представляет собой гауссову случайную величину с дисперсией , и если предположить, что последовательные выборки сигнала ( стохастически независимы или, что то же самое, источник не имеет памяти или сигнал некоррелирован ), мы находим следующее аналитическое выражение для функции скорости-искажения:

   [2]

На следующем рисунке показано, как выглядит эта функция:

Теория скорости-искажения говорит нам, что «не существует системы сжатия, работающей за пределами серой зоны». Чем ближе практическая система сжатия к красной (нижней) границе, тем лучше она работает. Как правило, эта граница может быть достигнута только за счет увеличения параметра длины блока кодирования. Тем не менее, даже при единичных длинах блоков часто можно найти хорошие (скалярные) квантователи , работающие на практически важных расстояниях от функции скорость-искажение. [3]

Эта функция скорости-искажения справедлива только для гауссовских источников без памяти. Известно, что гауссовский источник является самым «сложным» для кодирования источником: для заданной среднеквадратической ошибки он требует наибольшее количество бит. Производительность практической системы сжатия, работающей, скажем, с изображениями, вполне может быть ниже показана нижняя граница.

Безпамятный (независимый) источник Бернулли Хэмминга искажением с

Функция искажения скорости случайной величины Бернулли с искажением Хэмминга определяется выражением:

где обозначает двоичную функцию энтропии .

График функции искажения скорости для :

теории искажения скорости с пропускной способностью канала Связь

Предположим, мы хотим передать пользователю информацию об источнике с искажением, не D. превышающим Теория скорости-искажения говорит нам, что по крайней мере биты/символы информации из источника должны дойти до пользователя. Мы также знаем из теоремы о канальном кодировании Шеннона, что если энтропия источника равна H бит/символ, а пропускная способность канала равна C (где ), затем биты/символ будут потеряны при передаче этой информации по данному каналу. Чтобы у пользователя была хоть какая-то надежда на восстановление с максимальным искажением D , мы должны наложить требование, чтобы информация, теряемая при передаче, не превышала максимально допустимую потерю биты/символ. Это означает, что пропускная способность канала должна быть не менее . [4]

См. также [ править ]

Ссылки [ править ]

  1. ^ Блау, Ю.; Михаэли, Т. (2019). «Переосмысление сжатия с потерями: компромисс между скоростью, искажением и восприятием» (PDF) . Материалы международной конференции по машинному обучению . ПМЛР. стр. 675–685. arXiv : 1901.07821 .
  2. ^ Обложка и Томас 2012 , с. 310
  3. ^ Обложка, Томас М.; Томас, Джой А. (2012) [2006]. «10. Теория искажения скорости» . Элементы теории информации (2-е изд.). Уайли. ISBN  978-1-118-58577-1 .
  4. ^ Бергер, Тоби (1971). Теория искажения скорости: математическая основа сжатия данных . Прентис Холл. ISBN  978-0-13-753103-5 . LCCN   75-148254 . ОСЛК   156968 .

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: e7cddb840fd916500bc4ee0ed455bf1d__1714232400
URL1:https://arc.ask3.ru/arc/aa/e7/1d/e7cddb840fd916500bc4ee0ed455bf1d.html
Заголовок, (Title) документа по адресу, URL1:
Rate–distortion theory - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)