Оптимизация скорости и искажений
Оптимизация искажений скорости ( RDO ) — это метод улучшения качества видео при сжатии видео . Название относится к оптимизации количества искажений (потеря качества видео) относительно объема данных, необходимых для кодирования видео, скорости . Хотя оптимизация скорости искажения в основном используется видеокодировщиками, ее можно использовать для улучшения качества в любой ситуации кодирования (изображения, видео, аудио и т. д.), когда необходимо принимать решения, которые одновременно влияют как на размер файла, так и на его качество.
Фон
[ редактировать ]Классический метод принятия решений о кодировании заключается в том, что видеокодер выбирает результат, который дает выходное изображение наивысшего качества. Однако у этого метода есть недостаток: для выбора может потребоваться больше битов, но при этом качество будет сравнительно небольшим. Одним из распространенных примеров этой проблемы является оценка движения . [1] и, в частности, относительно использования оценки движения с точностью до четверти пикселя . Добавление дополнительной точности к движению блока во время оценки движения может повысить качество, но в некоторых случаях это дополнительное качество не стоит дополнительных битов, необходимых для кодирования вектора движения с более высокой точностью.
Как это работает
[ редактировать ]Оптимизация искажений скорости решает вышеупомянутую проблему, выступая в качестве показателя качества видео, измеряя как отклонение от исходного материала, так и стоимость бита для каждого возможного результата решения. Биты математически измеряются путем умножения стоимости бита на лагранжиан — значение, представляющее соотношение между стоимостью бита и качеством для определенного уровня качества. Отклонение от источника обычно измеряется как среднеквадратическая ошибка , чтобы максимизировать показатель качества видео PSNR .
Вычисление стоимости битов усложняется из-за энтропийных кодеров в современных видеокодеках, требующих от алгоритма оптимизации скорости искажения передачи каждого блока видео, подлежащего тестированию, в энтропийный кодер для измерения его фактической стоимости в битах. В кодеках MPEG полный процесс состоит из дискретного косинусного преобразования , за которым следует квантование и энтропийное кодирование. Из-за этого оптимизация искажений скорости происходит намного медленнее, чем большинство других показателей сопоставления блоков, таких как простая сумма абсолютных разностей (SAD) и сумма абсолютных преобразованных разностей (SATD). По существу, он обычно используется только на последних этапах процесса оценки движения , например, при выборе между различными типами разделов в H.264/AVC .
Список кодеров, поддерживающих RDO
[ редактировать ]- Ateme H.264 Кодер
- Кодеры Grass Valley ViBE (SD и HD MPEG-2/MPEG-4)
- Кодер Harmonic Electra 8000 (SD и HD MPEG-2/MPEG-4)
- libavcodec
- MainConcept H.264 Кодер
- Microsoft VC-1 Кодер
- Телевидение Тандберг SD MPEG-2 EN8100
- Телевидение Тандберг HD MPEG-4 EN8190
- Tandberg Television SD и HD MPEG-4 iPlex
- Theora 1.1-alpha1 и новее (ветвь «Thusnelda»)
- x264 H.264 кодировщик
- x265 H.265 кодировщик
- Xvid MPEG-4 ASP Кодер
- Справочное программное обеспечение H.264/AVC JM (Joint Model)
- Эталонное программное обеспечение HEVC HM (тестовая модель HEVC)
- Квазар (частичный) [2]
Ссылки
[ редактировать ]- ^ Хоанг, DT; Лонг, ПМ; Виттер, Джеффри (август 1998 г.). «Оптимизация скорости искажения для оценки движения при кодировании видео с низким битрейтом» (PDF) . Транзакции IEEE по схемам и системам видеотехнологий . 8 (4): 488–500. дои : 10.1109/76.709413 . Более короткая версия представлена в Хоанг, DT; Лонг, ПМ; Виттер, Дж. С. (март 1996 г.). «Оптимизация искажений скорости для оценки движения при кодировании видео с низкой скоростью передачи данных» . Сжатие цифрового видео: алгоритмы и технологии 1996 . Том. 2668. ШПИОН. стр. 18–27. дои : 10.1117/12.235433 .
- ^ «Ультра Видео Групп» .