Типы изображений сжатия видео
Эта статья нуждается в дополнительных цитатах для проверки . ( май 2024 г. ) |
В области сжатия видео видеокадр с разными преимуществами и недостатками, главным образом , сжимается с использованием разных алгоритмов в зависимости от степени сжатия данных . Эти различные алгоритмы для видеокадров называются типами изображений или типами кадров . используемые в различных видеоалгоритмах, — это I , P и B. Три основных типа изображения , [1] Они отличаются следующими характеристиками:
- I -кадры наименее сжимаемы, но для декодирования не требуют других видеокадров.
- P -кадры могут использовать данные из предыдущих кадров для распаковки и являются более сжимаемыми, чем I-кадры.
- B -кадры могут использовать как предыдущие, так и последующие кадры для ссылки на данные, чтобы получить максимальную степень сжатия данных.
Резюме [ править ]
три типа изображений используются При сжатии видео (или кадров) : I, P и B кадры.
( I-кадр изображение с внутренним кодированием ) — это полное изображение, подобное файлу изображения JPG или BMP .
P -кадр (прогнозированное изображение) сохраняет только изменения изображения по сравнению с предыдущим кадром. Например, в сцене, где автомобиль движется по неподвижному фону, необходимо закодировать только движения автомобиля. Кодеру не нужно хранить неизменяемые пиксели фона в P-кадре, что позволяет экономить место. P-кадры также известны как дельта-кадры .
B -кадр (двунаправленное прогнозируемое изображение) экономит еще больше места за счет использования различий между текущим кадром и предыдущим и последующим кадрами для указания его содержимого.
Кадры P и B также называются межкадрами . Порядок расположения кадров I, P и B называется Группой изображений .
Картинки/рамки [ править ]
Хотя термины «кадр» и «изображение» часто используются как взаимозаменяемые, термин « изображение» является более общим понятием, поскольку изображение может быть либо рамкой, либо полем . Кадр — это полное изображение, а поле — это набор строк развертки с нечетными или четными номерами, составляющих часть изображения. Например, изображение HD 1080 имеет 1080 строк (рядов) пикселей. Нечетное поле содержит информацию о пикселях для строк 1, 3, 5...1079. Четное поле содержит информацию о пикселях для строк 2, 4, 6...1080. Когда видео отправляется в формате чересстрочной развертки , каждый кадр отправляется в двух полях: поле строк с нечетными номерами, за которыми следует поле строк с четными номерами.
Кадр, используемый в качестве эталона для прогнозирования других кадров, называется опорным кадром.
Кадры, закодированные без информации из других кадров, называются I-кадрами. Кадры, которые используют предсказание на основе одного предыдущего опорного кадра (или одного кадра для предсказания каждой области), называются P-кадрами. B-кадры используют прогнозирование на основе (возможно, взвешенного) среднего значения двух опорных кадров: предыдущего и последующего.
Ломтики [ править ]
В стандарте H.264/MPEG-4 AVC степень детализации типов прогнозирования снижена до «уровня среза». Срез — это пространственно отличная область кадра, которая кодируется отдельно от любой другой области в том же кадре. I-срезы, P-срезы и B-срезы заменяют кадры I, P и B.
Макроблоки [ править ]
Обычно изображения (кадры) сегментируются на макроблоки , и отдельные типы прогнозирования могут выбираться на основе макроблока, а не быть одинаковыми для всего изображения, следующим образом:
- I-кадры могут содержать только внутримакроблоки
- P-кадры могут содержать как внутренние макроблоки, так и предсказанные макроблоки.
- B-кадры могут содержать макроблоки с внутренним, предсказанным и двойным предсказанием.
Кроме того, в стандарте кодирования видео H.264 кадр может быть сегментирован на последовательности макроблоков, называемых слайсами , и вместо использования выбора типа I, B и P-кадра кодер может выбирать стиль прогнозирования отдельно для каждого отдельного слайса. Также в H.264 обнаружено несколько дополнительных типов кадров/фрагментов:
- SI-кадры/срезы (переключение I): облегчает переключение между кодированными потоками; содержит SI-макроблоки (особый тип внутрикодированных макроблоков).
- SP-кадры/фрагменты (переключение P): облегчает переключение между кодированными потоками; содержит P и/или I-макроблоки
- Многокадровая оценка движения (до 16 опорных кадров или 32 опорных полей)
Многокадровая оценка движения повышает качество видео, сохраняя при этом ту же степень сжатия. Кадры SI и SP (определенные для расширенного профиля) улучшают коррекцию ошибок . Когда такие кадры используются вместе с интеллектуальным декодером, можно восстановить потоки вещания поврежденных DVD.
Внутрикодированные (I) кадры/фрагменты (ключевые кадры) [ править ]
- I-кадры содержат целое изображение. Они кодируются без ссылки на какой-либо другой кадр, кроме (частей) самих себя.
- Может генерироваться кодером для создания точки произвольного доступа (чтобы позволить декодеру начать правильное декодирование с нуля в этом месте изображения).
- Также может генерироваться, когда различение деталей изображения препятствует созданию эффективных P- или B-кадров.
- Обычно для кодирования требуется больше битов, чем для других типов кадров.
Часто I-кадры используются для произвольного доступа и используются в качестве эталонов для декодирования других изображений. Периоды внутреннего обновления в полсекунды обычно используются в таких приложениях, как цифровое телевещание и хранение DVD . В некоторых средах могут использоваться более длительные периоды обновления. Например, в системах видеоконференцсвязи I-кадры отправляются очень редко.
Предсказанные (P) кадры/фрагменты [ править ]
- Требовать предварительного декодирования некоторых других изображений для декодирования.
- Может содержать как данные изображения, так и смещения векторов движения, а также их комбинации.
- Можно ссылаться на предыдущие изображения в порядке декодирования.
- Более старые стандартные конструкции (например, MPEG-2 ) используют только одно ранее декодированное изображение в качестве эталона во время декодирования и требуют, чтобы это изображение также предшествовало изображению P в порядке отображения.
- В H.264 может использовать несколько ранее декодированных изображений в качестве ссылок во время декодирования и может иметь любое произвольное соотношение порядка отображения относительно изображения(й), используемого для его предсказания.
- Обычно для кодирования требуется меньше битов по сравнению с изображениями.
Двунаправленные предсказанные (B) кадры/срезы (макроблоки) [ править ]
- Требовать предварительного декодирования последующих кадров для отображения.
- Может содержать данные изображения и/или смещения вектора движения. Старые стандарты допускают только один глобальный вектор компенсации движения для всего кадра или один вектор компенсации движения для каждого макроблока.
- Включите некоторые режимы прогнозирования, которые формируют прогноз области движения (например, макроблока или меньшей области) путем усреднения прогнозов, полученных с использованием двух различных ранее декодированных опорных областей. Некоторые стандарты допускают два вектора компенсации движения на макроблок (двухпрогнозирование).
- В старых стандартах (таких как MPEG-2) B-кадры никогда не используются в качестве эталонов для прогнозирования других изображений. В результате для таких B-кадров можно использовать кодирование более низкого качества (требующее меньше места), поскольку потеря детализации не повредит качеству прогнозирования для последующих изображений.
- H.264 ослабляет это ограничение и позволяет использовать B-кадры в качестве эталонов для декодирования других кадров по усмотрению кодера.
- Более старые стандарты (такие как MPEG-2) используют ровно два ранее декодированных изображения в качестве эталонов во время декодирования и требуют, чтобы одно из этих изображений предшествовало B-кадру в порядке отображения, а другое - следовало за ним.
- H.264 допускает использование одного, двух или более двух ранее декодированных изображений в качестве эталонов во время декодирования и может иметь любое произвольное соотношение порядка отображения относительно изображения(й), используемого для его предсказания.
- Повышенная гибкость поиска информации означает, что B-кадры обычно требуют меньше битов для кодирования, чем I- или P-кадры.
См. также [ править ]
- Термин ключевой кадр в анимации
- Сжатие видео
- Внутрикадровый
- Межкадровый
- Группа изображений с применением типов рамок
- Датамош
- Видео
Ссылки [ править ]
- ^ Бич, Энди; Оуэн, Аарон (2019). Справочник по сжатию видео (2-е изд.). Место публикации не указано: Peachpit Press. ISBN 978-0-13-486621-5 . OCLC 1006298938 .