ВК-6
Организация | СМПТЭ |
---|---|
Домен | Сжатие видео |
СМПТЭ СТ 2117-1 , [1] неофициально известный как VC-6 , это формат кодирования видео . [2]
Обзор [ править ]
VC-6 Кодек оптимизирован для промежуточного, мезонинного или дополнительного кодирования. [2] Обычно эти приложения включают сжатие готовых композиций для редактирования, публикации, первичного распространения, архивирования и других приложений, где необходимо сохранить качество изображения как можно ближе к оригиналу, одновременно снижая битрейт и оптимизируя требования к обработке, энергопотреблению и хранению. VC-6, как и другие кодеки этой категории. [3] [4] использует только внутрикадровое сжатие, при котором каждый кадр сохраняется независимо и может быть декодирован без зависимости от любого другого кадра. [5] Кодек реализует сжатие без потерь и с потерями в зависимости от выбранных параметров кодирования. Он был стандартизирован в 2020 году. Более ранние варианты кодека использовались V-Nova с 2015 года под торговым названием Perseus. Кодек основан на иерархических структурах данных, называемых S-деревьями, и не использует сжатие DCT или вейвлет-преобразование . Механизм сжатия не зависит от сжимаемых данных и может применяться как к пикселям, так и к другим данным, не являющимся изображениями. [6]
В отличие от кодеков на основе DCT , VC-6 основан на иерархических, повторяемых структурах s-деревьев, похожих на модифицированные квадродеревья . Эти простые структуры предоставляют внутренние возможности, такие как массовый параллелизм. [7] и возможность выбирать тип фильтрации, используемый для восстановления изображений с более высоким разрешением из изображений с более низким разрешением. [8] В стандарте VC-6 [2] модуль повышающей дискретизации, разработанный с использованием внутриконтурной сверточной нейронной сети, предназначен для оптимизации деталей реконструированного изображения без необходимости больших вычислительных затрат. Возможность пространственной навигации внутри битового потока VC-6 на нескольких уровнях. [2] также предоставляет устройствам декодирования возможность применять больше ресурсов к различным областям изображения, позволяя приложениям областей интереса работать со сжатыми битовыми потоками без необходимости декодирования изображения с полным разрешением. [9]
История [ править ]
На выставке NAB в 2015 году компания V-Nova заявила о «среднем приросте сжатия в 2–3 раза на всех уровнях качества в практических сценариях работы в реальном времени по сравнению с H.264 , HEVC и JPEG2000 ». [10] Это заявление, сделанное 1 апреля перед крупной торговой выставкой, привлекло внимание многих экспертов по сжатию. [11] С тех пор V-Nova внедрила и лицензировала технологию, известную в то время как Персей. [10] в приложениях для внесения и распространения по всему миру, включая Sky Italia , [12] Почти фильмз, [13] [14] Harmonic Inc и другие. Вариант технологии, оптимизированный для улучшения кодека распространения, вскоре будет стандартизирован как MPEG-5 Part-2 LCEVC . [15] [16] [17]
Основные понятия [ править ]
Самолеты [ править ]
Стандарт [2] описывает алгоритм сжатия, который применяется к независимым плоскостям данных. Этими плоскостями могут быть пиксели RGB или RGBA , происходящие из камеры, пиксели YCbCr из обычного ТВ-источника видео или некоторые другие плоскости данных. Может существовать до 255 независимых плоскостей данных, и каждая плоскость может иметь сетку значений данных размером до 65535 x 65535. [18] Стандарт SMPTE ST 2117-1 фокусируется на сжатии плоскостей значений данных, обычно пикселей. Для сжатия и распаковки данных в каждой плоскости VC-6 использует иерархические представления небольшой древовидной структуры, содержащей метаданные, используемые для прогнозирования других деревьев. В каждой плоскости повторяются 3 фундаментальные структуры. [2]
S-дерево [ править ]
Основной структурой сжатия в VC-6 является s-дерево. Она похожа на структуру квадродерева , распространенную в других схемах. S-дерево состоит из узлов, расположенных в виде древовидной структуры, где каждый узел связан с 4 узлами следующего уровня. Общее количество слоев над корневым узлом известно как высота s -дерева . Сжатие достигается в s-дереве за счет использования метаданных, чтобы указать, можно ли прогнозировать уровни с помощью выборочного переноса расширенных данных в битовом потоке. Чем больше данных можно предсказать, тем меньше информации отправляется и тем лучше степень сжатия . [6] [2]
Таблица [ править ]
Стандарт [2] определяет таблицу как корневой узел или самый высокий уровень S-дерева , который содержит узлы для другого S-дерева. Подобно общим s-деревьям, из которых они построены, таблицы организованы по уровням, а метаданные в узлах указывают, прогнозируются или передаются ли более высокие уровни в битовом потоке. [6]
Эшелон [ править ]
Иерархические структуры S-дерева и таблицы в стандарте [2] используются для переноса улучшений (называемых остаточными значениями) и других метаданных для уменьшения объема необработанных данных, которые необходимо переносить в полезной нагрузке битового потока. Последний иерархический инструмент — это возможность упорядочивать таблицы так, чтобы данные из каждой плоскости (т. е. пикселей) можно было деквантовать при разных разрешениях и использовать в качестве предикторов для более высоких разрешений. Каждое из этих разрешений определяется стандартом [2] как эшелон. Каждый эшелон внутри плоскости идентифицируется индексом , где более отрицательный индекс указывает на низкое разрешение, а больший и более положительный индекс указывает на более высокое разрешение.
Обзор битового потока [ править ]
VC-6 — это пример внутрикадрового кодирования , при котором каждое изображение кодируется без ссылки на другие изображения. Это также внутриплоскостной подход, когда никакая информация из одной плоскости не используется для прогнозирования другой плоскости. В результате битовый поток VC-6 содержит всю информацию для всех плоскостей одного изображения. [2] Последовательность изображений создается путем объединения битовых потоков нескольких изображений или их упаковки в такой контейнер, как MXF , Quicktime или Matroska .
Битовый поток VC-6 определен в стандарте. [2] с помощью псевдокода, и на основе этого определения был продемонстрирован эталонный декодер. Первичный заголовок — единственная фиксированная структура, определенная стандартом. [2] Вторичный заголовок содержит информацию о маркерах и размерах в зависимости от значений в первичном заголовке. Третичный заголовок полностью рассчитывается, а затем структура полезной нагрузки выводится из параметров, рассчитанных во время декодирования заголовка. [2]
Обзор декодирования [ править ]
Стандарт [2] определяет процесс, называемый реконструкцией плоскости , для декодирования изображений из битового потока. Процесс начинается с эшелона, имеющего наименьший индекс. Для этого эшелона прогнозы не используются. Во-первых, правила битового потока используются для восстановления остатков. Затем выполняются процессы депарсификации и энтропийного декодирования для заполнения сетки значениями данных по каждой координате. Затем эти значения деквантуются для создания значений полного диапазона, которые можно использовать в качестве прогнозов для эшелона со следующим по величине индексом. Каждый эшелон использует повышающую дискретизацию, указанную в заголовке, для создания прогнозируемой плоскости из эшелона ниже, которая добавляется к остаточной сетке из текущего эшелона, которая может быть подвергнута повышающей дискретизации в качестве прогноза для следующего эшелона. [19]
Последний эшелон полного разрешения, определенный стандартом, имеет индекс 0, и его результаты отображаются, а не используются для другого эшелона. [2]
Параметры повышающего сэмплера [ править ]
Основные параметры [ править ]
Стандарт [2] определяет ряд основных преобразователей частоты дискретизации [20] для создания прогнозов с более высоким разрешением из эшелонов с более низким разрешением. Имеется два линейных повышающих модуля, бикубический и резкий, а также повышающий преобразователь ближайшего соседа.
нейронной сети дискретизации Повышение сверточной
Определены шесть различных нелинейных повышающих дискретизаторов. [2] набором процессов и коэффициентов, предоставляемых в формате JSON . [20] Эти коэффициенты были сгенерированы с использованием сверточной нейронной сети. [21] техники.
Ссылки [ править ]
- ^ «Результаты поиска IEEE Xplore» . ieeexplore.ieee.org . Проверено 17 сентября 2020 г.
- ^ Jump up to: Перейти обратно: а б с д и ж г час я дж к л м н тот п д р «СТ 2117-1:2020 - Стандарт SMPTE - Формат многоплоскостного изображения VC-6. Часть 1. Элементарный битовый поток» . Св. 2117-1: 2020 : 1–156. Июль 2020 г. doi : 10.5594/SMPTE.ST2117-1.2020 . ISBN 978-1-68303-219-9 .
- ^ «СТ 2042-1:2012 – Стандарт SMPTE – Сжатие видео VC-2» . Ст 2042-1: 2012 : 1–137. Август 2012 г. doi : 10.5594/SMPTE.ST2042-1.2012 . ISBN 978-1-61482-890-7 .
- ^ «ST 2019-1:2016 — Стандарт SMPTE — Сжатие изображения VC-3 и формат потока данных» . Св. 2019-1:2016 : 1–108. Июнь 2016 г. doi : 10.5594/SMPTE.ST2019-1.2016 . ISBN 978-1-68303-020-1 .
- ^ «ST 2073-1:2014 – Стандарт SMPTE – Сущность видео VC-5 – Часть 1: Элементарный битовый поток» . Св. 2073-1: 2014 : 1–50. Март 2014 г. doi : 10.5594/SMPTE.ST2073-1.2014 . ISBN 978-1-61482-797-9 .
- ^ Jump up to: Перейти обратно: а б с «SMPTE ратифицирует видеокодек VC-6 на базе искусственного интеллекта V-Nova» . Мир цифровых медиа . 7 октября 2020 г.
- ^ Хунг, Юбин; Розенфельд, Азриэль (1 августа 1989 г.). «Параллельная обработка линейных квадродеревьев на ячеисто-связном компьютере» . Журнал параллельных и распределенных вычислений . 7 (1): 1–27. дои : 10.1016/0743-7315(89)90049-X . ISSN 0743-7315 .
- ^ Самет, Ханан (1988), «Обзор квадродеревьев, октерей и связанных с ними иерархических структур данных» , «Теоретические основы компьютерной графики и САПР» , Берлин, Гейдельберг: Springer Berlin Heidelberg, стр. 51–68, doi : 10.1007/978- 3-642-83539-1_2 , ISBN 978-3-642-83541-4 , получено 9 сентября 2020 г.
- ^ С., В.Г. (5 октября 2020 г.). «SMPTE публикует новый стандарт кодека видеопроизводства VC-6» . Группа спортивного видео .
- ^ Jump up to: Перейти обратно: а б «Обзор: V-Nova Perseus: соответствует ли его сжатие рекламе?» . Журнал стриминговых медиа . 17 июня 2016 г. Проверено 4 сентября 2020 г.
- ^ «Историческая хронология стандартов и форматов кодирования видео» . Вкодекс . Проверено 30 июля 2021 г.
- ^ «Sky Italia выбирает V-Nova для расширения охвата IPTV» . Цифровое телевидение Европы .
- ^ «Индийская компания FastFilmz использует V-Nova для доставки OTT на телефоны 2G» . Цифровое телевидение Европы . 7 апреля 2016 года . Проверено 9 сентября 2020 г.
- ^ «SHAREit приобретает Fastfilmz, чтобы увеличить количество видеоконтента среди региональных пользователей» . Inc42 Медиа . 8 мая 2018 года . Проверено 17 сентября 2020 г.
- ^ «Видеокодек улучшения низкой сложности» . LCEVC — новый подход к сжатию видео .
- ^ «V-Nova объявляет о выпуске MPEG-5 Part 2 LCEVC» . ТВБ Европа .
- ^ «Политика Персея просочилась в NAB после открытия MPEG-5» . Повторное исследование . 11 апреля 2019 г.
- ^ «Обзор ВК-6» . mrmxf.com .
- ^ ST 2117-1:2020 - Стандарт SMPTE. Формат многоплоскостного изображения VC-6. Часть 1. Элементарный битовый поток . Июль 2020. стр. 1–156. doi : 10.5594/SMPTE.ST2117-1.2020 . ISBN 978-1-68303-219-9 .
{{cite book}}
:|journal=
игнорируется ( помогите ) - ^ Jump up to: Перейти обратно: а б Медиа-элемент повышающей дискретизации ST 2117-1 . 21 июля 2020 г. стр. 1–156. doi : 10.5594/SMPTE.ST2117-1.2020 . ISBN 978-1-68303-219-9 .
{{cite book}}
:|journal=
игнорируется ( помогите ) - ^ Арабшахи, П. (май 1996 г.). «Основы искусственных нейронных сетей [обзоры книг]» . Транзакции IEEE в нейронных сетях . 7 (3): 793. doi : 10.1109/tnn.1996.501738 . ISSN 1045-9227 . S2CID 6576607 .