ВК-6
Организация | СМПТЭ |
---|---|
Домен | Сжатие видео |

СМПТЭ СТ 2117-1 , [ 1 ] неофициально известный как VC-6 , это формат кодирования видео . [ 2 ]
Обзор
[ редактировать ]VC-6 Кодек оптимизирован для промежуточного, мезонинного или дополнительного кодирования. [ 2 ] Обычно эти приложения включают сжатие готовых композиций для редактирования, публикации, первичного распространения, архивирования и других приложений, где необходимо сохранить качество изображения как можно ближе к оригиналу, одновременно снижая битрейт и оптимизируя требования к обработке, энергопотреблению и хранению. VC-6, как и другие кодеки этой категории. [ 3 ] [ 4 ] использует только внутрикадровое сжатие, при котором каждый кадр сохраняется независимо и может быть декодирован без зависимости от любого другого кадра. [ 5 ] Кодек реализует сжатие без потерь и с потерями в зависимости от выбранных параметров кодирования. Он был стандартизирован в 2020 году. Более ранние варианты кодека использовались V-Nova с 2015 года под торговым названием Perseus. Кодек основан на иерархических структурах данных, называемых S-деревьями, и не использует сжатие DCT или вейвлет-преобразование . Механизм сжатия не зависит от сжимаемых данных и может применяться как к пикселям, так и к другим данным, не являющимся изображениями. [ 6 ]
В отличие от кодеков на основе DCT , VC-6 основан на иерархических, повторяемых структурах s-деревьев, похожих на модифицированные квадродеревья . Эти простые структуры предоставляют внутренние возможности, такие как массовый параллелизм. [ 7 ] и возможность выбирать тип фильтрации, используемый для восстановления изображений с более высоким разрешением из изображений с более низким разрешением. [ 8 ] В стандарте VC-6 [ 2 ] модуль повышающей дискретизации, разработанный с использованием внутриконтурной сверточной нейронной сети, предназначен для оптимизации деталей реконструированного изображения без необходимости больших вычислительных затрат. Возможность пространственной навигации внутри битового потока VC-6 на нескольких уровнях. [ 2 ] также предоставляет устройствам декодирования возможность применять больше ресурсов к различным областям изображения, позволяя приложениям областей интереса работать со сжатыми битовыми потоками без необходимости декодирования изображения с полным разрешением. [ 9 ]
История
[ редактировать ]На выставке NAB в 2015 году компания V-Nova заявила о «среднем приросте сжатия в 2–3 раза на всех уровнях качества в практических сценариях работы в реальном времени по сравнению с H.264 , HEVC и JPEG2000 ». [ 10 ] Это заявление, сделанное 1 апреля перед крупной торговой выставкой, привлекло внимание многих экспертов по сжатию. [ 11 ] С тех пор V-Nova внедрила и лицензировала технологию, известную в то время как Персей. [ 10 ] в приложениях для внесения и распространения по всему миру, включая Sky Italia , [ 12 ] Почти фильмз, [ 13 ] [ 14 ] Harmonic Inc и другие. Вариант технологии, оптимизированный для улучшения кодека распространения, вскоре будет стандартизирован как MPEG-5 Part-2 LCEVC . [ 15 ] [ 16 ] [ 17 ]
Основные понятия
[ редактировать ]Самолеты
[ редактировать ]Стандарт [ 2 ] описывает алгоритм сжатия, который применяется к независимым плоскостям данных. Этими плоскостями могут быть пиксели RGB или RGBA , происходящие из камеры, пиксели YCbCr из обычного ТВ-источника видео или некоторые другие плоскости данных. Может существовать до 255 независимых плоскостей данных, и каждая плоскость может иметь сетку значений данных размером до 65535 x 65535. [ 18 ] Стандарт SMPTE ST 2117-1 фокусируется на сжатии плоскостей значений данных, обычно пикселей. Для сжатия и распаковки данных в каждой плоскости VC-6 использует иерархические представления небольшой древовидной структуры, содержащей метаданные, используемые для прогнозирования других деревьев. В каждой плоскости повторяются 3 фундаментальные структуры. [ 2 ]
S-дерево
[ редактировать ]Основной структурой сжатия в VC-6 является s-дерево. Она похожа на структуру квадродерева , распространенную в других схемах. S-дерево состоит из узлов, расположенных в виде древовидной структуры, где каждый узел связан с 4 узлами следующего уровня. Общее количество слоев над корневым узлом известно как высота s -дерева . Сжатие достигается в s-дереве за счет использования метаданных, чтобы указать, можно ли прогнозировать уровни с помощью выборочного переноса расширенных данных в битовом потоке. Чем больше данных можно предсказать, тем меньше информации отправляется и тем лучше степень сжатия . [ 6 ] [ 2 ]
Рисование
[ редактировать ]Стандарт [ 2 ] определяет таблицу как корневой узел или самый высокий уровень S-дерева , который содержит узлы для другого S-дерева. Подобно общим s-деревьям, из которых они построены, таблицы упорядочиваются по слоям, а метаданные в узлах указывают, прогнозируются или передаются ли более высокие уровни в битовом потоке. [ 6 ]
Эшелон
[ редактировать ]Иерархические структуры S-дерева и таблицы в стандарте [ 2 ] используются для переноса улучшений (называемых остаточными значениями) и других метаданных для уменьшения объема необработанных данных, которые необходимо переносить в полезной нагрузке битового потока. Последний иерархический инструмент — это возможность упорядочивать таблицы так, чтобы данные из каждой плоскости (т. е. пикселей) можно было деквантовать при разных разрешениях и использовать в качестве предикторов для более высоких разрешений. Каждое из этих разрешений определяется стандартом [ 2 ] как эшелон. Каждый эшелон внутри плоскости идентифицируется индексом , где более отрицательный индекс указывает на низкое разрешение, а более крупный и положительный индекс указывает на более высокое разрешение.
Обзор битового потока
[ редактировать ]VC-6 — это пример внутрикадрового кодирования , при котором каждое изображение кодируется без ссылки на другие изображения. Это также внутриплоскостной подход, когда никакая информация из одной плоскости не используется для прогнозирования другой плоскости. В результате битовый поток VC-6 содержит всю информацию для всех плоскостей одного изображения. [ 2 ] Последовательность изображений создается путем объединения битовых потоков нескольких изображений или их упаковки в такой контейнер, как MXF , Quicktime или Matroska .
Битовый поток VC-6 определен в стандарте. [ 2 ] с помощью псевдокода, и на основе этого определения был продемонстрирован эталонный декодер. Первичный заголовок — единственная фиксированная структура, определенная стандартом. [ 2 ] Вторичный заголовок содержит информацию о маркерах и размерах в зависимости от значений в первичном заголовке. Третичный заголовок полностью рассчитывается, а затем структура полезной нагрузки выводится из параметров, рассчитанных во время декодирования заголовка. [ 2 ]
Обзор декодирования
[ редактировать ]Стандарт [ 2 ] определяет процесс, называемый реконструкцией плоскости , для декодирования изображений из битового потока. Процесс начинается с эшелона, имеющего наименьший индекс. Для этого эшелона прогнозы не используются. Во-первых, правила битового потока используются для восстановления остатков. Затем выполняются процессы депарсификации и энтропийного декодирования для заполнения сетки значениями данных по каждой координате. Затем эти значения деквантуются для создания значений полного диапазона, которые можно использовать в качестве прогнозов для эшелона со следующим по величине индексом. Каждый эшелон использует повышающую дискретизацию, указанную в заголовке, для создания прогнозируемой плоскости из эшелона ниже, которая добавляется к остаточной сетке из текущего эшелона, которая может быть подвергнута повышающей дискретизации в качестве прогноза для следующего эшелона. [ 19 ]
Последний эшелон полного разрешения, определенный стандартом, имеет индекс 0, и его результаты отображаются, а не используются для другого эшелона. [ 2 ]
Параметры повышения дискретизации
[ редактировать ]Базовые опции
[ редактировать ]Стандарт [ 2 ] определяет ряд основных преобразователей частоты дискретизации [ 20 ] для создания прогнозов с более высоким разрешением из эшелонов с более низким разрешением. Имеется два линейных повышающих модуля, бикубический и резкий, а также повышающий преобразователь ближайшего соседа.
Повышение дискретизации сверточной нейронной сети
[ редактировать ]Определены шесть различных нелинейных повышающих дискретизаторов. [ 2 ] набором процессов и коэффициентов, предоставляемых в формате JSON . [ 20 ] Эти коэффициенты были сгенерированы с использованием сверточной нейронной сети. [ 21 ] техники.
Ссылки
[ редактировать ]- ^ «Результаты поиска IEEE Xplore» . ИИЭЭ . Проверено 17 сентября 2020 г.
- ^ Jump up to: а б с д и ж г час я дж к л м н тот п д р «СТ 2117-1:2020 - Стандарт SMPTE. Формат многоплоскостного изображения VC-6. Часть 1. Элементарный битовый поток» . Св. 2117-1: 2020 : 1–156. Июль 2020 г. doi : 10.5594/SMPTE.ST2117-1.2020 . ISBN 978-1-68303-219-9 . Архивировано из оригинала 28 октября 2020 года.
- ^ «СТ 2042-1:2012 – Стандарт SMPTE – Сжатие видео VC-2» . Ст 2042-1: 2012 : 1–137. Август 2012 г. doi : 10.5594/SMPTE.ST2042-1.2012 . ISBN 978-1-61482-890-7 . Архивировано из оригинала 13 июня 2018 года.
- ^ «ST 2019-1:2016 — Стандарт SMPTE — Сжатие изображения VC-3 и формат потока данных» . Св. 2019-1:2016 : 1–108. Июнь 2016 г. doi : 10.5594/SMPTE.ST2019-1.2016 . ISBN 978-1-68303-020-1 . Архивировано из оригинала 6 марта 2017 года.
- ^ «ST 2073-1:2014 – Стандарт SMPTE – Сущность видео VC-5 – Часть 1: Элементарный битовый поток» . Св. 2073-1: 2014 : 1–50. Март 2014 г. doi : 10.5594/SMPTE.ST2073-1.2014 . ISBN 978-1-61482-797-9 . [ мертвая ссылка ]
- ^ Jump up to: а б с «SMPTE ратифицирует видеокодек VC-6 на базе искусственного интеллекта V-Nova» . Мир цифровых медиа . 7 октября 2020 г.
- ^ Хунг, Юбин; Розенфельд, Азриэль (1 августа 1989 г.). «Параллельная обработка линейных квадродеревьев на ячеисто-связном компьютере» . Журнал параллельных и распределенных вычислений . 7 (1): 1–27. дои : 10.1016/0743-7315(89)90049-X . ISSN 0743-7315 .
- ^ Самет, Ханан (1988), «Обзор квадродеревьев, октерей и связанных с ними иерархических структур данных» , «Теоретические основы компьютерной графики и САПР» , Берлин, Гейдельберг: Springer Berlin Heidelberg, стр. 51–68, doi : 10.1007/978- 3-642-83539-1_2 , ISBN 978-3-642-83541-4 , получено 9 сентября 2020 г.
- ^ С., В.Г. (5 октября 2020 г.). «SMPTE публикует новый стандарт кодека видеопроизводства VC-6» . Группа спортивного видео .
- ^ Jump up to: а б «Обзор: V-Nova Perseus: соответствует ли его сжатие рекламе?» . Журнал стриминговых медиа . 17 июня 2016 г. Проверено 4 сентября 2020 г.
- ^ «Историческая хронология стандартов и форматов кодирования видео» . Вкодекс . Проверено 30 июля 2021 г.
- ^ «Sky Italia выбирает V-Nova для расширения охвата IPTV» . Цифровое телевидение Европы .
- ^ «Индийская компания FastFilmz использует V-Nova для доставки OTT на телефоны 2G» . Цифровое телевидение Европы . 7 апреля 2016 года . Проверено 9 сентября 2020 г.
- ^ «SHAREit приобретает Fastfilmz, чтобы увеличить количество видеоконтента среди региональных пользователей» . Inc42 Медиа . 8 мая 2018 года . Проверено 17 сентября 2020 г.
- ^ «Видеокодек улучшения низкой сложности» . LCEVC — новый подход к сжатию видео .
- ^ «V-Nova объявляет о выпуске MPEG-5 Part 2 LCEVC» . ТВБ Европа .
- ^ «Политика Персея просочилась в NAB после открытия MPEG-5» . Повторное исследование . 11 апреля 2019 г.
- ^ «Обзор ВК-6» . mrmxf.com .
- ^ ST 2117-1:2020 - Стандарт SMPTE. Формат многоплоскостного изображения VC-6. Часть 1. Элементарный битовый поток . Июль 2020 г. стр. 1–156. doi : 10.5594/SMPTE.ST2117-1.2020 . ISBN 978-1-68303-219-9 . Архивировано из оригинала 28 октября 2020 года.
{{cite book}}
:|journal=
игнорируется ( помогите ) - ^ Jump up to: а б Медиа-элемент повышающей дискретизации ST 2117-1 . 21 июля 2020 г. стр. 1–156. doi : 10.5594/SMPTE.ST2117-1.2020 . ISBN 978-1-68303-219-9 . Архивировано из оригинала 15 июня 2021 года.
{{cite book}}
:|journal=
игнорируется ( помогите ) - ^ Арабшахи, П. (май 1996 г.). «Основы искусственных нейронных сетей [обзоры книг]» . Транзакции IEEE в нейронных сетях . 7 (3): 793. doi : 10.1109/tnn.1996.501738 . ISSN 1045-9227 . S2CID 6576607 .