ВК-6

ВК-6
Организация	СМПТЭ
Домен	Сжатие видео

СМПТЭ СТ 2117-1 , ^[1] неофициально известный как VC-6 , это формат кодирования видео . ^[2]

Обзор [ править ]

VC-6 Кодек оптимизирован для промежуточного, мезонинного или дополнительного кодирования. ^[2] Обычно эти приложения включают сжатие готовых композиций для редактирования, публикации, первичного распространения, архивирования и других приложений, где необходимо сохранить качество изображения как можно ближе к оригиналу, одновременно снижая битрейт и оптимизируя требования к обработке, энергопотреблению и хранению. VC-6, как и другие кодеки этой категории. ^[3]^[4] использует только внутрикадровое сжатие, при котором каждый кадр сохраняется независимо и может быть декодирован без зависимости от любого другого кадра. ^[5] Кодек реализует сжатие без потерь и с потерями в зависимости от выбранных параметров кодирования. Он был стандартизирован в 2020 году. Более ранние варианты кодека использовались V-Nova с 2015 года под торговым названием Perseus. Кодек основан на иерархических структурах данных, называемых S-деревьями, и не использует сжатие DCT или вейвлет-преобразование . Механизм сжатия не зависит от сжимаемых данных и может применяться как к пикселям, так и к другим данным, не являющимся изображениями. ^[6]

В отличие от кодеков на основе DCT , VC-6 основан на иерархических, повторяемых структурах s-деревьев, похожих на модифицированные квадродеревья . Эти простые структуры предоставляют внутренние возможности, такие как массовый параллелизм. ^[7] и возможность выбирать тип фильтрации, используемый для восстановления изображений с более высоким разрешением из изображений с более низким разрешением. ^[8] В стандарте VC-6 ^[2] модуль повышающей дискретизации, разработанный с использованием внутриконтурной сверточной нейронной сети, предназначен для оптимизации деталей реконструированного изображения без необходимости больших вычислительных затрат. Возможность пространственной навигации внутри битового потока VC-6 на нескольких уровнях. ^[2] также предоставляет устройствам декодирования возможность применять больше ресурсов к различным областям изображения, позволяя приложениям областей интереса работать со сжатыми битовыми потоками без необходимости декодирования изображения с полным разрешением. ^[9]

История [ править ]

На выставке NAB в 2015 году компания V-Nova заявила о «среднем приросте сжатия в 2–3 раза на всех уровнях качества в практических сценариях работы в реальном времени по сравнению с H.264 , HEVC и JPEG2000 ». ^[10] Это заявление, сделанное 1 апреля перед крупной торговой выставкой, привлекло внимание многих экспертов по сжатию. ^[11] С тех пор V-Nova внедрила и лицензировала технологию, известную в то время как Персей. ^[10] в приложениях для внесения и распространения по всему миру, включая Sky Italia , ^[12] Почти фильмз, ^[13]^[14] Harmonic Inc и другие. Вариант технологии, оптимизированный для улучшения кодека распространения, вскоре будет стандартизирован как MPEG-5 Part-2 LCEVC . ^[15]^[16]^[17]

Основные понятия [ править ]

Самолеты [ править ]

Стандарт ^[2] описывает алгоритм сжатия, который применяется к независимым плоскостям данных. Этими плоскостями могут быть пиксели RGB или RGBA , происходящие из камеры, пиксели YCbCr из обычного ТВ-источника видео или некоторые другие плоскости данных. Может существовать до 255 независимых плоскостей данных, и каждая плоскость может иметь сетку значений данных размером до 65535 x 65535. ^[18] Стандарт SMPTE ST 2117-1 фокусируется на сжатии плоскостей значений данных, обычно пикселей. Для сжатия и распаковки данных в каждой плоскости VC-6 использует иерархические представления небольшой древовидной структуры, содержащей метаданные, используемые для прогнозирования других деревьев. В каждой плоскости повторяются 3 фундаментальные структуры. ^[2]

S-дерево [ править ]

Основной структурой сжатия в VC-6 является s-дерево. Она похожа на структуру квадродерева , распространенную в других схемах. S-дерево состоит из узлов, расположенных в виде древовидной структуры, где каждый узел связан с 4 узлами следующего уровня. Общее количество слоев над корневым узлом известно как высота s -дерева . Сжатие достигается в s-дереве за счет использования метаданных, чтобы указать, можно ли прогнозировать уровни с помощью выборочного переноса расширенных данных в битовом потоке. Чем больше данных можно предсказать, тем меньше информации отправляется и тем лучше степень сжатия . ^[6]^[2]

Таблица [ править ]

Стандарт ^[2] определяет таблицу как корневой узел или самый высокий уровень S-дерева , который содержит узлы для другого S-дерева. Подобно общим s-деревьям, из которых они построены, таблицы организованы по уровням, а метаданные в узлах указывают, прогнозируются или передаются ли более высокие уровни в битовом потоке. ^[6]

Эшелон [ править ]

Иерархические структуры S-дерева и таблицы в стандарте ^[2] используются для переноса улучшений (называемых остаточными значениями) и других метаданных для уменьшения объема необработанных данных, которые необходимо переносить в полезной нагрузке битового потока. Последний иерархический инструмент — это возможность упорядочивать таблицы так, чтобы данные из каждой плоскости (т. е. пикселей) можно было деквантовать при разных разрешениях и использовать в качестве предикторов для более высоких разрешений. Каждое из этих разрешений определяется стандартом ^[2] как эшелон. Каждый эшелон внутри плоскости идентифицируется индексом , где более отрицательный индекс указывает на низкое разрешение, а больший и более положительный индекс указывает на более высокое разрешение.

Обзор битового потока [ править ]

VC-6 — это пример внутрикадрового кодирования , при котором каждое изображение кодируется без ссылки на другие изображения. Это также внутриплоскостной подход, когда никакая информация из одной плоскости не используется для прогнозирования другой плоскости. В результате битовый поток VC-6 содержит всю информацию для всех плоскостей одного изображения. ^[2] Последовательность изображений создается путем объединения битовых потоков нескольких изображений или их упаковки в такой контейнер, как MXF , Quicktime или Matroska .

Битовый поток VC-6 определен в стандарте. ^[2] с помощью псевдокода, и на основе этого определения был продемонстрирован эталонный декодер. Первичный заголовок — единственная фиксированная структура, определенная стандартом. ^[2] Вторичный заголовок содержит информацию о маркерах и размерах в зависимости от значений в первичном заголовке. Третичный заголовок полностью рассчитывается, а затем структура полезной нагрузки выводится из параметров, рассчитанных во время декодирования заголовка. ^[2]

Обзор декодирования [ править ]

Стандарт ^[2] определяет процесс, называемый реконструкцией плоскости , для декодирования изображений из битового потока. Процесс начинается с эшелона, имеющего наименьший индекс. Для этого эшелона прогнозы не используются. Во-первых, правила битового потока используются для восстановления остатков. Затем выполняются процессы депарсификации и энтропийного декодирования для заполнения сетки значениями данных по каждой координате. Затем эти значения деквантуются для создания значений полного диапазона, которые можно использовать в качестве прогнозов для эшелона со следующим по величине индексом. Каждый эшелон использует повышающую дискретизацию, указанную в заголовке, для создания прогнозируемой плоскости из эшелона ниже, которая добавляется к остаточной сетке из текущего эшелона, которая может быть подвергнута повышающей дискретизации в качестве прогноза для следующего эшелона. ^[19]

Последний эшелон полного разрешения, определенный стандартом, имеет индекс 0, и его результаты отображаются, а не используются для другого эшелона. ^[2]

Параметры повышающего сэмплера [ править ]

Основные параметры [ править ]

Стандарт ^[2] определяет ряд основных преобразователей частоты дискретизации ^[20] для создания прогнозов с более высоким разрешением из эшелонов с более низким разрешением. Имеется два линейных повышающих модуля, бикубический и резкий, а также повышающий преобразователь ближайшего соседа.

нейронной сети дискретизации Повышение сверточной

Определены шесть различных нелинейных повышающих дискретизаторов. ^[2] набором процессов и коэффициентов, предоставляемых в формате JSON . ^[20] Эти коэффициенты были сгенерированы с использованием сверточной нейронной сети. ^[21] техники.

Ссылки [ править ]

^ «Результаты поиска IEEE Xplore» . ieeexplore.ieee.org . Проверено 17 сентября 2020 г.
^ Jump up to: Перейти обратно: ^а ^б ^с ^д ^и ^ж ^г ^час ^я ^дж ^к ^л ^м ^н ^тот ^п ^д ^р «СТ 2117-1:2020 - Стандарт SMPTE - Формат многоплоскостного изображения VC-6. Часть 1. Элементарный битовый поток» . Св. 2117-1: 2020 : 1–156. Июль 2020 г. doi : 10.5594/SMPTE.ST2117-1.2020 . ISBN 978-1-68303-219-9 .
^ «СТ 2042-1:2012 – Стандарт SMPTE – Сжатие видео VC-2» . Ст 2042-1: 2012 : 1–137. Август 2012 г. doi : 10.5594/SMPTE.ST2042-1.2012 . ISBN 978-1-61482-890-7 .
^ «ST 2019-1:2016 — Стандарт SMPTE — Сжатие изображения VC-3 и формат потока данных» . Св. 2019-1:2016 : 1–108. Июнь 2016 г. doi : 10.5594/SMPTE.ST2019-1.2016 . ISBN 978-1-68303-020-1 .
^ «ST 2073-1:2014 – Стандарт SMPTE – Сущность видео VC-5 – Часть 1: Элементарный битовый поток» . Св. 2073-1: 2014 : 1–50. Март 2014 г. doi : 10.5594/SMPTE.ST2073-1.2014 . ISBN 978-1-61482-797-9 .
^ Jump up to: Перейти обратно: ^а ^б ^с «SMPTE ратифицирует видеокодек VC-6 на базе искусственного интеллекта V-Nova» . Мир цифровых медиа . 7 октября 2020 г.
^ Хунг, Юбин; Розенфельд, Азриэль (1 августа 1989 г.). «Параллельная обработка линейных квадродеревьев на ячеисто-связном компьютере» . Журнал параллельных и распределенных вычислений . 7 (1): 1–27. дои : 10.1016/0743-7315(89)90049-X . ISSN 0743-7315 .
^ Самет, Ханан (1988), «Обзор квадродеревьев, октерей и связанных с ними иерархических структур данных» , «Теоретические основы компьютерной графики и САПР» , Берлин, Гейдельберг: Springer Berlin Heidelberg, стр. 51–68, doi : 10.1007/978- 3-642-83539-1_2 , ISBN 978-3-642-83541-4 , получено 9 сентября 2020 г.
^ С., В.Г. (5 октября 2020 г.). «SMPTE публикует новый стандарт кодека видеопроизводства VC-6» . Группа спортивного видео .
^ Jump up to: Перейти обратно: ^а ^б «Обзор: V-Nova Perseus: соответствует ли его сжатие рекламе?» . Журнал стриминговых медиа . 17 июня 2016 г. Проверено 4 сентября 2020 г.
^ «Историческая хронология стандартов и форматов кодирования видео» . Вкодекс . Проверено 30 июля 2021 г.
^ «Sky Italia выбирает V-Nova для расширения охвата IPTV» . Цифровое телевидение Европы .
^ «Индийская компания FastFilmz использует V-Nova для доставки OTT на телефоны 2G» . Цифровое телевидение Европы . 7 апреля 2016 года . Проверено 9 сентября 2020 г.
^ «SHAREit приобретает Fastfilmz, чтобы увеличить количество видеоконтента среди региональных пользователей» . Inc42 Медиа . 8 мая 2018 года . Проверено 17 сентября 2020 г.
^ «Видеокодек улучшения низкой сложности» . LCEVC — новый подход к сжатию видео .
^ «V-Nova объявляет о выпуске MPEG-5 Part 2 LCEVC» . ТВБ Европа .
^ «Политика Персея просочилась в NAB после открытия MPEG-5» . Повторное исследование . 11 апреля 2019 г.
^ «Обзор ВК-6» . mrmxf.com .
^ ST 2117-1:2020 - Стандарт SMPTE. Формат многоплоскостного изображения VC-6. Часть 1. Элементарный битовый поток . Июль 2020. стр. 1–156. doi : 10.5594/SMPTE.ST2117-1.2020 . ISBN 978-1-68303-219-9 . {{cite book}}: |journal= игнорируется ( помогите )
^ Jump up to: Перейти обратно: ^а ^б Медиа-элемент повышающей дискретизации ST 2117-1 . 21 июля 2020 г. стр. 1–156. doi : 10.5594/SMPTE.ST2117-1.2020 . ISBN 978-1-68303-219-9 . {{cite book}}: |journal= игнорируется ( помогите )
^ Арабшахи, П. (май 1996 г.). «Основы искусственных нейронных сетей [обзоры книг]» . Транзакции IEEE в нейронных сетях . 7 (3): 793. doi : 10.1109/tnn.1996.501738 . ISSN 1045-9227 . S2CID 6576607 .

[1] «Результаты поиска IEEE Xplore» . ieeexplore.ieee.org . Проверено 17 сентября 2020 г.

[:0-2] Jump up to: Перейти обратно: ^а ^б ^с ^д ^и ^ж ^г ^час ^я ^дж ^к ^л ^м ^н ^тот ^п ^д ^р «СТ 2117-1:2020 - Стандарт SMPTE - Формат многоплоскостного изображения VC-6. Часть 1. Элементарный битовый поток» . Св. 2117-1: 2020 : 1–156. Июль 2020 г. doi : 10.5594/SMPTE.ST2117-1.2020 . ISBN 978-1-68303-219-9 .

[3] «СТ 2042-1:2012 – Стандарт SMPTE – Сжатие видео VC-2» . Ст 2042-1: 2012 : 1–137. Август 2012 г. doi : 10.5594/SMPTE.ST2042-1.2012 . ISBN 978-1-61482-890-7 .

[4] «ST 2019-1:2016 — Стандарт SMPTE — Сжатие изображения VC-3 и формат потока данных» . Св. 2019-1:2016 : 1–108. Июнь 2016 г. doi : 10.5594/SMPTE.ST2019-1.2016 . ISBN 978-1-68303-020-1 .

[5] «ST 2073-1:2014 – Стандарт SMPTE – Сущность видео VC-5 – Часть 1: Элементарный битовый поток» . Св. 2073-1: 2014 : 1–50. Март 2014 г. doi : 10.5594/SMPTE.ST2073-1.2014 . ISBN 978-1-61482-797-9 .

[dm-6] Jump up to: Перейти обратно: ^а ^б ^с «SMPTE ратифицирует видеокодек VC-6 на базе искусственного интеллекта V-Nova» . Мир цифровых медиа . 7 октября 2020 г.

[7] Хунг, Юбин; Розенфельд, Азриэль (1 августа 1989 г.). «Параллельная обработка линейных квадродеревьев на ячеисто-связном компьютере» . Журнал параллельных и распределенных вычислений . 7 (1): 1–27. дои : 10.1016/0743-7315(89)90049-X . ISSN 0743-7315 .

[8] Самет, Ханан (1988), «Обзор квадродеревьев, октерей и связанных с ними иерархических структур данных» , «Теоретические основы компьютерной графики и САПР» , Берлин, Гейдельберг: Springer Berlin Heidelberg, стр. 51–68, doi : 10.1007/978- 3-642-83539-1_2 , ISBN 978-3-642-83541-4 , получено 9 сентября 2020 г.

[9] С., В.Г. (5 октября 2020 г.). «SMPTE публикует новый стандарт кодека видеопроизводства VC-6» . Группа спортивного видео .

[:1-10] Jump up to: Перейти обратно: ^а ^б «Обзор: V-Nova Perseus: соответствует ли его сжатие рекламе?» . Журнал стриминговых медиа . 17 июня 2016 г. Проверено 4 сентября 2020 г.

[11] «Историческая хронология стандартов и форматов кодирования видео» . Вкодекс . Проверено 30 июля 2021 г.

[12] «Sky Italia выбирает V-Nova для расширения охвата IPTV» . Цифровое телевидение Европы .

[13] «Индийская компания FastFilmz использует V-Nova для доставки OTT на телефоны 2G» . Цифровое телевидение Европы . 7 апреля 2016 года . Проверено 9 сентября 2020 г.

[14] «SHAREit приобретает Fastfilmz, чтобы увеличить количество видеоконтента среди региональных пользователей» . Inc42 Медиа . 8 мая 2018 года . Проверено 17 сентября 2020 г.

[15] «Видеокодек улучшения низкой сложности» . LCEVC — новый подход к сжатию видео .

[16] «V-Nova объявляет о выпуске MPEG-5 Part 2 LCEVC» . ТВБ Европа .

[17] «Политика Персея просочилась в NAB после открытия MPEG-5» . Повторное исследование . 11 апреля 2019 г.

[18] «Обзор ВК-6» . mrmxf.com .

[19] ST 2117-1:2020 - Стандарт SMPTE. Формат многоплоскостного изображения VC-6. Часть 1. Элементарный битовый поток . Июль 2020. стр. 1–156. doi : 10.5594/SMPTE.ST2117-1.2020 . ISBN 978-1-68303-219-9 . {{cite book}}: |journal= игнорируется ( помогите )

[:2-20] Jump up to: Перейти обратно: ^а ^б Медиа-элемент повышающей дискретизации ST 2117-1 . 21 июля 2020 г. стр. 1–156. doi : 10.5594/SMPTE.ST2117-1.2020 . ISBN 978-1-68303-219-9 . {{cite book}}: |journal= игнорируется ( помогите )

[21] Арабшахи, П. (май 1996 г.). «Основы искусственных нейронных сетей [обзоры книг]» . Транзакции IEEE в нейронных сетях . 7 (3): 793. doi : 10.1109/tnn.1996.501738 . ISSN 1045-9227 . S2CID 6576607 .

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

v т и SMPTE Стандарты
Standards	SMPTE 259M SMPTE 268M SMPTE 274M SMPTE 291M SMPTE 292M SMPTE 296M SMPTE 330M SMPTE 344M SMPTE 356M SMPTE 360M SMPTE 367M SMPTE 372M SMPTE 377M SMPTE 421M SMPTE 424M SMPTE 2022 SMPTE 2059 SMPTE 2067 SMPTE 2071 SMPTE 2117 SMPTE color bars SMPTE DCP SMPTE timecode
Related articles	Broadcast-safe Broadcast television systems Interoperable Master Format
Related standards organizations	Advanced Television Systems Committee BBC Research Digital Video Broadcasting European Broadcasting Union ITU Radiocommunication Sector (formerly CCIR) ITU Telecommunication Sector (formerly CCITT) Joint Photographic Experts Group Moving Picture Experts Group NHK Science & Technology Research Laboratories