Jump to content

ВК-6

ВК-6
Организация СМПТЭ
Домен Сжатие видео
Логотип ВК-6

СМПТЭ СТ 2117-1 , [1] неофициально известный как VC-6 , это формат кодирования видео . [2]

Обзор [ править ]

VC-6 Кодек оптимизирован для промежуточного, мезонинного или дополнительного кодирования. [2] Обычно эти приложения включают сжатие готовых композиций для редактирования, публикации, первичного распространения, архивирования и других приложений, где необходимо сохранить качество изображения как можно ближе к оригиналу, одновременно снижая битрейт и оптимизируя требования к обработке, энергопотреблению и хранению. VC-6, как и другие кодеки этой категории. [3] [4] использует только внутрикадровое сжатие, при котором каждый кадр сохраняется независимо и может быть декодирован без зависимости от любого другого кадра. [5] Кодек реализует сжатие без потерь и с потерями в зависимости от выбранных параметров кодирования. Он был стандартизирован в 2020 году. Более ранние варианты кодека использовались V-Nova с 2015 года под торговым названием Perseus. Кодек основан на иерархических структурах данных, называемых S-деревьями, и не использует сжатие DCT или вейвлет-преобразование . Механизм сжатия не зависит от сжимаемых данных и может применяться как к пикселям, так и к другим данным, не являющимся изображениями. [6]

В отличие от кодеков на основе DCT , VC-6 основан на иерархических, повторяемых структурах s-деревьев, похожих на модифицированные квадродеревья . Эти простые структуры предоставляют внутренние возможности, такие как массовый параллелизм. [7] и возможность выбирать тип фильтрации, используемый для восстановления изображений с более высоким разрешением из изображений с более низким разрешением. [8] В стандарте VC-6 [2] модуль повышающей дискретизации, разработанный с использованием внутриконтурной сверточной нейронной сети, предназначен для оптимизации деталей реконструированного изображения без необходимости больших вычислительных затрат. Возможность пространственной навигации внутри битового потока VC-6 на нескольких уровнях. [2] также предоставляет устройствам декодирования возможность применять больше ресурсов к различным областям изображения, позволяя приложениям областей интереса работать со сжатыми битовыми потоками без необходимости декодирования изображения с полным разрешением. [9]

История [ править ]

На выставке NAB в 2015 году компания V-Nova заявила о «среднем приросте сжатия в 2–3 раза на всех уровнях качества в практических сценариях работы в реальном времени по сравнению с H.264 , HEVC и JPEG2000 ». [10] Это заявление, сделанное 1 апреля перед крупной торговой выставкой, привлекло внимание многих экспертов по сжатию. [11] С тех пор V-Nova внедрила и лицензировала технологию, известную в то время как Персей. [10] в приложениях для внесения и распространения по всему миру, включая Sky Italia , [12] Почти фильмз, [13] [14] Harmonic Inc и другие. Вариант технологии, оптимизированный для улучшения кодека распространения, вскоре будет стандартизирован как MPEG-5 Part-2 LCEVC . [15] [16] [17]

Основные понятия [ править ]

Самолеты [ править ]

Стандарт [2] описывает алгоритм сжатия, который применяется к независимым плоскостям данных. Этими плоскостями могут быть пиксели RGB или RGBA , происходящие из камеры, пиксели YCbCr из обычного ТВ-источника видео или некоторые другие плоскости данных. Может существовать до 255 независимых плоскостей данных, и каждая плоскость может иметь сетку значений данных размером до 65535 x 65535. [18] Стандарт SMPTE ST 2117-1 фокусируется на сжатии плоскостей значений данных, обычно пикселей. Для сжатия и распаковки данных в каждой плоскости VC-6 использует иерархические представления небольшой древовидной структуры, содержащей метаданные, используемые для прогнозирования других деревьев. В каждой плоскости повторяются 3 фундаментальные структуры. [2]

S-дерево [ править ]

Основной структурой сжатия в VC-6 является s-дерево. Она похожа на структуру квадродерева , распространенную в других схемах. S-дерево состоит из узлов, расположенных в виде древовидной структуры, где каждый узел связан с 4 узлами следующего уровня. Общее количество слоев над корневым узлом известно как высота s -дерева . Сжатие достигается в s-дереве за счет использования метаданных, чтобы указать, можно ли прогнозировать уровни с помощью выборочного переноса расширенных данных в битовом потоке. Чем больше данных можно предсказать, тем меньше информации отправляется и тем лучше степень сжатия . [6] [2]

Таблица [ править ]

Стандарт [2] определяет таблицу как корневой узел или самый высокий уровень S-дерева , который содержит узлы для другого S-дерева. Подобно общим s-деревьям, из которых они построены, таблицы организованы по уровням, а метаданные в узлах указывают, прогнозируются или передаются ли более высокие уровни в битовом потоке. [6]

Эшелон [ править ]

Иерархические структуры S-дерева и таблицы в стандарте [2] используются для переноса улучшений (называемых остаточными значениями) и других метаданных для уменьшения объема необработанных данных, которые необходимо переносить в полезной нагрузке битового потока. Последний иерархический инструмент — это возможность упорядочивать таблицы так, чтобы данные из каждой плоскости (т. е. пикселей) можно было деквантовать при разных разрешениях и использовать в качестве предикторов для более высоких разрешений. Каждое из этих разрешений определяется стандартом [2] как эшелон. Каждый эшелон внутри плоскости идентифицируется индексом , где более отрицательный индекс указывает на низкое разрешение, а больший и более положительный индекс указывает на более высокое разрешение.

Обзор битового потока [ править ]

VC-6 — это пример внутрикадрового кодирования , при котором каждое изображение кодируется без ссылки на другие изображения. Это также внутриплоскостной подход, когда никакая информация из одной плоскости не используется для прогнозирования другой плоскости. В результате битовый поток VC-6 содержит всю информацию для всех плоскостей одного изображения. [2] Последовательность изображений создается путем объединения битовых потоков нескольких изображений или их упаковки в такой контейнер, как MXF , Quicktime или Matroska .

Битовый поток VC-6 определен в стандарте. [2] с помощью псевдокода, и на основе этого определения был продемонстрирован эталонный декодер. Первичный заголовок — единственная фиксированная структура, определенная стандартом. [2] Вторичный заголовок содержит информацию о маркерах и размерах в зависимости от значений в первичном заголовке. Третичный заголовок полностью рассчитывается, а затем структура полезной нагрузки выводится из параметров, рассчитанных во время декодирования заголовка. [2]

Обзор декодирования [ править ]

Стандарт [2] определяет процесс, называемый реконструкцией плоскости , для декодирования изображений из битового потока. Процесс начинается с эшелона, имеющего наименьший индекс. Для этого эшелона прогнозы не используются. Во-первых, правила битового потока используются для восстановления остатков. Затем выполняются процессы депарсификации и энтропийного декодирования для заполнения сетки значениями данных по каждой координате. Затем эти значения деквантуются для создания значений полного диапазона, которые можно использовать в качестве прогнозов для эшелона со следующим по величине индексом. Каждый эшелон использует повышающую дискретизацию, указанную в заголовке, для создания прогнозируемой плоскости из эшелона ниже, которая добавляется к остаточной сетке из текущего эшелона, которая может быть подвергнута повышающей дискретизации в качестве прогноза для следующего эшелона. [19]

Последний эшелон полного разрешения, определенный стандартом, имеет индекс 0, и его результаты отображаются, а не используются для другого эшелона. [2]

Параметры повышающего сэмплера [ править ]

Основные параметры [ править ]

Стандарт [2] определяет ряд основных преобразователей частоты дискретизации [20] для создания прогнозов с более высоким разрешением из эшелонов с более низким разрешением. Имеется два линейных повышающих модуля, бикубический и резкий, а также повышающий преобразователь ближайшего соседа.

нейронной сети дискретизации Повышение сверточной

Определены шесть различных нелинейных повышающих дискретизаторов. [2] набором процессов и коэффициентов, предоставляемых в формате JSON . [20] Эти коэффициенты были сгенерированы с использованием сверточной нейронной сети. [21] техники.

Ссылки [ править ]

  1. ^ «Результаты поиска IEEE Xplore» . ieeexplore.ieee.org . Проверено 17 сентября 2020 г.
  2. ^ Jump up to: Перейти обратно: а б с д и ж г час я дж к л м н тот п д р «СТ 2117-1:2020 - Стандарт SMPTE - Формат многоплоскостного изображения VC-6. Часть 1. Элементарный битовый поток» . Св. 2117-1: 2020 : 1–156. Июль 2020 г. doi : 10.5594/SMPTE.ST2117-1.2020 . ISBN  978-1-68303-219-9 .
  3. ^ «СТ 2042-1:2012 – Стандарт SMPTE – Сжатие видео VC-2» . Ст 2042-1: 2012 : 1–137. Август 2012 г. doi : 10.5594/SMPTE.ST2042-1.2012 . ISBN  978-1-61482-890-7 .
  4. ^ «ST 2019-1:2016 — Стандарт SMPTE — Сжатие изображения VC-3 и формат потока данных» . Св. 2019-1:2016 : 1–108. Июнь 2016 г. doi : 10.5594/SMPTE.ST2019-1.2016 . ISBN  978-1-68303-020-1 .
  5. ^ «ST 2073-1:2014 – Стандарт SMPTE – Сущность видео VC-5 – Часть 1: Элементарный битовый поток» . Св. 2073-1: 2014 : 1–50. Март 2014 г. doi : 10.5594/SMPTE.ST2073-1.2014 . ISBN  978-1-61482-797-9 .
  6. ^ Jump up to: Перейти обратно: а б с «SMPTE ратифицирует видеокодек VC-6 на базе искусственного интеллекта V-Nova» . Мир цифровых медиа . 7 октября 2020 г.
  7. ^ Хунг, Юбин; Розенфельд, Азриэль (1 августа 1989 г.). «Параллельная обработка линейных квадродеревьев на ячеисто-связном компьютере» . Журнал параллельных и распределенных вычислений . 7 (1): 1–27. дои : 10.1016/0743-7315(89)90049-X . ISSN   0743-7315 .
  8. ^ Самет, Ханан (1988), «Обзор квадродеревьев, октерей и связанных с ними иерархических структур данных» , «Теоретические основы компьютерной графики и САПР» , Берлин, Гейдельберг: Springer Berlin Heidelberg, стр. 51–68, doi : 10.1007/978- 3-642-83539-1_2 , ISBN  978-3-642-83541-4 , получено 9 сентября 2020 г.
  9. ^ С., В.Г. (5 октября 2020 г.). «SMPTE публикует новый стандарт кодека видеопроизводства VC-6» . Группа спортивного видео .
  10. ^ Jump up to: Перейти обратно: а б «Обзор: V-Nova Perseus: соответствует ли его сжатие рекламе?» . Журнал стриминговых медиа . 17 июня 2016 г. Проверено 4 сентября 2020 г.
  11. ^ «Историческая хронология стандартов и форматов кодирования видео» . Вкодекс . Проверено 30 июля 2021 г.
  12. ^ «Sky Italia выбирает V-Nova для расширения охвата IPTV» . Цифровое телевидение Европы .
  13. ^ «Индийская компания FastFilmz использует V-Nova для доставки OTT на телефоны 2G» . Цифровое телевидение Европы . 7 апреля 2016 года . Проверено 9 сентября 2020 г.
  14. ^ «SHAREit приобретает Fastfilmz, чтобы увеличить количество видеоконтента среди региональных пользователей» . Inc42 Медиа . 8 мая 2018 года . Проверено 17 сентября 2020 г.
  15. ^ «Видеокодек улучшения низкой сложности» . LCEVC — новый подход к сжатию видео .
  16. ^ «V-Nova объявляет о выпуске MPEG-5 Part 2 LCEVC» . ТВБ Европа .
  17. ^ «Политика Персея просочилась в NAB после открытия MPEG-5» . Повторное исследование . 11 апреля 2019 г.
  18. ^ «Обзор ВК-6» . mrmxf.com .
  19. ^ ST 2117-1:2020 - Стандарт SMPTE. Формат многоплоскостного изображения VC-6. Часть 1. Элементарный битовый поток . Июль 2020. стр. 1–156. doi : 10.5594/SMPTE.ST2117-1.2020 . ISBN  978-1-68303-219-9 . {{cite book}}: |journal= игнорируется ( помогите )
  20. ^ Jump up to: Перейти обратно: а б Медиа-элемент повышающей дискретизации ST 2117-1 . 21 июля 2020 г. стр. 1–156. doi : 10.5594/SMPTE.ST2117-1.2020 . ISBN  978-1-68303-219-9 . {{cite book}}: |journal= игнорируется ( помогите )
  21. ^ Арабшахи, П. (май 1996 г.). «Основы искусственных нейронных сетей [обзоры книг]» . Транзакции IEEE в нейронных сетях . 7 (3): 793. doi : 10.1109/tnn.1996.501738 . ISSN   1045-9227 . S2CID   6576607 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 0efea1df692346e91ebad3c33f75487f__1709879100
URL1:https://arc.ask3.ru/arc/aa/0e/7f/0efea1df692346e91ebad3c33f75487f.html
Заголовок, (Title) документа по адресу, URL1:
VC-6 - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)