Jump to content

Аудио Видео Стандарт

Стандарт кодирования аудио-видео ( AVS ) относится к стандарту сжатия цифрового аудио и цифрового видео, разработанному рабочей группой по стандартизации кодирования аудио и видео в Китае. Работа началась в 2002 году, и были опубликованы три поколения стандартов. [1]

Стандарт AVS первого поколения включает «Информационные технологии, усовершенствованное кодирование аудио-видео, часть 2: видео» ( AVS1 ) и «Информационные технологии, усовершенствованное кодирование аудио-видео, часть 16: радио- и телевидение, видео» ( AVS+ ). Для второго поколения упоминается Как и AVS2 , основной целью применения было телевизионное видео сверхвысокой четкости , поддерживающее эффективное сжатие видео сверхвысокого разрешения ( 4K и выше) с расширенным динамическим диапазоном , и оно было опубликовано как международный стандарт IEEE IEEE 1857.4. Был создан отраслевой альянс для разработки и продвижения стандартов AVS. [2] Патентный пул взимает небольшую плату за терминальные продукты (например, телевизоры), за исключением поставщиков контента и операторов. [3]

Кодек AVS3 был добавлен в набор инструментов доставки мультимедиа DVB . [4]

Организации [ править ]

Рабочая группа [ править ]

Рабочая группа AVS была основана в июне 2002 года для сотрудничества с китайскими предприятиями и научно-исследовательскими институтами с целью разработки и пересмотра общих технических стандартов, таких как сжатие, декомпрессия, обработка и представление цифрового аудио и цифрового видео, чтобы обеспечить эффективные и экономичные технологии кодирования/декодирования. для цифровых аудио- и цифровых видеоустройств и систем, обслуживающих цифровое вещание высокого разрешения, цифровые лазерные носители данных высокой плотности, беспроводную широкополосную мультимедийную связь, широкополосную потоковую передачу данных в Интернете и другие приложения.

Рабочую группу возглавляет Гао Вэнь , академик Китайской инженерной академии, профессор и доктор технических наук. руководитель Пекинского университета и заместитель директора Комитета Национального фонда естественных наук, состоящего из группы требований, системной группы, видеогруппы, аудиогруппы, тестовой группы, группы интеллектуальной собственности и других отделов. Первой неудачей стало то, что в 2003 году Китай не использовал AVS для своей собственной системы цифрового телевизионного вещания. [5]

Патентный пул [ править ]

Патентный пул , который управляет патентами и утверждает их, был основан 20 сентября 2004 года. Этот комитет стал первым учреждением по управлению патентным пулом в Китае. Независимая корпоративная ассоциация, Пекинский центр продвижения стандартов цифрового аудио и видео района Хайдянь, зарегистрирована в Бюро по гражданским делам района Хайдянь города Пекина. [6] по патентным технологиям, включенным в стандарт, в качестве экспертного комитета и основного органа принятия бизнес-решений центра продвижения. Роялти за стандарт AVS первого поколения составлял всего один юань за терминал. Планировалось взимать небольшую сумму роялти только за терминал, исключая его содержимое, а также программные услуги в Интернете. [7]

Альянс [ править ]

Отраслевой альянс AVS, сокращение от Zhongguancun Audio Visual Industry Technology Innovation Alliance, был основан в мае 2005 года в Пекине двенадцатью организациями, включая TCL Group Co., Ltd., Исследовательский институт Skyworth Group, Huawei Technology Co., Ltd., Hisense Group. Co., Ltd., Haier Group Co., Ltd., Пекин Haier Guangke Co., Ltd., Inspur Group Co., Ltd., Joint Source Digital Audio Video Technology (Пекин) Co., Ltd., Новый район Пудун, мобильная связь Ассоциация связи, Sichuan Changhong Co., Ltd., Шанхайский центральный научно-исследовательский институт SVA (Group), Zte Communication Co., Ltd. и Ассоциация индустрии высоких технологий Чжунгуаньцунь. Организация также известна как AVSA и сотрудничает с «Рабочой группой AVS» и «Комитетом по управлению патентным пулом AVS» в рамках «Трех вагонов».

Первое поколение [ править ]

Стандарт AVS первого поколения включал китайский национальный стандарт «Информационные технологии, усовершенствованное кодирование аудио-видео, часть 2: видео» (сокращенно AVS1, маркировка GB: GB/T 20090.2-2006) и «Информационные технологии, усовершенствованное кодирование аудио-видео, часть 16: Радио Телевидение Видео» (сокращенно AVS+, маркировка Великобритании: GB/T 20090.16-2016). Тест, проведенный Институтом планирования радио и телевидения Государственного управления радио, кино и телевидения (SARFT, позднее входившего в состав Национального управления радио и телевидения ), показывает: если битрейт AVS1 составляет половину стандарта MPEG-2 , кодирование качество будет превосходным как для стандартного разрешения, так и для высокого разрешения; если битрейт меньше 1/3, то он также достигает уровня «хорошо-отлично». Видеочасть стандарта AVS1 была обнародована как национальный стандарт Китая в феврале 2006 года.Примерно в это же время рассматривалось возможность использования AVS в расширенном универсальном формате дисков. [8] хотя продукция так и не попала на рынок.

Во время собрания ITU-T (Сектор стандартизации электросвязи МСЭ) 7–11 мая 2007 г. AVS1 был одним из стандартов, доступных для телевидения по протоколу Интернет (IPTV), наряду с MPEG-2, H.264 и VC-1 . 4 июня 2013 года видеочасть AVS1 была выпущена Институтом инженеров по электротехнике и электронике (IEEE) как стандарт IEEE1857-2013. AVS+ — это не только стандарт радио, кино и телевидения GY/T 257.1-2012 «Расширенное кодирование аудио и видео для радио и телевидения, часть 1: Видео», выпущенный SARFT 10 июля 2012 г., но и расширенная версия AVS1. . [9]

Второе поколение [ править ]

Стандарт AVS второго поколения включал серию китайских национальных стандартов «Информационные технологии, эффективное мультимедийное кодирование» (AVS2). AVS2 в основном сталкивается с передачей дополнительных телепрограмм HD, SARFT объявил видео AVS2 отраслевым стандартом в мае 2016 года и национальным стандартом Китая 30 декабря 2016 года. AVS2 был опубликован Институтом инженеров по электротехнике и электронике (IEEE) как стандарт 1857.4-2018 в августе 2019 года. [10]

Тест показал, что эффективность кодирования AVS2 более чем вдвое превышает эффективность AVS+, а степень сжатия превосходит международный стандарт HEVC (H.265). По сравнению со стандартом AVS первого поколения, второе позволяет сэкономить половину полосы пропускания передачи.

Особенности [ править ]

AVS2 использует структуру гибридного кодирования, и весь процесс кодирования включает в себя такие модули, как внутрикадровое предсказание, межкадровое предсказание, преобразование, квантование, обратное квантование и обратное преобразование, контурный фильтр и энтропийное кодирование. Он имеет следующие технические характеристики: [11]

  • Раздел с гибкой структурой кодирования
    • Чтобы удовлетворить требования видео с разрешением HD и Ultra HD к эффективности сжатия, AVS2 использует блочную структуру разделов на основе квадродерева , включая CU (единицу кодирования), PU (единицу прогнозирования) и TU (единицу преобразования). Изображение разбивается на LCU (самый большой CU) фиксированного размера, который повторяется и разбивается на серию CU в форме квадродерева. Каждый CU содержит блок кодирования яркости и два соответствующих блока кодирования цветности (размер блока ниже относится к блоку кодирования яркости). По сравнению с традиционным макроблоком структура разделов на основе квадродерева более гибкая: размер CU увеличен с 8×8 до 64×64.
    • PU определяет все режимы прогнозирования CU и является базовой единицей прогнозирования, включая внутрикадровое и межкадровое прогнозирование. Максимальный размер PU не может превышать размер текущего CU, которому он принадлежит. На основе блоков квадратного внутрикадрового предсказания AVS1 добавляется раздел блока неквадратного внутрикадрового предсказания. Между тем, на основе разделения блоков симметричного предсказания межкадровое предсказание также добавляет 4 способа асимметричного разделения.
    • Помимо CU и PU, AVS2 также определяет блок преобразования TU для прогнозирования остаточного преобразования и квантования. TU — это базовая единица преобразования и квантования, определенная в CU, как PU. Выбор размера связан с соответствующей формой ПУ. Если текущий CU разделен на неквадратные PU, неквадратный раздел будет применен к соответствующему TU; в противном случае будет применен тип квадратного раздела. Размер ТУ может быть больше размера ПУ, но не больше размера ТС, которому он принадлежит.
  • Кодирование с внутренним предсказанием
    • По сравнению с AVS1 и H.264/AVC, AVS2 предлагает 33 режима для кодирования блоков яркости с внутрикадровым прогнозированием, включая режим прогнозирования постоянного тока, режим плоского прогнозирования, режим билинейного прогнозирования и 30 режимов ангельского прогнозирования. Существует 5 режимов для блоков цветности: режим постоянного тока, режим горизонтального прогнозирования, режим вертикального прогнозирования, режим билинейной интерполяции, а также недавно добавленный режим получения яркости (DM).
  • Интерпрогнозирующее кодирование
    • По сравнению с AVS1, AVS2 увеличивает максимальное количество кандидатов на опорные кадры до 4, чтобы адаптироваться к многоуровневому управлению опорными кадрами, которое также в полной мере использует избыточное пространство буфера.
    • Чтобы удовлетворить требования управления несколькими опорными кадрами, AVS2 использует своего рода режим многоуровневого управления опорными кадрами. В этом режиме кадры в каждой GOP (группе изображений) разделяются на несколько уровней в соответствии с опорными отношениями между кадрами.
  • Режим межпрогнозирования
    • На основе трех типов изображений I, P, B AVS1, в соответствии с требованиями приложения, AVS2 добавляет прямое прогнозируемое изображение F с несколькими гипотезами. Ориентируясь на видеонаблюдение, воспроизведение сцен и другие конкретные приложения, AVS2 проектирует кадры сцен ( Изображение G и Изображение GB) и опорный кадр сцены S.
    • Для кадра B, в дополнение к традиционному режиму прямой, обратной, двусторонней передачи и режиму пропуска/прямого перемещения, добавлен новый симметричный режим. В симметричном режиме необходимо кодировать только векторы движения вперед, а затем векторы движения назад будут получены из векторов движения вперед.
    • Чтобы в полной мере реализовать эффективность режима пропуска/прямого перемещения кадра B, AVS2 также использует многонаправленный режим пропуска/прямого перемещения при условии сохранения исходного режима пропуска/прямого перемещения кадра B: режим двустороннего пропуска/прямого перемещения, симметричный режим пропуска/прямого перемещения, режим пропуска/прямого движения назад и режим пропуска/прямого перемещения вперед. Для четырех конкретных режимов один и тот же блок режима прогнозирования между соседними блоками обнаруживается в соответствии с режимом прогнозирования текущего блока, и векторы движения соседних блоков с тем же режимом прогнозирования, которые обнаружены первыми, будут рассматриваться как текущего блока.
    • Для кадра F блоки кодирования могут относиться к двум прямым опорным блокам, что эквивалентно предсказанию двойной гипотезы кадра P.
    • AVS2 делит прогнозирование с использованием нескольких гипотез на две категории, а именно временной и пространственный режим с несколькими гипотезами.
    • Текущий блок кодирования двойной гипотезы во временной области применяет средневзвешенное значение блоков прогнозирования в качестве текущего значения прогнозирования, но существует только один как для MVD (разница векторов движения), так и для индекса опорного изображения, в то время как другой MVD и опорное изображение Индексы получаются путем линейного масштабирования на основе расстояния во временной области.
    • Двойное предсказание в пространственной области также называется DMH (направленная мультигипотеза), которое получается путем объединения двух точек прогнозирования вокруг начальной точки прогнозирования, причем начальная точка расположена на линии между двумя точками прогнозирования. Помимо начальной точки прогнозирования, всего имеется 8 точек прогнозирования, которые необходимо объединить только с двумя точками прогнозирования, расположенными на одной прямой с начальной точкой прогнозирования. Помимо четырех различных направлений, регулировка также будет проводиться в соответствии с расстоянием, и будут рассчитаны четыре режима с расстоянием 1/2 пикселя и расстоянием 1/4 пикселя соответственно, а также начальная точка прогнозирования, чтобы в общей сложности получить 9 режимов. для сравнения, чтобы выбрать оптимальный режим прогнозирования.
    • Кадр сцены предлагается AVS2 на основе метода кодирования видео наблюдения и моделирования фона. Когда инструмент наблюдения не открыт, кадр I предназначен только для справки для изображений перед следующей точкой произвольного доступа. Когда инструмент наблюдения открыт, AVS2 применит определенный кадр видео в качестве кадра изображения сцены G, который можно рассматривать как долгосрочный эталон для последующих изображений.
    • AVS2 может генерировать кадр GB изображения сцены с некоторыми кадрами видео, а кадр GB также можно применять в качестве долгосрочного эталона.
    • Чтобы упростить компенсацию движения, AVS2 использует интерполяционный фильтр с 8 отводами, основанный на преобразовании DCT , который требует только одной фильтрации и поддерживает генерацию вектора движения с более высокой точностью, чем 1/4 пикселя.
  • Трансформация
    • Кодирование преобразования в AVS2 в основном применяет целочисленное преобразование DCT , которое непосредственно выполняется над блоками преобразования размером 4×4, 8×8, 16×16, 32×32.
    • Для одного блока преобразования с размерностью более 64 используется логическое преобразование LOT для проведения вейвлет-преобразования, за которым следует целочисленное DCT-преобразование.
    • После того, как преобразование DCT будет достигнуто, AVS2 проведет второе преобразование 4 x 4 для блоков 4 x 4 с низкочастотными коэффициентами, что еще больше уменьшит корреляцию между коэффициентами и позволит более сконцентрировать энергию.
  • Энтропийное кодирование
    • Энтропийное кодирование AVS2 сначала делит коэффициенты преобразования на CG (группу коэффициентов) размером 4 x 4, а затем выполняет кодирование и зигзагообразное сканирование в соответствии с CG.
    • Коэффициентное кодирование сначала кодирует позицию CG, содержащую последний ненулевой коэффициент, а затем кодирует каждую CG до тех пор, пока все коэффициенты CG не будут завершены, чтобы обеспечить более высокую концентрацию нулевых коэффициентов во время процесса кодирования.
    • Двоичное арифметическое кодирование и двумерное кодирование переменной длины на основе контекста по-прежнему применяются в AVS2.
  • Петлевой фильтр
    • Модули петлевых фильтров AVS2 состоят из трех частей: фильтр деблокировки, адаптивное смещение точки выборки и фильтр компенсации выборки.
    • Фильтрующие блоки фильтра удаления блочности имеют размер 8×8, которые сначала проводят фильтрацию по вертикальному краю, а затем по горизонтальному краю. Для каждого края выбираются различные методы фильтрации в соответствии с различной интенсивностью фильтрации.
    • После фильтра удаления блочности применяется адаптивная компенсация смещения выборки для дальнейшего уменьшения искажений.
    • AVS2 добавляет адаптивный фильтр после фильтра удаления блочности и компенсации смещения выборки, фильтр Винера с крестом 7×7 плюс квадратная центросимметрия 3×3, который применяет исходное неискаженное изображение и кодирует восстановленное изображение для определения коэффициента наименьших квадратов фильтра, и проводить фильтрацию декодированного реконструированного изображения, чтобы уменьшить искажения сжатия в декодированном изображении и повысить качество опорного изображения.

Реализации [ править ]

уАВС3 [ править ]

uAVS3 — это открытым исходным кодом с кроссплатформенный кодер и декодер AVS3 . Декодер ( uAVS3d ) и кодер ( uAVS3e ) поддерживают базовый профиль AVS3-Phase2. uAVS3d можно скомпилировать для Windows , Linux , macOS , iOS и Android . [12] в то время как uAVS3e можно скомпилировать только для Windows и Linux . [13] uAVS3d и uAVS3e выпускаются в соответствии с условиями 3-го пункта BSD. [12] и 4-пункт BSD [13] лицензии соответственно.

FFmpeg v6 может использовать библиотеку uAVS3d AVS3-P2/IEEE1857.10 для декодирования видео . [14]

уАВС2 [ править ]

Кодировщик под названием uAVS2 был разработан исследовательским центром цифровых медиа Шэньчжэньской высшей школы Пекинского университета . Впоследствии были анонсированы видеокодер AVS2 Ultra HD в реальном времени и мобильный HD-кодер. [15] [16]

OpenAVS2 [ править ]

OpenAVS2 — это набор программного обеспечения для кодирования, транскодирования и декодирования аудио и видео, основанный на стандарте AVS2. [17]

xAVS2 и dAVS2 [ править ]

xAVS2 и dAVS2 — это кодеры и декодеры с открытым исходным кодом, опубликованные Лабораторией видеокодирования Пекинского университета ( PKU-VCL ) на основе стандарта видеокодирования AVS2-P2/ IEEE 1857.4 , который предлагается по любой из версий 2 Стандартной общественной лицензии GNU (GPL). или коммерческую лицензию.

FFmpeg версии 6 может использовать библиотеку dAVS2 AVS2-P2/IEEE1857.4. для декодирования видео [18] [19] библиотека xAVS2 AVS2-P2/IEEE1857.4 для кодирования видео . [20] [21]

libdavs2 и libxavs2 находятся под лицензией GNU General Public License версии 2 или более поздней.

См. также [ править ]

Ссылки [ править ]

  1. ^ «Youwei Vision запускает декодер видео реального времени AVS3 8K (на китайском языке)» . Тенсент . 29 мая 2019 г.
  2. ^ «Введение в AVSA» . Официальный сайт AVSA . Архивировано из оригинала 24 марта 2019 года . Проверено 29 сентября 2017 г.
  3. ^ «Кто возглавит новый стандарт кодирования видео: отчет о сравнении производительности HEVC, AVS2 и AV1» . Архивировано из оригинала 28 июля 2018 года . Проверено 29 сентября 2017 г.
  4. ^ «Кодек AVS3 добавлен в набор инструментов доставки мультимедиа DVB» . 7 июля 2022 г. Проверено 7 сентября 2022 г.
  5. ^ Элспет Томсон, Джон Сигурдсон, изд. (2008). Китайский сектор науки и технологий и силы глобализации . Мировое научное издательство. стр. 93–95. ISBN  978-981-277-101-8 . Проверено 15 июня 2022 г.
  6. ^ Совет по прыжку . www.avs.org.cn .
  7. ^ Национальный исследовательский совет (7 октября 2013 г.). Патентные проблемы установления стандартов в глобальной экономике: уроки информационных и коммуникационных технологий . Пресса национальных академий. ISBN  978-0-309-29315-0 . Проверено 15 июня 2022 г.
  8. ^ Лю Байцзя (6 марта 2006 г.). «Стандартный выпуск» . Китайский деловой еженедельник . Проверено 14 июня 2022 г.
  9. ^ Синьхуа (27 августа 2012 г.). «Китай будет продвигать собственный стандарт кодирования аудио-видео» . Манилла Таймс . Проверено 15 июня 2022 г.
  10. ^ Стандарт IEEE для кодирования видео второго поколения IEEE 1857 . Институт инженеров электротехники и электроники . 30 августа 2019 г. стр. 1–199. дои : 10.1109/IEESTD.2019.8821610 . ISBN  978-1-5044-5461-2 . Проверено 13 июня 2022 г. {{cite book}}: |journal= игнорируется ( помогите )
  11. ^ «Специальная колонка АВС2» .
  12. ^ Перейти обратно: а б uavs3d , БПЛА, 11 апреля 2023 г. , получено 29 апреля 2023 г.
  13. ^ Перейти обратно: а б uavs3e , БПЛА, 4 апреля 2023 г. , получено 29 апреля 2023 г.
  14. ^ FFmpeg. "1.8 уавс3д" . Проверено 6 апреля 2023 г.
  15. ^ «Кодер высокого разрешения реального времени AVS2 показал лучшую производительность, чем x265 кодер HEVC/H.265» .
  16. ^ «Кодек реального времени AVS2 — uAVS2» . Архивировано из оригинала 27 апреля 2018 года . Проверено 29 сентября 2017 г.
  17. ^ «Официальный сайт OpenAVS2» . Архивировано из оригинала 31 декабря 2019 года.
  18. ^ FFmpeg. «1,7 дАВС2» . Проверено 6 апреля 2023 г.
  19. ^ дАВС2. «дАВС2» . Гитхаб . Проверено 6 апреля 2023 г. {{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )
  20. ^ FFmpeg. «1.27 xAVS2» . Проверено 6 апреля 2023 г.
  21. ^ дАВС2. «дАВС2» . Гитхаб . Проверено 6 апреля 2023 г. {{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 08183be98f4d0c24342ff0647fcd2a3f__1714992420
URL1:https://arc.ask3.ru/arc/aa/08/3f/08183be98f4d0c24342ff0647fcd2a3f.html
Заголовок, (Title) документа по адресу, URL1:
Audio Video Standard - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)