Единое кодирование речи и аудио
Unified Speech and Audio Coding (USAC) — это сжатия звука формат и кодек для музыки и речи или любого сочетания речи и звука с использованием очень низких скоростей передачи данных от 12 до 64 кбит/с. [1] Он был разработан Группой экспертов по движущимся изображениям (MPEG) и опубликован как международный стандарт ISO / IEC 23003-3 (он же MPEG-D Part 3). [2] а также как тип аудиообъекта MPEG-4 в ISO/IEC 14496-3:2009/Amd 3 в 2012 году. [3]
Он использует инструменты линейного прогнозирования во временной области и остаточного кодирования ( методы типа ACELP ) для сегментов речевого сигнала и инструменты кодирования преобразования ( методы на основе MDCT ) для сегментов музыкального сигнала, а также способен динамически переключаться между наборами инструментов в сигнале. отзывчивая манера. Он разрабатывается с целью создать единый унифицированный кодер с производительностью, которая равна или превосходит производительность специализированных кодеров речи и музыкальных кодеров в широком диапазоне битрейтов. Расширенные варианты инструментов параметрического кодирования MPEG-4 Spectral Band Replication (SBR) и MPEG-D MPEG Surround интегрированы в кодек USAC. [4] [5]
Расширенный HE-AAC [ править ]
Стандарт MPEG-D USAC (ISO/IEC 23003-3) определяет расширенный высокоэффективный профиль AAC, который содержит все инструменты профиля HE-AAC v2, а также возможности моно/стерео базового профиля USAC. В результате декодер, созданный в соответствии с профилем Extended High Efficiency AAC, способен также декодировать потоки битов, созданные для предыдущих профилей семейства AAC. Профиль Extended High Efficiency AAC был разработан для приложений, которым необходима стабильная производительность при низких скоростях передачи данных и возможность декодирования всего существующего AAC-LC , HE-AAC и HE-AACv2 . контента [6]
xHE-AAC [ править ]
Фраунгофер определил кодек xHE-AAC как комбинацию расширенного высокоэффективного профиля AAC и соответствующих частей профиля управления громкостью MPEG-D DRC или профиля управления динамическим диапазоном. [7] xHE-AAC расширяет рабочий диапазон кодека с 12 до 300 кбит/с для стереосигналов и позволяет плавно переключаться между битрейтами в этом диапазоне для адаптивной доставки битрейта ( с использованием таких стандартов, как MPEG-DASH или HLS например, ). xHE-AAC также включает обязательную регулировку громкости MPEG-D DRC для воспроизведения контента на постоянной громкости и предлагает новые профили управления динамическим диапазоном для прослушивания в шумных ситуациях. [8]
Хотя декодеры xHE-AAC смогут декодировать потоки битов, созданные для предыдущих профилей семейства AAC, кодеры xHE-AAC обычно предназначены для кодирования типа аудиообъекта MPEG-D USAC (AOT 42) с метаданными громкости MPEG-D DRC. хотя некоторые из них могут поддерживать кодирование устаревших типов объектов AAC. [7]
xHE-AAC — обязательный аудиокодек стандарта Radio Mondiale . Digital [9] [10] [11] и является торговой маркой Fraunhofer. [7]
В апреле 2016 года компания Via Licensing объявила о запуске программы лицензирования патентного пула xHE-AAC на 2016 год. [12] В 2018 году xHE-AAC был включен в патентный пул AAC компании Via Licensing без дополнительных затрат. [8] [13]
В январе 2021 года Фраунгофер объявил о программе тестирования услуг и товарных знаков для xHE-AAC и объявил, что этот кодек используется Netflix. [14] [15] Netflix сообщил, что пользователи переключались с динамиков на наушники на 16% реже (из-за плохого качества звука или недостаточной громкости) при воспроизведении контента с высоким динамическим диапазоном при использовании xHE-AAC вместо HE-AAC. Netflix также пояснил, что xHE-AAC позволил им начать потоковую передачу звука с адаптивным битрейтом на устройства Android. [16] Фраунгофер также объявил о лицензиях xHE-AAC компании MainConcept. [17] Пойкософт, [18] и ЛГ. [19] xHE-AAC поддерживается упаковщиком Bento4 DASH/HLS. [20] В январе 2022 года компания MainConcept создала службу веб-кодирования для тестирования xHE-AAC. В октябре 2022 года декодирование xHE-AAC было добавлено на устройства Windows 11 и Xbox. [21]
Совместимость [ править ]
xHE-AAC поддерживается в Android начиная с Android Pie. [8] и в iOS начиная с iOS 13 . Было объявлено, что он будет добавлен в watchOS 7. [22] [23] и была лицензирована Microsoft . [24] Воспроизведение аудиофайлов xHE-AAC поддерживается в foobar2000 с использованием дополнительного декодера AAC. [25] В октябре 2022 года в Windows 11 добавлена поддержка xHE-AAC в обновлении 22H2 . [26]
См. также [ править ]
- Opus (кодек) - бесплатная альтернатива кодеку с низкой задержкой для аналогичного использования.
Ссылки [ править ]
- ^ МПЕГ. «Единое кодирование речи и звука» . Группа экспертов по движущимся изображениям . Проверено 11 ноября 2016 г.
- ^ «ISO/IEC DIS 23003-3. Информационные технологии. Аудиотехнологии MPEG. Часть 3. Унифицированное кодирование речи и звука» . 15 февраля 2011 г. Проверено 18 июля 2011 г.
- ^ «ISO/IEC 14496-3:2009/PDAM 3 – Транспорт унифицированного кодирования речи и звука (USAC)» . 30 июня 2011 г. Проверено 18 июля 2011 г.
- ^ Нойендорф; и др. (20 декабря 2013 г.), Унифицированный стандарт кодирования речи и аудио ISO/MPEG — стабильно высокое качество для всех типов контента и при всех скоростях передачи данных , получено 13 июня 2015 г.
- ^ Нойендорф; и др. (26 апреля 2012 г.), Унифицированное кодирование речи и аудио MPEG — стандарт ISO/MPEG для высокоэффективного аудиокодирования всех типов контента , получено 13 июня 2015 г.
- ^ Нойендорф, Макс; Мультрус, Маркус; Реттельбах, Николас; Фокс, Гийом; Робильяр, Жюльен; Лекомт, Джереми; Уайльд, Стивен; Байер, Стефан; Диш, Саша; Хельмрих, Кристиан; Лефевр, Рош; Гурне, Филипп; Бессетт, Бруно; Лапьер, Джимми; Кьёрлинг, Кристофер; Пурнхаген, Хайко; Виллемоэс, Ларс; Оомен, Вернер; Шуйерс, Эрик; Кикуири, Кей; Чинен, Тору; Норимацу, Такеши; Чонг, Кок Сенг; О, Ынми; Ким, Миён; Квакенбуш, Шайлер; Гриль, Бернхард (1 декабря 2013 г.). «Унифицированный стандарт кодирования речи и аудио ISO/MPEG — стабильно высокое качество для всех типов контента и при всех скоростях передачи данных» . Журнал Общества аудиоинженеров . 61 (12): 956–977. ISSN 0004-7554 .
- ↑ Перейти обратно: Перейти обратно: а б с «Программа товарных знаков xHE-AAC» . Институт интегральных микросхем Фраунгофера IIS . Проверено 11 февраля 2021 г.
- ↑ Перейти обратно: Перейти обратно: а б с «Программное обеспечение аудиокодека xHE-AAC от Fraunhofer расширяет встроенную поддержку AAC в Android P для лучшего качества при низких битрейтах» . Институт интегральных микросхем Фраунгофера IIS . Проверено 11 июля 2020 г.
- ^ «Техническая информация | Мир цифрового радио» . www.drm.org . Проверено 2 августа 2016 г.
- ^ «xHE-AAC» . Институт интегральных микросхем Фраунгофера IIS . Проверено 2 августа 2016 г.
- ^ xHE-AAC в цифровом мировом радио (DRM) (PDF) . Фраунгофера ИИС. 2015.
- ^ «Via Licensing объявляет о расширении высокоэффективного патентного пула AAC — Via Corp» . www.via-corp.com . Проверено 2 августа 2016 г.
- ^ «Via добавляет MPEG-D DRC в патентный пул усовершенствованного аудиокодирования – ViaCorp» . Проверено 11 июля 2020 г.
- ^ «Fraunhofer IIS представляет новую службу тестирования и программу товарных знаков для аудиокодека xHE-AAC» . www.businesswire.com . 12 января 2021 г. Проверено 13 января 2021 г.
- ^ «Netflix теперь осуществляет потоковую передачу с аудио xHE-AAC Фраунгофера на мобильном устройстве Android» . www.businesswire.com . 12 января 2021 г. Проверено 13 января 2021 г.
- ^ Блог, Netflix Technology (21 января 2021 г.). «Оптимизация звука на устройствах Android с помощью xHE-AAC» . Середина . Проверено 26 января 2021 г.
- ^ «MainConcept запускает плагин кодирования xHE-AAC FFmpeg на основе программного обеспечения аудиокодека от Fraunhofer - Fraunhofer Audio Blog» . Проверено 6 октября 2021 г.
- ^ «Аудио конвертер EZ CD от Poikosoft теперь поддерживает аудиокодек xHE-AAC от Fraunhofer IIS — аудиоблог Fraunhofer» . Проверено 6 октября 2021 г.
- ^ «LG Electronics лицензирует программное обеспечение аудиокодеков xHE-AAC и AAC-ELD у Fraunhofer IIS — Fraunhofer Audio Blog» . Проверено 6 октября 2021 г.
- ^ «Аудиокодек xHE-AAC, поддерживаемый Bento4 DASH/HLS Packager — аудиоблог Fraunhofer» . Проверено 6 октября 2021 г.
- ^ «Аудиокодек xHE-AAC теперь в Windows 11 — аудиоблог Fraunhofer» . Проверено 20 октября 2022 г.
- ^ «Apple рекомендует xHE-AAC для потоковой передачи всех аудиоресурсов — аудиоблог Fraunhofer» . Проверено 11 июля 2020 г.
- ^ «Что нового в потоковой передаче звука для Apple Watch — WWDC 2020 — Видео» . Разработчик Apple . Проверено 11 июля 2020 г.
- ^ «Fraunhofer IIS лицензирует программное обеспечение аудиокодека xHE-AAC для Microsoft — Fraunhofer Audio Blog» . Проверено 11 июля 2020 г.
- ^ код54. «декодер пакетов fdk-aac» . Проверено 14 декабря 2020 г.
{{cite web}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ «Аудиокодек xHE-AAC теперь в Windows 11» . 20 октября 2022 г. Проверено 20 апреля 2024 г.