MPEG объемный звук
Эта статья нуждается в дополнительных цитатах для проверки . ( апрель 2009 г. ) |
MPEG Surround ( ISO / IEC 23003-1) [1] или MPEG-D, часть 1 [2] [3] ), также известное как пространственное аудиокодирование (SAC). [4] [5] [6] [7] — это с потерями сжатия формат для объемного звука , который обеспечивает метод расширения услуг моно- или стереозвука для многоканального звука с обратной совместимостью. Общая скорость передачи данных , используемая для ядра (моно или стерео) и данных MPEG Surround, обычно лишь немного выше, чем скорость передачи данных , используемая для кодирования ядра (моно или стерео).MPEG Surround добавляет поток дополнительной информации к основному битовому потоку (моно или стерео) , содержащему данные пространственного изображения. Устаревшие системы стереовоспроизведения будут игнорировать эту дополнительную информацию, в то время как проигрыватели, поддерживающие декодирование MPEG Surround, будут выводить восстановленный многоканальный звук.
Группа экспертов по движущимся изображениям (MPEG) объявила конкурс предложений по пространственному кодированию звука MPEG в марте 2004 года. Группа решила, что технология, которая станет отправной точкой в процессе стандартизации, будет представлять собой комбинацию предложений от двух сторонников - Fraunhofer IIS. / Agere Systems и технологии кодирования / Philips. [5] Стандарт MPEG Surround был разработан Группой экспертов по движущимся изображениям ( ISO/IEC JTC 1 /SC29/WG11) и опубликован как ISO/IEC 23003 в 2007 году. [1] Это был первый стандарт группы стандартов MPEG-D, официально известный как ISO/IEC 23003 — аудиотехнологии MPEG .
MPEG Surround также был определен как один из типов аудиообъектов MPEG-4 в 2007 году. [8] Существует также тип объекта MPEG-4 No Delay MPEG Surround (LD MPEG Surround), который был опубликован в 2010 году. [9] [10] Кодирование пространственных аудиообъектов (SAOC) было опубликовано как MPEG-D Part 2 — ISO/IEC 23003–2 в 2010 году и расширяет стандарт MPEG Surround за счет повторного использования его возможностей пространственного рендеринга, сохраняя при этом полную совместимость с существующими приемниками. Система MPEG SAOC позволяет пользователям на стороне декодирования интерактивно управлять рендерингом каждого отдельного аудиообъекта (например, отдельных инструментов, вокала, человеческих голосов). [2] [3] [11] [12] [13] [14] [15] Существует также унифицированное кодирование речи и звука (USAC), которое будет определено в MPEG-D Part 3 — ISO/IEC 23003-3 и ISO/IEC 14496-3:2009/Amd 3. [16] [17] MPEG-D Инструменты параметрического кодирования MPEG Surround интегрированы в кодек USAC. [18]
Ядро (моно или стерео) может быть закодировано с помощью любого ( с потерями или без потерь ) аудиокодека . Особенно низкие скорости передачи данных (64–96 кбит/с для каналов 5.1) возможны при использовании HE-AAC v2 в качестве основного кодека.
Восприятие звуков в космосе [ править ]
Кодирование MPEG Surround использует нашу способность воспринимать звук в 3D и фиксирует это восприятие в компактном наборе параметров. Пространственное восприятие в первую очередь объясняется тремя параметрами или сигналами, описывающими, как люди локализуют звук в горизонтальной плоскости: межушная разница уровней (ILD), межушная разница во времени (ITD) и межушная когерентность (IC). Эти три концепции проиллюстрированы на следующем изображении. Прямые, или первичные, сигналы от источника вовремя достигают левого уха, в то время как прямой звук, принимаемый правым ухом, дифрагируется вокруг головы, что связано с временной задержкой и затуханием уровня. Эти два эффекта приводят к тому, что ITD и ILD связаны с основным источником. Наконец, в реверберирующей среде отраженный звук от источника, звук от рассеянного источника или некоррелированный звук могут поразить оба уха, все они связаны с IC.
Описание [ править ]
MPEG Surround использует межканальные различия в уровне, фазе и когерентности, эквивалентные параметрам ILD, ITD и IC. Пространственное изображение захватывается многоканальным аудиосигналом относительно передаваемого сигнала понижающего микширования. Эти параметры кодируются в очень компактной форме, чтобы декодировать параметры и передаваемый сигнал и синтезировать высококачественное многоканальное представление.
, где количество входных каналов равно N. Кодер MPEG Surround принимает многоканальный аудиосигнал от x1 до xN Наиболее важным аспектом процесса кодирования является то, что сигнал понижающего микширования xt1 и xt2, который обычно является стереофоническим, получается из многоканального входного сигнала, и именно этот сигнал понижающего микширования сжимается для передачи по каналу, а не многоканальный сигнал. . Кодер может иметь возможность использовать процесс понижающего микширования, чтобы получить больше преимуществ. Он не только создает точный эквивалент многоканального сигнала в моно- или стереофоническом микшировании, но также обеспечивает наилучшее многоканальное декодирование на основе понижающего микширования и закодированных пространственных сигналов. В качестве альтернативы, микширование может быть выполнено извне (художественное микширование перед блоком диаграммы). Процесс кодирования MPEG Surround может игнорироваться алгоритмом сжатия, используемым для передаваемых каналов (аудиокодер и аудиодекодер перед блоком диаграммы). Это может быть любой тип высокопроизводительных алгоритмов сжатия, например MPEG-1 Layer III, MPEG-4 AAC или MPEG-4 High Efficiency AAC, или даже PCM.
Пространственные сигналы генерируются и восстанавливаются в двух типах модулей фильтров. Обратный OTT (один к двум) генерирует один поток микширования, одну разность уровней, одно значение когерентности и дополнительный сигнал остатка из одной пары сигналов. Элемент обратного ТТТ (два к трем) генерирует два потока микширования, две разности уровней, одно значение когерентности и дополнительный сигнал остатка. Как в прямом (декодирование), так и в обратном (кодирование) направлениях расположение этих фильтров в виде дерева позволяет выполнять произвольное понижающее микширование и восстановление. [19]
Совместимость с устаревшими версиями [ править ]
Технология MPEG Surround обеспечивает совместимость с существующими и будущими стереодекодерами MPEG, поскольку передаваемое понижающее микширование (например, стерео) представляется стереодекодерам MPEG обычной стереоверсией многоканального сигнала. Совместимость со стереодекодерами желательна, поскольку стереопредставление останется распространенным из-за большого количества приложений, в которых прослушивание осуществляется в основном через наушники, таких как портативные музыкальные плееры.
MPEG Surround также поддерживает режим, в котором понижающее микширование совместимо с популярными матричными декодерами объемного звучания, такими как Dolby Pro-Logic . [19]
Приложения [ править ]
аудиовещание Цифровое
Из-за относительно небольшой полосы пропускания канала, относительно большой стоимости передающего оборудования и лицензий на передачу, а также желания максимизировать выбор пользователя за счет предоставления большого количества программ, большинство существующих или планируемых систем цифрового вещания не могут обеспечить пользователям многоканальный звук.
DRM+ был разработан [20] быть полностью способным передавать MPEG Surround, и такое вещание также было успешно продемонстрировано. [21]
Обратная совместимость MPEG Surround и относительно низкие накладные расходы обеспечивают один из способов добавления многоканального звука в DAB без серьезного снижения качества звука или влияния на другие услуги.
Цифровое телевещание [ править ]
В настоящее время большинство цифровых телепередач используют кодирование стереозвука. MPEG Surround можно использовать для расширения этих существующих услуг на объемный звук, как в случае с DAB.
Сервис загрузки музыки [ править ]
В настоящее время существует ряд коммерческих служб загрузки музыки, которые работают со значительным коммерческим успехом. Такие услуги могут быть легко расширены для обеспечения многоканальных презентаций, оставаясь при этом совместимыми со стереоплеерами: на компьютерах с 5.1-канальными системами воспроизведения сжатые звуковые файлы воспроизводятся с объемным звуком, а на портативных плеерах те же файлы воспроизводятся в стереофоническом режиме.
Сервис потоковой музыки/Интернет-радио [ править ]
Многие интернет-радио работают с сильно ограниченной полосой пропускания, поэтому могут предлагать только моно- или стереоконтент. Технология MPEG Surround Coding может распространить это на многоканальную услугу, оставаясь при этом в допустимом рабочем диапазоне битрейта. Поскольку эффективность имеет первостепенное значение в этом приложении, сжатие передаваемого аудиосигнала имеет жизненно важное значение. Используя новейшую технологию сжатия MPEG (кодирование профиля высокой эффективности MPEG-4), были продемонстрированы системы полного объемного звучания MPEG со скоростью передачи данных всего 48 кбит/с.
См. также [ править ]
Ссылки [ править ]
- ^ Jump up to: Перейти обратно: а б ИСО (29 января 2007 г.). «ISO/IEC 23003-1:2007. Информационные технологии. Аудиотехнологии MPEG. Часть 1. MPEG Surround» . ИСО. Архивировано из оригинала 6 июня 2011 г. Проверено 24 октября 2009 г.
- ^ Jump up to: Перейти обратно: а б МПЕГ. «Стандарты MPEG — Полный список стандартов, разработанных или находящихся в разработке» . chiariglione.org. Архивировано из оригинала 20 апреля 2010 г. Проверено 9 февраля 2010 г.
- ^ Jump up to: Перейти обратно: а б МПЕГ. «Техническое задание» . chiariglione.org. Архивировано из оригинала 21 февраля 2010 г. Проверено 9 февраля 2010 г.
- ^ «Предварительный просмотр ISO/IEC 23003-1, первое издание, 15 февраля 2007 г., Часть 1: MPEG Surround» (PDF) . 15 февраля 2007 г. Архивировано (PDF) из оригинала 14 июня 2011 г. Проверено 24 октября 2009 г.
- ^ Jump up to: Перейти обратно: а б ISO/IEC JTC 1/SC29/WG11 (июль 2005 г.). «Учебное пособие по кодированию объемного звука MPEG» . Архивировано из оригинала 30 апреля 2010 г. Проверено 9 февраля 2010 г.
{{cite web}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ «Рабочая документация MPEG-D (MPEG Audio Technologies)» . МПЕГ. Архивировано из оригинала 21 февраля 2010 г. Проверено 9 февраля 2010 г.
- ^ Пространственное аудиокодирование MPEG / MPEG Surround: обзор и текущий статус (PDF) , Audio Engineering Society, 2005 г., заархивировано (PDF) из оригинала 18 июля 2011 г. , получено 29 октября 2009 г.
- ^ ИСО (2007). «Расширения BSAC и транспортировка MPEG Surround, ISO/IEC 14496-3:2005/Amd 5:2007» . ИСО. Архивировано из оригинала 6 июня 2011 г. Проверено 13 октября 2009 г.
- ^ Документ конвенции AES 8099 — новое параметрическое стерео и многоканальное расширение для MPEG-4 Enhanced Low Delay AAC (AAC-ELD) (PDF) , заархивировано из оригинала (PDF) 28 сентября 2011 г. , получено 18 июля 2011 г.
- ^ ISO/IEC JTC 1/SC29/WG11 (октябрь 2009 г.), ISO/IEC 14496-3:2009/FPDAM 2 – Простой профиль ALS и транспортировка SAOC, N11032 , заархивировано из оригинала (DOC) 29 июля 2014 г. , получено 30 декабря 2009 г.
{{citation}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ ИСО (06.10.2010). «ISO/IEC 23003-2 – Информационные технологии – Аудиотехнологии MPEG – Часть 2: Пространственное кодирование аудиообъектов (SAOC)» . Архивировано из оригинала 1 февраля 2012 г. Проверено 18 июля 2011 г.
- ^ Пространственное кодирование аудиообъектов (SAOC) - будущий стандарт MPEG по параметрическому объектно-ориентированному аудиокодированию (PDF) , 2008 г., заархивировано (PDF) из оригинала 12 марта 2012 г. , получено 19 июля 2011 г.
- ^ Манфред Луцки, Fraunhofer IIS (2007), аудиокодеки MPEG с низкой задержкой (PDF) , заархивировано (PDF) из оригинала 27 сентября 2011 г. , получено 19 июля 2011 г.
- ^ MPEG (октябрь 2009 г.). «Уведомление о 91-м заседании РГ11» . chiariglione.org. Архивировано из оригинала 17 февраля 2010 г. Проверено 9 февраля 2010 г.
- ^ ISO/IEC JTC 1/SC 29 (30 декабря 2009 г.). «Программа работы (распределена ПК 29/РГ 11) – MPEG-D» . Архивировано из оригинала 31 декабря 2013 г. Проверено 30 декабря 2009 г.
{{cite web}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ «ISO/IEC DIS 23003-3. Информационные технологии. Аудиотехнологии MPEG. Часть 3. Унифицированное кодирование речи и звука» . 15 февраля 2011 г. Архивировано из оригинала 28 января 2012 г. Проверено 18 июля 2011 г.
- ^ «ISO/IEC 14496-3:2009/PDAM 3 – Транспорт унифицированного кодирования речи и звука (USAC)» . 30 июня 2011 г. Архивировано из оригинала 29 января 2012 г. Проверено 18 июля 2011 г.
- ^ «Общее справочное программное обеспечение Unified Speech and Audio Coder» . Март 2011 г. Архивировано из оригинала 6 августа 2011 г. Проверено 18 июля 2011 г.
- ^ Jump up to: Перейти обратно: а б Эрре, Юрген; Кьёрлинг, Кристофер; Брибарт, Йерун; Фаллер, Кристоф; Диш, Саша; Пурнхаген, Хайко; Коппенс, Йерун; Хилперт, Джон; Рёден, Йонас; Оомен, Вернер; Линцмайер, Карстен; Чонг, Кок Сен (8 декабря 2008 г.). «MPEG Surround — стандарт ISO/MPEG для эффективного и совместимого многоканального аудиокодирования» . Журнал Общества аудиоинженеров . 56 (11): 932–955. Абстрактный
- ^ «Усовершенствование системы DRM одобрено ETSI» (пресс-релиз). Консорциум DRM. 2 сентября 2009 г. Архивировано из оригинала 15 октября 2009 г. . Проверено 20 октября 2009 г.
- ^ «DRM+ в Band I продвигается как наиболее подходящая технология для дополнения других стандартов цифрового радио в таких странах, как Франция» (пресс-релиз). Консорциум DRM. 16 июля 2009 года. Архивировано из оригинала 15 октября 2009 года . Проверено 20 октября 2009 г.
Внешние ссылки [ править ]
- MPEG объемный звук
- Официальный веб-сайт MPEG
- RFC 5691 — формат полезной нагрузки RTP для элементарных потоков с многоканальным звуком MPEG Surround