MPEG объемный звук

MPEG Surround ( ISO / IEC 23003-1) ^[1] или MPEG-D, часть 1 ^[2]^[3]), также известное как пространственное аудиокодирование (SAC). ^[4]^[5]^[6]^[7] — это с потерями сжатия формат для объемного звука , который обеспечивает метод расширения услуг моно- или стереозвука для многоканального звука с обратной совместимостью. Общая скорость передачи данных , используемая для ядра (моно или стерео) и данных MPEG Surround, обычно лишь немного выше, чем скорость передачи данных , используемая для кодирования ядра (моно или стерео).MPEG Surround добавляет поток дополнительной информации к основному битовому потоку (моно или стерео) , содержащему данные пространственного изображения. Устаревшие системы стереовоспроизведения будут игнорировать эту дополнительную информацию, в то время как проигрыватели, поддерживающие декодирование MPEG Surround, будут выводить восстановленный многоканальный звук.

Группа экспертов по движущимся изображениям (MPEG) объявила конкурс предложений по пространственному кодированию звука MPEG в марте 2004 года. Группа решила, что технология, которая станет отправной точкой в процессе стандартизации, будет представлять собой комбинацию предложений от двух сторонников - Fraunhofer IIS. / Agere Systems и технологии кодирования / Philips. ^[5] Стандарт MPEG Surround был разработан Группой экспертов по движущимся изображениям ( ISO/IEC JTC 1 /SC29/WG11) и опубликован как ISO/IEC 23003 в 2007 году. ^[1] Это был первый стандарт группы стандартов MPEG-D, официально известный как ISO/IEC 23003 — аудиотехнологии MPEG .

MPEG Surround также был определен как один из типов аудиообъектов MPEG-4 в 2007 году. ^[8] Существует также тип объекта MPEG-4 No Delay MPEG Surround (LD MPEG Surround), который был опубликован в 2010 году. ^[9]^[10] Кодирование пространственных аудиообъектов (SAOC) было опубликовано как MPEG-D Part 2 — ISO/IEC 23003–2 в 2010 году и расширяет стандарт MPEG Surround за счет повторного использования его возможностей пространственного рендеринга, сохраняя при этом полную совместимость с существующими приемниками. Система MPEG SAOC позволяет пользователям на стороне декодирования интерактивно управлять рендерингом каждого отдельного аудиообъекта (например, отдельных инструментов, вокала, человеческих голосов). ^[2]^[3]^[11]^[12]^[13]^[14]^[15] Существует также унифицированное кодирование речи и звука (USAC), которое будет определено в MPEG-D Part 3 — ISO/IEC 23003-3 и ISO/IEC 14496-3:2009/Amd 3. ^[16]^[17] MPEG-D Инструменты параметрического кодирования MPEG Surround интегрированы в кодек USAC. ^[18]

Ядро (моно или стерео) может быть закодировано с помощью любого ( с потерями или без потерь ) аудиокодека . Особенно низкие скорости передачи данных (64–96 кбит/с для каналов 5.1) возможны при использовании HE-AAC v2 в качестве основного кодека.

Восприятие звуков в космосе [ править ]

Кодирование MPEG Surround использует нашу способность воспринимать звук в 3D и фиксирует это восприятие в компактном наборе параметров. Пространственное восприятие в первую очередь объясняется тремя параметрами или сигналами, описывающими, как люди локализуют звук в горизонтальной плоскости: межушная разница уровней (ILD), межушная разница во времени (ITD) и межушная когерентность (IC). Эти три концепции проиллюстрированы на следующем изображении. Прямые, или первичные, сигналы от источника вовремя достигают левого уха, в то время как прямой звук, принимаемый правым ухом, дифрагируется вокруг головы, что связано с временной задержкой и затуханием уровня. Эти два эффекта приводят к тому, что ITD и ILD связаны с основным источником. Наконец, в реверберирующей среде отраженный звук от источника, звук от рассеянного источника или некоррелированный звук могут поразить оба уха, все они связаны с IC.

Описание [ править ]

MPEG Surround использует межканальные различия в уровне, фазе и когерентности, эквивалентные параметрам ILD, ITD и IC. Пространственное изображение захватывается многоканальным аудиосигналом относительно передаваемого сигнала понижающего микширования. Эти параметры кодируются в очень компактной форме, чтобы декодировать параметры и передаваемый сигнал и синтезировать высококачественное многоканальное представление.

, где количество входных каналов равно N. Кодер MPEG Surround принимает многоканальный аудиосигнал от x1 до xN Наиболее важным аспектом процесса кодирования является то, что сигнал понижающего микширования xt1 и xt2, который обычно является стереофоническим, получается из многоканального входного сигнала, и именно этот сигнал понижающего микширования сжимается для передачи по каналу, а не многоканальный сигнал. . Кодер может иметь возможность использовать процесс понижающего микширования, чтобы получить больше преимуществ. Он не только создает точный эквивалент многоканального сигнала в моно- или стереофоническом микшировании, но также обеспечивает наилучшее многоканальное декодирование на основе понижающего микширования и закодированных пространственных сигналов. В качестве альтернативы, микширование может быть выполнено извне (художественное микширование перед блоком диаграммы). Процесс кодирования MPEG Surround может игнорироваться алгоритмом сжатия, используемым для передаваемых каналов (аудиокодер и аудиодекодер перед блоком диаграммы). Это может быть любой тип высокопроизводительных алгоритмов сжатия, например MPEG-1 Layer III, MPEG-4 AAC или MPEG-4 High Efficiency AAC, или даже PCM.

Пространственные сигналы генерируются и восстанавливаются в двух типах модулей фильтров. Обратный OTT (один к двум) генерирует один поток микширования, одну разность уровней, одно значение когерентности и дополнительный сигнал остатка из одной пары сигналов. Элемент обратного ТТТ (два к трем) генерирует два потока микширования, две разности уровней, одно значение когерентности и дополнительный сигнал остатка. Как в прямом (декодирование), так и в обратном (кодирование) направлениях расположение этих фильтров в виде дерева позволяет выполнять произвольное понижающее микширование и восстановление. ^[19]

Совместимость с устаревшими версиями [ править ]

Технология MPEG Surround обеспечивает совместимость с существующими и будущими стереодекодерами MPEG, поскольку передаваемое понижающее микширование (например, стерео) представляется стереодекодерам MPEG обычной стереоверсией многоканального сигнала. Совместимость со стереодекодерами желательна, поскольку стереопредставление останется распространенным из-за большого количества приложений, в которых прослушивание осуществляется в основном через наушники, таких как портативные музыкальные плееры.

MPEG Surround также поддерживает режим, в котором понижающее микширование совместимо с популярными матричными декодерами объемного звучания, такими как Dolby Pro-Logic . ^[19]

Приложения [ править ]

аудиовещание Цифровое

Из-за относительно небольшой полосы пропускания канала, относительно большой стоимости передающего оборудования и лицензий на передачу, а также желания максимизировать выбор пользователя за счет предоставления большого количества программ, большинство существующих или планируемых систем цифрового вещания не могут обеспечить пользователям многоканальный звук.

DRM+ был разработан ^[20] быть полностью способным передавать MPEG Surround, и такое вещание также было успешно продемонстрировано. ^[21]

Обратная совместимость MPEG Surround и относительно низкие накладные расходы обеспечивают один из способов добавления многоканального звука в DAB без серьезного снижения качества звука или влияния на другие услуги.

Цифровое телевещание [ править ]

В настоящее время большинство цифровых телепередач используют кодирование стереозвука. MPEG Surround можно использовать для расширения этих существующих услуг на объемный звук, как в случае с DAB.

Сервис загрузки музыки [ править ]

В настоящее время существует ряд коммерческих служб загрузки музыки, которые работают со значительным коммерческим успехом. Такие услуги могут быть легко расширены для обеспечения многоканальных презентаций, оставаясь при этом совместимыми со стереоплеерами: на компьютерах с 5.1-канальными системами воспроизведения сжатые звуковые файлы воспроизводятся с объемным звуком, а на портативных плеерах те же файлы воспроизводятся в стереофоническом режиме.

Сервис потоковой музыки/Интернет-радио [ править ]

Многие интернет-радио работают с сильно ограниченной полосой пропускания, поэтому могут предлагать только моно- или стереоконтент. Технология MPEG Surround Coding может распространить это на многоканальную услугу, оставаясь при этом в допустимом рабочем диапазоне битрейта. Поскольку эффективность имеет первостепенное значение в этом приложении, сжатие передаваемого аудиосигнала имеет жизненно важное значение. Используя новейшую технологию сжатия MPEG (кодирование профиля высокой эффективности MPEG-4), были продемонстрированы системы полного объемного звучания MPEG со скоростью передачи данных всего 48 кбит/с.

См. также [ править ]

Ссылки [ править ]

^ Jump up to: Перейти обратно: ^а ^б ИСО (29 января 2007 г.). «ISO/IEC 23003-1:2007. Информационные технологии. Аудиотехнологии MPEG. Часть 1. MPEG Surround» . ИСО. Архивировано из оригинала 6 июня 2011 г. Проверено 24 октября 2009 г.
^ Jump up to: Перейти обратно: ^а ^б МПЕГ. «Стандарты MPEG — Полный список стандартов, разработанных или находящихся в разработке» . chiariglione.org. Архивировано из оригинала 20 апреля 2010 г. Проверено 9 февраля 2010 г.
^ Jump up to: Перейти обратно: ^а ^б МПЕГ. «Техническое задание» . chiariglione.org. Архивировано из оригинала 21 февраля 2010 г. Проверено 9 февраля 2010 г.
^ «Предварительный просмотр ISO/IEC 23003-1, первое издание, 15 февраля 2007 г., Часть 1: MPEG Surround» (PDF) . 15 февраля 2007 г. Архивировано (PDF) из оригинала 14 июня 2011 г. Проверено 24 октября 2009 г.
^ Jump up to: Перейти обратно: ^а ^б ISO/IEC JTC 1/SC29/WG11 (июль 2005 г.). «Учебное пособие по кодированию объемного звука MPEG» . Архивировано из оригинала 30 апреля 2010 г. Проверено 9 февраля 2010 г. {{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )
^ «Рабочая документация MPEG-D (MPEG Audio Technologies)» . МПЕГ. Архивировано из оригинала 21 февраля 2010 г. Проверено 9 февраля 2010 г.
^ Пространственное аудиокодирование MPEG / MPEG Surround: обзор и текущий статус (PDF) , Audio Engineering Society, 2005 г., заархивировано (PDF) из оригинала 18 июля 2011 г. , получено 29 октября 2009 г.
^ ИСО (2007). «Расширения BSAC и транспортировка MPEG Surround, ISO/IEC 14496-3:2005/Amd 5:2007» . ИСО. Архивировано из оригинала 6 июня 2011 г. Проверено 13 октября 2009 г.
^ Документ конвенции AES 8099 — новое параметрическое стерео и многоканальное расширение для MPEG-4 Enhanced Low Delay AAC (AAC-ELD) (PDF) , заархивировано из оригинала (PDF) 28 сентября 2011 г. , получено 18 июля 2011 г.
^ ISO/IEC JTC 1/SC29/WG11 (октябрь 2009 г.), ISO/IEC 14496-3:2009/FPDAM 2 – Простой профиль ALS и транспортировка SAOC, N11032 , заархивировано из оригинала (DOC) 29 июля 2014 г. , получено 30 декабря 2009 г. {{citation}}: CS1 maint: числовые имена: список авторов ( ссылка )
^ ИСО (06.10.2010). «ISO/IEC 23003-2 – Информационные технологии – Аудиотехнологии MPEG – Часть 2: Пространственное кодирование аудиообъектов (SAOC)» . Архивировано из оригинала 1 февраля 2012 г. Проверено 18 июля 2011 г.
^ Пространственное кодирование аудиообъектов (SAOC) - будущий стандарт MPEG по параметрическому объектно-ориентированному аудиокодированию (PDF) , 2008 г., заархивировано (PDF) из оригинала 12 марта 2012 г. , получено 19 июля 2011 г.
^ Манфред Луцки, Fraunhofer IIS (2007), аудиокодеки MPEG с низкой задержкой (PDF) , заархивировано (PDF) из оригинала 27 сентября 2011 г. , получено 19 июля 2011 г.
^ MPEG (октябрь 2009 г.). «Уведомление о 91-м заседании РГ11» . chiariglione.org. Архивировано из оригинала 17 февраля 2010 г. Проверено 9 февраля 2010 г.
^ ISO/IEC JTC 1/SC 29 (30 декабря 2009 г.). «Программа работы (распределена ПК 29/РГ 11) – MPEG-D» . Архивировано из оригинала 31 декабря 2013 г. Проверено 30 декабря 2009 г. {{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )
^ «ISO/IEC DIS 23003-3. Информационные технологии. Аудиотехнологии MPEG. Часть 3. Унифицированное кодирование речи и звука» . 15 февраля 2011 г. Архивировано из оригинала 28 января 2012 г. Проверено 18 июля 2011 г.
^ «ISO/IEC 14496-3:2009/PDAM 3 – Транспорт унифицированного кодирования речи и звука (USAC)» . 30 июня 2011 г. Архивировано из оригинала 29 января 2012 г. Проверено 18 июля 2011 г.
^ «Общее справочное программное обеспечение Unified Speech and Audio Coder» . Март 2011 г. Архивировано из оригинала 6 августа 2011 г. Проверено 18 июля 2011 г.
^ Jump up to: Перейти обратно: ^а ^б Эрре, Юрген; Кьёрлинг, Кристофер; Брибарт, Йерун; Фаллер, Кристоф; Диш, Саша; Пурнхаген, Хайко; Коппенс, Йерун; Хилперт, Джон; Рёден, Йонас; Оомен, Вернер; Линцмайер, Карстен; Чонг, Кок Сен (8 декабря 2008 г.). «MPEG Surround — стандарт ISO/MPEG для эффективного и совместимого многоканального аудиокодирования» . Журнал Общества аудиоинженеров . 56 (11): 932–955. Абстрактный
^ «Усовершенствование системы DRM одобрено ETSI» (пресс-релиз). Консорциум DRM. 2 сентября 2009 г. Архивировано из оригинала 15 октября 2009 г. . Проверено 20 октября 2009 г.
^ «DRM+ в Band I продвигается как наиболее подходящая технология для дополнения других стандартов цифрового радио в таких странах, как Франция» (пресс-релиз). Консорциум DRM. 16 июля 2009 года. Архивировано из оригинала 15 октября 2009 года . Проверено 20 октября 2009 г.

Внешние ссылки [ править ]

MPEG объемный звук
Официальный веб-сайт MPEG
RFC 5691 — формат полезной нагрузки RTP для элементарных потоков с многоканальным звуком MPEG Surround

[iso23003-1] Jump up to: Перейти обратно: ^а ^б ИСО (29 января 2007 г.). «ISO/IEC 23003-1:2007. Информационные технологии. Аудиотехнологии MPEG. Часть 1. MPEG Surround» . ИСО. Архивировано из оригинала 6 июня 2011 г. Проверено 24 октября 2009 г.

[mpeg-standards-2] Jump up to: Перейти обратно: ^а ^б МПЕГ. «Стандарты MPEG — Полный список стандартов, разработанных или находящихся в разработке» . chiariglione.org. Архивировано из оригинала 20 апреля 2010 г. Проверено 9 февраля 2010 г.

[mpeg-terms-of-reference-3] Jump up to: Перейти обратно: ^а ^б МПЕГ. «Техническое задание» . chiariglione.org. Архивировано из оригинала 21 февраля 2010 г. Проверено 9 февраля 2010 г.

[4] «Предварительный просмотр ISO/IEC 23003-1, первое издание, 15 февраля 2007 г., Часть 1: MPEG Surround» (PDF) . 15 февраля 2007 г. Архивировано (PDF) из оригинала 14 июня 2011 г. Проверено 24 октября 2009 г.

[mpeg-surround-tutorial-5] Jump up to: Перейти обратно: ^а ^б ISO/IEC JTC 1/SC29/WG11 (июль 2005 г.). «Учебное пособие по кодированию объемного звука MPEG» . Архивировано из оригинала 30 апреля 2010 г. Проверено 9 февраля 2010 г. {{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )

[6] «Рабочая документация MPEG-D (MPEG Audio Technologies)» . МПЕГ. Архивировано из оригинала 21 февраля 2010 г. Проверено 9 февраля 2010 г.

[aes-sac-mpeg-surround-overview-7] Пространственное аудиокодирование MPEG / MPEG Surround: обзор и текущий статус (PDF) , Audio Engineering Society, 2005 г., заархивировано (PDF) из оригинала 18 июля 2011 г. , получено 29 октября 2009 г.

[8] ИСО (2007). «Расширения BSAC и транспортировка MPEG Surround, ISO/IEC 14496-3:2005/Amd 5:2007» . ИСО. Архивировано из оригинала 6 июня 2011 г. Проверено 13 октября 2009 г.

[9] Документ конвенции AES 8099 — новое параметрическое стерео и многоканальное расширение для MPEG-4 Enhanced Low Delay AAC (AAC-ELD) (PDF) , заархивировано из оригинала (PDF) 28 сентября 2011 г. , получено 18 июля 2011 г.

[saoc-ld-mpeg-surround-doc-10] ISO/IEC JTC 1/SC29/WG11 (октябрь 2009 г.), ISO/IEC 14496-3:2009/FPDAM 2 – Простой профиль ALS и транспортировка SAOC, N11032 , заархивировано из оригинала (DOC) 29 июля 2014 г. , получено 30 декабря 2009 г. {{citation}}: CS1 maint: числовые имена: список авторов ( ссылка )

[11] ИСО (06.10.2010). «ISO/IEC 23003-2 – Информационные технологии – Аудиотехнологии MPEG – Часть 2: Пространственное кодирование аудиообъектов (SAOC)» . Архивировано из оригинала 1 февраля 2012 г. Проверено 18 июля 2011 г.

[12] Пространственное кодирование аудиообъектов (SAOC) - будущий стандарт MPEG по параметрическому объектно-ориентированному аудиокодированию (PDF) , 2008 г., заархивировано (PDF) из оригинала 12 марта 2012 г. , получено 19 июля 2011 г.

[13] Манфред Луцки, Fraunhofer IIS (2007), аудиокодеки MPEG с низкой задержкой (PDF) , заархивировано (PDF) из оригинала 27 сентября 2011 г. , получено 19 июля 2011 г.

[14] MPEG (октябрь 2009 г.). «Уведомление о 91-м заседании РГ11» . chiariglione.org. Архивировано из оригинала 17 февраля 2010 г. Проверено 9 февраля 2010 г.

[15] ISO/IEC JTC 1/SC 29 (30 декабря 2009 г.). «Программа работы (распределена ПК 29/РГ 11) – MPEG-D» . Архивировано из оригинала 31 декабря 2013 г. Проверено 30 декабря 2009 г. {{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )

[16] «ISO/IEC DIS 23003-3. Информационные технологии. Аудиотехнологии MPEG. Часть 3. Унифицированное кодирование речи и звука» . 15 февраля 2011 г. Архивировано из оригинала 28 января 2012 г. Проверено 18 июля 2011 г.

[17] «ISO/IEC 14496-3:2009/PDAM 3 – Транспорт унифицированного кодирования речи и звука (USAC)» . 30 июня 2011 г. Архивировано из оригинала 29 января 2012 г. Проверено 18 июля 2011 г.

[18] «Общее справочное программное обеспечение Unified Speech and Audio Coder» . Март 2011 г. Архивировано из оригинала 6 августа 2011 г. Проверено 18 июля 2011 г.

[Herre-19] Jump up to: Перейти обратно: ^а ^б Эрре, Юрген; Кьёрлинг, Кристофер; Брибарт, Йерун; Фаллер, Кристоф; Диш, Саша; Пурнхаген, Хайко; Коппенс, Йерун; Хилперт, Джон; Рёден, Йонас; Оомен, Вернер; Линцмайер, Карстен; Чонг, Кок Сен (8 декабря 2008 г.). «MPEG Surround — стандарт ISO/MPEG для эффективного и совместимого многоканального аудиокодирования» . Журнал Общества аудиоинженеров . 56 (11): 932–955. Абстрактный

[20] «Усовершенствование системы DRM одобрено ETSI» (пресс-релиз). Консорциум DRM. 2 сентября 2009 г. Архивировано из оригинала 15 октября 2009 г. . Проверено 20 октября 2009 г.

[21] «DRM+ в Band I продвигается как наиболее подходящая технология для дополнения других стандартов цифрового радио в таких странах, как Франция» (пресс-релиз). Консорциум DRM. 16 июля 2009 года. Архивировано из оригинала 15 октября 2009 года . Проверено 20 октября 2009 г.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

v т и MPEG (Группа экспертов по движущимся изображениям)
MPEG-1 2 3 4 7 21 A B C D E G V M U H I 5
MPEG-1 Parts	Part 1: Systems Program stream Part 2: Video based on H.261 Part 3: Audio Layer I Layer II Layer III
MPEG-2 Parts	Part 1: Systems (H.222.0) Transport stream Program stream Part 2: Video (H.262) Part 3: Audio Layer I Layer II Layer III MPEG Multichannel Part 6: DSM CC Part 7: Advanced Audio Coding
MPEG-4 Parts	Part 2: Video based on H.263 Part 3: Audio Part 6: DMIF Part 10: Advanced Video Coding (H.264) Part 11: Scene description Part 12: ISO base media file format Part 14: MP4 file format Part 17: Streaming text format Part 20: LASeR Part 22: Open Font Format Part 33: Internet Video Coding
MPEG-7 Parts	Part 2: Description definition language
MPEG-21 Parts	Parts 2, 3 and 9: Digital Item Part 5: Rights Expression Language
MPEG-D Parts	Part 1: MPEG Surround Part 3: Unified Speech and Audio Coding
MPEG-G Parts	Part 1: Transport and Storage of Genomic Information Part 2: Coding of Genomic Information Part 3: APIs Part 4: Reference Software Part 5: Conformance
MPEG-H Parts	Part 1: MPEG media transport Part 2: High Efficiency Video Coding (H.265) Part 3: MPEG-H 3D Audio Part 12: High Efficiency Image File Format
MPEG-I Parts	Part 3: Versatile Video Coding (H.266)
MPEG-5 Parts	Part 1: Essential Video Coding Part 2: Low Complexity Enhancement Video Coding
Other	MPEG-DASH