Jump to content

MPEG объемный звук

MPEG Surround ( ISO / IEC 23003-1) [1] или MPEG-D, часть 1 [2] [3] ), также известное как пространственное аудиокодирование (SAC). [4] [5] [6] [7] — это с потерями сжатия формат для объемного звука , который обеспечивает метод расширения услуг моно- или стереозвука для многоканального звука с обратной совместимостью. Общая скорость передачи данных , используемая для ядра (моно или стерео) и данных MPEG Surround, обычно лишь немного выше, чем скорость передачи данных , используемая для кодирования ядра (моно или стерео).MPEG Surround добавляет поток дополнительной информации к основному битовому потоку (моно или стерео) , содержащему данные пространственного изображения. Устаревшие системы стереовоспроизведения будут игнорировать эту дополнительную информацию, в то время как проигрыватели, поддерживающие декодирование MPEG Surround, будут выводить восстановленный многоканальный звук.

Группа экспертов по движущимся изображениям (MPEG) объявила конкурс предложений по пространственному кодированию звука MPEG в марте 2004 года. Группа решила, что технология, которая станет отправной точкой в ​​процессе стандартизации, будет представлять собой комбинацию предложений от двух сторонников - Fraunhofer IIS. / Agere Systems и технологии кодирования / Philips. [5] Стандарт MPEG Surround был разработан Группой экспертов по движущимся изображениям ( ISO/IEC JTC 1 /SC29/WG11) и опубликован как ISO/IEC 23003 в 2007 году. [1] Это был первый стандарт группы стандартов MPEG-D, официально известный как ISO/IEC 23003 — аудиотехнологии MPEG .

MPEG Surround также был определен как один из типов аудиообъектов MPEG-4 в 2007 году. [8] Существует также тип объекта MPEG-4 No Delay MPEG Surround (LD MPEG Surround), который был опубликован в 2010 году. [9] [10] Кодирование пространственных аудиообъектов (SAOC) было опубликовано как MPEG-D Part 2 — ISO/IEC 23003–2 в 2010 году и расширяет стандарт MPEG Surround за счет повторного использования его возможностей пространственного рендеринга, сохраняя при этом полную совместимость с существующими приемниками. Система MPEG SAOC позволяет пользователям на стороне декодирования интерактивно управлять рендерингом каждого отдельного аудиообъекта (например, отдельных инструментов, вокала, человеческих голосов). [2] [3] [11] [12] [13] [14] [15] Существует также унифицированное кодирование речи и звука (USAC), которое будет определено в MPEG-D Part 3 — ISO/IEC 23003-3 и ISO/IEC 14496-3:2009/Amd 3. [16] [17] MPEG-D Инструменты параметрического кодирования MPEG Surround интегрированы в кодек USAC. [18]

Ядро (моно или стерео) может быть закодировано с помощью любого ( с потерями или без потерь ) аудиокодека . Особенно низкие скорости передачи данных (64–96 кбит/с для каналов 5.1) возможны при использовании HE-AAC v2 в качестве основного кодека.

Восприятие звуков в космосе [ править ]

Кодирование MPEG Surround использует нашу способность воспринимать звук в 3D и фиксирует это восприятие в компактном наборе параметров. Пространственное восприятие в первую очередь объясняется тремя параметрами или сигналами, описывающими, как люди локализуют звук в горизонтальной плоскости: межушная разница уровней (ILD), межушная разница во времени (ITD) и межушная когерентность (IC). Эти три концепции проиллюстрированы на следующем изображении. Прямые, или первичные, сигналы от источника вовремя достигают левого уха, в то время как прямой звук, принимаемый правым ухом, дифрагируется вокруг головы, что связано с временной задержкой и затуханием уровня. Эти два эффекта приводят к тому, что ITD и ILD связаны с основным источником. Наконец, в реверберирующей среде отраженный звук от источника, звук от рассеянного источника или некоррелированный звук могут поразить оба уха, все они связаны с IC. Рисунок 1. Иллюстрация ILD, ITD и IC

Описание [ править ]

MPEG Surround использует межканальные различия в уровне, фазе и когерентности, эквивалентные параметрам ILD, ITD и IC. Пространственное изображение захватывается многоканальным аудиосигналом относительно передаваемого сигнала понижающего микширования. Эти параметры кодируются в очень компактной форме, чтобы декодировать параметры и передаваемый сигнал и синтезировать высококачественное многоканальное представление.

Принципы кодирования MPEG Surround

, где количество входных каналов равно N. Кодер MPEG Surround принимает многоканальный аудиосигнал от x1 до xN Наиболее важным аспектом процесса кодирования является то, что сигнал понижающего микширования xt1 и xt2, который обычно является стереофоническим, получается из многоканального входного сигнала, и именно этот сигнал понижающего микширования сжимается для передачи по каналу, а не многоканальный сигнал. . Кодер может иметь возможность использовать процесс понижающего микширования, чтобы получить больше преимуществ. Он не только создает точный эквивалент многоканального сигнала в моно- или стереофоническом микшировании, но также обеспечивает наилучшее многоканальное декодирование на основе понижающего микширования и закодированных пространственных сигналов. В качестве альтернативы, микширование может быть выполнено извне (художественное микширование перед блоком диаграммы). Процесс кодирования MPEG Surround может игнорироваться алгоритмом сжатия, используемым для передаваемых каналов (аудиокодер и аудиодекодер перед блоком диаграммы). Это может быть любой тип высокопроизводительных алгоритмов сжатия, например MPEG-1 Layer III, MPEG-4 AAC или MPEG-4 High Efficiency AAC, или даже PCM.

Пространственные сигналы генерируются и восстанавливаются в двух типах модулей фильтров. Обратный OTT (один к двум) генерирует один поток микширования, одну разность уровней, одно значение когерентности и дополнительный сигнал остатка из одной пары сигналов. Элемент обратного ТТТ (два к трем) генерирует два потока микширования, две разности уровней, одно значение когерентности и дополнительный сигнал остатка. Как в прямом (декодирование), так и в обратном (кодирование) направлениях расположение этих фильтров в виде дерева позволяет выполнять произвольное понижающее микширование и восстановление. [19]

Совместимость с устаревшими версиями [ править ]

Технология MPEG Surround обеспечивает совместимость с существующими и будущими стереодекодерами MPEG, поскольку передаваемое понижающее микширование (например, стерео) представляется стереодекодерам MPEG обычной стереоверсией многоканального сигнала. Совместимость со стереодекодерами желательна, поскольку стереопредставление останется распространенным из-за большого количества приложений, в которых прослушивание осуществляется в основном через наушники, таких как портативные музыкальные плееры.

MPEG Surround также поддерживает режим, в котором понижающее микширование совместимо с популярными матричными декодерами объемного звучания, такими как Dolby Pro-Logic . [19]

Приложения [ править ]

аудиовещание Цифровое

Из-за относительно небольшой полосы пропускания канала, относительно большой стоимости передающего оборудования и лицензий на передачу, а также желания максимизировать выбор пользователя за счет предоставления большого количества программ, большинство существующих или планируемых систем цифрового вещания не могут обеспечить пользователям многоканальный звук.

DRM+ был разработан [20] быть полностью способным передавать MPEG Surround, и такое вещание также было успешно продемонстрировано. [21]

Обратная совместимость MPEG Surround и относительно низкие накладные расходы обеспечивают один из способов добавления многоканального звука в DAB без серьезного снижения качества звука или влияния на другие услуги.

Цифровое телевещание [ править ]

В настоящее время большинство цифровых телепередач используют кодирование стереозвука. MPEG Surround можно использовать для расширения этих существующих услуг на объемный звук, как в случае с DAB.

Сервис загрузки музыки [ править ]

В настоящее время существует ряд коммерческих служб загрузки музыки, которые работают со значительным коммерческим успехом. Такие услуги могут быть легко расширены для обеспечения многоканальных презентаций, оставаясь при этом совместимыми со стереоплеерами: на компьютерах с 5.1-канальными системами воспроизведения сжатые звуковые файлы воспроизводятся с объемным звуком, а на портативных плеерах те же файлы воспроизводятся в стереофоническом режиме.

Сервис потоковой музыки/Интернет-радио [ править ]

Многие интернет-радио работают с сильно ограниченной полосой пропускания, поэтому могут предлагать только моно- или стереоконтент. Технология MPEG Surround Coding может распространить это на многоканальную услугу, оставаясь при этом в допустимом рабочем диапазоне битрейта. Поскольку эффективность имеет первостепенное значение в этом приложении, сжатие передаваемого аудиосигнала имеет жизненно важное значение. Используя новейшую технологию сжатия MPEG (кодирование профиля высокой эффективности MPEG-4), были продемонстрированы системы полного объемного звучания MPEG со скоростью передачи данных всего 48 кбит/с.

См. также [ править ]

Ссылки [ править ]

  1. ^ Jump up to: Перейти обратно: а б ИСО (29 января 2007 г.). «ISO/IEC 23003-1:2007. Информационные технологии. Аудиотехнологии MPEG. Часть 1. MPEG Surround» . ИСО. Архивировано из оригинала 6 июня 2011 г. Проверено 24 октября 2009 г.
  2. ^ Jump up to: Перейти обратно: а б МПЕГ. «Стандарты MPEG — Полный список стандартов, разработанных или находящихся в разработке» . chiariglione.org. Архивировано из оригинала 20 апреля 2010 г. Проверено 9 февраля 2010 г.
  3. ^ Jump up to: Перейти обратно: а б МПЕГ. «Техническое задание» . chiariglione.org. Архивировано из оригинала 21 февраля 2010 г. Проверено 9 февраля 2010 г.
  4. ^ «Предварительный просмотр ISO/IEC 23003-1, первое издание, 15 февраля 2007 г., Часть 1: MPEG Surround» (PDF) . 15 февраля 2007 г. Архивировано (PDF) из оригинала 14 июня 2011 г. Проверено 24 октября 2009 г.
  5. ^ Jump up to: Перейти обратно: а б ISO/IEC JTC 1/SC29/WG11 (июль 2005 г.). «Учебное пособие по кодированию объемного звука MPEG» . Архивировано из оригинала 30 апреля 2010 г. Проверено 9 февраля 2010 г. {{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )
  6. ^ «Рабочая документация MPEG-D (MPEG Audio Technologies)» . МПЕГ. Архивировано из оригинала 21 февраля 2010 г. Проверено 9 февраля 2010 г.
  7. ^ Пространственное аудиокодирование MPEG / MPEG Surround: обзор и текущий статус (PDF) , Audio Engineering Society, 2005 г., заархивировано (PDF) из оригинала 18 июля 2011 г. , получено 29 октября 2009 г.
  8. ^ ИСО (2007). «Расширения BSAC и транспортировка MPEG Surround, ISO/IEC 14496-3:2005/Amd 5:2007» . ИСО. Архивировано из оригинала 6 июня 2011 г. Проверено 13 октября 2009 г.
  9. ^ Документ конвенции AES 8099 — новое параметрическое стерео и многоканальное расширение для MPEG-4 Enhanced Low Delay AAC (AAC-ELD) (PDF) , заархивировано из оригинала (PDF) 28 сентября 2011 г. , получено 18 июля 2011 г.
  10. ^ ISO/IEC JTC 1/SC29/WG11 (октябрь 2009 г.), ISO/IEC 14496-3:2009/FPDAM 2 – Простой профиль ALS и транспортировка SAOC, N11032 , заархивировано из оригинала (DOC) 29 июля 2014 г. , получено 30 декабря 2009 г. {{citation}}: CS1 maint: числовые имена: список авторов ( ссылка )
  11. ^ ИСО (06.10.2010). «ISO/IEC 23003-2 – Информационные технологии – Аудиотехнологии MPEG – Часть 2: Пространственное кодирование аудиообъектов (SAOC)» . Архивировано из оригинала 1 февраля 2012 г. Проверено 18 июля 2011 г.
  12. ^ Пространственное кодирование аудиообъектов (SAOC) - будущий стандарт MPEG по параметрическому объектно-ориентированному аудиокодированию (PDF) , 2008 г., заархивировано (PDF) из оригинала 12 марта 2012 г. , получено 19 июля 2011 г.
  13. ^ Манфред Луцки, Fraunhofer IIS (2007), аудиокодеки MPEG с низкой задержкой (PDF) , заархивировано (PDF) из оригинала 27 сентября 2011 г. , получено 19 июля 2011 г.
  14. ^ MPEG (октябрь 2009 г.). «Уведомление о 91-м заседании РГ11» . chiariglione.org. Архивировано из оригинала 17 февраля 2010 г. Проверено 9 февраля 2010 г.
  15. ^ ISO/IEC JTC 1/SC 29 (30 декабря 2009 г.). «Программа работы (распределена ПК 29/РГ 11) – MPEG-D» . Архивировано из оригинала 31 декабря 2013 г. Проверено 30 декабря 2009 г. {{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )
  16. ^ «ISO/IEC DIS 23003-3. Информационные технологии. Аудиотехнологии MPEG. Часть 3. Унифицированное кодирование речи и звука» . 15 февраля 2011 г. Архивировано из оригинала 28 января 2012 г. Проверено 18 июля 2011 г.
  17. ^ «ISO/IEC 14496-3:2009/PDAM 3 – Транспорт унифицированного кодирования речи и звука (USAC)» . 30 июня 2011 г. Архивировано из оригинала 29 января 2012 г. Проверено 18 июля 2011 г.
  18. ^ «Общее справочное программное обеспечение Unified Speech and Audio Coder» . Март 2011 г. Архивировано из оригинала 6 августа 2011 г. Проверено 18 июля 2011 г.
  19. ^ Jump up to: Перейти обратно: а б Эрре, Юрген; Кьёрлинг, Кристофер; Брибарт, Йерун; Фаллер, Кристоф; Диш, Саша; Пурнхаген, Хайко; Коппенс, Йерун; Хилперт, Джон; Рёден, Йонас; Оомен, Вернер; Линцмайер, Карстен; Чонг, Кок Сен (8 декабря 2008 г.). «MPEG Surround — стандарт ISO/MPEG для эффективного и совместимого многоканального аудиокодирования» . Журнал Общества аудиоинженеров . 56 (11): 932–955. Абстрактный
  20. ^ «Усовершенствование системы DRM одобрено ETSI» (пресс-релиз). Консорциум DRM. 2 сентября 2009 г. Архивировано из оригинала 15 октября 2009 г. . Проверено 20 октября 2009 г.
  21. ^ «DRM+ в Band I продвигается как наиболее подходящая технология для дополнения других стандартов цифрового радио в таких странах, как Франция» (пресс-релиз). Консорциум DRM. 16 июля 2009 года. Архивировано из оригинала 15 октября 2009 года . Проверено 20 октября 2009 г.

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: db516ecbe11dbeec20a4a141cb10229a__1714071600
URL1:https://arc.ask3.ru/arc/aa/db/9a/db516ecbe11dbeec20a4a141cb10229a.html
Заголовок, (Title) документа по адресу, URL1:
MPEG Surround - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)