Jump to content

Амбисоника

(Перенаправлено с Ambisonic )

Бывшая торговая марка Ambisonics

Ambisonics — это формат полносферного объемного звучания : помимо горизонтальной плоскости он охватывает источники звука выше и ниже слушателя. [1]

В отличие от некоторых других форматов многоканального объемного звучания, его каналы передачи не передают сигналы динамиков. Вместо этого они содержат независимое от динамика представление звукового поля, называемое B-форматом , которое затем декодируется в соответствии с настройкой динамика слушателя. Этот дополнительный шаг позволяет продюсеру думать о направлениях источников, а не о положении громкоговорителей, и предлагает слушателю значительную степень гибкости в отношении расположения и количества громкоговорителей, используемых для воспроизведения.

Ambisonics была разработана в Великобритании в 1970-х годах под эгидой Британской национальной корпорации исследований и развития .

Несмотря на прочную техническую базу и множество преимуществ, компания Ambisonics до недавнего времени не имела возможности [ когда? ] имел коммерческий успех и выжил только в нишевых приложениях и среди энтузиастов звукозаписи.

Благодаря широкой доступности мощной цифровой обработки сигналов (в отличие от дорогих и подверженных ошибкам аналоговых схем, которые приходилось использовать в первые годы) и успешному внедрению на рынок систем объемного звучания для домашних кинотеатров с 1990-х годов, интерес к Ambisonics среди инженеров звукозаписи, звукорежиссеров, композиторов, медиа-компаний, телерадиовещателей и исследователей вернулось и продолжает расти.

В частности, он оказался эффективным способом представления пространственного звука в приложениях виртуальной реальности (например, YouTube 360 ​​Video), поскольку сцену B-формата можно повернуть в соответствии с ориентацией головы пользователя, а затем декодировать как бинауральное стерео.

Введение

[ редактировать ]

Ambisonics можно понимать как трехмерное расширение стереофонического звука M/S (mid/side) , добавляющее дополнительные каналы различия по высоте и глубине. Результирующий набор сигналов называется B-форматом . Его составляющие каналы помечены для звукового давления (М в M/S), для градиента звукового давления спереди минус сзади, для левого-минус-правого (S в M/S) и для вверх-минус-вниз. [примечание 1]

The сигнал соответствует всенаправленному микрофону, тогда как — это компоненты, которые будут улавливаться капсулами в форме восьмерки, ориентированными вдоль трех пространственных осей.

Панорамирование источника

[ редактировать ]

Простой паннер Ambisonic (или кодер ) принимает исходный сигнал. и два параметра: горизонтальный угол и угол возвышения . Он позиционирует источник под нужным углом, распределяя сигнал по компонентам Ambisonic с разным усилением:

Будучи всенаправленным, канал всегда получает один и тот же постоянный входной сигнал, независимо от углов. Чтобы он имел более или менее такую ​​же среднюю энергию, как и другие каналы, W ослабляется примерно на 3 дБ (точнее, делится на квадратный корень из двух). [2] Условия для фактически создают диаграммы направленности микрофонов в форме восьмерки (см. иллюстрацию справа, второй ряд). Мы принимаем их значение в и и умножьте результат на входной сигнал. В результате входной сигнал во всех компонентах звучит ровно настолько громко, насколько его мог бы уловить соответствующий микрофон.

Виртуальные микрофоны

[ редактировать ]
Преобразование между различными шаблонами виртуальных микрофонов

Компоненты формата B можно комбинировать для получения виртуальных микрофонов с любой диаграммой направленности первого порядка (всенаправленной, кардиоидной, гиперкардиоидной, восьмерочной или любой промежуточной), направленной в любом направлении. Одновременно можно использовать несколько таких микрофонов с разными параметрами для создания совпадающих стереопар (например, Blumlein ) или массивов объемного звучания.

Шаблон
восьмерка
Гипер- и суперкардиоиды
Кардиоида
Широкие кардиоиды
Всенаправленный

Горизонтальный виртуальный микрофон под горизонтальным углом с рисунком дается

.

Этот виртуальный микрофон нормализован по свободному полю , что означает, что он имеет постоянное усиление, равное единице, для звуков, расположенных по оси. На рисунке слева показано несколько примеров, созданных с помощью этой формулы.

Виртуальными микрофонами можно манипулировать на этапе постобработки: можно выбирать нужные звуки, подавлять нежелательные, а баланс между прямым и реверберирующим звуком можно точно настроить во время микширования.

Декодирование

[ редактировать ]
Наивный однополосный синфазный декодер для акустической системы квадратной формы.

Базовый декодер Ambisonic очень похож на набор виртуальных микрофонов. Для идеально регулярных схем можно создать упрощенный декодер, направив виртуальный кардиоидный микрофон в направлении каждого динамика. Вот квадрат:

Признаки и Компоненты — важная часть, остальные — коэффициенты усиления. Компонент отброшен, поскольку невозможно воспроизвести сигналы высоты всего четырьмя громкоговорителями в одной плоскости.

На практике настоящий декодер Ambisonic требует ряда психоакустических оптимизаций для правильной работы. [3]

Частотно-зависимое декодирование также можно использовать для создания бинаурального стерео; это особенно актуально в приложениях виртуальной реальности.

Амбисоник высшего порядка

[ редактировать ]
Визуальное представление компонентов Ambisonic B-формата до третьего порядка. Темные участки представляют собой области, в которых полярность инвертирована. Обратите внимание, что первые две строки соответствуют диаграммам направленности всенаправленного и восьмерочного микрофона.

Пространственное разрешение Ambisonics первого порядка, как описано выше, довольно низкое. На практике это означает слегка размытые источники, но также и сравнительно небольшую полезную зону прослушивания или зону наилучшего восприятия . Разрешение можно увеличить, а зону наилучшего восприятия увеличить, добавив в B-формат группы более избирательных направленных компонентов. Они больше не соответствуют диаграммам направленности обычных микрофонов, а скорее напоминают листья клевера. Результирующий набор сигналов затем называется амбисоникой второго , третьего или вместе высшего порядка .

Для данного заказа полносферные системы требуют компоненты сигнала и компоненты необходимы для горизонтального воспроизведения.

Исторически сложилось так, что для Ambisonics высшего порядка существовало несколько различных соглашений о форматах; подробнее см. Форматы обмена данными Ambisonic .

Сравнение с другими форматами объемного звучания

[ редактировать ]

Ambisonics отличается от других форматов объемного звучания по ряду аспектов:

  • Ему требуется всего три канала для базового горизонтального объемного звучания и четыре канала для полносферного звукового поля. Для базового полносферного воспроизведения требуется минимум шесть громкоговорителей (минимум четыре для горизонтального воспроизведения).
  • Один и тот же программный материал может быть декодирован для разного количества громкоговорителей. Более того, смесь ширины и высоты может воспроизводиться только на горизонтальных, стерео или даже моносистемах без полной потери содержимого (она будет свернута в горизонтальную плоскость и во фронтальный квадрант соответственно). Это позволяет производителям осуществлять производство на высоте, не беспокоясь о потере информации.
  • Амбисонику можно масштабировать до любого желаемого пространственного разрешения за счет дополнительных каналов передачи и большего количества динамиков для воспроизведения. Материал более высокого порядка остается совместимым с обратной связью и может воспроизводиться с более низким пространственным разрешением без необходимости специального сведения.
  • Основная технология Ambisonics не защищена патентами, а полный набор инструментов для производства и прослушивания доступен в виде бесплатного программного обеспечения для всех основных операционных систем .

С другой стороны, Ambisonics:

  • Склонен к сильному окрашиванию из- за артефактов гребенчатой ​​фильтрации из-за высокой когерентности сигналов соседних громкоговорителей более низких порядков.
  • Невозможно обеспечить особую просторность разнесенных всенаправленных микрофонов, предпочитаемых многими классическими звукорежиссерами и слушателями.
  • Не поддерживается ни одной крупной звукозаписывающей компанией или медиа-компанией. Хотя ряд треков, закодированных в формате Ambisonic UHJ (UHJ) (в основном классических), можно найти, хотя и с некоторыми трудностями, на таких сервисах, как Spotify . [1] .
  • Концептуально сложно для понимания, в отличие от традиционной парадигмы «один канал, один динамик» .
  • Более сложная настройка для потребителя из-за этапа декодирования.
  • Точка наилучшего восприятия, которой нет в других формах объемного звука, таких как VBAP.
  • Худшая локализация точечных источников, чем панорамирование амплитуды и противофазные сигналы, размывающие изображение.
  • Гораздо более чувствителен к расположению динамиков, чем другие формы объемного звука, использующие панорамирование по амплитуде.

Теоретическая основа

[ редактировать ]

Анализ звукового поля (кодирование)

[ редактировать ]

Сигналы формата B представляют собой усеченное сферическое гармоническое разложение звукового поля. Они соответствуют звуковому давлению. , а три компонента градиента давления (не путать со скоростью соответствующей частицы ) в точке пространства. Вместе они аппроксимируют звуковое поле на сфере вокруг микрофона; формально усечение первого порядка мультипольного разложения . (моносигнал) — это информация нулевого порядка, соответствующая постоянной функции на сфере, а являются членами первого порядка (диполи или восьмерки). Это усечение первого порядка является лишь приближением общего звукового поля.

Высшие порядки соответствуют дальнейшим членам мультипольного разложения функции на сфере по сферическим гармоникам. На практике более высокие порядки требуют большего количества динамиков для воспроизведения, но увеличивают пространственное разрешение и увеличивают область, где звуковое поле воспроизводится идеально (вплоть до верхней граничной частоты).

Радиус этой области для заказа Ambisonic и частота дается

, [4]

где обозначает скорость звука.

Эта площадь становится меньше человеческой головы при частоте выше 600 Гц для первого порядка или 1800 Гц для третьего порядка. Для точного воспроизведения на головной громкости до 20 кГц потребуется порядка 32 или более 1000 громкоговорителей.

На тех частотах и ​​позициях прослушивания, где идеальная реконструкция звукового поля уже невозможна, воспроизведение Ambisonics должно быть сосредоточено на передаче правильных сигналов направления, чтобы обеспечить хорошую локализацию даже при наличии ошибок реконструкции.

Психоакустика

[ редактировать ]

Слуховой аппарат человека имеет очень четкую локализацию в горизонтальной плоскости (в некоторых экспериментах расстояние между источниками достигает 2°). Можно выделить два преобладающих сигнала для разных частотных диапазонов:

Низкочастотная локализация

[ редактировать ]

На низких частотах, где длина волны велика по сравнению с длиной головы человека, входящий звук дифрагирует вокруг него, так что акустической тени практически нет и, следовательно, нет разницы в уровнях между ушами. В этом диапазоне единственной доступной информацией является соотношение фаз между двумя ушными сигналами, называемое межушной разницей во времени , или ITD . Оценка этой разницы во времени позволяет точно локализовать внутри конуса растерянности : угол падения однозначен, но ITD одинаков для звуков спереди и сзади. Пока звук не совсем неизвестен субъекту, путаницу обычно можно устранить, воспринимая тембральные вариации спереди и сзади, вызванные ушными вкладышами (или ушными раковинами ).

Высокочастотная локализация

[ редактировать ]

Когда длина волны приближается к удвоенному размеру головы, фазовые соотношения становятся неоднозначными, поскольку уже не ясно, соответствует ли разность фаз между ушами одному, двум или даже большему количеству периодов при повышении частоты. К счастью, в этом диапазоне голова создает значительную акустическую тень, что приводит к небольшой разнице в уровне между ушами. Это называется межушной разницей уровней , или ILD (применяется тот же конус замешательства). В совокупности эти два механизма обеспечивают локализацию во всем диапазоне слуха.

Воспроизведение ITD и ILD в Ambisonics

[ редактировать ]

Герзон показал, что качество сигналов локализации в воспроизводимом звуковом поле соответствует двум объективным метрикам: длине вектора скорости частицы. для ITD и длина вектора энергии для ИЛД. Герзон и Бартон (1992) определяют декодер для горизонтального объемного звучания как Ambisonic, если

  • направления и договоримся минимум до 4 кГц,
  • на частотах ниже примерно 400 Гц, для всех азимутальных углов, и
  • на частотах примерно от 700 Гц до 4 кГц величина «существенно максимизируется на максимально возможной части звуковой сцены на 360°» . [5]

На практике удовлетворительные результаты достигаются при умеренных порядках даже для очень больших зон прослушивания. [6] [7]

Моноауральный сигнал HRTF

[ редактировать ]

Люди также способны получать информацию о местоположении источника звука в 3D-пространстве с учетом высоты. Во многом эта способность обусловлена ​​формой головы (особенно ушной раковины ), создающей переменную частотную характеристику в зависимости от угла источника. Реакцию можно измерить, поместив микрофон в ушной канал человека и затем воспроизведя звуки с разных направлений. Записанную передаточную функцию, связанную с головой (HRTF), можно затем использовать для рендеринга амбисоники в наушниках, имитируя эффект головы. HRTF различаются у разных людей из-за различий в форме головы, но общий вариант может дать удовлетворительный результат. [8]

Синтез звукового поля (декодирование)

[ редактировать ]

В принципе, сигналы громкоговорителей формируются с использованием линейной комбинации сигналов компонентов Ambisonic, где каждый сигнал зависит от фактического положения громкоговорителя относительно центра воображаемой сферы, поверхность которой проходит через все доступные громкоговорители. На практике слегка неравномерное расстояние до динамиков можно компенсировать задержкой .

высокочастотного и низкочастотного Однако истинное декодирование Ambisonics требует пространственного выравнивания сигналов для учета различий в механизмах локализации звука в человеческом слухе. [9] Дальнейшее уточнение учитывает расстояние слушателя от громкоговорителей ( компенсация ближнего поля ). [10]

Также используются различные более современные методы декодирования.

Совместимость с существующими каналами сбыта.

[ редактировать ]

Декодеры Ambisonics в настоящее время не продаются каким-либо значительным образом конечным пользователям, и никаких собственных записей Ambisonic коммерчески не доступно. Следовательно, контент, созданный с помощью Ambisonics, должен быть доступен потребителям в стереофоническом или дискретном многоканальном формате.

Контент Ambisonics можно автоматически преобразовать в стерео без необходимости специального сведения. Самый простой подход — сэмплировать B-формат с помощью виртуального стереомикрофона . Результат эквивалентен совпадающей стереозаписи. Изображение будет зависеть от геометрии микрофона, но обычно тыловые источники будут воспроизводиться более мягко и рассеянно. Вертикальная информация (из канал) опускается.

Альтернативно, B-формат может быть матрично закодирован в формат UHJ , который подходит для прямого воспроизведения на стереосистемах. Как и прежде, вертикальная информация будет отброшена, но в дополнение к воспроизведению слева и справа UHJ пытается сохранить часть горизонтальной информации объемного звучания, переводя источники сзади в противофазные сигналы. Это дает слушателю некоторое ощущение задней локализации.

Двухканальный UHJ также можно декодировать обратно в горизонтальный Ambisonics (с некоторой потерей точности), если доступна система воспроизведения Ambisonic. UHJ без потерь до четырех каналов (включая информацию о высоте) существует, но никогда не нашел широкого применения. Во всех схемах UHJ первые два канала представляют собой обычные каналы для левого и правого динамиков.

Многоканальные форматы

[ редактировать ]

Аналогично, можно предварительно декодировать материал Ambisonics в произвольные расположения динамиков, такие как Quad , 5.1 , 7.1 , Auro 11.1 или даже 22.2 , опять же без ручного вмешательства. Канал LFE либо опускается, либо вручную создается специальный микс. Предварительное декодирование на носитель 5.1 известно как G-формат [11] на заре DVD-аудио, хотя этот термин больше не используется.

Очевидным преимуществом предварительного декодирования является то, что любой слушатель объемного звучания может услышать Ambisonics; не требуется никакого специального оборудования, кроме того, которое имеется в обычной системе домашнего кинотеатра. Основным недостатком является то, что теряется гибкость рендеринга одного стандартного сигнала Ambisonics на любой целевой массив динамиков: сигнал принимает определенную «стандартную» компоновку, и любой, кто слушает другой массив, может столкнуться с ухудшением точности локализации.

Макеты целей от 5.1 и выше обычно превосходят пространственное разрешение Ambisonics первого порядка, по крайней мере, в переднем квадранте. Для оптимального разрешения, чтобы избежать чрезмерных перекрестных помех и избежать неровностей целевой компоновки, предварительное декодирование таких целей должно быть получено из исходного материала в Ambisonics более высокого порядка. [12]

Рабочий процесс производства

[ редактировать ]

Амбисоник-контент можно создать двумя основными способами: записывая звук с помощью подходящего микрофона первого или более высокого порядка или беря отдельные монофонические источники и панорамируя их в нужные позиции. Контентом также можно манипулировать, пока он находится в формате B.

Амбисонические микрофоны

[ редактировать ]

Собственные массивы B-формата

[ редактировать ]
Массив разработан и изготовлен доктором Джонатаном Холлидеем из Nimbus Records.

Поскольку компоненты Ambisonics первого порядка соответствуют физическим диаграммам направленности микрофонов, вполне практично записывать B-формат напрямую с тремя совпадающими микрофонами: всенаправленным капсюлем, одним обращенным вперед капсюлем в форме восьмерки и одним обращенным влево капсюлем в виде восьмерки. -8 капсул, что дает , и компоненты. [13] [14] Его называют штатной микрофонной решеткой или микрофонной решеткой Nimbus/Halliday , в честь ее дизайнера доктора Джонатана Холлидея из Nimbus Records , где она используется для записи обширной и продолжающейся серии релизов Ambisonic. Встроенный встроенный микрофон B-формата C700S. [15] производится и продается компанией Josephson Engineering с 1990 года.

Основная трудность, присущая этому подходу, заключается в том, что высокочастотная локализация и четкость зависят от того, насколько диафрагмы приближаются к истинному совпадению. Путем вертикальной установки капсул достигается идеальное совпадение для горизонтальных источников. Однако звук сверху или снизу теоретически будет страдать от эффектов тонкой гребенчатой ​​фильтрации на самых высоких частотах. В большинстве случаев это не является ограничением, поскольку источники звука, расположенные далеко от горизонтальной плоскости, обычно возникают из-за реверберации помещения. Кроме того, расположенные друг над другом микрофонные элементы в форме восьмерки имеют глубокую нулевую зону в направлении оси их сборки, так что основным преобразователем в этих направлениях является центральный всенаправленный микрофон. На практике это может привести к меньшей ошибке локализации, чем любой из альтернатив (тетраэдрические решетки с обработкой или четвертый микрофон для оси Z). [ нужна ссылка ]

Собственные массивы чаще всего используются для горизонтального объемного звучания из-за увеличения ошибок позиционирования и эффектов затенения при добавлении четвертого микрофона.

Тетраэдрический микрофон

[ редактировать ]

Поскольку невозможно построить идеально совпадающую микрофонную решетку, следующим лучшим подходом является минимизация и максимально равномерное распределение ошибки позиционирования. Этого можно достичь, расположив четыре кардиоидные или субкардиоидные капсюли в тетраэдре и выровняв их для обеспечения равномерного отклика диффузного поля. [16] Затем сигналы капсулы преобразуются в B-формат с помощью матричной операции.

За пределами Ambisonics тетраэдрические микрофоны стали популярны среди инженеров по натурной записи, работающих в стерео или 5.1, из-за их гибкости при постобработке; здесь B-формат используется только как промежуточный вариант для создания виртуальных микрофонов .

Микрофоны высшего порядка

[ редактировать ]

Выше первого порядка больше невозможно получить компоненты Ambisonic напрямую с помощью одиночных микрофонных капсюлей. Вместо этого разностные сигналы более высокого порядка получаются из нескольких пространственно распределенных (обычно всенаправленных) капсул с использованием очень сложной цифровой обработки сигналов. [17]

em32 Эйгенмайк [18] и ЗИЛИЯ ЗМ-1 [19] представляет собой коммерчески доступную 32-канальную микрофонную решетку с объемным звучанием.

Недавняя статья Питера Крейвена и др. [20] (впоследствии запатентовано) описывает использование двунаправленных капсюлей для микрофонов более высокого порядка для уменьшения экстремальности используемой эквализации. Микрофонов, использующих эту идею, пока не создано.

Амбисоническое панорамирование

[ редактировать ]

Самый простой способ создания миксов Ambisonic произвольно высокого порядка — взять монофонические источники и позиционировать их с помощью кодера Ambisonic.

Полносферный энкодер обычно имеет два параметра: азимут (или горизонт) и угол места. Кодер будет распределять исходный сигнал по компонентам Ambisonic таким образом, что при декодировании источник появится в нужном месте. Более сложные панорамы дополнительно предоставляют параметр радиуса, который будет учитывать зависящее от расстояния затухание и усиление басов из-за эффекта ближнего поля.

Аппаратные панорамирующие устройства и микшеры для Ambisonics первого порядка доступны с 1980-х годов. [21] [22] [23] и использовались в коммерческих целях. Сегодня плагины панорамирования и другие соответствующие программные инструменты доступны для всех основных рабочих станций цифрового аудио, часто в виде бесплатного программного обеспечения . Однако из-за произвольных ограничений ширины шины лишь немногие профессиональные рабочие станции цифрового аудио (DAW) поддерживают порядок выше второго. Заметными исключениями являются REAPER , Pyramix , ProTools , Nuendo и Ardor .

Амбисонические манипуляции

[ редактировать ]

B-форматом первого порядка можно манипулировать различными способами, чтобы изменить содержание слуховой сцены. Хорошо известные манипуляции включают «вращение» и «доминирование» (перемещение источников в определенном направлении или от него). [5] [24]

Кроме того, к B-формату может быть применена линейная, не зависящая от времени обработка сигнала, такая как эквалайзер , без нарушения направления звука, если она одинаково применяется ко всем компонентным каналам.

Более поздние разработки в области Ambisonics более высокого порядка позволяют выполнять широкий спектр манипуляций, включая вращение, отражение, движение, 3D- реверберацию , повышающее микширование из устаревших форматов, таких как 5.1 или первый порядок, визуализацию и зависящее от направления маскирование и эквалайзер.

Обмен данными

[ редактировать ]

Передача формата Ambisonic B между устройствами и конечным пользователям требует стандартизированного формата обмена. Хотя традиционный B-формат первого порядка четко определен и универсально понятен, существуют противоречивые соглашения для Ambisonics более высокого порядка, различающиеся как по порядку каналов, так и по весу, которые, возможно, потребуется поддерживать в течение некоторого времени. Традиционно наиболее распространенным является формат высшего порядка Фурс-Малхам в .amb контейнер на основе формата файлов Microsoft WAVE-EX. [25] Он масштабируется до третьего порядка и имеет ограничение размера файла в 4 ГБ.

Новые реализации и производства, возможно, захотят рассмотреть AmbiX. [26] предложение, которое принимает .caf формат файла и устраняет ограничение в 4 ГБ. Он масштабируется до произвольно высоких порядков и основан на кодировании SN3D. Кодировка SN3D была принята Google в качестве основы для формата YouTube 360. [27]

Сжатое распространение

[ редактировать ]

Для эффективного распространения данных Ambisonic среди непрофессионалов желательно использовать сжатие с потерями, чтобы сохранить приемлемый размер данных. Однако простого мультимоно-сжатия недостаточно, поскольку сжатие с потерями имеет тенденцию разрушать фазовую информацию и, таким образом, ухудшать локализацию в форме пространственного уменьшения, размытия и фантомного источника. Уменьшение избыточности между каналами желательно не только для улучшения сжатия, но и для уменьшения риска заметных фазовых ошибок. [28] (Также можно использовать постобработку, чтобы скрыть артефакты.) [29]

Как и в случае с объединенным стереокодированием средней стороны, схема статического матричного изображения (как в Opus) пригодна для амбисоники первого порядка, но не оптимальна в случае нескольких источников. Ряд схем, таких как DirAC, используют схему, аналогичную параметрическому стерео , где кодируется микшированный сигнал, записывается основное направление и добавляется некоторое описание атмосферы. MPEG-H 3D Audio , основанный на некоторых разработках MPEG Surround , расширяет концепцию для обработки нескольких источников. MPEG-H использует анализ главных компонент для определения основных источников, а затем кодирует мультимоно сигнал, соответствующий основным направлениям. Эти параметрические методы обеспечивают хорошее качество, если они тщательно сглаживают направления звука между кадрами. [28] PCA/SVD применим как для входа амбисоники первого, так и высокого порядка. [30]

Текущее развитие

[ редактировать ]

Открытый исходный код

[ редактировать ]

существует бесплатная реализация с открытым исходным кодом С 2018 года в звуковом кодеке Opus . Предусмотрено два режима кодирования каналов: один просто сохраняет каналы по отдельности, а другой взвешивает каналы с помощью фиксированной обратимой матрицы для уменьшения избыточности. [31] Тест прослушивания Opus ambisonics был опубликован в 2020 году в качестве калибровки для AMBIQUAL, объективного показателя сжатого ambisonics от Google. Амбисоника Opus третьего порядка со скоростью 256 кбит/с имеет аналогичную точность локализации по сравнению с амбисоникой Opus первого порядка со скоростью 128 кбит/с. [32] : Рис. 12

Корпоративный интерес

[ редактировать ]

С момента его принятия Google и другими производителями в качестве предпочтительного аудиоформата для виртуальной реальности , к Ambisonics наблюдался всплеск интереса. [33] [34] [35]

В 2018 году Sennheiser выпустила микрофон виртуальной реальности. [36] и Zoom выпустили полевой рекордер Ambisonics. [37] Оба являются реализациями тетраэдрической конструкции микрофона, которая создает амбисоник первого порядка.

Ряд компаний в настоящее время проводят исследования в области Ambisonics:

Dolby Laboratories выразила «интерес» к Ambisonics, приобретя (и ликвидировав) базирующегося в Барселоне специалиста по Ambisonics imm sound перед запуском Dolby Atmos . [43] который, хотя его точная работа не разглашается, реализует развязку между направлением источника и фактическим положением громкоговорителей. Atmos использует принципиально иной подход: он не пытается передавать звуковое поле; он передает дискретные премиксы или основы (т. е. необработанные потоки звуковых данных) вместе с метаданными о том, из какого места и направления они должны исходить. Затем стемы декодируются, микшируются и визуализируются в реальном времени с использованием любых громкоговорителей, доступных в месте воспроизведения.

Использование в играх

[ редактировать ]

Ambisonics высшего порядка нашла нишу на рынке видеоигр, разработанных Codemasters . Их первой игрой, в которой использовался звуковой движок Ambisonic, была Colin McRae: DiRT , однако Ambisonics использовалась только на платформе PlayStation 3 . [44] Их игра Race Driver: GRID распространила использование Ambisonics на платформу Xbox 360 . [45] и Колин Макрей: DiRT 2 использует Ambisonics на всех платформах, включая ПК. [46]

Последние игры от Codemasters, F1 2010 , Dirt 3 , [47] Ф1 2011 [48] и Грязь: Разборки , [49] используйте Ambisonics четвертого порядка на более быстрых ПК, [50] рендерится с помощью Blue Ripple Sound компании драйвера Rapture3D OpenAL и предварительно микшированного звука Ambisonic, созданного с использованием подключаемых модулей WigWare Ambisonic Брюса Виггинса. [51]

OpenAL Soft [2] — бесплатная реализация спецификации OpenAL с открытым исходным кодом, также использует Ambisonics для рендеринга 3D-звука. [52] OpenAL Soft часто можно использовать в качестве замены другим реализациям OpenAL, позволяя нескольким играм, использующим API OpenAL, получать выгоду от рендеринга звука с помощью Ambisonics.

Для многих игр, которые изначально не используют API OpenAL, использование оболочки или цепочки оболочек может помочь заставить эти игры косвенно использовать API OpenAL. В конечном итоге это приводит к тому, что звук воспроизводится в Ambisonics, если используется совместимый драйвер OpenAL, такой как OpenAL Soft. [53]

Unreal Engine поддерживает рендеринг звукового поля Ambisonics начиная с версии 4.25. [54] Движок Unity поддерживает работу с аудиоклипами Ambisonics начиная с версии 2017.1. [55]

Патенты и товарные знаки

[ редактировать ]

Срок действия большинства патентов, охватывающих разработки Ambisonic, уже истек (в том числе патентов, касающихся микрофона Soundfield ), и, как следствие, базовая технология доступна для реализации каждому.

«Пул» патентов, включающий технологию Ambisonics, первоначально был собран Национальной корпорацией исследований и разработок (NRDC) правительства Великобритании, которая существовала до конца 1970-х годов для разработки и продвижения британских изобретений и предоставления лицензий на них коммерческим производителям - в идеале одному лицензиату. В конечном итоге лицензия на систему была передана Nimbus Records (сейчас принадлежит Wyastone Estate Ltd).

Срок действия логотипа Ambisonic в виде «переплетающихся кругов» (торговые марки Великобритании UK00001113276 и UK00001113277 ), а также текстовых знаков «AMBISONIC» и «AMBISO N» (торговые марки Великобритании UK00001500177 и UK00001112259 ), ранее принадлежавших Wyastone Estate Ltd., истек в 2010 году.

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ Во вводном абзаце используется традиционная нотация формата B, поскольку предполагается, что читатель, возможно, уже сталкивался с ней. Для Ambisonics более высокого порядка использовать обозначение ACN . рекомендуется
  1. ^ Майкл А. Герзон, Перифония: воспроизведение звука с высотой . Журнал Общества аудиоинженеров, 1973, 21 (1): 2–10.
  2. ^ Герзон, Массачусетс (февраль 1980 г.). Практическая перифония . 65-й ​​съезд Общества аудиоинженеров. Лондон: Общество аудиоинженеров . п. 7. Препринт 1571. Чтобы сигналы B-формата имели более или менее равную среднюю энергию, X, Y, Z имеют усиление 2 в направлениях максимальной чувствительности.
  3. ^ Эрик Бенджамин, Ричард Ли и Аарон Хеллер, Мой декодер Ambisonic? , 125-я конференция AES, Сан-Франциско, 2008 г.
  4. ^ Даррен Б. Уорд и Тушара Д. Абхаяпала, Воспроизведение плосковолнового звукового поля с использованием массива громкоговорителей. Архивировано 8 октября 2006 г. в Wayback Machine , Транзакции IEEE по обработке речи и звука, том 9, № 6, сентябрь 2001 г.
  5. ^ Jump up to: а б Майкл А. Герзон, Джеффри Дж. Бартон, «Амбисоник-декодеры для HDTV», 92-я конвенция AES, Вена, 1992 г. http://www.aes.org/e-lib/browse.cfm?elib=6788
  6. ^ Малхам, генеральный директор (1992). «Опыт использования трехмерных акустических систем Ambisonic большой площади» (PDF) . Труды Института акустики . 14 (5): 209–215. Архивировано из оригинала (PDF) 22 июля 2011 года . Проверено 24 января 2007 г.
  7. ^ Йорн Неттингсмайер и Дэвид Дорманн, Предварительные исследования крупномасштабных систем звукоусиления Ambisonic высшего порядка , Симпозиум Ambisonics 2011, Лексингтон (Кентукки), 2011 г.
  8. ^ Армстронг, Кэл; Треш, Льюис; Мерфи, Дамиан; Кирни, Гэвин (23 октября 2018 г.). «Перцептуальная оценка индивидуальных и неиндивидуальных HRTF: пример базы данных SADIE II» . Прикладные науки . 8 (11): 2029. doi : 10.3390/app8112029 .
  9. ^ Эрик Бенджамин, Ричард Ли и Аарон Хеллер: Локализация в горизонтальных амбизонных системах , 121-я конвенция AES, Сан-Франциско, 2006 г.
  10. ^ Жером Даниэль, Пространственное кодирование звука, включая эффект ближнего поля: введение фильтров дистанционного кодирования и жизнеспособного нового формата Ambisonic , 23-я конференция AES, Копенгаген, 2003 г.
  11. ^ Ричард Элен, Ambisonics for the New Millennium , сентябрь 1998 г.
  12. ^ Брюс Виггинс, Генерация законов панорамирования для нерегулярных массивов динамиков с использованием эвристических методов. Архивировано 17 мая 2016 года в Португальском веб-архиве. 31-я конференция AES, Лондон, 2007 г.
  13. ^ Э.М. Бенджамин и Т. Чен, «Микрофон собственного формата B», 119-я конвенция AES, Нью-Йорк, 2005 г., Препринт №. 6621. http://www.aes.org/e-lib/browse.cfm?elib=13348 .
  14. ^ [1] Э.М. Бенджамин и Т. Чен, «Микрофон собственного формата B: Часть II», 120-я конвенция AES, Париж, 2006 г., Препринт №. 6640. http://www.aes.org/e-lib/browse.cfm?elib=13444 .
  15. ^ Микрофоны с регулируемой диаграммой направленности C700 , Josephson Engineering
  16. ^ Майкл А. Герзон, Проектирование точно совпадающих микрофонных решеток для стереофонического и объемного звука , 50-я конвенция AES, Лондон, 1975 г., http://www.aes.org/e-lib/browse.cfm?elib=2466
  17. ^ Питер Плессас, Микрофонные решетки с жесткой сферой для пространственной записи и голографии , Дипломная работа по электротехнике - аудиотехника, Грац, 2009 г.
  18. ^ «Продукты | mhacoustics.com» . mhacoustics.com . Проверено 7 апреля 2018 г.
  19. ^ «ZYLIA — Решения для записи и постобработки 3D-аудио» . Залия Инк . Проверено 19 сентября 2023 г.
  20. ^ PG Craven, MJ Law и C Travis, Микрофонные решетки с использованием датчиков тангенциальной скорости. Архивировано 30 июня 2009 г. в Wayback Machine , Симпозиум Ambisonics, Грац, 2009 г.
  21. ^ Майкл А. Герзон и Джеффри Дж. Бартон, Микширование объемного звука Ambisonic для многодорожечных студий , Препринт AES C1009, 2-я Международная конференция: Искусство и технология записи, май 1984 г. http://www.aes.org/e-lib/browse .cfm?elib=11654
  22. ^ Ричард Элен, микширование Ambisonic - введение , Studio Sound, сентябрь 1983 г.
  23. ^ Найджел Бранвелл, технология объемного звука Ambisonic для записи и вещания , инженер звукозаписи / продюсер, декабрь 1983 г.
  24. ^ Дэйв Г. Малхэм, Механизмы пространственного направления и воспроизведение звука , 1998 г., получено 24 января 2014 г.
  25. ^ Ричард Добсон. Формат файла AMB Ambisonic. Архивировано 22 апреля 2014 г. на Wayback Machine.
  26. ^ Кристиан Нахбар, Франц Зоттер, Этьен Делефли и Алоис Зонтакки: AmbiX - Предлагаемый формат Ambisonics Симпозиум Ambisonics 2011, Лексингтон (Кентукки) 2011
  27. ^ Справка YouTube, Использование пространственного звука в 360-градусных и VR-видео.
  28. ^ Jump up to: а б Маэ, Пьер; Раго, Стефан; Маршан, Сильвен (2 сентября 2019 г.). Амбизонное кодирование первого порядка с матрицей PCA и интерполяцией на основе кватернионов . 22-я Международная конференция по цифровым аудиоэффектам (DAFx-19), Бирмингем, Великобритания. п. 284.
  29. ^ Маэ, Пьер; Раго, Стефан; Маршан, Сильвен; Даниэль, Жером (январь 2021 г.). Амбизонное кодирование с пространственной коррекцией изображения . Европейская конференция по обработке сигналов (EUSIPCO) 2020.
  30. ^ Замани, Сина; Нанджундасвами, Теджасви; Роуз, Кеннет (октябрь 2017 г.). «Разложение сингулярных значений в частотной области для эффективного пространственного кодирования звука». Семинар IEEE 2017 по применению обработки сигналов в аудио и акустике (WASPAA) . стр. 126–130. arXiv : 1705.03877 . дои : 10.1109/WASPAA.2017.8170008 . ISBN  978-1-5386-1632-1 . S2CID   1036250 .
  31. ^ Вален, Жан-Марк. «Выпущен Опус 1.3» . Документация Опуса . Проверено 7 сентября 2020 г.
  32. ^ Нарбутт, Мирослав; Скоглунд, Ян; Аллен, Эндрю; Чинен, Майкл; Барри, Дэн; Хайнс, Эндрю (3 мая 2020 г.). «AMBIQUAL: К показателю качества сжатого Ambisonic пространственного звука, визуализируемого в наушниках» . Прикладные науки . 10 (9): 3188. doi : 10.3390/app10093188 . hdl : 10197/11947 .
  33. ^ Спецификации и инструменты Google для видео 360° и пространственного звука , получено в мае 2016 г.
  34. Загрузите видео в формате 360 градусов , получено в мае 2016 г.
  35. ^ Центр разработчиков Oculus: поддерживаемые функции/амбисоника
  36. ^ "Микрофон Sennheiser AMBEO VR"
  37. ^ "Полевой рекордер Ambisonics Zoom H3-VR"
  38. ^ Крис Баум, Энтони Чернсайд, Upping the Auntie: Взгляд вещателя на Ambisonics , BBC R&D Publications, 2012
  39. ^ Дариус Сатонгар, Крис Данн, Ю Лам и Фрэнсис Ли. Локализация амбисоники высшего порядка для прослушивания вне центра , BBC R&D Publications, 2013
  40. ^ Пол Пауэр, Крис Данн, У. Дэвис и Дж. Херст, Локализация повышенных источников в амбисонике высшего порядка , BBC R&D Publications, 2013
  41. ^ Иоганн-Маркус Батке и Флориан Кейлер, Использование функций панорамирования, полученных из VBAP, для декодирования 3D-амбисоники, 2-й Международный симпозиум по амбисонике и сферической акустике, Париж, 2010 г.
  42. ^ Флориан Кейлер, Свен Кордон, Йоханнес Бём, Хольгер Кропп и Иоганн-Маркус Батке, Структура данных для аудиоданных Ambisonics высшего порядка , Заявка на европейский патент EP 2450880 A1, 2012
  43. ^ «Dolby Laboratories приобретает конкурента imm sound» . Голливудский репортер. 23 июля 2012 г.
  44. ^ Делефли, Этьен (30 августа 2007 г.). «Интервью с Саймоном Гудвином из Codemasters об игре DiRT и Ambisonics для PS3» . Создание Ambisonia.com . Австралия: Этьен Делефли. Архивировано из оригинала 23 июля 2011 года . Проверено 7 августа 2010 г.
  45. ^ Делефли, Этьен (24 июня 2008 г.). «Codemasters снова запускает Ambisonics в Race Driver GRID…» . Создание Ambisonia.com . Австралия: Этьен Делефли. Архивировано из оригинала 23 июля 2011 года . Проверено 7 августа 2010 г.
  46. ^ Фиршман, Бен (3 марта 2010 г.). «Интервью: Саймон Н. Гудвин, Codemasters» . Кабан . Ковентри, Великобритания: Уорикский университет. п. 18. Суть тома 32, выпуска 11 . Проверено 7 августа 2010 г.
  47. ^ «ДиРТ3» . Игровые новости . Звук синей пульсации. 23 мая 2011 года . Проверено 21 ноября 2013 г.
  48. ^ «Ф1 2011» . Игровые новости . Звук синей пульсации. 23 сентября 2011 г. Архивировано из оригинала 19 декабря 2013 г. Проверено 21 ноября 2013 г.
  49. ^ «Разборки DiRT» . Игровые новости . Звук синей пульсации. 18 июня 2012 года. Архивировано из оригинала 14 декабря 2017 года . Проверено 21 ноября 2013 г.
  50. ^ «3D-аудио для игр» . Звук синей пульсации. Архивировано из оригинала 13 декабря 2013 года . Проверено 21 ноября 2013 г.
  51. ^ «Улучшение пространственного звука с помощью программного обеспечения Ambisonic Surround Sound — пример воздействия REF» . Совет по финансированию высшего образования Англии (HEFCE) . Проверено 18 февраля 2016 г.
  52. ^ «openal-soft/ambisonics.txt в master · kcat/openal-soft · GitHub» . Гитхаб . Проверено 15 июня 2021 г.
  53. ^ «Список компьютерных игр, использующих DirectSound3D — Google Docs» . Я пью лаву . Проверено 26 июня 2021 г.
  54. ^ «Примечания к выпуску Unreal Engine 4.25 | Документация Unreal Engine» . Эпик Геймс, Инк . Проверено 27 мая 2022 г.
  55. ^ «Что нового в Unity 2017.1 — Unity» . Юнити Технологии. Архивировано из оригинала 24 марта 2022 года . Проверено 27 мая 2022 г.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 6be7ac1a83e9437dc84a996b27a1ff11__1721734020
URL1:https://arc.ask3.ru/arc/aa/6b/11/6be7ac1a83e9437dc84a996b27a1ff11.html
Заголовок, (Title) документа по адресу, URL1:
Ambisonics - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)