Jump to content

Совместное кодирование

В аудиотехнике означает совместное кодирование объединение нескольких каналов схожей информации во время кодирования с целью получения более высокого качества, меньшего размера файла или того и другого.

Совместное стерео

[ редактировать ]

Термин «совместное стерео» стал популярным, поскольку Интернет позволил передавать относительно низкой скоростью передачи данных звук приемлемого качества с и умеренной скоростью доступа в Интернет. Совместное стерео относится к любому количеству методов кодирования, используемых для этой цели. Здесь описаны две формы, обе из которых реализованы по-разному с разными кодеками , такими как MP3 , AAC и Ogg Vorbis .

Интенсивное стереокодирование

[ редактировать ]

Эта форма совместного стерео использует технику, известную как совместное частотное кодирование , которая действует по принципу локализации звука . Человеческий слух преимущественно менее остр в восприятии направления определенных звуковых частот. Используя эту характеристику, интенсивное стереокодирование может снизить скорость передачи данных аудиопотока с незначительным изменением видимого качества или вообще без него.

Более конкретно, преобладание межушных временных различий (ITD) для локализации звука человеком присутствует только для более низких частот. В результате межушные амплитудные различия (IAD) остаются доминирующим индикатором местоположения для более высоких частот (граница составляет ~ 2 кГц). Идея интенсивного стереокодирования состоит в том, чтобы объединить нижний спектр в один канал (таким образом уменьшая общие различия между каналами) и передать небольшую дополнительную информацию о том, как панорамировать определенные частотные области для восстановления сигналов IAD . Однако в этой схеме ITD не теряется полностью: форма уха позволяет восстановить ITD из IAD, если звук исходит из свободного пространства, например, воспроизводится через громкоговорители. [1]

Этот тип кодирования не позволяет полностью восстановить исходный звук из-за потери информации, что приводит к упрощению стереоизображения и может привести к заметным артефактам сжатия . Однако при очень низких скоростях передачи данных этот тип кодирования обычно дает улучшение воспринимаемого качества звука. Он поддерживается многими форматами сжатия звука (включая MP3 , AAC , Vorbis и Opus ), но не всегда всеми кодировщиками.

Стереокодирование M/S

[ редактировать ]

Стереокодирование M/S преобразует левый и правый каналы в средний канал и побочный канал. Средний канал представляет собой сумму левого и правого каналов, или . Боковой канал — это разница левого и правого каналов, или . В отличие от интенсивного стереокодирования, кодирование M/S представляет собой особый случай кодирования с преобразованием и прекрасно сохраняет звук без появления артефактов. Из-за этой характеристики кодеки без потерь, такие как FLAC или Monkey's Audio, используют стереокодирование M/S.

Для восстановления исходного сигнала каналы либо добавляются или вычитается .

Эту форму кодирования иногда называют матричным стерео. [а] и используется во многих различных видах оборудования для обработки и записи звука. Он не ограничивается цифровыми системами и может быть создан даже с помощью пассивных аудиотрансформаторов или аналоговых усилителей . Одним из примеров использования стерео M/S является FM -стереовещание, где модулирует несущую волну и модулирует поднесущую . Это обеспечивает обратную совместимость с монооборудованием, которому потребуется только средний канал. [2] Другим примером M/S-стерео является стереофоническая пластинка с микроканавками . Боковые движения иглы представляют собой сумму двух каналов, а вертикальное движение представляет собой разницу между каналами; две перпендикулярные катушки механически декодируют каналы. [3]

M/S также является распространенным методом производства стереозаписей. См. раздел «Практика использования микрофона» § Техника M/S .

Кодирование M/S не требует строгого того, чтобы левый и правый каналы использовали один и тот же вес. В Opus CELT кодирование M/S сочетается с параметром угла, так что можно использовать разные веса для максимизации декорреляции. [4] : 4.5.1 

Похожая форма объединения нескольких каналов наблюдается в реализации ambisonics в Opus 1.3. Матрица может использоваться для смешивания каналов сферических гармоник вместе, уменьшая избыточность. [5]

Параметрическое стерео

[ редактировать ]

Параметрическое стерео похоже на стерео по интенсивности, за исключением того, что используются параметры, выходящие за пределы разницы в интенсивности. В версии MPEG-4 (HE-AAC) используются разница в интенсивности и разница во времени, что позволяет использовать все полосы без ущерба для локализации. HE-AAC также добавляет информацию «корреляции», которая воспроизводит атмосферу путем синтеза некоторой разницы между каналами. [6]

Бинауральное кодирование сигналов (BCC) — это метод HE-AAC PS, расширенный для многих входных каналов, все из которых преобразуются в один. Использовались одни и те же параметры ILD, ITD и IC. MPEG Surround похож на BCC, но позволяет микшировать несколько каналов и, похоже, не использует ITD. [7]

Совместное частотное кодирование

[ редактировать ]

Совместное частотное кодирование — это метод кодирования, используемый при сжатии аудиоданных для снижения скорости передачи данных .

Идея состоит в том, чтобы объединить заданный диапазон частот нескольких звуковых каналов вместе, чтобы полученное кодирование сохраняло звуковую информацию этого диапазона не как набор отдельных каналов, а как один однородный поток данных. Это навсегда разрушит исходное разделение каналов, поскольку информацию невозможно точно восстановить, но значительно уменьшит объем требуемого места для хранения. Только некоторые формы совместного стерео используют метод совместного частотного кодирования, например, интенсивное стереокодирование.

Реализации

[ редактировать ]

При использовании в процессе сжатия MP3 объединенное стерео обычно использует несколько методов и может переключаться между ними для каждого кадра MPEG. Обычно в совместном стереорежиме современного кодера используется стереофоническое M/S для некоторых кадров и стереофоническое L/R для других, в зависимости от того, какой метод дает наилучший результат. Кодеры используют разные алгоритмы, чтобы определить, когда переключиться и сколько места выделить каждому каналу; качество может ухудшиться, если переключение происходит слишком часто или если побочный канал не получает достаточного количества битов. С помощью некоторого программного обеспечения для кодирования можно принудительно использовать стерео M/S для всех кадров, имитируя объединенный стереорежим некоторых ранних кодировщиков, таких как Xing . В кодере LAME это известно как принудительное совместное стерео. [8]

Как и в случае с MP3, Ogg Vorbis стереофайлы могут использовать либо L/R-стерео, либо совместное стерео. При использовании совместного стерео можно использовать как методы M/S стерео, так и методы интенсивного стерео. В отличие от MP3, где стерео M/S (если оно используется) применяется перед квантованием, кодер Ogg Vorbis применяет стерео M/S к семплам в частотной области после квантования, что делает применение стерео M/S без потерь. После этого шага любую частотную область можно преобразовать в интенсивное стерео, удалив соответствующую часть бокового канала сигнала M/S. Функция Floor Ogg Vorbis позаботится о необходимом панорамировании влево-вправо. [ нужна ссылка ] Opus также поддерживает все три варианта уровня CELT; слой SILK предназначен только для M/S. [9]

Примечания

[ редактировать ]
  1. ^ Названо так потому, что сложение и вычитание можно представить в виде матрицы .
  1. ^ Ф. Баумгарте и К. Фаллер, «Разработка и оценка бинаурального кодирования сигналов», в AES 113th Conv., Лос-Анджелес, Калифорния, октябрь 2002 г.
  2. ^ «Стереофоническое вещание: технические детали системы пилот-тонов», информационный лист 1604 (4) , BBC , июнь 1970 г. Служба инженерной информации
  3. ^ «Запись стереодиска» . Архивировано из оригинала 25 сентября 2006 года . Проверено 4 октября 2006 г.
  4. ^ Жан-Марк Вален; Грегори Максвелл; Тимоти Б. Терриберри; Коэн Вос (17–20 октября 2013 г.). «Высококачественное кодирование музыки с малой задержкой в ​​кодеке Opus» (PDF) . www.xiph.org . Нью-Йорк, штат Нью-Йорк: Фонд Xiph.Org. п. 2. Архивировано из оригинала (PDF) 14 июля 2018 года . Проверено 19 августа 2014 г. Упреждающий просмотр CELT составляет 2,5 мс, а упреждающий просмотр SILK — 5 мс плюс 1,5 мс на повторную выборку (включая повторную выборку как кодера, так и декодера). По этой причине путь CELT в кодере добавляет задержку в 4 мс. Однако приложение может ограничить кодер CELT и исключить эту задержку. Это уменьшает общее время просмотра до 2,5 мс.
  5. ^ «Выпущен Опус 1.3» . jmvalin.ca . Для всех звуковых эффектов более высокого порядка отображение каналов 3 обеспечивает более эффективное представление путем предварительного преобразования сигналов звукового окружения с помощью назначенной матрицы смешивания перед кодированием. В этой версии 1.3 представлены матрицы первого, второго и третьего порядка.
  6. ^ Пурнхаген, Хайко (5–8 октября 2004 г.). «ПАРАМЕТРИЧЕСКОЕ СТЕРЕОКОДИРОВАНИЕ НИЗКОЙ СЛОЖНОСТИ В MPEG-4» (PDF) . 7-я Международная конференция по цифровым аудиоэффектам : 163–168.
  7. ^ ХАН, Чи-Кан. Ускорение и реализация кодека MPEG Surround на платформе TI DSP (PDF) (MSc).
  8. ^ «Подробные переключатели командной строки» . LAME-документация . Проверено 13 декабря 2013 г. JOINT STEREO [...] означает, что кодер может использовать (кадр за кадром) либо L/R стерео, либо среднее/боковое стерео. В среднем/побочном стерео [...] каналу среднего/побочного канала выделяется больше битов, чем побочному. Когда разделения стерео не слишком много, это эффективно увеличивает полосу пропускания, обеспечивая более высокое качество при том же количестве бит. Неправильное использование среднего/бокового стерео может привести к слышимым артефактам сжатия. Слишком частое переключение между средним/боковым и обычным стерео также может звучать плохо. Чтобы определить, когда переключиться на среднее/боковое стерео, LAME использует гораздо более сложный алгоритм, чем тот, который описан в документации ISO. FORCED MID/SIDE STEREO принудительно кодирует все кадры с использованием среднего/бокового стерео. Его следует использовать только в том случае, если вы уверены, что каждый кадр входного файла имеет очень небольшое стереоразделение.
  9. ^ RFC   6716 , §§ 4.2.1, 4.3
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 8406ae1da8910c7f6fe5946ec0311a36__1714192980
URL1:https://arc.ask3.ru/arc/aa/84/36/8406ae1da8910c7f6fe5946ec0311a36.html
Заголовок, (Title) документа по адресу, URL1:
Joint encoding - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)