Jump to content

Формат аудиокодирования

(Перенаправлено из формата сжатия аудио )
Сравнение эффективности кодирования популярных аудиоформатов

Формат аудиокодирования [1] (или иногда формат сжатия звука ) — это формат представления контента для хранения или передачи цифрового звука (например, в цифровом телевидении , цифровом радио , а также в аудио- и видеофайлах). Примеры форматов аудиокодирования включают MP3 , AAC , Vorbis , FLAC и Opus . Конкретная программная или аппаратная реализация, способная сжимать и распаковывать звук в/из определенного формата кодирования звука, называется аудиокодеком ; примером аудиокодека является LAME реализуют кодирование и декодирование звука в формате аудиокодирования MP3 , который является одним из нескольких различных кодеков, которые программно .

Некоторые форматы кодирования звука документированы в подробной технической спецификации , известной как спецификация кодирования звука . Некоторые такие спецификации написаны и одобрены организациями по стандартизации как технические стандарты и, таким образом, известны как стандарт кодирования звука . Термин «стандарт» также иногда используется как для де-факто, стандартов так и для формальных стандартов.

Аудиоконтент, закодированный в определенном формате аудиокодирования, обычно инкапсулируется в формат контейнера . Таким образом, у пользователя обычно нет необработанного файла AAC , а вместо него имеется аудиофайл .m4a , который представляет собой контейнер MPEG-4 Part 14, содержащий аудио в формате AAC. Контейнер также содержит метаданные , такие как заголовок и другие теги, и, возможно, индекс для быстрого поиска. [2] Заметным исключением являются файлы MP3 , которые представляют собой необработанное аудиокодирование без контейнерного формата. Стандарты де-факто для добавления тегов метаданных, таких как название и исполнитель, в MP3-файлы, такие как ID3 , представляют собой хаки , которые работают путем добавления тегов в MP3, а затем полагаются на то, что MP3-плеер распознает фрагмент как неправильное аудиокодирование и, следовательно, пропускает его. . В видеофайлах со звуком закодированный аудиоконтент объединяется с видео (в формате видеокодирования ) внутри формата мультимедийного контейнера .

Формат аудиокодирования не определяет все алгоритмы, используемые кодеком, реализующим этот формат. важной частью работы сжатия звука с потерями является удаление данных способами, которые люди не могут услышать В соответствии с психоакустической моделью ; разработчик кодера имеет некоторую свободу выбора данных для удаления (в соответствии с их психоакустической моделью).

Форматы кодирования звука без потерь, с потерями и без сжатия

[ редактировать ]

Формат кодирования звука без потерь уменьшает общий объем данных, необходимых для представления звука, но может быть декодирован в исходную несжатую форму. Формат кодирования звука с потерями дополнительно снижает битовое разрешение звука помимо сжатия, что приводит к гораздо меньшему количеству данных за счет безвозвратно потерянной информации.

Передаваемый (потоковое) аудио чаще всего сжимается с использованием аудиокодеков с потерями, поскольку меньший размер гораздо удобнее для распространения. Наиболее широко используемыми форматами кодирования звука являются MP3 и Advanced Audio Coding (AAC), оба из которых представляют собой форматы с потерями, основанные на модифицированном дискретном косинусном преобразовании (MDCT) и алгоритмах перцепционного кодирования .

Форматы аудиокодирования без потерь, такие как FLAC и Apple Lossless, иногда доступны, но за счет файлов большего размера.

несжатые аудиоформаты , такие как импульсно-кодовая модуляция Иногда также используются (PCM или .wav). PCM был стандартным форматом для компакт-дисков Digital Audio (CDDA).

Solidyne 922: первая в мире коммерческая звуковая карта с битовым сжатием звука для ПК, 1990 г.

В 1950 году Bell Labs подала патент на дифференциальную импульсно-кодовую модуляцию (DPCM). [3] Адаптивный DPCM (ADPCM) был представлен П. Каммиски, Никилом С. Джаянтом и Джеймсом Л. Фланаганом в Bell Labs в 1973 году. [4] [5]

Перцептивное кодирование было впервые использовано для кодирования речи сжатия с помощью кодирования с линейным предсказанием (LPC). [6] Первоначальные концепции LPC восходят к работам Фумитады Итакура ( Университет Нагои ) и Сюдзо Сайто ( Nippon Telegraph and Telephone ). [7] В 1970-х годах Бишну С. Атал и Манфред Р. Шредер из Bell Labs разработали форму LPC, названную адаптивным предсказательным кодированием (APC), алгоритм перцептивного кодирования, который использовал маскирующие свойства человеческого уха, за которым в начале 1980-х годов последовало алгоритм линейного предсказания с кодовым возбуждением (CELP), который достиг значительной для своего времени степени сжатия. [6] Перцептивное кодирование используется в современных форматах сжатия звука, таких как MP3. [6] и ААК .

Дискретное косинусное преобразование (ДКП), разработанное Насиром Ахмедом , Т. Натараджаном и К. Р. Рао в 1974 году, [8] послужил основой для модифицированного дискретного косинусного преобразования (MDCT), используемого в современных форматах сжатия звука, таких как MP3. [9] и ААК. MDCT был предложен Дж. П. Принсеном, А. В. Джонсоном и А. Б. Брэдли в 1987 г. [10] после более ранней работы Принсена и Брэдли в 1986 году. [11] MDCT используется современными форматами сжатия звука, такими как Dolby Digital , [12] [13] MP3 , [9] и расширенное кодирование звука (AAC). [14]

Список форматов с потерями

[ редактировать ]
Базовый алгоритм сжатия Стандарт аудиокодирования Аббревиатура Введение Доля рынка (2019 г.) [15] Ссылка
Модифицированное дискретное косинусное преобразование (MDCT) Долби Цифровой (AC-3) AC3 1991 58% [12] [16]
Адаптивное преобразование акустического кодирования АТРАК 1992 Un­known [12]
MPEG-уровень III MP3 1993 49% [9] [17]
Расширенное кодирование звука ( MPEG-2 / MPEG-4 ) ААС 1997 88% [14] [12]
Windows Медиа Аудио WMA 1999 Un­known [12]
Огг Ворбис Огг 2000 7% [18] [12]
Преобразование с ограниченной энергией с перекрытием КЕЛЬТ 2011 [19]
Опус Опус 2012 8% [20]
ЛДАК ЛДАК 2015 Un­known [21] [22]
Адаптивная дифференциальная импульсно-кодовая модуляция (ADPCM) aptX / aptX-HD aptX 1989 Un­known [23]
Цифровые театральные системы ДТС 1990 14% [24] [25]
Мастер качество подтверждено контроль качества 2014 Un­known
Поддиапазонное кодирование (SBC) Аудио MPEG-1, уровень II МП2 1993 Un­known
Музпак ПДК 1997

Список форматов без потерь

[ редактировать ]

См. также

[ редактировать ]
  1. ^ Термин «аудиокодирование» можно увидеть, например, в названии Advanced Audio Coding , и он аналогичен термину «кодирование видео».
  2. ^ «Видео — где хранится информация о синхронизации в форматах контейнеров?» .
  3. ^ Патент США 2605361 , К. Чапин Катлер, «Дифференциальное квантование сигналов связи», выдан 29 июля 1952 г.  
  4. ^ Каммиски, П.; Джаянт, Н.С.; Фланаган, Дж. Л. (1973). «Адаптивное квантование при дифференциальном PCM-кодировании речи» . Технический журнал Bell System . 52 (7): 1105–1118. дои : 10.1002/j.1538-7305.1973.tb02007.x .
  5. ^ Каммиски, П.; Джаянт, Никил С.; Фланаган, Дж. Л. (1973). «Адаптивное квантование при дифференциальном ИКМ-кодировании речи». Технический журнал Bell System . 52 (7): 1105–1118. дои : 10.1002/j.1538-7305.1973.tb02007.x . ISSN   0005-8580 .
  6. ^ Перейти обратно: а б с Шредер, Манфред Р. (2014). «Лаборатории Белла» . Акустика, информация и связь: Мемориальный том в честь Манфреда Р. Шредера . Спрингер. п. 388. ИСБН  9783319056609 .
  7. ^ Грей, Роберт М. (2010). «История цифровой речи в реальном времени в пакетных сетях: Часть II кодирования с линейным прогнозированием и интернет-протокола» (PDF) . Найденный. Процесс сигналов трендов . 3 (4): 203–303. дои : 10.1561/2000000036 . ISSN   1932-8346 .
  8. ^ Насир Ахмед ; Т. Натараджан; Камисетти Рамамохан Рао (январь 1974 г.). «Дискретное косинусное преобразование» (PDF) . Транзакции IEEE на компьютерах . С-23 (1): 90–93. дои : 10.1109/TC.1974.223784 . S2CID   149806273 . Архивировано из оригинала (PDF) 8 декабря 2016 г. Проверено 20 октября 2019 г.
  9. ^ Перейти обратно: а б с Гукерт, Джон (весна 2012 г.). «Использование БПФ и MDCT в сжатии аудио MP3» (PDF) . Университет Юты . Проверено 14 июля 2019 г.
  10. ^ Принсен, Дж.; Джонсон, А.; Брэдли, А. (1987). «Кодирование поддиапазона/преобразования с использованием конструкции банка фильтров на основе отмены псевдонимов во временной области» . ИКАССП '87. Международная конференция IEEE по акустике, речи и обработке сигналов . Том. 12. С. 2161–2164. дои : 10.1109/ICASSP.1987.1169405 . S2CID   58446992 .
  11. ^ Принсен, Дж.; Брэдли, А. (1986). «Разработка банка фильтров анализа/синтеза на основе отмены псевдонимов во временной области» . Транзакции IEEE по акустике, речи и обработке сигналов . 34 (5): 1153–1161. дои : 10.1109/ТАССП.1986.1164954 .
  12. ^ Перейти обратно: а б с д и ж Ло, Фа-Лонг (2008). Стандарты мобильного мультимедийного вещания: технологии и практика . Springer Science & Business Media . п. 590. ИСБН  9780387782638 .
  13. ^ Британак, В. (2011). «О свойствах, связях и упрощенной реализации наборов фильтров в стандартах кодирования звука Dolby Digital (Plus) AC-3». Транзакции IEEE по обработке звука, речи и языка . 19 (5): 1231–1241. дои : 10.1109/TASL.2010.2087755 . S2CID   897622 .
  14. ^ Перейти обратно: а б Бранденбург, Карлхайнц (1999). «Объяснение MP3 и AAC» (PDF) . Архивировано (PDF) из оригинала 13 февраля 2017 г.
  15. ^ «Отчет разработчиков видео за 2019 год» (PDF) . Битмовин . 2019 . Проверено 5 ноября 2019 г.
  16. ^ Британак, В. (2011). «О свойствах, связях и упрощенной реализации наборов фильтров в стандартах кодирования звука Dolby Digital (Plus) AC-3». Транзакции IEEE по обработке звука, речи и языка . 19 (5): 1231–1241. дои : 10.1109/TASL.2010.2087755 . S2CID   897622 .
  17. ^ Станкович, Радомир С.; Астола, Яакко Т. (2012). «Воспоминания о ранней работе в DCT: интервью с К.Р. Рао» (PDF) . Отпечатки первых дней информационных наук . 60 . Проверено 13 октября 2019 г.
  18. ^ Фонд Xiph.Org (2 июня 2009 г.). «Спецификация Vorbis I – 1.1.2 Классификация» . Фонд Xiph.Org . Проверено 22 сентября 2009 г.
  19. ^ Терриберри, Тимоти Б. Презентация кодека CELT . Презентация (PDF) .
  20. ^ Вален, Жан-Марк; Максвелл, Грегори; Терриберри, Тимоти Б.; Вос, Коэн (октябрь 2013 г.). Высококачественное кодирование музыки с малой задержкой в ​​кодеке Opus . 135-я Конвенция AES. Общество аудиоинженеров . arXiv : 1602.04845 .
  21. ^ Дарко, Джон Х. (29 марта 2017 г.). «Неудобная правда о Bluetooth-аудио» . ДАР__КО . Архивировано из оригинала 14 января 2018 г. Проверено 13 января 2018 г.
  22. ^ Форд, Джез (24 августа 2015 г.). «Что такое Sony LDAC и как она это делает?» . AVHub . Проверено 13 января 2018 г.
  23. ^ Форд, Джез (22 ноября 2016 г.). «aptX HD — без потерь или с потерями?» . AVHub . Проверено 13 января 2018 г.
  24. ^ «Аудиоформаты цифровых театральных систем» . Библиотека Конгресса . 27 декабря 2011 года . Проверено 10 ноября 2019 г. .
  25. ^ Спаниас, Андреас; Художник, Тед; Атти, Венкатраман (2006). Обработка и кодирование аудиосигналов . Джон Уайли и сыновья . п. 338. ИСБН  9780470041963 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 81fd613232826e10c16ac7bf0c714cb0__1714539660
URL1:https://arc.ask3.ru/arc/aa/81/b0/81fd613232826e10c16ac7bf0c714cb0.html
Заголовок, (Title) документа по адресу, URL1:
Audio coding format - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)