Цифровое аудио
Цифровое аудио — это представление звука, записанного или преобразованного в цифровую форму . аудио звуковая волна аудиосигнала В цифровом обычно кодируется в виде числовых выборок в непрерывной последовательности. Например, в аудио CD семплы берутся 44 100 раз в секунду 16 бит , каждый с глубиной семпла . Цифровое аудио — это также название всей технологии записи и воспроизведения звука с использованием аудиосигналов, закодированных в цифровой форме. После значительных достижений в области цифровых аудиотехнологий в 1970-х и 1980-х годах они постепенно заменили аналоговые аудиотехнологии во многих областях аудиотехники , производства пластинок и телекоммуникаций в 1990-х и 2000-х годах.
В цифровой аудиосистеме аналоговый электрический сигнал, представляющий звук, преобразуется с помощью аналого-цифрового преобразователя (АЦП) в цифровой сигнал, обычно с использованием импульсно-кодовой модуляции (ИКМ). Этот цифровой сигнал затем можно записывать, редактировать, модифицировать и копировать с помощью компьютеров , устройств воспроизведения звука и других цифровых инструментов. При воспроизведении цифро-аналоговый преобразователь (ЦАП) выполняет обратный процесс, преобразуя цифровой сигнал обратно в аналоговый сигнал, который затем передается через усилитель мощности звука и, в конечном итоге, на громкоговоритель .
Цифровые аудиосистемы могут включать в себя сжатия , хранения , обработки и передачи компоненты . Преобразование в цифровой формат позволяет удобно манипулировать, хранить, передавать и извлекать аудиосигнал. В отличие от аналогового звука, при котором копирование записи приводит к потерям генерации и ухудшению качества сигнала, цифровой звук позволяет создавать бесконечное количество копий без какого-либо ухудшения качества сигнала.
Обзор
[ редактировать ]Цифровые аудиотехнологии используются при записи, обработке, массовом производстве и распространении звука, включая записи песен , инструментальных произведений, подкастов , звуковых эффектов и других звуков. Современное распространение музыки в Интернете зависит от цифровой записи и сжатия данных . Доступность музыки в виде файлов данных, а не физических объектов, значительно снизила затраты на распространение, а также облегчила обмен копиями. [ 1 ] До появления цифрового звука музыкальная индустрия распространяла и продавала музыку, продавая физические копии в виде пластинок и кассет . С помощью систем цифрового аудио и онлайн-распространения, таких как iTunes , компании продают потребителям цифровые звуковые файлы, которые потребитель получает через Интернет. Популярные потоковые сервисы, такие как Apple Music , Spotify или YouTube , предлагают временный доступ к цифровому файлу и в настоящее время являются наиболее распространенной формой потребления музыки. [ 2 ]
Аналоговая аудиосистема преобразует физические формы звуковых сигналов в электрические представления этих сигналов с помощью преобразователя , например микрофона . Звуки затем сохраняются на аналоговом носителе, таком как магнитная лента , или передаются через аналоговый носитель, такой как телефонная линия или радио . При воспроизведении процесс обратный: электрический аудиосигнал усиливается , а затем преобразуется обратно в физические сигналы через громкоговоритель . Аналоговый звук сохраняет свои фундаментальные волновые характеристики при хранении, преобразовании, дублировании и усилении.
Аналоговые аудиосигналы подвержены шуму и искажениям из-за врожденных характеристик электронных схем и связанных с ними устройств. Помехи в цифровой системе не приводят к ошибке, если только они не настолько велики, что приводят к неправильной интерпретации символа как другого символа или к нарушению последовательности символов. Таким образом, в целом возможно иметь полностью безошибочную цифровую аудиосистему, в которой между преобразованием в цифровой формат и обратным преобразованием в аналоговый не возникает шума или искажений. [ а ]
Цифровой аудиосигнал может быть закодирован для исправления любых ошибок, которые могут возникнуть при хранении или передаче сигнала. Этот метод, известный как канальное кодирование , необходим для цифровых систем вещания или записи для поддержания точности битов. Модуляция от восьми до четырнадцати — это код канала, используемый для аудиокомпакт -диска (CD).
Процесс конвертации
[ редактировать ]Если аудиосигнал является аналоговым, цифровая аудиосистема начинается с АЦП, который преобразует аналоговый сигнал в цифровой сигнал. [ б ] АЦП работает с заданной частотой дискретизации и выполняет преобразование с известным битовым разрешением. CD-аудио , например, имеет частоту дискретизации 44,1 кГц (44 100 выборок в секунду) и 16-битное разрешение для каждого стереоканала . Аналоговые сигналы, которые еще не были ограничены по полосе, должны быть пропущены через фильтр сглаживания перед преобразованием, чтобы предотвратить искажение наложения спектров , вызываемое аудиосигналами с частотами выше частоты Найквиста (половина частоты дискретизации).
Цифровой аудиосигнал может храниться или передаваться. Цифровое аудио можно хранить на компакт-диске, цифровом аудиоплеере , жестком диске , USB-накопителе или любом другом устройстве хранения цифровых данных . Цифровой сигнал может быть изменен посредством цифровой обработки сигнала , где он может быть отфильтрован или к нему применены эффекты . Преобразование частоты дискретизации , включая повышающую и понижающую дискретизацию, можно использовать для изменения сигналов, которые были закодированы с другой частотой дискретизации, на общую частоту дискретизации перед обработкой. методы сжатия аудиоданных, такие как MP3 , Advanced Audio Coding , Ogg Vorbis или FLAC Для уменьшения размера файла обычно используются . Цифровое аудио может передаваться через цифровые аудиоинтерфейсы, такие как AES3 или MADI . Цифровое аудио может передаваться по сети с использованием аудио через Ethernet , аудио через IP или других стандартов и систем потокового мультимедиа .
Для воспроизведения цифровой звук необходимо преобразовать обратно в аналоговый сигнал с помощью ЦАП. Согласно теореме выборки Найквиста-Шеннона , с некоторыми практическими и теоретическими ограничениями, версия исходного аналогового сигнала с ограниченной полосой частот может быть точно восстановлена из цифрового сигнала.
Во время преобразования аудиоданные могут быть снабжены цифровым водяным знаком для предотвращения пиратства и несанкционированного использования. Нанесение водяных знаков осуществляется с использованием метода расширения спектра прямой последовательности (DSSS). Затем аудиоинформация модулируется псевдошумовой (PN) последовательностью, затем формируется в частотной области и возвращается в исходный сигнал. Сила встраивания определяет силу водяного знака в аудиоданных. [ 4 ]
История
[ редактировать ]Кодирование
[ редактировать ]Импульсно-кодовая модуляция (ИКМ) была изобретена британским ученым Алеком Ривзом в 1937 году. [ 5 ] В 1950 году К. Чапин Катлер из Bell Labs подал патент на дифференциальную импульсно-кодовую модуляцию (DPCM). [ 6 ] алгоритм сжатия данных . Адаптивный DPCM (ADPCM) был представлен П. Каммиски, Никилом С. Джаянтом и Джеймсом Л. Фланаганом в Bell Labs в 1973 году. [ 7 ] [ 8 ]
Перцептивное кодирование было впервые использовано для кодирования речи сжатия с помощью кодирования с линейным предсказанием (LPC). [ 9 ] Первоначальные концепции LPC восходят к работам Фумитады Итакура ( Университет Нагои ) и Сюдзо Сайто ( Nippon Telegraph and Telephone ). [ 10 ] В 1970-х годах Бишну С. Атал и Манфред Р. Шредер из Bell Labs разработали форму LPC, названную адаптивным предсказательным кодированием (APC), алгоритм перцептивного кодирования, который использовал маскирующие свойства человеческого уха, за которым в начале 1980-х годов последовало алгоритм линейного предсказания с кодовым возбуждением (CELP). [ 9 ]
Кодирование с дискретным косинусным преобразованием (DCT) — метод сжатия с потерями , впервые предложенный Насиром Ахмедом в 1972 году. [ 11 ] [ 12 ] обеспечил основу для модифицированного дискретного косинусного преобразования (MDCT), которое было разработано Дж. П. Принсеном, А. В. Джонсоном и А. Б. Брэдли в 1987 году. [ 13 ] MDCT является основой большинства стандартов кодирования звука , таких как Dolby Digital (AC-3), [ 14 ] MP3 ( MPEG Layer III), [ 15 ] [ 9 ] Advanced Audio Coding (AAC), Windows Media Audio (WMA) и Vorbis ( Ogg ). [ 14 ]
Запись
[ редактировать ]PCM использовался в телекоммуникационных приложениях задолго до его первого использования в коммерческом вещании и записи. Коммерческая цифровая запись была впервые внедрена в Японии компаниями NHK и Nippon Columbia и их брендом Denon в 1960-х годах. Первые коммерческие цифровые записи были выпущены в 1971 году. [ 16 ]
BBC . также начала экспериментировать с цифровым звуком в 1960-х годах К началу 1970-х годов компания разработала двухканальный рекордер, а в 1972 году внедрила систему цифровой передачи звука, которая связала центр вещания с удаленными передатчиками. [ 16 ]
Первая 16-битная запись PCM в США была сделана Томасом Стокхэмом в Опере Санта-Фе в 1976 году на записывающем устройстве Soundstream . Усовершенствованная версия системы Soundstream использовалась Telarc для создания нескольких классических записей в 1978 году. 3M цифровой многодорожечный рекордер Разрабатываемый в то время был основан на технологии BBC. Первым полностью цифровым альбомом, записанным на этом аппарате, был Рая Кудера в «Bop Till You Drop» 1979 году. Британский лейбл Decca начал разработку собственных двухдорожечных цифровых аудиорекордеров в 1978 году и выпустил первую европейскую цифровую запись в 1979 году. [ 16 ]
Популярные профессиональные цифровые многодорожечные записывающие устройства, произведенные Sony/Studer ( DASH ) и Mitsubishi ( ProDigi ) в начале 1980-х годов, помогли добиться признания цифровой записи крупными звукозаписывающими компаниями. Машины для этих форматов также имели свои собственные встроенные транспортеры, использующие катушечную ленту шириной 1/4", 1/2" или 1 дюйм, при этом аудиоданные записывались на ленту с помощью мультикассеты. Стационарные магнитофонные головки с дорожками PCM позволяли осуществлять запись цифрового стереозвука на обычный видеомагнитофон NTCS или PAL .
Выпуск компакт-диска компаниями Philips и Sony в 1982 году популяризировал цифровое аудио среди потребителей. [ 16 ]
ADAT стал доступен в начале 1990-х годов, что позволяло записывать восемь дорожек с частотой 44,1 или 48 кГц на кассеты S-VHS, а DTRS выполнял аналогичную функцию с лентами Hi8.
Такие форматы, как ProDigi и DASH, назывались форматами SDAT ( цифровая ) головкой со стационарной аудиокассета ) . , в отличие от таких форматов , как системы на базе адаптеров PCM и DAT, которые назывались RDAT ( с вращающейся головкой D igital Audio Tape ) из-за их процесса записи со спиральной разверткой.
Как и кассета DAT , машины ProDigi и DASH также поддерживают обязательную частоту дискретизации 44,1 кГц, но также и 48 кГц на всех машинах и, в конечном итоге, частоту дискретизации 96 кГц. Они преодолели проблемы, из-за которых типичные аналоговые записывающие устройства не могли удовлетворить требования к полосе пропускания (диапазону частот) цифровой записи за счет сочетания более высоких скоростей ленты, более узких зазоров между головками, используемых в сочетании с лентами с металлическим составом, и распределения данных по нескольким параллельным каналам. треки.
В отличие от аналоговых систем, современные цифровые звуковые рабочие станции и аудиоинтерфейсы позволяют использовать столько каналов с таким количеством различных частот дискретизации, сколько компьютер может эффективно работать одновременно. Avid Audio и Steinberg выпустили первые программы для рабочих станций цифрового аудио в 1989 году. [ 17 ] Рабочие станции цифрового аудио значительно упрощают многодорожечную запись и микширование для крупных проектов, которые в противном случае были бы затруднительны с аналоговым оборудованием.
Телефония
[ редактировать ]Быстрое развитие и широкое распространение цифровой телефонии PCM стало возможным благодаря (SC) металл-оксид-полупроводник (МОП) технологии переключаемых конденсаторов , разработанной в начале 1970-х годов. [ 18 ] Это привело к разработке чипов-фильтров кодеков PCM в конце 1970-х годов. [ 18 ] [ 19 ] Микросхема (дополнительная MOS) с кремниевым затвором кодека-фильтра PCM CMOS , разработанная Дэвидом А. Ходжесом и У. К. Блэком в 1980 году. [ 18 ] с тех пор стал отраслевым стандартом цифровой телефонии. [ 18 ] [ 19 ] К 1990-м годам телекоммуникационные сети , такие как коммутируемая телефонная сеть общего пользования (PSTN), были в значительной степени оцифрованы с помощью VLSI (очень крупномасштабной интеграции CMOS PCM-кодеков-фильтров ), широко используемых в электронных системах коммутации для телефонных станций на стороне пользователя , модемов и ряд приложений цифровой передачи , таких как цифровая сеть с интеграцией услуг (ISDN), беспроводные телефоны и сотовые телефоны . [ 19 ]
Технологии
[ редактировать ]Цифровое аудио используется при трансляции звука. Стандартные технологии включают цифровое аудиовещание (DAB), мировое цифровое радио (DRM), HD-радио и внутриполосное внутриканальное радиовещание (IBOC).
Цифровой звук в приложениях записи хранится на специальных аудиотехнологиях, включая компакт-диски, цифровые аудиокассеты (DAT), цифровые компакт-кассеты (DCC) и мини-диски . Цифровое аудио может храниться в стандартных форматах аудиофайлов и храниться на рекордере с жестким диском , Blu-ray или DVD-Audio . Файлы можно воспроизводить на смартфонах, компьютерах или MP3-плеерах . Разрешение цифрового звука измеряется глубиной сэмпла . Большинство цифровых аудиоформатов используют глубину семпла 16, 24 или 32 бита.
Интерфейсы
[ редактировать ]
Для персональных компьютеров USB и IEEE 1394 предусматривают передачу цифрового звука в реальном времени. USB-интерфейсы становятся все более популярными среди независимых аудиоинженеров и продюсеров благодаря своим небольшим размерам и простоте использования. В профессиональных архитектурных или монтажных приложениях передачи звука через Ethernet существует множество протоколов и интерфейсов . В радиовещании более общей технологии передачи звука по IP- предпочтение отдается сети. В телефонии передача голоса по IP используется в качестве сетевого интерфейса для цифрового аудио для голосовой связи.
Несколько интерфейсов предназначены для совместной передачи цифрового видео и аудио, включая HDMI и DisplayPort . Некоторые интерфейсы поддерживают MIDI , а также XLR и TRS аналоговые порты .
Интерфейсы, специфичные для цифрового аудио, включают в себя:
- A2DP через Bluetooth
- AC'97 Интерфейс (Audio Codec 1997) между интегральными схемами на материнских платах ПК.
- ADAT Lightpipe Интерфейс
- Интерфейс AES3 с разъемами XLR , распространенный в профессиональном аудиооборудовании.
- AES47 — профессиональное цифровое аудио в стиле AES3 по с асинхронным режимом передачи сетям
- Intel High Definition Audio — современная замена AC'97
- Интерфейс I²S (звук Inter-IC) между интегральными схемами в бытовой электронике
- MADI (многоканальный цифровой аудиоинтерфейс)
- MIDI — низкоскоростное соединение для передачи данных инструмента; не может передавать звук, но может передавать данные цифровых сэмплов не в реальном времени
- S/PDIF — либо по коаксиальному кабелю , либо по TOSLINK , распространен в потребительском аудиооборудовании и получен на основе AES3.
- TDIF , TASCAM собственный формат D-sub с кабелем
См. также
[ редактировать ]- Цифровой аудиоредактор
- Цифровой синтезатор
- Синтез частотной модуляции
- Звуковой чип
- Звуковая карта
- Аудио интерфейс
- Квантование
- Выборка
- Многодорожечная запись
- Цифровая аудио рабочая станция
Примечания
[ редактировать ]- ^ Фильтрация сглаживания и дополнительная цифровая обработка сигнала могут ухудшить аудиосигнал из-за пульсаций полосы пропускания, нелинейного фазового сдвига, шума числового прецизионного квантования или временных искажений переходных процессов. Однако эти потенциальные ухудшения могут быть ограничены тщательным цифровым проектированием. [ 3 ]
- ^ Некоторые аудиосигналы, например, созданные с помощью цифрового синтеза, полностью происходят в цифровой области, и в этом случае аналого-цифровое преобразование не происходит.
Ссылки
[ редактировать ]- ^ Янссенс, Йелле; Стейн Вандаэле; Том Вандер Бекен (2009). «Музыкальная индустрия на линии? Как пережить музыкальное пиратство в цифровую эпоху» . Европейский журнал преступности, уголовного права и уголовного правосудия . 77 (96): 77–96. дои : 10.1163/157181709X429105 . hdl : 1854/LU-608677 .
- ^ Лийкканен, Ласси А.; Оман, Пиркка (май 2016 г.). «Сервисы перетасовки: текущие тенденции взаимодействия с цифровой музыкой» . Взаимодействие с компьютерами . 28 (3): 352–371. дои : 10.1093/iwc/iwv004 . ISSN 0953-5438 .
- ^ История, Майк (сентябрь 1997 г.). «Предлагаемое объяснение (некоторых) звуковых различий между аудиоматериалами с высокой частотой дискретизации и обычной частотой дискретизации» (PDF) . dCS Ltd. Архивировано (PDF) оригинала 28 ноября 2009 г.
- ^ Сок, Чонвон; Хун, Джин Ву; Ким, Джинун (1 июня 2002 г.). «Новый алгоритм нанесения водяных знаков на аудио для защиты авторских прав на цифровое аудио» . Журнал ЭТРИ . 24 (3): 181–189. дои : 10.4218/etrij.02.0102.0301 . ISSN 1225-6463 . S2CID 3008374 .
- ^ Гений непризнанный , BBC, 27 марта 2011 г. , получено 30 марта 2011 г.
- ^ Патент США 2605361 , К. Чапин Катлер, «Дифференциальное квантование сигналов связи», выдан 29 июля 1952 г.
- ^ П. Каммиски, Никил С. Джаянт и Дж. Л. Фланаган, «Адаптивное квантование в дифференциальном ИКМ-кодировании речи», Bell Syst. Тех. Дж. , вып. 52, стр. 1105–1118, сентябрь 1973 г.
- ^ Каммиски, П.; Джаянт, Никил С.; Фланаган, Дж. Л. (1973). «Адаптивное квантование при дифференциальном ИКМ-кодировании речи». Технический журнал Bell System . 52 (7): 1105–1118. дои : 10.1002/j.1538-7305.1973.tb02007.x . ISSN 0005-8580 .
- ^ Перейти обратно: а б с Шредер, Манфред Р. (2014). «Лаборатории Белла» . Акустика, информация и связь: Мемориальный том в честь Манфреда Р. Шредера . Спрингер. п. 388. ИСБН 9783319056609 .
- ^ Грей, Роберт М. (2010). «История цифровой речи в реальном времени в пакетных сетях: Часть II линейного прогнозирующего кодирования и интернет-протокола» (PDF) . Найденный. Процесс сигналов трендов . 3 (4): 203–303. дои : 10.1561/2000000036 . ISSN 1932-8346 .
- ^ Ахмед, Насир (январь 1991 г.). «Как я придумал дискретное косинусное преобразование» . Цифровая обработка сигналов . 1 (1): 4–5. дои : 10.1016/1051-2004(91)90086-Z .
- ^ Насир Ахмед; Т. Натараджан; Камисетти Рамамохан Рао (январь 1974 г.). «Дискретное косинусное преобразование» (PDF) . Транзакции IEEE на компьютерах . С-23 (1): 90–93. дои : 10.1109/TC.1974.223784 . S2CID 149806273 .
- ^ Дж. П. Принсен, А. В. Джонсон и А. Б. Брэдли: Кодирование поддиапазонов/преобразований с использованием конструкций банка фильтров на основе отмены наложения псевдонимов во временной области , IEEE Proc. Международный Конференция по акустике, речи и обработке сигналов (ICASSP), 2161–2164, 1987.
- ^ Перейти обратно: а б Ло, Фа-Лонг (2008). Стандарты мобильного мультимедийного вещания: технологии и практика . Springer Science & Business Media . п. 590. ИСБН 9780387782638 .
- ^ Гукерт, Джон (весна 2012 г.). «Использование БПФ и MDCT в сжатии аудио MP3» (PDF) . Университет Юты . Проверено 14 июля 2019 г.
- ^ Перейти обратно: а б с д Хорошо, Томас (2008). Барри Р. Эшпол (ред.). «Рассвет коммерческой цифровой записи» (PDF) . Журнал АРСК . Проверено 2 мая 2010 г.
- ^ Рейтер, Андерс (15 марта 2022 г.). «Кто выпустил DAW? Цифра в новом поколении цифровой аудио рабочей станции» . Популярная музыка и общество . 45 (2): 113–128. дои : 10.1080/03007766.2021.1972701 . ISSN 0300-7766 . S2CID 242779244 .
- ^ Перейти обратно: а б с д Олстот, Дэвид Дж. (2016). «Фильтры с переключаемыми конденсаторами» (PDF) . В Малоберти, Франко; Дэвис, Энтони К. (ред.). Краткая история схем и систем: от экологически чистых, мобильных, всеобъемлющих сетей к вычислениям больших данных . Общество схем и систем IEEE . стр. 105–110. ISBN 9788793609860 . Архивировано из оригинала (PDF) 30 сентября 2021 г. Проверено 29 ноября 2019 г.
- ^ Перейти обратно: а б с Флойд, Майкл Д.; Хиллман, Гарт Д. (8 октября 2018 г.) [1-й паб. 2000]. «Кодек-фильтры импульсно-кодовой модуляции» . Справочник по коммуникациям (2-е изд.). ЦРК Пресс . стр. 26–1, 26–2, 26–3. ISBN 9781420041163 .
Дальнейшее чтение
[ редактировать ]- Борвик, Джон, редактор, 1994: Практика звукозаписи (Оксфорд: Oxford University Press)
- Боси, Марина и Голдберг, Ричард Э., 2003: Введение в кодирование и стандарты цифрового аудио (Springer)
- Ифичор, Эммануэль К., и Джервис, Барри В., 2002: Цифровая обработка сигналов: практический подход (Харлоу, Англия: Pearson Education Limited)
- Рабинер, Лоуренс Р. и Голд, Бернард, 1975: Теория и применение цифровой обработки сигналов (Энглвуд Клиффс, Нью-Джерси: Prentice-Hall, Inc.)
- Уоткинсон, Джон, 1994: Искусство цифрового аудио (Оксфорд: Focal Press)
Внешние ссылки
[ редактировать ]- Монти Монтгомери (24 октября 2012 г.). «Мнение гостя: почему загрузка музыки 24/192 не имеет смысла» . разработчик.fm. Архивировано из оригинала 10 декабря 2012 г. Проверено 7 декабря 2012 г.
- Дж. РОБЕРТ СТЮАРТ. «Кодирование высококачественного цифрового звука» (PDF) . Архивировано из оригинала (PDF) 27 июня 2007 г. Проверено 7 декабря 2012 г.
- Дэн Лаври. «Теория дискретизации цифрового звука» (PDF) . Архивировано (PDF) из оригинала 16 сентября 2012 г. Проверено 7 декабря 2012 г.