Jump to content

Цифровое аудио

Послушайте эту статью
(Перенаправлено с цифрового звука )
Уровни звука отображаются на цифровом диктофоне ( Zoom H4n )

Цифровое аудио — это представление звука, записанного или преобразованного в цифровую форму . аудио звуковая волна аудиосигнала В цифровом обычно кодируется в виде числовых выборок в непрерывной последовательности. Например, в аудио CD семплы берутся 44 100 раз в секунду 16 бит , каждый с глубиной семпла . Цифровое аудио — это также название всей технологии записи и воспроизведения звука с использованием аудиосигналов, закодированных в цифровой форме. После значительных достижений в области цифровых аудиотехнологий в 1970-х и 1980-х годах они постепенно заменили аналоговые аудиотехнологии во многих областях аудиотехники , производства пластинок и телекоммуникаций в 1990-х и 2000-х годах.

В цифровой аудиосистеме аналоговый электрический сигнал, представляющий звук, преобразуется с помощью аналого-цифрового преобразователя (АЦП) в цифровой сигнал, обычно с использованием импульсно-кодовой модуляции (ИКМ). Этот цифровой сигнал затем можно записывать, редактировать, модифицировать и копировать с помощью компьютеров , устройств воспроизведения звука и других цифровых инструментов. При воспроизведении цифро-аналоговый преобразователь (ЦАП) выполняет обратный процесс, преобразуя цифровой сигнал обратно в аналоговый сигнал, который затем передается через усилитель мощности звука и, в конечном итоге, на громкоговоритель .

Цифровые аудиосистемы могут включать в себя сжатия , хранения , обработки и передачи компоненты . Преобразование в цифровой формат позволяет удобно манипулировать, хранить, передавать и извлекать аудиосигнал. В отличие от аналогового звука, при котором копирование записи приводит к потерям генерации и ухудшению качества сигнала, цифровой звук позволяет создавать бесконечное количество копий без какого-либо ухудшения качества сигнала.

Звуковая волна (красный цвет) представлена ​​в цифровом виде, синий цвет (после дискретизации и 4-битного квантования ).

Цифровые аудиотехнологии используются при записи, обработке, массовом производстве и распространении звука, включая записи песен , инструментальных произведений, подкастов , звуковых эффектов и других звуков. Современное распространение музыки в Интернете зависит от цифровой записи и сжатия данных . Доступность музыки в виде файлов данных, а не физических объектов, значительно снизила затраты на распространение, а также облегчила обмен копиями. [ 1 ] До появления цифрового звука музыкальная индустрия распространяла и продавала музыку, продавая физические копии в виде пластинок и кассет . С помощью систем цифрового аудио и онлайн-распространения, таких как iTunes , компании продают потребителям цифровые звуковые файлы, которые потребитель получает через Интернет. Популярные потоковые сервисы, такие как Apple Music , Spotify или YouTube , предлагают временный доступ к цифровому файлу и в настоящее время являются наиболее распространенной формой потребления музыки. [ 2 ]

Аналоговая аудиосистема преобразует физические формы звуковых сигналов в электрические представления этих сигналов с помощью преобразователя , например микрофона . Звуки затем сохраняются на аналоговом носителе, таком как магнитная лента , или передаются через аналоговый носитель, такой как телефонная линия или радио . При воспроизведении процесс обратный: электрический аудиосигнал усиливается , а затем преобразуется обратно в физические сигналы через громкоговоритель . Аналоговый звук сохраняет свои фундаментальные волновые характеристики при хранении, преобразовании, дублировании и усилении.

Аналоговые аудиосигналы подвержены шуму и искажениям из-за врожденных характеристик электронных схем и связанных с ними устройств. Помехи в цифровой системе не приводят к ошибке, если только они не настолько велики, что приводят к неправильной интерпретации символа как другого символа или к нарушению последовательности символов. Таким образом, в целом возможно иметь полностью безошибочную цифровую аудиосистему, в которой между преобразованием в цифровой формат и обратным преобразованием в аналоговый не возникает шума или искажений. [ а ]

Цифровой аудиосигнал может быть закодирован для исправления любых ошибок, которые могут возникнуть при хранении или передаче сигнала. Этот метод, известный как канальное кодирование , необходим для цифровых систем вещания или записи для поддержания точности битов. Модуляция от восьми до четырнадцати — это код канала, используемый для аудиокомпакт -диска (CD).

Процесс конвертации

[ редактировать ]
Аналого-цифро-аналоговое преобразование
Жизненный цикл звука от источника, через АЦП, цифровую обработку, ЦАП и, наконец, снова в виде звука.

Если аудиосигнал является аналоговым, цифровая аудиосистема начинается с АЦП, который преобразует аналоговый сигнал в цифровой сигнал. [ б ] АЦП работает с заданной частотой дискретизации и выполняет преобразование с известным битовым разрешением. CD-аудио , например, имеет частоту дискретизации 44,1 кГц (44 100 выборок в секунду) и 16-битное разрешение для каждого стереоканала . Аналоговые сигналы, которые еще не были ограничены по полосе, должны быть пропущены через фильтр сглаживания перед преобразованием, чтобы предотвратить искажение наложения спектров , вызываемое аудиосигналами с частотами выше частоты Найквиста (половина частоты дискретизации).

Цифровой аудиосигнал может храниться или передаваться. Цифровое аудио можно хранить на компакт-диске, цифровом аудиоплеере , жестком диске , USB-накопителе или любом другом устройстве хранения цифровых данных . Цифровой сигнал может быть изменен посредством цифровой обработки сигнала , где он может быть отфильтрован или к нему применены эффекты . Преобразование частоты дискретизации , включая повышающую и понижающую дискретизацию, можно использовать для изменения сигналов, которые были закодированы с другой частотой дискретизации, на общую частоту дискретизации перед обработкой. методы сжатия аудиоданных, такие как MP3 , Advanced Audio Coding , Ogg Vorbis или FLAC Для уменьшения размера файла обычно используются . Цифровое аудио может передаваться через цифровые аудиоинтерфейсы, такие как AES3 или MADI . Цифровое аудио может передаваться по сети с использованием аудио через Ethernet , аудио через IP или других стандартов и систем потокового мультимедиа .

Для воспроизведения цифровой звук необходимо преобразовать обратно в аналоговый сигнал с помощью ЦАП. Согласно теореме выборки Найквиста-Шеннона , с некоторыми практическими и теоретическими ограничениями, версия исходного аналогового сигнала с ограниченной полосой частот может быть точно восстановлена ​​из цифрового сигнала.

Во время преобразования аудиоданные могут быть снабжены цифровым водяным знаком для предотвращения пиратства и несанкционированного использования. Нанесение водяных знаков осуществляется с использованием метода расширения спектра прямой последовательности (DSSS). Затем аудиоинформация модулируется псевдошумовой (PN) последовательностью, затем формируется в частотной области и возвращается в исходный сигнал. Сила встраивания определяет силу водяного знака в аудиоданных. [ 4 ]

Кодирование

[ редактировать ]

Импульсно-кодовая модуляция (ИКМ) была изобретена британским ученым Алеком Ривзом в 1937 году. [ 5 ] В 1950 году К. Чапин Катлер из Bell Labs подал патент на дифференциальную импульсно-кодовую модуляцию (DPCM). [ 6 ] алгоритм сжатия данных . Адаптивный DPCM (ADPCM) был представлен П. Каммиски, Никилом С. Джаянтом и Джеймсом Л. Фланаганом в Bell Labs в 1973 году. [ 7 ] [ 8 ]

Перцептивное кодирование было впервые использовано для кодирования речи сжатия с помощью кодирования с линейным предсказанием (LPC). [ 9 ] Первоначальные концепции LPC восходят к работам Фумитады Итакура ( Университет Нагои ) и Сюдзо Сайто ( Nippon Telegraph and Telephone ). [ 10 ] В 1970-х годах Бишну С. Атал и Манфред Р. Шредер из Bell Labs разработали форму LPC, названную адаптивным предсказательным кодированием (APC), алгоритм перцептивного кодирования, который использовал маскирующие свойства человеческого уха, за которым в начале 1980-х годов последовало алгоритм линейного предсказания с кодовым возбуждением (CELP). [ 9 ]

Кодирование с дискретным косинусным преобразованием (DCT) — метод сжатия с потерями , впервые предложенный Насиром Ахмедом в 1972 году. [ 11 ] [ 12 ] обеспечил основу для модифицированного дискретного косинусного преобразования (MDCT), которое было разработано Дж. П. Принсеном, А. В. Джонсоном и А. Б. Брэдли в 1987 году. [ 13 ] MDCT является основой большинства стандартов кодирования звука , таких как Dolby Digital (AC-3), [ 14 ] MP3 ( MPEG Layer III), [ 15 ] [ 9 ] Advanced Audio Coding (AAC), Windows Media Audio (WMA) и Vorbis ( Ogg ). [ 14 ]

PCM использовался в телекоммуникационных приложениях задолго до его первого использования в коммерческом вещании и записи. Коммерческая цифровая запись была впервые внедрена в Японии компаниями NHK и Nippon Columbia и их брендом Denon в 1960-х годах. Первые коммерческие цифровые записи были выпущены в 1971 году. [ 16 ]

BBC . также начала экспериментировать с цифровым звуком в 1960-х годах К началу 1970-х годов компания разработала двухканальный рекордер, а в 1972 году внедрила систему цифровой передачи звука, которая связала центр вещания с удаленными передатчиками. [ 16 ]

Катушечный магнитофон

Первая 16-битная запись PCM в США была сделана Томасом Стокхэмом в Опере Санта-Фе в 1976 году на записывающем устройстве Soundstream . Усовершенствованная версия системы Soundstream использовалась Telarc для создания нескольких классических записей в 1978 году. 3M цифровой многодорожечный рекордер Разрабатываемый в то время был основан на технологии BBC. Первым полностью цифровым альбомом, записанным на этом аппарате, был Рая Кудера в «Bop Till You Drop» 1979 году. Британский лейбл Decca начал разработку собственных двухдорожечных цифровых аудиорекордеров в 1978 году и выпустил первую европейскую цифровую запись в 1979 году. [ 16 ]

Популярные профессиональные цифровые многодорожечные записывающие устройства, произведенные Sony/Studer ( DASH ) и Mitsubishi ( ProDigi ) в начале 1980-х годов, помогли добиться признания цифровой записи крупными звукозаписывающими компаниями. Машины для этих форматов также имели свои собственные встроенные транспортеры, использующие катушечную ленту шириной 1/4", 1/2" или 1 дюйм, при этом аудиоданные записывались на ленту с помощью мультикассеты. Стационарные магнитофонные головки с дорожками PCM позволяли осуществлять запись цифрового стереозвука на обычный видеомагнитофон NTCS или PAL .

Выпуск компакт-диска компаниями Philips и Sony в 1982 году популяризировал цифровое аудио среди потребителей. [ 16 ]

ADAT стал доступен в начале 1990-х годов, что позволяло записывать восемь дорожек с частотой 44,1 или 48 кГц на кассеты S-VHS, а DTRS выполнял аналогичную функцию с лентами Hi8.

Такие форматы, как ProDigi и DASH, назывались форматами SDAT ( цифровая ) головкой со стационарной аудиокассета ) . , в отличие от таких форматов , как системы на базе адаптеров PCM и DAT, которые назывались RDAT ( с вращающейся головкой D igital Audio Tape ) из-за их процесса записи со спиральной разверткой.

Как и кассета DAT , машины ProDigi и DASH также поддерживают обязательную частоту дискретизации 44,1 кГц, но также и 48 кГц на всех машинах и, в конечном итоге, частоту дискретизации 96 кГц. Они преодолели проблемы, из-за которых типичные аналоговые записывающие устройства не могли удовлетворить требования к полосе пропускания (диапазону частот) цифровой записи за счет сочетания более высоких скоростей ленты, более узких зазоров между головками, используемых в сочетании с лентами с металлическим составом, и распределения данных по нескольким параллельным каналам. треки.

В отличие от аналоговых систем, современные цифровые звуковые рабочие станции и аудиоинтерфейсы позволяют использовать столько каналов с таким количеством различных частот дискретизации, сколько компьютер может эффективно работать одновременно. Avid Audio и Steinberg выпустили первые программы для рабочих станций цифрового аудио в 1989 году. [ 17 ] Рабочие станции цифрового аудио значительно упрощают многодорожечную запись и микширование для крупных проектов, которые в противном случае были бы затруднительны с аналоговым оборудованием.

Телефония

[ редактировать ]

Быстрое развитие и широкое распространение цифровой телефонии PCM стало возможным благодаря (SC) металл-оксид-полупроводник (МОП) технологии переключаемых конденсаторов , разработанной в начале 1970-х годов. [ 18 ] Это привело к разработке чипов-фильтров кодеков PCM в конце 1970-х годов. [ 18 ] [ 19 ] Микросхема (дополнительная MOS) с кремниевым затвором кодека-фильтра PCM CMOS , разработанная Дэвидом А. Ходжесом и У. К. Блэком в 1980 году. [ 18 ] с тех пор стал отраслевым стандартом цифровой телефонии. [ 18 ] [ 19 ] К 1990-м годам телекоммуникационные сети , такие как коммутируемая телефонная сеть общего пользования (PSTN), были в значительной степени оцифрованы с помощью VLSI (очень крупномасштабной интеграции CMOS PCM-кодеков-фильтров ), широко используемых в электронных системах коммутации для телефонных станций на стороне пользователя , модемов и ряд приложений цифровой передачи , таких как цифровая сеть с интеграцией услуг (ISDN), беспроводные телефоны и сотовые телефоны . [ 19 ]

(DAT) Sony Профессиональный цифровой аудиомагнитофон PCM-7030

Технологии

[ редактировать ]

Цифровое аудио используется при трансляции звука. Стандартные технологии включают цифровое аудиовещание (DAB), мировое цифровое радио (DRM), HD-радио и внутриполосное внутриканальное радиовещание (IBOC).

Цифровой звук в приложениях записи хранится на специальных аудиотехнологиях, включая компакт-диски, цифровые аудиокассеты (DAT), цифровые компакт-кассеты (DCC) и мини-диски . Цифровое аудио может храниться в стандартных форматах аудиофайлов и храниться на рекордере с жестким диском , Blu-ray или DVD-Audio . Файлы можно воспроизводить на смартфонах, компьютерах или MP3-плеерах . Разрешение цифрового звука измеряется глубиной сэмпла . Большинство цифровых аудиоформатов используют глубину семпла 16, 24 или 32 бита.

Цифровая аудио рабочая станция

Интерфейсы

[ редактировать ]


Для персональных компьютеров USB и IEEE 1394 предусматривают передачу цифрового звука в реальном времени. USB-интерфейсы становятся все более популярными среди независимых аудиоинженеров и продюсеров благодаря своим небольшим размерам и простоте использования. В профессиональных архитектурных или монтажных приложениях передачи звука через Ethernet существует множество протоколов и интерфейсов . В радиовещании более общей технологии передачи звука по IP- предпочтение отдается сети. В телефонии передача голоса по IP используется в качестве сетевого интерфейса для цифрового аудио для голосовой связи.

Несколько интерфейсов предназначены для совместной передачи цифрового видео и аудио, включая HDMI и DisplayPort . Некоторые интерфейсы поддерживают MIDI , а также XLR и TRS аналоговые порты .

USB-интерфейсы Focusrite

Интерфейсы, специфичные для цифрового аудио, включают в себя:

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ Фильтрация сглаживания и дополнительная цифровая обработка сигнала могут ухудшить аудиосигнал из-за пульсаций полосы пропускания, нелинейного фазового сдвига, шума числового прецизионного квантования или временных искажений переходных процессов. Однако эти потенциальные ухудшения могут быть ограничены тщательным цифровым проектированием. [ 3 ]
  2. ^ Некоторые аудиосигналы, например, созданные с помощью цифрового синтеза, полностью происходят в цифровой области, и в этом случае аналого-цифровое преобразование не происходит.
  1. ^ Янссенс, Йелле; Стейн Вандаэле; Том Вандер Бекен (2009). «Музыкальная индустрия на линии? Как пережить музыкальное пиратство в цифровую эпоху» . Европейский журнал преступности, уголовного права и уголовного правосудия . 77 (96): 77–96. дои : 10.1163/157181709X429105 . hdl : 1854/LU-608677 .
  2. ^ Лийкканен, Ласси А.; Оман, Пиркка (май 2016 г.). «Сервисы перетасовки: текущие тенденции взаимодействия с цифровой музыкой» . Взаимодействие с компьютерами . 28 (3): 352–371. дои : 10.1093/iwc/iwv004 . ISSN   0953-5438 .
  3. ^ История, Майк (сентябрь 1997 г.). «Предлагаемое объяснение (некоторых) звуковых различий между аудиоматериалами с высокой частотой дискретизации и обычной частотой дискретизации» (PDF) . dCS Ltd. Архивировано (PDF) оригинала 28 ноября 2009 г.
  4. ^ Сок, Чонвон; Хун, Джин Ву; Ким, Джинун (1 июня 2002 г.). «Новый алгоритм нанесения водяных знаков на аудио для защиты авторских прав на цифровое аудио» . Журнал ЭТРИ . 24 (3): 181–189. дои : 10.4218/etrij.02.0102.0301 . ISSN   1225-6463 . S2CID   3008374 .
  5. ^ Гений непризнанный , BBC, 27 марта 2011 г. , получено 30 марта 2011 г.
  6. ^ Патент США 2605361 , К. Чапин Катлер, «Дифференциальное квантование сигналов связи», выдан 29 июля 1952 г.  
  7. ^ П. Каммиски, Никил С. Джаянт и Дж. Л. Фланаган, «Адаптивное квантование в дифференциальном ИКМ-кодировании речи», Bell Syst. Тех. Дж. , вып. 52, стр. 1105–1118, сентябрь 1973 г.
  8. ^ Каммиски, П.; Джаянт, Никил С.; Фланаган, Дж. Л. (1973). «Адаптивное квантование при дифференциальном ИКМ-кодировании речи». Технический журнал Bell System . 52 (7): 1105–1118. дои : 10.1002/j.1538-7305.1973.tb02007.x . ISSN   0005-8580 .
  9. ^ Перейти обратно: а б с Шредер, Манфред Р. (2014). «Лаборатории Белла» . Акустика, информация и связь: Мемориальный том в честь Манфреда Р. Шредера . Спрингер. п. 388. ИСБН  9783319056609 .
  10. ^ Грей, Роберт М. (2010). «История цифровой речи в реальном времени в пакетных сетях: Часть II линейного прогнозирующего кодирования и интернет-протокола» (PDF) . Найденный. Процесс сигналов трендов . 3 (4): 203–303. дои : 10.1561/2000000036 . ISSN   1932-8346 .
  11. ^ Ахмед, Насир (январь 1991 г.). «Как я придумал дискретное косинусное преобразование» . Цифровая обработка сигналов . 1 (1): 4–5. дои : 10.1016/1051-2004(91)90086-Z .
  12. ^ Насир Ахмед; Т. Натараджан; Камисетти Рамамохан Рао (январь 1974 г.). «Дискретное косинусное преобразование» (PDF) . Транзакции IEEE на компьютерах . С-23 (1): 90–93. дои : 10.1109/TC.1974.223784 . S2CID   149806273 .
  13. ^ Дж. П. Принсен, А. В. Джонсон и А. Б. Брэдли: Кодирование поддиапазонов/преобразований с использованием конструкций банка фильтров на основе отмены наложения псевдонимов во временной области , IEEE Proc. Международный Конференция по акустике, речи и обработке сигналов (ICASSP), 2161–2164, 1987.
  14. ^ Перейти обратно: а б Ло, Фа-Лонг (2008). Стандарты мобильного мультимедийного вещания: технологии и практика . Springer Science & Business Media . п. 590. ИСБН  9780387782638 .
  15. ^ Гукерт, Джон (весна 2012 г.). «Использование БПФ и MDCT в сжатии аудио MP3» (PDF) . Университет Юты . Проверено 14 июля 2019 г.
  16. ^ Перейти обратно: а б с д Хорошо, Томас (2008). Барри Р. Эшпол (ред.). «Рассвет коммерческой цифровой записи» (PDF) . Журнал АРСК . Проверено 2 мая 2010 г.
  17. ^ Рейтер, Андерс (15 марта 2022 г.). «Кто выпустил DAW? Цифра в новом поколении цифровой аудио рабочей станции» . Популярная музыка и общество . 45 (2): 113–128. дои : 10.1080/03007766.2021.1972701 . ISSN   0300-7766 . S2CID   242779244 .
  18. ^ Перейти обратно: а б с д Олстот, Дэвид Дж. (2016). «Фильтры с переключаемыми конденсаторами» (PDF) . В Малоберти, Франко; Дэвис, Энтони К. (ред.). Краткая история схем и систем: от экологически чистых, мобильных, всеобъемлющих сетей к вычислениям больших данных . Общество схем и систем IEEE . стр. 105–110. ISBN  9788793609860 . Архивировано из оригинала (PDF) 30 сентября 2021 г. Проверено 29 ноября 2019 г.
  19. ^ Перейти обратно: а б с Флойд, Майкл Д.; Хиллман, Гарт Д. (8 октября 2018 г.) [1-й паб. 2000]. «Кодек-фильтры импульсно-кодовой модуляции» . Справочник по коммуникациям (2-е изд.). ЦРК Пресс . стр. 26–1, 26–2, 26–3. ISBN  9781420041163 .

Дальнейшее чтение

[ редактировать ]
  • Борвик, Джон, редактор, 1994: Практика звукозаписи (Оксфорд: Oxford University Press)
  • Боси, Марина и Голдберг, Ричард Э., 2003: Введение в кодирование и стандарты цифрового аудио (Springer)
  • Ифичор, Эммануэль К., и Джервис, Барри В., 2002: Цифровая обработка сигналов: практический подход (Харлоу, Англия: Pearson Education Limited)
  • Рабинер, Лоуренс Р. и Голд, Бернард, 1975: Теория и применение цифровой обработки сигналов (Энглвуд Клиффс, Нью-Джерси: Prentice-Hall, Inc.)
  • Уоткинсон, Джон, 1994: Искусство цифрового аудио (Оксфорд: Focal Press)
[ редактировать ]
Послушайте эту статью ( 9 минут )
Продолжительность: 9 минут 17 секунд.
Разговорная иконка Википедии
Этот аудиофайл был создан на основе редакции этой статьи от 12 марта 2016 г. ( 12 марта 2016 г. ) и не отражает последующие изменения.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 9a08e7d6e4896200f68d989213c0df33__1721992860
URL1:https://arc.ask3.ru/arc/aa/9a/33/9a08e7d6e4896200f68d989213c0df33.html
Заголовок, (Title) документа по адресу, URL1:
Digital audio - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)