WAV
Расширение имени файла |
.wav .wave |
---|---|
Тип интернет-СМИ | |
Введите код | ВОЛНА |
Единый идентификатор типа (UTI) | com.microsoft.waveform-audio |
Разработано | IBM и Майкрософт |
Первоначальный выпуск | август 1991 года [ 3 ] |
Последний выпуск | |
Тип формата | Формат аудиофайла , формат контейнера |
Расширено с | РИФФ |
Распространено на | БВФ , РФ64 |
Формат аудиофайла Waveform ( WAVE или WAV в зависимости от расширения имени файла ); [ 3 ] [ 6 ] [ 7 ] произносится / w æ v / или / w eɪ v / [ 8 ] ) — стандарт формата аудиофайлов для хранения аудиопотока на персональных компьютерах . Формат был разработан и впервые опубликован в 1991 году компаниями IBM и Microsoft . Это основной формат, используемый в системах Microsoft Windows для несжатого аудио . Обычное кодирование битового потока представляет собой формат линейной импульсно-кодовой модуляции (LPCM).
WAV — это применение формата файла обмена ресурсами (RIFF) метода формата битового потока для хранения данных в виде фрагментов и, таким образом, аналогично формату 8SVX и формату файла обмена аудио (AIFF), используемому на компьютерах Amiga и Macintosh соответственно.
Описание
[ редактировать ]Файл WAV является экземпляром формата файла обмена ресурсами (RIFF), определенного IBM и Microsoft . [ 3 ] Формат RIFF действует как оболочка для различных форматов кодирования звука .
Хотя файл WAV может содержать сжатый звук, наиболее распространенным аудиоформатом WAV является несжатый звук в формате линейной импульсно-кодовой модуляции (LPCM). LPCM также является стандартным форматом кодирования звука для аудио компакт-дисков , на которых хранится двухканальный звук LPCM, дискретизированный с частотой 44,1 кГц и 16 битами на выборку . Поскольку LPCM не сжат и сохраняет все образцы звуковой дорожки, профессиональные пользователи или эксперты в области звука могут использовать формат WAV со звуком LPCM для достижения максимального качества звука. [ 9 ] Файлы WAV также можно относительно легко редактировать и манипулировать ими с помощью программного обеспечения.
В Microsoft Windows формат WAV поддерживает сжатие звука с помощью диспетчера сжатия звука (ACM). любой кодек Для сжатия файла WAV можно использовать ( ACM. Доступ к пользовательскому интерфейсу UI) Audio Compression Manager можно получить через различные программы, которые его используют, включая Sound Recorder в некоторых версиях Windows.
Начиная с Windows 2000 , WAVE_FORMAT_EXTENSIBLE
Был определен заголовок, который определяет данные нескольких аудиоканалов вместе с позициями динамиков, устраняет двусмысленность относительно типов семплов и размеров контейнеров в стандартном формате WAV и поддерживает определение пользовательских расширений этого формата. [ 4 ] [ 5 ] [ 10 ]
Характеристики файла
[ редактировать ]РИФФ
[ редактировать ]Файл RIFF представляет собой формат файла с тегами. Он имеет особый формат контейнера ( чанк ) с заголовком, который включает четырехсимвольный тег ( FourCC ) и размер (количество байтов) чанка. Тег определяет, как следует интерпретировать данные внутри фрагмента. Существует несколько стандартных тегов FourCC. Теги, состоящие только из заглавных букв, являются зарезервированными. Самый внешний фрагмент файла RIFF имеет RIFF
ярлык; первые четыре байта данных фрагмента представляют собой дополнительный тег FourCC, который определяет тип формы, за которым следует последовательность подфрагментов. В случае файла WAV дополнительный тег WAVE
. Остальная часть данных RIFF представляет собой последовательность фрагментов, описывающих аудиоинформацию.
Преимущество формата файла с тегами состоит в том, что в дальнейшем этот формат можно расширить, сохраняя при этом обратную совместимость . [ 11 ] Правило для программы чтения RIFF (или WAV) заключается в том, что она должна игнорировать любой помеченный фрагмент, который он не распознает. [ 12 ] Читатель не сможет воспользоваться новой информацией, но читатель не должен запутаться.
Спецификация файлов RIFF включает определение INFO
кусок. Чанк может включать в себя такую информацию, как название произведения, автор, дата создания и информация об авторских правах. Хотя INFO
chunk был определен для RIFF в версии 1.0, на него не ссылались в формальной спецификации файла WAV. У многих читателей возникли проблемы с этим. Следовательно, самым безопасным с точки зрения обмена было бы опустить INFO
chunk и другие расширения и отправить файл с наименьшим общим знаменателем. Существуют и другие проблемы с размещением блоков INFO .
Предполагалось, что файлы RIFF будут использоваться в международных средах, поэтому существует CSET
chunk, чтобы указать код страны, язык, диалект и кодовую страницу для строк в файле RIFF. [ 13 ] Например, указав соответствующий CSET
чанк должен разрешать строки в INFO
chunk (и другие фрагменты в файле RIFF), которые будут интерпретироваться как символы кириллицы или японского языка.
RIFF также определяет JUNK
чанк, содержимое которого неинтересно. [ 14 ] Чанк позволяет удалить чанк, просто изменив его FourCC. Этот фрагмент также можно использовать для резервирования некоторого места для будущих изменений, чтобы файл можно было изменять без изменения размера. Более позднее определение RIFF представило аналогичный PAD
кусок. [ 15 ]
РИФ ВОЛНА
[ редактировать ]Определение верхнего уровня файла WAV: [ 16 ]
<WAVE-form> → RIFF('WAVE' <fmt-ck> // Format of the file [<fact-ck>] // Fact chunk [<cue-ck>] // Cue points [<playlist-ck>] // Playlist [<assoc-data-list>] // Associated data list <wave-data> ) // Wave data
Форма RIFF верхнего уровня использует WAVE
ярлык. За ним следует обязательное <fmt-ck>
фрагмент, описывающий формат следующего примера данных. Этот фрагмент включает в себя такую информацию, как кодирование выборки, количество бит на канал, количество каналов и частоту дискретизации.
Спецификация WAV включает некоторые дополнительные функции. Необязательный <fact-ck>
chunk сообщает количество выборок для некоторых схем сжатого кодирования. <cue-ck>
chunk идентифицирует некоторые значимые номера выборок в волновом файле. <playlist-ck>
chunk позволяет воспроизводить семплы не по порядку или повторять их, а не просто от начала до конца. Соответствующий список данных ( <assoc-data-list>
) позволяет прикреплять метки и примечания к ключевым точкам; текстовая аннотация может быть предоставлена для группы образцов (например, информация о подписи).
Наконец, обязательный <wave-data>
chunk содержит фактические образцы в указанном ранее формате.
Обратите внимание, что в определении файла WAV не указано, где находится INFO
чанк должен быть помещен. Также ничего не говорится о размещении CSET
фрагмент (который определяет используемый набор символов).
Спецификация RIFF пытается быть формальной спецификацией, но ее формализму не хватает точности, наблюдаемой в других форматах с тегами. Например, спецификация RIFF не проводит четкого различия между набором фрагментов и упорядоченной последовательностью фрагментов. Чанк формы RIFF предполагает, что это должен быть контейнер последовательности. Информация о секвенировании указывается в форме RIFF файла WAV в соответствии с формализмом: «Однако <fmt-ck>
всегда должно происходить раньше <wave-data>
, и оба эти фрагмента являются обязательными в WAVE-файле». [ 17 ] Спецификация предполагает LIST
фрагмент также является последовательностью: «Чанк LIST содержит список или упорядоченную последовательность подфрагментов». [ 18 ] Однако спецификация не дает формального описания INFO
кусок; пример INFO
LIST
chunk игнорирует последовательность фрагментов, подразумеваемую в INFO
описание. [ 19 ] LIST
определение чанка для <wave-data>
использует LIST
chunk как контейнер последовательности с хорошей формальной семантикой.
Спецификация WAV поддерживает, и в большинстве файлов WAV используется один непрерывный массив аудиосэмплов. Спецификация также поддерживает дискретные блоки семплов и тишины, которые воспроизводятся по порядку. Спецификация образцов данных содержит очевидные ошибки: [ 20 ]
The <wave-data> contains the waveform data. It is defined as follows: <wave-data> → { <data-ck> | <data-list> } <data-ck> → data( <wave-data> ) <wave-list> → LIST( 'wavl' { <data-ck> | // Wave samples <silence-ck> }... ) // Silence <silence-ck> → slnt( <dwSamples:DWORD> ) // Count of silent samples
Видимо <data-list>
(неопределено) и <wave-list>
(определенные, но не упомянутые) должны быть идентичными. Даже если это решено, постановки позволяют <data-ck>
содержать рекурсивный <wave-data>
(что подразумевает проблемы с интерпретацией данных). Чтобы избежать рекурсии, спецификацию можно интерпретировать как:
<wave-data> → { <data-ck> | <wave-list> } <data-ck> → data( <bSampleData:BYTE> ... ) <wave-list> → LIST( 'wavl' { <data-ck> | // Wave samples <silence-ck> }... ) // Silence <silence-ck> → slnt( <dwSamples:DWORD> ) // Count of silent samples
IFF Файлы WAV могут содержать встроенные списки , которые могут содержать несколько подфрагментов . [ 21 ] [ 22 ] [ 23 ]
Заголовок файла WAV
[ редактировать ]Это пример заголовка файла WAV (44 байта). Данные хранятся в порядке байтов с прямым порядком байтов.
[Master RIFF chunk] FileTypeBlocID (4 bytes) : Identifier « RIFF » (0x52, 0x49, 0x46, 0x46) FileSize (4 bytes) : Overall file size minus 8 bytes FileFormatID (4 bytes) : Format = « WAVE » (0x57, 0x41, 0x56, 0x45) [Chunk describing the data format] FormatBlocID (4 bytes) : Identifier « fmt␣ » (0x66, 0x6D, 0x74, 0x20) BlocSize (4 bytes) : Chunk size minus 8 bytes, which is 16 bytes here (0x10) AudioFormat (2 bytes) : Audio format (1: PCM integer, 3: IEEE 754 float) NbrChannels (2 bytes) : Number of channels Frequence (4 bytes) : Sample rate (in hertz) BytePerSec (4 bytes) : Number of bytes to read per second (Frequence * BytePerBloc). BytePerBloc (2 bytes) : Number of bytes per block (NbrChannels * BitsPerSample / 8). BitsPerSample (2 bytes) : Number of bits per sample [Chunk containing the sampled data] DataBlocID (4 bytes) : Identifier « data » (0x64, 0x61, 0x74, 0x61) DataSize (4 bytes) : SampledData size SampledData
Метаданные
[ редактировать ]Являясь производным от RIFF, файлы WAV могут быть помечены метаданными в фрагменте INFO. Кроме того, в файлы WAV можно встраивать метаданные любого типа, включая, помимо прочего, расширяемой платформы метаданных (XMP). данные [ 24 ] или ID3 теги [ 25 ] в дополнительных кусках. Спецификация RIFF требует, чтобы приложения игнорировали фрагменты, которые они не распознают, и приложения не обязательно могли использовать эту дополнительную информацию.
Популярность
[ редактировать ]Несжатые файлы WAV имеют большой размер, поэтому обмен файлами WAV через Интернет встречается редко, за исключением профессионалов в области видео, музыки и аудио. Высокое разрешение формата делает его подходящим для сохранения первого поколения высококачественных архивных файлов для использования в системе, где дисковое пространство и пропускная способность сети не являются ограничениями.
Использование вещательными компаниями
[ редактировать ]Несмотря на большой размер, несжатые файлы WAV используются большинством радиовещательных компаний, особенно теми, которые внедрили безленточную систему.
- Радио BBC в Великобритании требует звука Linear PCM 48 кГц и 16-битного WAV в качестве стандарта для всего контента, транслируемого на его станциях. [ 26 ]
- Британская коммерческая радиокомпания Global Radio использует 16-битные двухканальные файлы WAV с частотой 44,1 кГц во всей своей цепочке вещания.
- Система ABC «D-Cart», разработанная австралийской телекомпанией, использует 16-битные двухканальные файлы WAV с частотой 48 кГц.
- Консорциум Digital Radio Mondiale использует файлы WAV в качестве неофициального стандарта для моделирования передатчиков и тестирования приемников.
Ограничения
[ редактировать ]Формат WAV ограничен файлами размером менее 4 ГиБ из-за использования 32-битного целого числа без знака для записи размера файла в заголовке. Хотя это эквивалентно примерно 6,8 часам звука CD-качества с частотой 44,1 кГц, 16-битным стерео, иногда необходимо превысить этот предел, особенно когда более высокие частоты дискретизации , битовое разрешение или количество каналов требуются . Поэтому формат W64 был создан для использования в Sound Forge . Его 64-битное поле размера файла в заголовке позволяет значительно увеличить время записи. Формат RF64 , определенный Европейским вещательным союзом, также был создан для решения этой проблемы.
Неаудио данные
[ редактировать ]Поскольку частота дискретизации файла WAV может варьироваться от 1 Гц до 4,3 ГГц , а количество каналов может достигать 65535, файлы WAV также используются для неаудиоданных. LTspice , например, может хранить несколько сигналов трассировки цепи в отдельных каналах с любой подходящей частотой дискретизации, при этом полный диапазон представляет собой ± 1 В или А , а не звуковое давление. [ 27 ]
Аудио компакт-диски
[ редактировать ]Аудиокомпакт -диски (CD) не используют формат файлов WAV, вместо этого используется аудио из Красной книги . Общим является то, что аудио компакт-диски кодируются как несжатая импульсно-кодовая модуляция (PCM), которая является одним из форматов, поддерживаемых WAV.
Сравнение схем кодирования
[ редактировать ]Звук в файлах WAV может быть закодирован в различные форматы аудиокодирования, такие как GSM или MP3 , чтобы уменьшить размер файла.
Это ссылка для сравнения качества монофонического (не стереофонического ) звука и битрейта сжатия форматов кодирования звука, доступных для файлов WAV, включая PCM , ADPCM , Microsoft GSM 06.10 , CELP , SBC , Truespeech и MPEG Layer-3. Это кодеки ACM по умолчанию, поставляемые с Windows.
Формат | Битрейт ( кбит/с ) | 1 минута ( КиБ ) |
---|---|---|
11025 Гц, 16 бит PCM | 176.4 | 1292 |
8000 Гц 16 бит PCM | 128 | 938 |
11025 Гц, 8-битный PCM | 88.2 | 646 |
11025 Гц | 88.2 | 646 |
8000 Гц 8 бит PCM | 64 | 469 |
8000 Гц | 64 | 469 |
11025 Гц, 4 бит ADPCM | 44.1 | 323 |
8000 Гц 4 бит ADPCM | 32 | 234 |
11025 Гц GSM 06.10 | 18 | 132 |
8,000 Hz MP3 16 kbit/s | 16 | 117 |
8000 Гц GSM 06.10 | 13 | 103 |
Lernout & Hauspie SBC 12 кбит/с | 8000 Гц12 | 88 |
Группа DSP Truespeech | 8000 Гц9 | 66 |
8,000 Hz MP3 8 kbit/s | 8 | 60 |
CELP | 8000 Гц Лерноут и Хауспи4.8 | 35 |
Вышеупомянутые файлы WAV; даже те, кто использует сжатие MP3, имеют .wav
расширение.
См. также
[ редактировать ]- Менеджер сжатия звука
- Формат широковещательной волны (BWF)
- Сравнение форматов кодирования звука
- RF64 , расширенный формат файла для аудио (многоканальный формат файла, позволяющий размерам файлов превышать 4 гигабайта)
- Windows Медиа Аудио
Ссылки
[ редактировать ]- ^ Флейшман, Э. (июнь 1998 г.). Реестры кодеков WAVE и AVI . IETF. дои : 10.17487/RFC2361 . РФК 2361 . Проверено 6 декабря 2009 г.
- ^ «Расширение файла .WAV. Подробности» . Filext.com . Проверено 10 августа 2015 г.
- ^ Перейти обратно: а б с ИБМ; Microsoft (август 1991 г.). «Мультимедийный программный интерфейс и спецификации данных 1.0» (PDF) . Проверено 26 декабря 2020 г.
- ^ Перейти обратно: а б П. Кабал (19 июня 2006 г.). «Характеристики формата аудиофайла — звуковой файл WAVE или RIFF WAVE» . Университет Макгилла . Проверено 16 марта 2010 г.
- ^ Перейти обратно: а б «Многоканальные аудиоданные и файлы WAVE» . Корпорация Майкрософт. 07.03.2007 . Проверено 16 марта 2010 г.
- ^ «Формат аудиофайла WAVE» . Библиотека Конгресса . 12 сентября 2008 г. Проверено 3 декабря 2023 г.
- ^ Ди Сильвестро, Лейле Л.; Барибо, Грег (20 июня 1999 г.). Формат аудиофайла Waveform, регистрация подтипа MIME . IETF. Идентификатор черновика-ema-vpim-wav-00 . Проверено 6 декабря 2009 г.
- ^ «Определение файла WAV на английском языке» . Оксфордский живой словарь английского языка . Архивировано из оригинала 7 февраля 2018 года.
- ^ Брэнсон, Райан (21 октября 2015 г.) (21 октября 2015 г.). «Чем WAV лучше MP3» . Онлайн видео конвертер . Проверено 18 июня 2016 г.
{{cite web}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ EBU (июль 2009 г.), EBU Tech 3306 - MBWF / RF64: расширенный формат файла для аудио (PDF) , заархивировано из оригинала (PDF) 22 ноября 2009 г. , получено 19 января 2010 г.
- ^ IBM и Microsoft 1991 , с. 1-1: «Основным преимуществом RIFF является его расширяемость; форматы файлов, основанные на RIFF, могут быть адаптированы к будущему, поскольку изменения формата могут игнорироваться существующими приложениями».
- ^ IBM и Microsoft 1991 , PDF, стр. 56: «Программы должны ожидать (и игнорировать) любые неизвестные фрагменты, как и во всех формах RIFF».
- ^ IBM & Microsoft 1991 , стр. 2–17–2–18.
- ^ IBM и Microsoft 1991 , с. 2-18
- ^ Обновление стандартов мультимедиа Microsoft, Новые типы мультимедийных данных и методы обработки данных, версия 3.0, 15 апреля 1994 г., стр. 6.
- ^ IBM и Microsoft 1991 , PDF, стр. 56
- ^ IBM и Microsoft 1991 , PDF, стр. 56
- ^ IBM и Microsoft 1991 , PDF, стр. 23
- ^ IBM и Microsoft 1991 , PDF, стр. 21,
INAM
появляется раньшеICOP
- ^ Спецификация IBM и Microsoft 1991 , которая также описывает интерпретацию производственного синтаксиса.
- ^ «Формат файла WAVE» . 15 ноября 1999 г. Архивировано из оригинала 15 ноября 1999 г. Проверено 16 марта 2010 г.
- ^ «Формат звукового файла WAVE PCM» . 20 января 2003 г. Архивировано из оригинала 27 августа 2009 г. Проверено 16 марта 2010 г.
- ^ «Формат файла WAVE» . Архивировано из оригинала 22 июля 2011 г. Проверено 16 марта 2010 г.
- ^ СПЕЦИФИКАЦИЯ XMP ЧАСТЬ 3: ХРАНЕНИЕ В ФАЙЛАХ (PDF) . Adobe Systems Incorporated. 2016. С. 24–25. Архивировано из оригинала (PDF) 25 февраля 2018 года . Проверено 8 января 2020 г.
- ^ «ВАВ» . Мужество. Архивировано из оригинала 06.11.2020 . Проверено 8 января 2020 г.
- ^ «Информация и стандарты качества звука для радио BBC и звуков BBC» (PDF) . Би-би-си . BBC Дизайн и инженерия. 28 марта 2022 г. с. 8. Архивировано из оригинала (PDF) 28 мая 2024 года . Проверено 28 мая 2024 г.
- ^ «LTspice IV» (PDF) . Корпорация Линейные Технологии. 2009. с. 95. Архивировано из оригинала (PDF) 27 февраля 2012 г. Проверено 4 сентября 2015 г.
Внешние ссылки
[ редактировать ]- Спецификации формата файла WAVE — Университет Макгилла (последнее обновление: 3 января 2011 г.).
- Расширяемые дескрипторы волнового формата от Microsoft (обновлено 26 октября 2017 г.)
- Дополнительная информация о WAVE_FORMAT_EXTENSIBLE — Университет Бата
- Формат файла WAVE - технические подробности (1999 г.)
- Руководство по метаданным WAV и BWF
- Exif-теги ; см., например, стр. 128