Jump to content

WAV

Формат аудиофайла Waveform (WAVE/WAV)
Расширение имени файла
.wav .wave
Тип интернет-СМИ
аудио/внд.волна, [1] аудио/wav, аудио/волна, аудио/x-wav [2]
Введите код ВОЛНА
Единый идентификатор типа (UTI) com.microsoft.waveform-audio
Разработано IBM и Майкрософт
Первоначальный выпуск август 1991 года ; 32 года назад ( 1991-08 ) [3]
Последний выпуск
Многоканальные аудиоданные и WAVE-файлы
7 марта 2007 г .; 17 лет назад ( 07.03.2007 ) (обновление) [4] [5]
Тип формата Формат аудиофайла , формат контейнера
Расширено с РИФФ
Распространено на БВФ , РФ64

Формат аудиофайла Waveform ( WAVE или WAV в зависимости от расширения имени файла ); [3] [6] [7] произносится / w æ v / или / w v / [8] ) — стандарт формата аудиофайлов для хранения аудиопотока на персональных компьютерах . Формат был разработан и впервые опубликован в 1991 году компаниями IBM и Microsoft . Это основной формат, используемый в системах Microsoft Windows для несжатого аудио . Обычное кодирование битового потока представляет собой формат линейной импульсно-кодовой модуляции (LPCM).

WAV — это применение формата файла обмена ресурсами (RIFF) метода формата битового потока для хранения данных в виде фрагментов и, таким образом, аналогично формату 8SVX и формату файла обмена аудио (AIFF), используемому на компьютерах Amiga и Macintosh соответственно.

Описание [ править ]

Файл WAV является экземпляром формата файла обмена ресурсами (RIFF), определенного IBM и Microsoft . [3] Формат RIFF действует как оболочка для различных форматов кодирования звука .

Хотя файл WAV может содержать сжатый звук, наиболее распространенным аудиоформатом WAV является несжатый звук в формате линейной импульсно-кодовой модуляции (LPCM). LPCM также является стандартным форматом кодирования звука для аудио компакт-дисков , на которых хранится двухканальный звук LPCM, дискретизированный с частотой 44,1 кГц и 16 битами на выборку . Поскольку LPCM не имеет сжатия и сохраняет все образцы звуковой дорожки, профессиональные пользователи или эксперты в области звука могут использовать формат WAV со звуком LPCM для достижения максимального качества звука. [9] Файлы WAV также можно относительно легко редактировать и манипулировать ими с помощью программного обеспечения.

В Microsoft Windows формат WAV поддерживает сжатие звука с помощью диспетчера сжатия звука (ACM). любой кодек Для сжатия файла WAV можно использовать ( ACM. Доступ к пользовательскому интерфейсу UI) Audio Compression Manager можно получить через различные программы, которые его используют, включая Sound Recorder в некоторых версиях Windows.

Начиная с Windows 2000 , WAVE_FORMAT_EXTENSIBLE Был определен заголовок, который определяет данные нескольких аудиоканалов вместе с позициями динамиков, устраняет двусмысленность относительно типов семплов и размеров контейнеров в стандартном формате WAV и поддерживает определение пользовательских расширений этого формата. [4] [5] [10]

Характеристики файла [ править ]

РИФФ [ править ]

Файл RIFF представляет собой формат файла с тегами. Он имеет определенный формат контейнера ( чанк ) с заголовком, который включает четырехсимвольный тег ( FourCC ) и размер (количество байтов) чанка. Тег определяет, как следует интерпретировать данные внутри фрагмента. Существует несколько стандартных тегов FourCC. Теги, состоящие только из заглавных букв, являются зарезервированными. Самый внешний фрагмент файла RIFF имеет RIFF ярлык; первые четыре байта данных фрагмента представляют собой дополнительный тег FourCC, определяющий тип формы, за которым следует последовательность подфрагментов. В случае файла WAV дополнительный тег WAVE. Остальная часть данных RIFF представляет собой последовательность фрагментов, описывающих аудиоинформацию.

Преимущество формата файла с тегами состоит в том, что в дальнейшем этот формат можно расширить, сохраняя при этом обратную совместимость . [11] Правило для программы чтения RIFF (или WAV) заключается в том, что она должна игнорировать любой помеченный фрагмент, который он не распознает. [12] Читатель не сможет воспользоваться новой информацией, но читатель не должен запутаться.

Спецификация файлов RIFF включает определение INFO кусок. Чанк может включать в себя такую ​​информацию, как название произведения, автор, дата создания и информация об авторских правах. Хотя INFO chunk был определен для RIFF в версии 1.0, на него не ссылались в формальной спецификации файла WAV. У многих читателей возникли проблемы с этим. Следовательно, самым безопасным с точки зрения обмена было бы опустить INFO chunk и другие расширения и отправить файл с наименьшим общим знаменателем. Существуют и другие проблемы с размещением чанка INFO .

Предполагалось, что файлы RIFF будут использоваться в международных средах, поэтому существует CSET chunk, чтобы указать код страны, язык, диалект и кодовую страницу для строк в файле RIFF. [13] Например, указав соответствующий CSET чанк должен разрешать строки в INFO chunk (и другие фрагменты в файле RIFF), которые будут интерпретироваться как символы кириллицы или японского языка.

RIFF также определяет JUNK чанк, содержимое которого неинтересно. [14] Чанк позволяет удалить чанк, просто изменив его FourCC. Этот фрагмент также можно использовать для резервирования некоторого места для будущих изменений, чтобы файл можно было изменять без изменения размера. Более позднее определение RIFF представило аналогичный PAD кусок. [15]

РИФ ВОЛНА [ править ]

Определение верхнего уровня файла WAV: [16]

<WAVE-form> → RIFF('WAVE'
                   <fmt-ck>            // Format of the file
                   [<fact-ck>]         // Fact chunk
                   [<cue-ck>]          // Cue points
                   [<playlist-ck>]     // Playlist
                   [<assoc-data-list>] // Associated data list
                   <wave-data> )       // Wave data

Форма RIFF верхнего уровня использует WAVE ярлык. За ним следует обязательное <fmt-ck> фрагмент, описывающий формат следующего примера данных. Этот фрагмент включает в себя такую ​​информацию, как кодирование выборки, количество бит на канал, количество каналов и частоту дискретизации.

Спецификация WAV включает некоторые дополнительные функции. Необязательный <fact-ck> chunk сообщает количество выборок для некоторых схем сжатого кодирования. <cue-ck> chunk идентифицирует некоторые значимые номера выборок в волновом файле. <playlist-ck> chunk позволяет воспроизводить семплы не по порядку или повторять их, а не просто от начала до конца. Соответствующий список данных ( <assoc-data-list>) позволяет прикреплять метки и примечания к ключевым точкам; текстовая аннотация может быть предоставлена ​​для группы образцов (например, информация о подписи).

Наконец, обязательный <wave-data> chunk содержит фактические образцы в указанном ранее формате.

Обратите внимание, что в определении файла WAV не указано, где находится INFO чанк должен быть помещен. Также ничего не говорится о размещении CSET фрагмент (который определяет используемый набор символов).

Спецификация RIFF пытается быть формальной спецификацией, но ее формализму не хватает точности, наблюдаемой в других форматах с тегами. Например, спецификация RIFF не проводит четкого различия между набором фрагментов и упорядоченной последовательностью фрагментов. Чанк формы RIFF предполагает, что это должен быть контейнер последовательности. Информация о секвенировании указывается в форме RIFF файла WAV в соответствии с формализмом: «Однако <fmt-ck> всегда должно происходить раньше <wave-data>, и оба эти фрагмента являются обязательными в WAVE-файле». [17] Спецификация предполагает LIST фрагмент также является последовательностью: «Чанк LIST содержит список или упорядоченную последовательность подфрагментов». [18] Однако спецификация не дает формального описания INFO кусок; пример INFO LIST chunk игнорирует последовательность фрагментов, подразумеваемую в INFO описание. [19] LIST определение чанка для <wave-data> использует LIST chunk как контейнер последовательности с хорошей формальной семантикой.

Спецификация WAV поддерживает, и в большинстве файлов WAV используется один непрерывный массив аудиосэмплов. Спецификация также поддерживает дискретные блоки сэмплов и тишины, которые воспроизводятся по порядку. Спецификация образцов данных содержит очевидные ошибки: [20]

The <wave-data> contains the waveform data. It is defined as follows:
  <wave-data>  → { <data-ck> | <data-list> }
  <data-ck>    → data( <wave-data> )
  <wave-list>  → LIST( 'wavl' { <data-ck> | // Wave samples
                                <silence-ck> }... ) // Silence
  <silence-ck> → slnt( <dwSamples:DWORD> ) // Count of silent samples

Видимо <data-list> (неопределено) и <wave-list> (определенные, но не упомянутые) должны быть идентичными. Даже если это решено, постановки позволяют <data-ck> содержать рекурсивный <wave-data> (что подразумевает проблемы с интерпретацией данных). Чтобы избежать рекурсии, спецификацию можно интерпретировать как:

<wave-data>  → { <data-ck> | <wave-list> }
  <data-ck>    → data( <bSampleData:BYTE> ... )
  <wave-list>  → LIST( 'wavl' { <data-ck> | // Wave samples
                                <silence-ck> }... ) // Silence
  <silence-ck> → slnt( <dwSamples:DWORD> ) // Count of silent samples

IFF Файлы WAV могут содержать встроенные списки , которые могут содержать несколько подфрагментов . [21] [22] [23]

Заголовок файла WAV [ править ]

Это пример заголовка файла WAV (44 байта). Данные хранятся в порядке байтов с прямым порядком байтов.

[Master RIFF chunk]
   FileTypeBlocID  (4 bytes) : Identifier « RIFF »  (0x52, 0x49, 0x46, 0x46)
   FileSize        (4 bytes) : Overall file size minus 8 bytes
   FileFormatID    (4 bytes) : Format = « WAVE »  (0x57, 0x41, 0x56, 0x45)

[Chunk describing the data format]
   FormatBlocID    (4 bytes) : Identifier « fmt␣ »  (0x66, 0x6D, 0x74, 0x20)
   BlocSize        (4 bytes) : Chunk size minus 8 bytes, which is 16 bytes here  (0x10)
   AudioFormat     (2 bytes) : Audio format (1: PCM integer, 3: IEEE 754 float)
   NbrChannels     (2 bytes) : Number of channels
   Frequence       (4 bytes) : Sample rate (in hertz)
   BytePerSec      (4 bytes) : Number of bytes to read per second (Frequence * BytePerBloc).
   BytePerBloc     (2 bytes) : Number of bytes per block (NbrChannels * BitsPerSample / 8).
   BitsPerSample   (2 bytes) : Number of bits per sample

[Chunk containing the sampled data]
   DataBlocID      (4 bytes) : Identifier « data »  (0x64, 0x61, 0x74, 0x61)
   DataSize        (4 bytes) : SampledData size
   SampledData

Метаданные [ править ]

Являясь производным от RIFF, файлы WAV могут быть помечены метаданными в фрагменте INFO. Кроме того, в файлы WAV можно встраивать метаданные любого типа, включая, помимо прочего, расширяемой платформы метаданных (XMP). данные [24] или ID3 теги [25] в дополнительных кусках. Спецификация RIFF требует, чтобы приложения игнорировали фрагменты, которые они не распознают, и приложения не обязательно могли использовать эту дополнительную информацию.

Популярность [ править ]

Несжатые файлы WAV имеют большой размер, поэтому обмен файлами WAV через Интернет встречается редко, за исключением профессионалов в области видео, музыки и аудио. Высокое разрешение формата делает его подходящим для сохранения первого поколения высококачественных архивных файлов для использования в системе, где дисковое пространство и пропускная способность сети не являются ограничениями.

Использование вещательными компаниями [ править ]

Несмотря на большой размер, несжатые файлы WAV используются большинством радиовещательных компаний, особенно теми, которые внедрили безленточную систему.

  • Радио BBC в Великобритании требует звука Linear PCM 48 кГц и 16-битного WAV в качестве стандарта для всего контента, транслируемого на его станциях. [26]
  • Британская коммерческая радиокомпания Global Radio использует 16-битные двухканальные файлы WAV с частотой 44,1 кГц во всей своей цепочке вещания.
  • Система ABC «D-Cart», разработанная австралийской телекомпанией, использует 16-битные двухканальные файлы WAV с частотой 48 кГц.
  • Консорциум Digital Radio Mondiale использует файлы WAV в качестве неофициального стандарта для моделирования передатчиков и тестирования приемников.

Ограничения [ править ]

Формат WAV ограничен файлами размером менее 4 ГиБ из-за использования 32-битного целого числа без знака для записи размера файла в заголовке. Хотя это эквивалентно примерно 6,8 часам звука CD-качества с частотой 44,1 кГц, 16-битным стерео, иногда необходимо превысить этот предел, особенно когда более высокие частоты дискретизации , битовое разрешение или количество каналов требуются . Поэтому формат W64 был создан для использования в Sound Forge . Его 64-битное поле размера файла в заголовке позволяет значительно увеличить время записи. Формат RF64 , определенный Европейским вещательным союзом, также был создан для решения этой проблемы.

Неаудио данные [ править ]

Поскольку частота дискретизации файла WAV может варьироваться от 1 Гц до 4,3 ГГц , а количество каналов может достигать 65535, файлы .wav также используются для неаудиоданных. LTspice , например, может хранить несколько сигналов трассировки цепи в отдельных каналах с любой подходящей частотой дискретизации, при этом полный диапазон представляет собой ± 1 В или А , а не звуковое давление. [27]

Аудио компакт-диски [ править ]

Аудиокомпакт -диски (CD) не используют формат файлов WAV, вместо этого используется аудио из Красной книги . Общим является то, что аудио компакт-диски кодируются как несжатая импульсно-кодовая модуляция (PCM), которая является одним из форматов, поддерживаемых WAV. WAV — это формат файла для использования на компьютере, который не может быть понят напрямую большинством проигрывателей компакт-дисков. Чтобы записать файлы WAV на аудио компакт-диск, заголовки файлов должны быть удалены, содержимое должно быть перекодировано, если оно еще не сохранено в формате PCM, а данные PCM записаны непосредственно на диск в виде отдельных дорожек с добавлением заполнения нулями, чтобы соответствовать размеру сектора компакт-диска. .

Чтобы звук PCM можно было записать на компакт-диск, он должен быть в стереоформате 44,1 кГц, 16 бит.

Сравнение схем кодирования [ править ]

Звук в файлах WAV может быть закодирован в различные форматы аудиокодирования, такие как GSM или MP3 , чтобы уменьшить размер файла.

Это ссылка для сравнения качества монофонического (не стереофонического ) звука и битрейта сжатия форматов кодирования звука, доступных для файлов WAV, включая PCM , ADPCM , Microsoft GSM 06.10 , CELP , SBC , Truespeech и MPEG Layer-3. Это кодеки ACM по умолчанию, поставляемые с Windows.

Формат Битрейт ( кбит/с ) 1 минута ( КиБ )
11025 Гц, 16 бит PCM 176.4 1292
0 8000 Гц 16 бит PCM 128 0 938
11025 Гц, 8 бит PCM 0 88.2 0 646
11025 Гц 0 88.2 0 646
0 8000 Гц 8 бит PCM 0 64 0 469
0 8000 Гц 0 64 0 469
11025 Гц, 4 бит ADPCM 0 44.1 0 323
0 8000 Гц 4 бит ADPCM 0 32 0 234
11025 Гц GSM 06.10 0 18 0 132
0 8,000 Hz MP3 16 kbit/s 0 16 0 117
0 8000 Гц GSM 06.10 0 13 0 103
0 8000 Гц Lernout & Hauspie SBC 12 кбит/с 0 12 00 88
0 8000 Гц Группа DSP Truespeech 00 9 00 66
0 8,000 Hz MP3 8 kbit/s 00 8 00 60
0 8000 Гц Лерноут и Хауспи CELP 00 4.8 00 35

Вышеупомянутые файлы WAV; даже те, кто использует сжатие MP3, имеют .wav расширение.

См. также [ править ]

Ссылки [ править ]

  1. ^ Флейшман, Э. (июнь 1998 г.). Реестры кодеков WAVE и AVI . IETF. дои : 10.17487/RFC2361 . РФК 2361 . Проверено 6 декабря 2009 г.
  2. ^ «Расширение файла .WAV. Подробности» . Filext.com . Проверено 10 августа 2015 г.
  3. Перейти обратно: Перейти обратно: а б с ИБМ; Microsoft (август 1991 г.). «Мультимедийный программный интерфейс и спецификации данных 1.0» (PDF) . Проверено 26 декабря 2020 г.
  4. Перейти обратно: Перейти обратно: а б П. Кабал (19 июня 2006 г.). «Характеристики формата аудиофайла — звуковой файл WAVE или RIFF WAVE» . Университет Макгилла . Проверено 16 марта 2010 г.
  5. Перейти обратно: Перейти обратно: а б «Многоканальные аудиоданные и файлы WAVE» . Корпорация Майкрософт. 07.03.2007 . Проверено 16 марта 2010 г.
  6. ^ «Формат аудиофайла WAVE» . Библиотека Конгресса . 12 сентября 2008 г. Проверено 03 декабря 2023 г.
  7. ^ Ди Сильвестро, Лейле Л.; Барибо, Грег (20 июня 1999 г.). Формат аудиофайла Waveform, регистрация подтипа MIME . IETF. Идентификатор черновика-ema-vpim-wav-00 . Проверено 6 декабря 2009 г.
  8. ^ «Определение файла WAV на английском языке» . Оксфордский живой словарь английского языка . Архивировано из оригинала 7 февраля 2018 года.
  9. ^ Брэнсон, Райан (21 октября 2015 г.) (21 октября 2015 г.). «Чем WAV лучше MP3» . Онлайн видео конвертер . Проверено 18 июня 2016 г. {{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )
  10. ^ EBU (июль 2009 г.), EBU Tech 3306 - MBWF / RF64: расширенный формат файла для аудио (PDF) , заархивировано из оригинала (PDF) 22 ноября 2009 г. , получено 19 января 2010 г.
  11. ^ IBM и Microsoft 1991 , с. 1-1: «Основным преимуществом RIFF является его расширяемость; форматы файлов, основанные на RIFF, могут быть адаптированы к будущему, поскольку изменения формата могут игнорироваться существующими приложениями».
  12. ^ IBM и Microsoft 1991 , PDF, стр. 56: «Программы должны ожидать (и игнорировать) любые неизвестные фрагменты, как и во всех формах RIFF».
  13. ^ IBM & Microsoft 1991 , стр. 2–17–2–18.
  14. ^ IBM и Microsoft 1991 , с. 2-18
  15. ^ Обновление стандартов мультимедиа Microsoft, Новые типы мультимедийных данных и методы обработки данных, версия 3.0, 15 апреля 1994 г., стр. 6.
  16. ^ IBM и Microsoft 1991 , PDF, стр. 56
  17. ^ IBM и Microsoft 1991 , PDF, стр. 56
  18. ^ IBM и Microsoft 1991 , PDF, стр. 23
  19. ^ IBM и Microsoft 1991 , PDF, стр. 21, INAM появляется раньше ICOP
  20. ^ Спецификация IBM и Microsoft 1991 , которая также описывает интерпретацию производственного синтаксиса.
  21. ^ «Формат файла WAVE» . 15 ноября 1999 г. Архивировано из оригинала 15 ноября 1999 г. Проверено 16 марта 2010 г.
  22. ^ «Формат звукового файла WAVE PCM» . 20 января 2003 г. Архивировано из оригинала 27 августа 2009 г. Проверено 16 марта 2010 г.
  23. ^ «Формат файла WAVE» . Архивировано из оригинала 22 июля 2011 г. Проверено 16 марта 2010 г.
  24. ^ СПЕЦИФИКАЦИЯ XMP ЧАСТЬ 3: ХРАНЕНИЕ В ФАЙЛАХ (PDF) . Adobe Systems Incorporated. 2016. С. 24–25. Архивировано из оригинала (PDF) 25 февраля 2018 года . Проверено 8 января 2020 г.
  25. ^ «ВАВ» . Мужество. Архивировано из оригинала 06.11.2020 . Проверено 8 января 2020 г.
  26. ^ «Информация и стандарты качества звука для радио BBC и звуков BBC» (PDF) . Би-би-си . BBC Дизайн и инженерия. 28 марта 2022 г. с. 8. Архивировано из оригинала (PDF) 28 мая 2024 года . Проверено 28 мая 2024 г.
  27. ^ «LTspice IV» (PDF) . Корпорация Линейные Технологии. 2009. с. 95. Архивировано из оригинала (PDF) 27 февраля 2012 г. Проверено 4 сентября 2015 г.

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: d7dcf1a9952074fc203f5e56d38970a8__1718358720
URL1:https://arc.ask3.ru/arc/aa/d7/a8/d7dcf1a9952074fc203f5e56d38970a8.html
Заголовок, (Title) документа по адресу, URL1:
WAV - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)