Jump to content

Частотно-временной анализ музыкальных сигналов

Частотно-временной анализ музыкальных сигналов является одним из применений частотно-временного анализа . Музыкальный звук может быть более сложным, чем звук человеческого голоса, и занимать более широкую полосу частот. Музыкальные сигналы — это сигналы, изменяющиеся во времени; хотя классического преобразования Фурье недостаточно для их анализа, частотно-временной анализ является эффективным инструментом для такого использования. Частотно-временной анализ является продолжением классического подхода Фурье. Кратковременное преобразование Фурье (STFT), преобразование Габора (GT) и функция распределения Вигнера (WDF) — это известные частотно-временные методы, полезные для анализа музыкальных сигналов, таких как ноты, сыгранные на фортепиано, флейте или гитаре.

Знание музыкального сигнала

[ редактировать ]

Музыка — это тип звука, который имеет некоторые стабильные частоты в определенный период времени. Музыку можно создавать несколькими способами. Например, звук фортепиано получается при ударе по струнам , а звук скрипки — при смычке . Все музыкальные звуки имеют свою основную частоту и обертоны. Основная частота — это самая низкая частота в гармоническом ряду. В периодическом сигнале основная частота обратна длине периода. Обертоны — это целые числа, кратные основной частоте.

Стол. 1 основная частота и обертон
Частота Заказ
f = 440 Гц Н = 1 Основная частота 1-я гармоника
f = 880 Гц Н = 2 1-й обертон 2-я гармоника
f = 1320 Гц Н = 3 2-й обертон 3-я гармоника
f = 1760 Гц Н = 4 3-й обертон 4-я гармоника

В теории музыки высота представляет собой воспринимаемую основную частоту звука. Однако фактическая основная частота может отличаться от воспринимаемой основной частоты из-за обертонов.

Кратковременное преобразование Фурье

[ редактировать ]
Рис.1 Форма волны аудиофайла ""
Рис.2 Преобразование Габора ""
Рис. 3 Спектрограмма « »

Непрерывное STFT

[ редактировать ]

Кратковременное преобразование Фурье является основным типом частотно-временного анализа. Если существует непрерывный сигнал x ( t ), мы можем вычислить кратковременное преобразование Фурье с помощью

где w ( t ) — оконная функция . Когда w ( t ) является прямоугольной функцией, преобразование называется Rec-STFT. Когда w ( t ) является функцией Гаусса, преобразование называется преобразованием Габора .

Дискретный STFT

[ редактировать ]

Однако обычно музыкальный сигнал, который мы имеем, не является непрерывным. Он дискретизируется с частотой дискретизации. Следовательно, мы не можем использовать эту формулу для вычисления преобразования Фурье Rec-кратковременного действия. Изменяем исходную форму на

Позволять , , и . Существуют некоторые ограничения дискретного кратковременного преобразования Фурье:

  • где N — целое число.
  • , где это самая высокая частота сигнала.

Пример STFT

[ редактировать ]

На рисунке 1 показана форма сигнала аудиофайла «» с частотой дискретизации 44100 Гц. На рисунке 2 показан частотно-временной график результатов кратковременного преобразования Фурье (в частности, преобразования Габора ) аудиофайла. На этом графике горизонтальные линии с частотами не выше 230 Гц представляют основные частоты, а горизонтальные линии с частотами выше 230 Гц представляют собой гармонические составляющие. Обратите внимание, что с момента t = 0 до 0,5 секунды исполняется аккорд, состоящий из трех нот (CEG). Затем хорда изменилась на CEA при t = 0,5, а затем снова изменилась на DFA при t = 1.

Спектрограмма

[ редактировать ]

На рисунке 3 показана спектрограмма аудиофайла, показанного на рисунке 1. Спектрограмма представляет собой квадрат STFT, изменяющееся во времени спектральное представление. Спектрограмму сигнала s ( t ) можно оценить путем вычисления квадрата величины STFT сигнала s ( t ), как показано ниже:

Хотя спектрограмма чрезвычайно полезна, у нее все же есть один недостаток. Он отображает частоты в единой шкале. Однако музыкальные шкалы основаны на логарифмической шкале частот. Поэтому нам следует описывать частоту в логарифмическом масштабе, связанную со слухом человека.

Функция распределения Вигнера

[ редактировать ]

Функция распределения Вигнера также может использоваться для анализа музыкальных сигналов. Преимуществом функции распределения Вигнера является высокая наглядность вывода; однако он требует больших вычислительных затрат и имеет проблему перекрестных условий, поэтому он более подходит для одновременного анализа сигналов без более чем одной частоты.

Функция распределения Вигнера является:

где x ( t ) является сигналом, а x *( t ) является сопряженным сигналом.

См. также

[ редактировать ]

Источники

[ редактировать ]
  • Джоан Серра, Эмилия Гомес, Перфекто Эррера и Ксавье Серра , «Двоичное сходство цветности и локальное выравнивание, применяемое для идентификации кавер-песен», август 2008 г.
  • Уильям Дж. Пилемейер, Грегори Х. Уэйкфилд и Мэри Х. Симони, «Частотно-временной анализ музыкальных сигналов», сентябрь 1996 г.
  • Джереми Ф. Альм и Джеймс С. Уокер, «Частотно-временной анализ музыкальных инструментов», 2002 г.
  • Моника Дорфлер, «Что может сделать частотно-временной анализ с музыкальными сигналами», апрель 2004 г.
  • ЭнШо Цау, Намгук Чо и К.-С. Джей Куо , «Фундаментальная оценка частоты музыкальных сигналов с модифицированным преобразованием Гильберта – Хуанга », Международная конференция IEEE по мультимедиа и выставке, 2009.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 57feb90796f5b522fa5c67b1e4865c16__1706482860
URL1:https://arc.ask3.ru/arc/aa/57/16/57feb90796f5b522fa5c67b1e4865c16.html
Заголовок, (Title) документа по адресу, URL1:
Time–frequency analysis for music signals - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)