Jump to content

Преобразование с постоянной Q

В математике и обработке сигналов преобразование с постоянной добротностью и преобразование с переменной добротностью , просто известные как CQT и VQT , преобразуют ряд данных в частотную область . Это связано с преобразованием Фурье [1] и очень тесно связан со сложным вейвлет-преобразованием Морле . [2] Его дизайн подходит для музыкального представления.

Преобразование Constant-Q, к форме волны аккорда до мажор фортепианного примененное . Ось X — это частота , сопоставленная со стандартными музыкальными тонами , от низкой (слева) до высокой (справа). Ось Y — это время, начиная с момента нажатия фортепианного аккорда внизу и отпускания фортепианного аккорда вверху, через 8 секунд. Более темные пиксели соответствуют более высоким значениям преобразования Constant-Q. Пики точно соответствуют точным частотам вибрирующих струн фортепиано. Таким образом, пики можно использовать для обнаружения нот, сыгранных на фортепиано. Три самых низких пика — это основные частоты аккорда до мажор (C, E, G). Каждая струна также вибрирует с частотой, кратной основной ноте, известной как обертоны , которые соответствуют оставшимся меньшим пикам справа от основной высоты. Обертоны имеют меньшую интенсивность, чем основной тон.
Duration: 9 seconds.
Звук фортепианного аккорда до мажор, использованный для создания преобразования Constant-Q выше.
Его форма сигнала не передает визуально информацию о высоте, как это может сделать преобразование Constant-Q.

Преобразование можно рассматривать как серию фильтров f k , логарифмически разнесенных по частоте, причем k -й фильтр имеет спектральную ширину δf k , кратную ширине предыдущего фильтра:

где δf k — полоса пропускания k -го фильтра, f min — центральная частота самого нижнего фильтра, а n — количество фильтров на октаву .

Кратковременное преобразование Фурье x [ n ] для кадра, сдвинутого на выборку m, вычисляется следующим образом:

Учитывая ряд данных с частотой дискретизации f s = 1/ T , где T — период выборки наших данных, для каждого интервала частоты мы можем определить следующее:

  • Ширина фильтра, δf k .
  • Q , «добротность»:
Ниже показано, что это целое число циклов, обработанных на центральной частоте f k . Таким образом, это в некоторой степени определяет временную сложность преобразования.
  • Длина окна для k -го интервала:
Поскольку f s / f k — это количество выборок, обрабатываемых за цикл на частоте f k , Q — это количество целочисленных циклов, обработанных на этой центральной частоте.

Эквивалентное ядро ​​преобразования можно найти с помощью следующих подстановок:

  • Длина окна каждого интервала теперь является функцией номера интервала:
  • Относительная мощность каждого элемента будет уменьшаться на более высоких частотах, поскольку они суммируются за меньшее количество членов. Чтобы компенсировать это, мы нормализуем на N [ k ].
  • Любая оконная функция будет функцией длины окна, а также функцией номера окна. Например, эквивалентным окном Хэмминга будет
  • Наша цифровая частота, , становится .

После этих изменений у нас осталось

Расчет полосы пропускания с переменной добротностью

[ редактировать ]

Преобразование переменной Q такое же, как преобразование постоянной Q, но с той лишь разницей, что фильтр Q является переменным, отсюда и название преобразования переменной Q. Преобразование переменной добротности полезно там, где важно временное разрешение на низких частотах. [ необходимы примеры ] . Существуют способы расчета пропускной способности VQT, один из них использует эквивалентную прямоугольную полосу пропускания в качестве значения пропускной способности бина VQT. [3]

Самый простой способ реализовать преобразование переменной Q — добавить смещение полосы пропускания, называемое γ, например: [ нужна ссылка ]

Эту формулу можно изменить, добавив дополнительные параметры для регулировки резкости перехода между постоянной добротностью и постоянной полосой пропускания следующим образом: [ нужна ссылка ]

с α в качестве параметра резкости перехода и где α , равное 2, соответствует гиперболическому синусоидальному масштабу частот с точки зрения частотного разрешения.

Быстрый расчет

[ редактировать ]

Прямое вычисление преобразования с постоянной Q (либо с использованием простого ДПФ , либо немного более быстрого алгоритма Герцеля ) происходит медленно по сравнению с быстрым преобразованием Фурье (БПФ). Однако БПФ само по себе может использоваться в сочетании с использованием ядра для выполнения эквивалентных вычислений, но гораздо быстрее. [4] Приблизительная обратная такая реализация была предложена в 2006 году; он работает, возвращаясь к DFT, и подходит только для инструментов высоты тона. [5]

Развитие этого метода с улучшенной обратимостью включает выполнение CQT (через БПФ) октава за октавой, используя результаты фильтрации нижних частот и пониженной дискретизации для последовательно более низких тонов. [6] Реализации этого метода включают реализацию MATLAB и реализацию Python от LibROSA. [7] LibROSA сочетает метод субдискретизации с методом прямого БПФ (который она называет «псевдо-CQT»), заставляя последний обрабатывать более высокие частоты в целом. [7]

Скользящее ДПФ можно использовать для более быстрого расчета преобразования с постоянной добротностью, поскольку скользящее ДПФ не обязательно должно иметь линейный интервал частот и одинаковый размер окна на элемент. [8]

Альтернативно, преобразование с постоянной добротностью можно аппроксимировать, используя несколько БПФ с разными размерами окон и/или частотой дискретизации в разных частотных диапазонах, а затем сшивая их вместе. Это называется STFT с несколькими разрешениями , однако размеры окон для БПФ с несколькими разрешениями различаются для каждой октавы, а не для каждого элемента. [ нужна ссылка ] [ двусмысленный ]

Сравнение с преобразованием Фурье

[ редактировать ]

В целом преобразование хорошо подходит для музыкальных данных, и в этом можно увидеть некоторые его преимущества по сравнению с быстрым преобразованием Фурье. Поскольку выходные данные преобразования фактически представляют собой амплитуду/фазу в зависимости от логарифмической частоты, для эффективного покрытия заданного диапазона требуется меньшее количество элементов разрешения по частоте, и это оказывается полезным, когда частоты охватывают несколько октав. Поскольку диапазон человеческого слуха охватывает примерно десять октав от 20 Гц до примерно 20 кГц, это сокращение выходных данных является значительным.

Преобразование демонстрирует снижение разрешения по частоте при более высоких элементах разрешения по частоте, что желательно для слуховых приложений. Преобразование отражает слуховую систему человека, при этом на более низких частотах спектральное разрешение лучше, тогда как временное разрешение улучшается на более высоких частотах. В нижней части фортепианной гаммы (около 30 Гц) разница в 1 полутон — это разница примерно в 1,5 Гц, тогда как в верхней части музыкальной гаммы (около 5 кГц) разница в 1 полутон — это разница примерно в 1,5 Гц. 200 Гц. [9] Таким образом, для музыкальных данных идеально подходит экспоненциальное частотное разрешение преобразования с постоянной добротностью.

Кроме того, гармоники музыкальных нот при этом преобразовании образуют закономерность, характерную для тембра инструмента. Если предположить, что относительная сила каждой гармоники одинакова, то при изменении основной частоты относительное положение этих гармоник остается постоянным. Это может значительно облегчить идентификацию инструментов. Постоянное преобразование Q также можно использовать для автоматического распознавания музыкальных тональностей на основе накопленного содержания цветности. [10]

По сравнению с преобразованием Фурье реализация этого преобразования более сложна. Это связано с различным количеством выборок, используемых при вычислении каждого элемента разрешения по частоте, что также влияет на длину любой реализованной оконной функции. [11]

Также обратите внимание, что, поскольку шкала частот является логарифмической, в ней отсутствует истинная составляющая нулевой частоты/постоянного тока, что может быть недостатком в приложениях, которым интересен член постоянного тока. Хотя для приложений, которым не интересен ДК типа аудио, это не является недостатком.

  1. ^ Джудит К. Браун , Расчет спектрального преобразования с постоянной Q , J. Acoust. Соц. Являюсь. , 89(1):425–434, 1991.
  2. ^ Непрерывное вейвлет-преобразование «Когда материнский вейвлет можно интерпретировать как оконную синусоиду (например, вейвлет Морле), вейвлет-преобразование можно интерпретировать как преобразование Фурье с постоянной добротностью. До появления теории вейвлетов преобразования Фурье с постоянной добротностью ( например, полученные из классического банка третьоктавных фильтров), было нелегко инвертировать, потому что базовые сигналы не были ортогональными».
  3. ^ Цвитковиц, Фрэнк С.младший (2019). «Сквозная транскрипция музыки с использованием точно настроенных наборов фильтров с переменной Q» (PDF) . Рочестерский технологический институт : 32–34 . Проверено 21 августа 2022 г.
  4. ^ Джудит К. Браун и Миллер С. Пакетт, Эффективный алгоритм расчета постоянного Q-преобразования , J. Acoust. Соц. Являюсь. , 92(5):2698–2701, 1992.
  5. ^ Фитцджеральд, Дерри; Циховский, Марцин Т.; Кранич, Мэтт (1 мая 2006 г.). «К обратному преобразованию с постоянной Q» . Съезд Общества аудиоинженеров . 120 . Париж: Общество аудиоинженеров.
  6. ^ Шёрхубер, Кристиан; Клапури, Ансси (2010). «НАБОР ИНСТРУМЕНТОВ ПРЕОБРАЗОВАНИЯ CONSTANT-Q ДЛЯ ОБРАБОТКИ МУЗЫКИ» . 7-я конференция по звуковым и музыкальным вычислениям . Барселона . Проверено 12 декабря 2018 г. бумага
  7. ^ Jump up to: а б Макфи, Брайан; Баттенберг, Эрик; Лостанлен, Винсент; Том, Карл (12 декабря 2018 г.). "библиотека: core/constantq.py в 8d2 Гитхаб . книжный Получено 12 декабря.
  8. ^ Брэдфорд, Р., Ффич, Дж. и Добсон, Р. 2008, Скольжение с постоянным Q , на 11-й Международной конференции по цифровым аудиоэффектам (DAFx-08), материалы 1–4 сентября 2008 г., Эспоо, Финляндия . DAFx, Эспоо, Финляндия, стр. 363-369, Proc. Международного Конф. о цифровых аудиоэффектах (DAFx-08), 09.01.08.
  9. ^ http://newt.phys.unsw.edu.au/jw/graphics/notes.GIF [ файл изображения с пустым URL-адресом ]
  10. ^ Хендрик Пурвинс, Бенджамин Бланкерц и Клаус Обермайер, Новый метод отслеживания модуляций тональной музыки в формате аудиоданных , Международная совместная конференция по нейронным сетям (IJCNN'00). , 6:270-275, 2000.
  11. ^ Бенджамин Бланкерц, Постоянное Q-преобразование , 1999.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 8b961e82db3427908009f746e84220b3__1708443480
URL1:https://arc.ask3.ru/arc/aa/8b/b3/8b961e82db3427908009f746e84220b3.html
Заголовок, (Title) документа по адресу, URL1:
Constant-Q transform - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)