Jump to content

Поиск музыкальной информации

(Перенаправлено с «Распознавание музыки »)

Поиск музыкальной информации ( МИР ) – это междисциплинарная наука о извлечении информации из музыки . Те, кто участвует в MIR, могут иметь опыт работы в области академического музыковедения , психоакустики , психологии , обработки сигналов , информатики , машинного обучения , оптического распознавания музыки , вычислительного интеллекта или некоторой их комбинации.

Приложения

[ редактировать ]

Поиск музыкальной информации используется предприятиями и учеными для классификации, манипулирования и даже создания музыки.

Классификация музыки

[ редактировать ]

Одной из классических тем исследований МИР является жанровая классификация, которая относит музыкальные произведения к одному из заранее определенных жанров, таких как классика , джаз , рок и т. д. Классификация по настроению , классификация исполнителей, идентификация инструментов и маркировка музыкальных тегов также являются популярными темами. .

Рекомендательные системы

[ редактировать ]

Несколько систем рекомендаций для музыки уже существуют, но на удивление лишь немногие из них основаны на методах MIR, а не на сходстве между пользователями или трудоемкой компиляции данных. Pandora , например, использует экспертов, чтобы присвоить музыке определенные качества, такие как «певица» или «сильная басовая партия». Многие другие системы находят пользователей, история прослушивания которых аналогична, и предлагают пользователям неслыханную музыку из соответствующих коллекций. Методы MIR для определения сходства в музыке теперь начинают становиться частью таких систем.

Разделение музыкальных источников и распознавание инструментов

[ редактировать ]

Разделение музыкальных источников заключается в отделении исходных сигналов от смешанного аудиосигнала . Распознавание инструментов заключается в идентификации инструментов, участвующих в музыке. Были разработаны различные системы МИР, которые могут разделять музыку на составные дорожки без доступа к мастер-копии. Таким способом, например, треки караоке могут быть созданы из обычных музыкальных треков, хотя этот процесс еще не идеален из-за того, что вокал занимает часть того же частотного пространства, что и другие инструменты.

Автоматическая транскрипция музыки

[ редактировать ]

Автоматическая транскрипция музыки — это процесс преобразования аудиозаписи в символическую запись, например партитуру или MIDI-файл . [1] Этот процесс включает в себя несколько задач аудиоанализа, которые могут включать в себя обнаружение многотональности, обнаружение начала , оценку продолжительности, идентификацию инструмента и извлечение гармонической , ритмической или мелодической информации. Эта задача усложняется при большем количестве инструментов и большем уровне полифонии .

Генерация музыки

[ редактировать ]

Автоматическое создание музыки — цель многих исследователей МИР. Попытки были предприняты с ограниченным успехом с точки зрения человеческой оценки результатов.

Используемые методы

[ редактировать ]

Источник данных

[ редактировать ]

Партитуры дают четкое и логичное описание музыки, с которой можно работать, но доступ к нотам , цифровым или другим, часто непрактичен. MIDI- музыка также использовалась по тем же причинам, но некоторые данные теряются при преобразовании в MIDI из любого другого формата, если только музыка не была написана с учетом стандартов MIDI, что случается редко. Форматы цифрового аудио , такие как WAV , mp3 и ogg, используются, когда сам звук является частью анализа. Форматы с потерями, такие как mp3 и ogg, хорошо воспринимаются человеческим ухом, но в них могут отсутствовать важные данные для изучения. Кроме того, некоторые кодировки создают артефакты, которые могут ввести в заблуждение любой автоматический анализатор. Несмотря на это, повсеместное распространение mp3 привело к тому, что во многих исследованиях в этой области они использовались в качестве исходного материала. Все чаще метаданные , полученные из Интернета, включаются в MIR для более всестороннего понимания музыки в ее культурном контексте, и в последнее время это заключается в анализе социальных тегов музыки.

Представление объекта

[ редактировать ]

Анализ часто может потребовать некоторого обобщения, [2] а для музыки (как и для многих других форм данных) это достигается путем извлечения признаков , особенно когда аудиоконтент анализируется сам машинное обучение и применяется . Цель состоит в том, чтобы сократить количество данных до управляемого набора значений, чтобы обучение можно было проводить в разумные сроки. Одной из общих особенностей является кепстральный коэффициент мел-частоты (MFCC), который является мерой тембра произведения музыкального . Другие функции могут использоваться для представления тональности , аккордов , гармоний , мелодии , основной высоты тона , количества ударов в минуту или ритма в произведении. Существует ряд доступных инструментов извлечения аудиофункций. [3] Доступно здесь

Статистика и машинное обучение

[ редактировать ]

Другие вопросы

[ редактировать ]

Академическая деятельность

[ редактировать ]

См. также

[ редактировать ]
  1. ^ А. Клапури и М. Дэви, редакторы. Методы обработки сигналов для транскрипции музыки. Спрингер-Верлаг, Нью-Йорк, 2006 г.
  2. ^ Эйденбергер, Хорст (2011). «Фундаментальное понимание медиа», atpress. ISBN   978-3-8423-7917-6 .
  3. ^ Дэвид Моффат, Дэвид Ронан и Джошуа Д. Рейсс. «Оценка наборов инструментов для извлечения аудиофункций». В материалах Международной конференции по цифровым аудиоэффектам (DAFx), 2016.
[ редактировать ]

Примеры применения МИР

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 54c75de3f09720ae4e34cd77b3400d1e__1722547020
URL1:https://arc.ask3.ru/arc/aa/54/1e/54c75de3f09720ae4e34cd77b3400d1e.html
Заголовок, (Title) документа по адресу, URL1:
Music information retrieval - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)