Jump to content

Поиск музыкальной информации

Поиск музыкальной информации ( МИР ) – это междисциплинарная наука о извлечении информации из музыки . Те, кто участвует в MIR, могут иметь опыт работы в области академического музыковедения , психоакустики , психологии , обработки сигналов , информатики , машинного обучения , оптического распознавания музыки , вычислительного интеллекта или некоторой их комбинации.

Приложения [ править ]

MIR используется предприятиями и учеными для классификации, управления и даже создания музыки.

Классификация музыки [ править ]

Одной из классических тем исследования МИР является жанровая классификация, которая относит музыкальные произведения к одному из заранее определенных жанров, таких как классика , джаз , рок и т. д. Классификация по настроению , классификация исполнителей, идентификация инструментов и маркировка музыкальных тегов также являются популярными темами. .

Рекомендательные системы [ править ]

Несколько систем рекомендаций для музыки уже существуют, но на удивление лишь немногие из них основаны на методах MIR, а не на сходстве между пользователями или трудоемкой компиляции данных. Pandora , например, использует экспертов, чтобы присвоить музыке определенные качества, такие как «певица» или «сильная басовая партия». Многие другие системы находят пользователей, история прослушивания которых аналогична, и предлагают пользователям неслыханную музыку из соответствующих коллекций. Методы MIR для определения сходства в музыке теперь начинают составлять часть таких систем.

музыкальных источников и распознавание Разделение инструментов

Разделение музыкальных источников заключается в отделении исходных сигналов от смешанного аудиосигнала . Распознавание инструментов заключается в идентификации инструментов, участвующих в музыке. Были разработаны различные системы МИР, которые могут разделять музыку на составные дорожки без доступа к мастер-копии. Таким способом, например, треки караоке могут быть созданы из обычных музыкальных треков, хотя этот процесс еще не идеален из-за того, что вокал занимает часть того же частотного пространства, что и другие инструменты.

Автоматическая транскрипция музыки [ править ]

Автоматическая транскрипция музыки — это процесс преобразования аудиозаписи в символическую запись, например партитуру или MIDI-файл . [1] Этот процесс включает в себя несколько задач аудиоанализа, которые могут включать в себя обнаружение нескольких тонов, обнаружение начала , оценку продолжительности, идентификацию инструмента и извлечение гармонической , ритмической или мелодической информации. Эта задача усложняется при большем количестве инструментов и большем уровне полифонии .

Генерация музыки [ править ]

Автоматическое создание музыки — цель многих исследователей МИР. Попытки были предприняты с ограниченным успехом с точки зрения человеческой оценки результатов.

Используемые методы [ править ]

Источник данных [ править ]

Партитуры дают четкое и логичное описание музыки, с которой можно работать, но доступ к нотам , цифровым или другим, часто непрактичен. MIDI- музыка также использовалась по тем же причинам, но некоторые данные теряются при преобразовании в MIDI из любого другого формата, если только музыка не была написана с учетом стандартов MIDI, что случается редко. Форматы цифрового аудио , такие как WAV , mp3 и ogg, используются, когда сам звук является частью анализа. Форматы с потерями, такие как mp3 и ogg, хорошо воспринимаются человеческим ухом, но в них могут отсутствовать важные данные для изучения. Кроме того, некоторые кодировки создают артефакты, которые могут ввести в заблуждение любой автоматический анализатор. Несмотря на это, повсеместное распространение mp3 привело к тому, что во многих исследованиях в этой области они использовались в качестве исходного материала. Все чаще метаданные , полученные из Интернета, включаются в MIR для более всестороннего понимания музыки в ее культурном контексте, и в последнее время это заключается в анализе социальных тегов музыки.

Представление объекта [ править ]

Анализ часто может потребовать некоторого обобщения, [2] а для музыки (как и для многих других форм данных) это достигается путем извлечения признаков , особенно когда аудиоконтент анализируется сам машинное обучение и применяется . Цель состоит в том, чтобы сократить количество данных до управляемого набора значений, чтобы обучение можно было проводить в разумные сроки. Одной из общих особенностей является кепстральный коэффициент мел-частоты (MFCC), который является мерой тембра произведения музыкального . Другие функции могут использоваться для представления тональности , аккордов , гармоний , мелодии , основной высоты тона , количества ударов в минуту или ритма в произведении. Существует ряд доступных инструментов извлечения аудиофункций. [3] Доступно здесь

Статистика и машинное обучение [ править ]

Другие проблемы [ править ]

Академическая деятельность [ править ]

См. также [ править ]

Ссылки [ править ]

  1. ^ А. Клапури и М. Дэви, редакторы. Методы обработки сигналов для транскрипции музыки. Спрингер-Верлаг, Нью-Йорк, 2006 г.
  2. ^ Эйденбергер, Хорст (2011). «Фундаментальное понимание медиа», atpress. ISBN   978-3-8423-7917-6 .
  3. ^ Дэвид Моффат, Дэвид Ронан и Джошуа Д. Рейсс. «Оценка наборов инструментов для извлечения аудиофункций». В материалах Международной конференции по цифровым аудиоэффектам (DAFx), 2016.

Внешние ссылки [ править ]

Примеры применения МИР [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 00601c73bea1f7a94e77581d25c31f65__1717021620
URL1:https://arc.ask3.ru/arc/aa/00/65/00601c73bea1f7a94e77581d25c31f65.html
Заголовок, (Title) документа по адресу, URL1:
Music information retrieval - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)