Jump to content

Аудио поисковая система

Аудиопоисковая система — это веб- поисковик , который сканирует Интернет в поисках аудиоконтента . Информация может состоять из веб-страниц, изображений, аудиофайлов или документов другого типа. Существуют различные методы исследования этих двигателей.

[ редактировать ]

Поиск аудио по тексту

[ редактировать ]

Текст, введенный пользователем в строку поиска, сравнивается с базой данных поисковой системы. Результаты сопоставления сопровождаются кратким описанием аудиофайла и его характеристик, таких как частота дискретизации, битрейт, тип файла, длина, продолжительность или тип кодирования. Пользователю предоставляется возможность скачать полученные файлы.

Поиск аудио по изображению

[ редактировать ]

Система « Запрос по примеру» (QBE) — это алгоритм поиска, использующий поиск изображений на основе контента (CBIR). Ключевые слова генерируются из анализируемого изображения. Эти ключевые слова используются для поиска аудиофайлов в базе данных. Результаты поиска отображаются в соответствии с предпочтениями пользователя относительно типа файла (wav, mp3, aiff…) или других характеристик.

Вверху: звук, форма волны.
Внизу: звуковая спектрограмма .

Поиск аудио по аудио

[ редактировать ]

При поиске аудио по аудио пользователь должен воспроизвести звук песни либо с помощью музыкального проигрывателя, либо напевая, либо напевая в микрофон компьютера. Впоследствии звуковой образец A получается из формы звукового сигнала, а частотное представление получается из его преобразования Фурье . Этот шаблон будет сопоставлен с шаблоном B , соответствующим форме волны и преобразованию звуковых файлов, найденных в базе данных. Все те аудиофайлы в базе данных, шаблоны которых похожи на искомый шаблон, будут отображаться в качестве результатов поиска.

Дизайн и алгоритмы

[ редактировать ]
Спектрограмма звука скрипки.
Целевая зона песни, сканируемой Shazam. [ нужны разъяснения ]

Аудиопоиск медленно развивался через несколько основных форматов поиска, которые существуют сегодня и все из которых используют ключевые слова . Ключевые слова для каждого поиска можно найти в заголовке носителя, любом тексте, прикрепленном к веб-страницам, связанным с носителем и контентом, которые также определяются авторами и пользователями видеоресурсов.

Некоторые поисковые системы могут искать записанную речь, например подкасты, хотя это может быть сложно, если есть фоновый шум. около 40 фонем В каждом языке существует , а во всех разговорных языках их около 400. Вместо того, чтобы применять алгоритм поиска текста после завершения обработки речи в текст, некоторые системы используют алгоритм фонетического поиска для поиска результатов в произнесенном слове. Другие работают, прослушивая подкаст целиком и создавая текстовую транскрипцию.

Такие приложения, как Munax, используют несколько независимых алгоритмов ранжирования, которые используют инвертированный индекс вместе с сотнями параметров поиска для получения окончательного рейтинга для каждого документа. Также как Shazam, который анализирует записанный звук и ищет совпадения на основе акустического отпечатка в базе данных, содержащей более 11 миллионов песен. Shazam идентифицирует песни на основе аудиоотпечатка на основе частотно-временного графика, называемого спектрограммой . Shazam хранит каталог аудиоотпечатков в базе данных. Пользователь помечает песню на 10 секунд, и приложение создает аудиоотпечаток. Как только Shazam создаст отпечаток аудио, он начнет поиск совпадений в базе данных. Если есть совпадение, он возвращает информацию пользователю; в противном случае возвращается диалог «песня неизвестна». Shazam может идентифицировать заранее записанную музыку, транслируемую из любого источника, например радио, телевидения, кино или музыки в клубе, при условии, что уровень фонового шума недостаточно высок, чтобы предотвратить получение акустического отпечатка пальца, и что песня присутствует в базу данных программного обеспечения. [ нужна ссылка ]

Известные двигатели

[ редактировать ]
[ редактировать ]
  • Picsearch Audio Search имеет лицензию на поисковые порталы с 2006 года. Picsearch — поставщик поисковых технологий, обеспечивающий поиск изображений, видео и аудио в более чем 100 основных поисковых системах по всему миру.

Для смартфонов

[ редактировать ]
  • SoundHound (ранее известный как Midomi ) — это программное обеспечение и компания (обе имеют одно и то же название), которые позволяют пользователям находить результаты со звуком. на основе аудио, так Его функциями являются как служба искусственного интеллекта и службы для поиска песен и подробностей о них путем их пения , напевания или записи.
  • Shazam — это приложение для смартфона или Mac, наиболее известное своими возможностями идентификации музыки. Он использует встроенный микрофон для сбора краткого фрагмента воспроизводимого звука. Он создает акустический отпечаток на основе образца и сравнивает его с центральной базой данных на предмет совпадения. Если он находит совпадение, он отправляет пользователю такую ​​информацию, как исполнитель, название песни и альбом.
  • Доресо идентифицирует песню, напевая или напевая мелодию с помощью микрофона; и прямым вводом названия песни или исполнителя. Приложение предоставляет информацию о названии песни, ее исполнителе и позволяет приобрести песню.
  • Munax (несуществующая) — компания, которая выпустила свою первую версию поисковой системы по всему контенту в 2005 году. Их мультимедийная поисковая система PlayAudioVideo , созданная в июле 2007 года, была первой настоящей поисковой системой для мультимедиа, обеспечивающей поиск в Интернете изображений, видео и аудио в одной поисковой системе, что позволяет пользователям просматривать их на одной странице. [ нужна ссылка ] С тех пор Мунакс закрылся. [ нужна ссылка ]

См. также

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: f14ee9c55c663bb6ba9d088acff22955__1708692960
URL1:https://arc.ask3.ru/arc/aa/f1/55/f14ee9c55c663bb6ba9d088acff22955.html
Заголовок, (Title) документа по адресу, URL1:
Audio search engine - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)