Аудио поисковая система
Аудиопоисковая система — это веб- поисковик , который сканирует Интернет в поисках аудиоконтента . Информация может состоять из веб-страниц, изображений, аудиофайлов или документов другого типа. Существуют различные методы исследования этих двигателей.
Виды поиска
[ редактировать ]Поиск аудио по тексту
[ редактировать ]Текст, введенный пользователем в строку поиска, сравнивается с базой данных поисковой системы. Результаты сопоставления сопровождаются кратким описанием аудиофайла и его характеристик, таких как частота дискретизации, битрейт, тип файла, длина, продолжительность или тип кодирования. Пользователю предоставляется возможность скачать полученные файлы.
Поиск аудио по изображению
[ редактировать ]Система « Запрос по примеру» (QBE) — это алгоритм поиска, использующий поиск изображений на основе контента (CBIR). Ключевые слова генерируются из анализируемого изображения. Эти ключевые слова используются для поиска аудиофайлов в базе данных. Результаты поиска отображаются в соответствии с предпочтениями пользователя относительно типа файла (wav, mp3, aiff…) или других характеристик.

Внизу: звуковая спектрограмма .
Поиск аудио по аудио
[ редактировать ]При поиске аудио по аудио пользователь должен воспроизвести звук песни либо с помощью музыкального проигрывателя, либо напевая, либо напевая в микрофон компьютера. Впоследствии звуковой образец A получается из формы звукового сигнала, а частотное представление получается из его преобразования Фурье . Этот шаблон будет сопоставлен с шаблоном B , соответствующим форме волны и преобразованию звуковых файлов, найденных в базе данных. Все те аудиофайлы в базе данных, шаблоны которых похожи на искомый шаблон, будут отображаться в качестве результатов поиска.
Дизайн и алгоритмы
[ редактировать ]

Аудиопоиск медленно развивался через несколько основных форматов поиска, которые существуют сегодня и все из которых используют ключевые слова . Ключевые слова для каждого поиска можно найти в заголовке носителя, любом тексте, прикрепленном к веб-страницам, связанным с носителем и контентом, которые также определяются авторами и пользователями видеоресурсов.
Некоторые поисковые системы могут искать записанную речь, например подкасты, хотя это может быть сложно, если есть фоновый шум. около 40 фонем В каждом языке существует , а во всех разговорных языках их около 400. Вместо того, чтобы применять алгоритм поиска текста после завершения обработки речи в текст, некоторые системы используют алгоритм фонетического поиска для поиска результатов в произнесенном слове. Другие работают, прослушивая подкаст целиком и создавая текстовую транскрипцию.
Такие приложения, как Munax, используют несколько независимых алгоритмов ранжирования, которые используют инвертированный индекс вместе с сотнями параметров поиска для получения окончательного рейтинга для каждого документа. Также как Shazam, который анализирует записанный звук и ищет совпадения на основе акустического отпечатка в базе данных, содержащей более 11 миллионов песен. Shazam идентифицирует песни на основе аудиоотпечатка на основе частотно-временного графика, называемого спектрограммой . Shazam хранит каталог аудиоотпечатков в базе данных. Пользователь помечает песню на 10 секунд, и приложение создает аудиоотпечаток. Как только Shazam создаст отпечаток аудио, он начнет поиск совпадений в базе данных. Если есть совпадение, он возвращает информацию пользователю; в противном случае возвращается диалог «песня неизвестна». Shazam может идентифицировать заранее записанную музыку, транслируемую из любого источника, например радио, телевидения, кино или музыки в клубе, при условии, что уровень фонового шума недостаточно высок, чтобы предотвратить получение акустического отпечатка пальца, и что песня присутствует в базу данных программного обеспечения. [ нужна ссылка ]
Известные двигатели
[ редактировать ]Глубокий аудиопоиск
[ редактировать ]- Picsearch Audio Search имеет лицензию на поисковые порталы с 2006 года. Picsearch — поставщик поисковых технологий, обеспечивающий поиск изображений, видео и аудио в более чем 100 основных поисковых системах по всему миру.
Для смартфонов
[ редактировать ]- SoundHound (ранее известный как Midomi ) — это программное обеспечение и компания (обе имеют одно и то же название), которые позволяют пользователям находить результаты со звуком. на основе аудио, так Его функциями являются как служба искусственного интеллекта и службы для поиска песен и подробностей о них путем их пения , напевания или записи.
- Shazam — это приложение для смартфона или Mac, наиболее известное своими возможностями идентификации музыки. Он использует встроенный микрофон для сбора краткого фрагмента воспроизводимого звука. Он создает акустический отпечаток на основе образца и сравнивает его с центральной базой данных на предмет совпадения. Если он находит совпадение, он отправляет пользователю такую информацию, как исполнитель, название песни и альбом.
- Доресо идентифицирует песню, напевая или напевая мелодию с помощью микрофона; и прямым вводом названия песни или исполнителя. Приложение предоставляет информацию о названии песни, ее исполнителе и позволяет приобрести песню.
- Munax (несуществующая) — компания, которая выпустила свою первую версию поисковой системы по всему контенту в 2005 году. Их мультимедийная поисковая система PlayAudioVideo , созданная в июле 2007 года, была первой настоящей поисковой системой для мультимедиа, обеспечивающей поиск в Интернете изображений, видео и аудио в одной поисковой системе, что позволяет пользователям просматривать их на одной странице. [ нужна ссылка ] С тех пор Мунакс закрылся. [ нужна ссылка ]