Визуальный рейтинг
Эта статья нуждается в дополнительных цитатах для проверки . ( июнь 2021 г. ) |
VisualRank — это система поиска и ранжирования изображений путем анализа и сравнения их содержимого , а не поиска названий изображений, веб-ссылок или другого текста. Ученые Google обнародовали свою работу с VisualRank в статье, описывающей применение PageRank для поиска изображений Google на Международной конференции World Wide Web в Пекине в 2008 году. [1]
Методы
[ редактировать ]как компьютерного зрения методы , так и локально-чувствительное хеширование VisualRank используются В алгоритме (LSH) . Рассмотрим поиск изображений, инициированный текстовым запросом. Существующая методика поиска, основанная на метаданных изображения и окружающем тексте, используется для получения исходных кандидатов в результат ( PageRank ), которые вместе с другими изображениями в индексе группируются в графе в соответствии с их сходством (которое заранее вычисляется). Затем центральность измеряется при кластеризации, которая возвращает наиболее канонические изображения по отношению к запросу. Идея здесь заключается в том, что соглашение между пользователями сети об изображении и связанных с ним концепциях приведет к тому, что эти изображения будут считаться более похожими. VisualRank определяется итеративно , где — матрица сходства изображений. Поскольку используются матрицы, в качестве меры будет применяться центральность собственного вектора с повторным умножением и создавая собственный вектор, который мы ищем. Очевидно, что мера сходства изображений имеет решающее значение для производительности VisualRank, поскольку она определяет базовую структуру графа.
Основная система VisualRank начинается с извлечения векторов локальных признаков из изображений с использованием масштабно-инвариантного преобразования признаков (SIFT). Дескрипторы локальных объектов используются вместо цветовых гистограмм, поскольку они позволяют учитывать сходство между изображениями с возможным поворотом, масштабированием и перспективными преобразованиями. Затем к этим векторам признаков применяется хеширование с учетом местоположения с использованием схемы p-стабильного распределения . В дополнение к этому применяется усиление LSH с использованием конструкций И/ИЛИ. В рамках прикладной схемы распределение Гаусса при используется норма .