Jump to content

Средний сдвиг

Средний сдвиг — это непараметрический метод математического анализа пространства признаков для определения максимумов функции плотности , так называемый алгоритм поиска режима . [1] Области применения включают кластерный анализ в компьютерном зрении и обработке изображений . [2]

История [ править ]

Процедуру среднего сдвига обычно приписывают работе Фукунаги и Хостетлера в 1975 году. [3] Однако это напоминает более раннюю работу Шнелла 1964 года. [4]

Обзор [ править ]

Сдвиг среднего — это процедура определения максимумов ( мод ) функции плотности с учетом дискретных данных, выбранных из этой функции. [1] Это итерационный метод, и мы начинаем с начальной оценки . Пусть функция ядра быть дано. Эта функция определяет вес близлежащих точек для переоценки среднего значения. Обычно ядро ​​Гаусса для расстояния до текущей оценки: используется . Средневзвешенное значение плотности в окне, определенное по формуле является

где это окрестности , набор точек, для которых .

Разница называется сдвигом среднего по Фукунаге и Хостетлеру. [3] Алгоритм среднего сдвига теперь устанавливает , и повторяет оценку до тех пор, пока сходится.

Хотя алгоритм среднего сдвига широко используется во многих приложениях, строгое доказательство сходимости алгоритма с использованием общего ядра в многомерном пространстве до сих пор не известно. [5] Алияри Гассабех показал сходимость алгоритма среднего сдвига в одном измерении с дифференцируемой, выпуклой и строго убывающей функцией профиля. [6] Однако одномерный случай имеет ограниченное применение в реальном мире. Также доказана сходимость алгоритма в более высоких размерностях с конечным числом стационарных (или изолированных) точек. [5] [7] Однако достаточные условия для того, чтобы общая ядерная функция имела конечные стационарные (или изолированные) точки, не были предоставлены.

Гауссовский средний сдвиг — это алгоритм максимизации ожиданий . [8]

Подробности [ править ]

Пусть данные представляют собой конечное множество встроенный в -мерное евклидово пространство, . Позволять быть плоским ядром, которое является характеристической функцией - мяч в ,

На каждой итерации алгоритма выполняется для всех одновременно. Таким образом, первый вопрос заключается в том, как оценить функцию плотности с учетом разреженного набора выборок. Один из самых простых подходов — просто сгладить данные, например, путем свертки их с фиксированным ядром ширины. ,

где являются входными образцами и — это функция ядра (или окно Парцена ). является единственным параметром в алгоритме и называется пропускной способностью. Этот подход известен как оценка плотности ядра или метод окна Парцена. Как только мы вычислили из приведенного выше уравнения мы можем найти его локальные максимумы, используя градиентный подъем или какой-либо другой метод оптимизации. Проблема с этим подходом «грубой силы» заключается в том, что для более высоких размерностей становится вычислительно невозможно оценить по всему пространству поиска. Вместо этого средний сдвиг использует вариант того, что известно в литературе по оптимизации как градиентный спуск с множественным перезапуском . Начиная с некоторого предположения о локальном максимуме, , который может быть случайной точкой входных данных , средний сдвиг вычисляет градиент оценки плотности в и делает шаг в гору в этом направлении. [9]

Типы ядер [ править ]

Определение ядра: Пусть быть -мерное евклидово пространство, . Норма является неотрицательным числом, . Функция называется ядром, если существует профиль , , такой, что

и

  • k неотрицательен.
  • k не возрастает: если .
  • k кусочно-непрерывен и

Два наиболее часто используемых профиля ядра для среднего сдвига:

Плоское ядро

Гауссово ядро

где параметр стандартного отклонения работает как параметр пропускной способности, .

Приложения [ править ]

Кластеризация [ править ]

Рассмотрим набор точек в двумерном пространстве. Предположим, круглое окно с центром в и имеющий радиус как ядро. Сдвиг среднего — это алгоритм восхождения на холм, который включает в себя итеративный сдвиг этого ядра в область с более высокой плотностью до сходимости. Каждый сдвиг определяется вектором среднего сдвига. Вектор среднего сдвига всегда указывает в сторону максимального увеличения плотности. На каждой итерации ядро ​​смещается к центру тяжести или к среднему значению точек внутри него. Метод вычисления этого среднего зависит от выбора ядра. В этом случае, если вместо плоского ядра выбрано гауссово ядро, то каждой точке сначала будет присвоен вес, который будет экспоненциально убывать по мере увеличения расстояния от центра ядра. При сходимости не будет направления, в котором сдвиг мог бы разместить больше точек внутри ядра.

Отслеживание [ править ]

Алгоритм среднего сдвига можно использовать для визуального отслеживания. Самый простой такой алгоритм будет создавать карту достоверности в новом изображении на основе цветовой гистограммы объекта на предыдущем изображении и использовать сдвиг среднего, чтобы найти пик карты достоверности вблизи старого положения объекта. Карта достоверности — это функция плотности вероятности нового изображения, присваивающая каждому пикселю нового изображения вероятность, которая представляет собой вероятность того, что цвет пикселя встречается в объекте на предыдущем изображении. Некоторые алгоритмы, такие как отслеживание объектов на основе ядра, [10] трекинг ансамбля, [11] CAMshift [12] [13] расширить эту идею.

Сглаживание [ править ]

Позволять и быть -мерные входные и отфильтрованные пиксели изображения в совместной области пространственного диапазона. Для каждого пикселя

  • Инициализировать и
  • Вычислить в соответствии с до сближения, .
  • Назначать . Верхние индексы s и r обозначают пространственную и дальностную компоненты вектора соответственно. Назначение указывает, что отфильтрованные данные на оси пространственного местоположения будут иметь компонент диапазона точки сходимости. .

Сильные стороны [ править ]

  1. Сдвиг среднего значения — это независимый от приложения инструмент, подходящий для анализа реальных данных.
  2. Не принимает никакой предопределенной формы в кластерах данных.
  3. Он способен обрабатывать произвольные пространства объектов.
  4. Процедура основана на выборе одного параметра: пропускной способности.
  5. Размер полосы пропускания/окна 'h' имеет физическое значение, в отличие от k -means .

Слабые стороны [ править ]

  1. Выбор размера окна нетривиален.
  2. Неподходящий размер окна может привести к объединению режимов или созданию дополнительных «мелких» режимов.
  3. Часто требуется использование адаптивного размера окна.

Наличие [ править ]

Варианты алгоритма можно найти в пакетах машинного обучения и обработки изображений:

  • ЭЛКИ . Инструмент интеллектуального анализа данных Java со множеством алгоритмов кластеризации.
  • ИзображениеДж . Фильтрация изображений с использованием фильтра среднего сдвига.
  • млпак . Эффективная реализация на основе алгоритма двойного дерева.
  • OpenCV содержит реализацию среднего сдвига с помощью метода cvMeanShift.
  • Набор инструментов Орфео . Реализация C++.
  • scikit-learn Реализация Numpy/Python использует дерево шариков для эффективного поиска соседних точек

См. также [ править ]

Ссылки [ править ]

  1. ^ Перейти обратно: а б Ченг, Ицзун (август 1995 г.). «Сдвиг среднего, поиск режима и кластеризация». Транзакции IEEE по анализу шаблонов и машинному интеллекту . 17 (8): 790–799. CiteSeerX   10.1.1.510.1222 . дои : 10.1109/34.400568 .
  2. ^ Команичиу, Дорин; Питер Меер (май 2002 г.). «Сдвиг среднего значения: надежный подход к анализу пространства признаков». Транзакции IEEE по анализу шаблонов и машинному интеллекту . 24 (5): 603–619. CiteSeerX   10.1.1.160.3832 . дои : 10.1109/34.1000236 . S2CID   691081 .
  3. ^ Перейти обратно: а б Фукунага, Кейносукэ; Ларри Д. Хостетлер (январь 1975 г.). «Оценка градиента функции плотности с применением в распознавании образов». Транзакции IEEE по теории информации . 21 (1): 32–40. дои : 10.1109/TIT.1975.1055330 .
  4. ^ Шнелл, П. (1964). «Метод обнаружения групп» . Биометрический журнал (на немецком языке). 6 (1): 47–48. дои : 10.1002/bimj.19640060105 .
  5. ^ Перейти обратно: а б Алияри Гассабе, Юнесс (01 марта 2015 г.). «Достаточное условие сходимости алгоритма среднего сдвига с ядром Гаусса» . Журнал многомерного анализа . 135 : 1–10. дои : 10.1016/j.jmva.2014.11.009 .
  6. ^ Алияри Гассабе, Юнесс (1 сентября 2013 г.). «О сходимости алгоритма среднего сдвига в одномерном пространстве». Буквы для распознавания образов . 34 (12): 1423–1427. arXiv : 1407.2961 . Бибкод : 2013PaReL..34.1423A . дои : 10.1016/j.patrec.2013.05.004 . S2CID   10233475 .
  7. ^ Ли, Сянгру; Ху, Чжани; Ву, Фучао (1 июня 2007 г.). «Заметка о сходимости среднего сдвига». Распознавание образов . 40 (6): 1756–1762. Бибкод : 2007PatRe..40.1756L . дои : 10.1016/j.patcog.2006.10.016 .
  8. ^ Каррейра-Перпинан, Мигель А. (май 2007 г.). «Гауссов сдвиг среднего — это алгоритм EM». Транзакции IEEE по анализу шаблонов и машинному интеллекту . 29 (5): 767–776. дои : 10.1109/tpami.2007.1057 . ISSN   0162-8828 . ПМИД   17356198 . S2CID   6694308 .
  9. ^ Ричард Селиски, Компьютерное зрение, алгоритмы и приложения, Springer, 2011 г.
  10. ^ Команичиу, Дорин; Вишванатан Рамеш; Питер Меер (май 2003 г.). «Отслеживание объектов на основе ядра». Транзакции IEEE по анализу шаблонов и машинному интеллекту . 25 (5): 564–575. CiteSeerX   10.1.1.8.7474 . дои : 10.1109/tpami.2003.1195991 . S2CID   823678 .
  11. ^ Авидан, Шай (2005). «Слежение за ансамблем». 2005 Конференция IEEE Computer Society по компьютерному зрению и распознаванию образов (CVPR'05) . Том. 2. Сан-Диего, Калифорния: IEEE. стр. 494–501. дои : 10.1109/CVPR.2005.144 . ISBN  978-0-7695-2372-9 . ПМИД   17170479 . S2CID   1638397 .
  12. ^ Гэри Брэдски (1998) Отслеживание лиц компьютерным зрением для использования в перцептивном пользовательском интерфейсе. Архивировано 17 апреля 2012 г. в Wayback Machine , Intel Technology Journal, № Q2.
  13. ^ Эмами, Ибрагим (2013). «Онлайн-обнаружение и исправление неисправностей алгоритма отслеживания CAMShift». 2013 8-я Иранская конференция по машинному зрению и обработке изображений (MVIP) . Том. 2. ИИЭР. стр. 180–183. doi : 10.1109/IranianMVIP.2013.6779974 . ISBN  978-1-4673-6184-2 . S2CID   15864761 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 1d77f1bf1e3dde590d46ee492b9f9216__1693953120
URL1:https://arc.ask3.ru/arc/aa/1d/16/1d77f1bf1e3dde590d46ee492b9f9216.html
Заголовок, (Title) документа по адресу, URL1:
Mean shift - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)