Jump to content

Геометрическая медиана

(Перенаправлено с Пространственной медианы )
Пример геометрической медианы (желтого цвета) ряда точек. Синим цветом — Центр масс .

В геометрии геометрическая медиана дискретного набора точек выборки в евклидовом пространстве — это точка, минимизирующая сумму расстояний до точек выборки. Это обобщает медиану , которая имеет свойство минимизировать сумму расстояний для одномерных данных, и обеспечивает центральную тенденцию в более высоких измерениях. Его также называют пространственной медианой . [1] Евклидова точка минимума , [1] точка Торричелли , [2] или 1-медиана .

Геометрическая медиана является важным показателем местоположения в статистике . [3] поскольку это минимизирует сумму L 2 расстояний образцов. [4] Его следует сравнивать со средним значением, которое минимизирует сумму квадратов расстояний L2 медианой по координатам , которая минимизирует сумму расстояний L1 , и с . Это также стандартная задача определения местоположения объекта , где моделируется задача определения местоположения объекта для минимизации затрат на транспортировку. [5] Более общая k задача -медианы требует определения местоположения k центров кластеров, минимизирующих сумму расстояний L 2 от каждой точки выборки до ее ближайшего центра.

Частный случай проблемы для трех точек на плоскости (т. е. m = 3 и n = 2 в определении ниже) иногда также называют проблемой Ферма ; она возникает при построении минимальных деревьев Штейнера и первоначально была поставлена ​​как проблема Пьером де Ферма и решена Евангелистой Торричелли . [6] Его решение теперь известно как точка Ферма треугольника, образованного тремя точками выборки. [7] Геометрическую медиану, в свою очередь, можно обобщить на проблему минимизации суммы взвешенных расстояний, известную как проблема Вебера после Альфредом Вебером в его книге 1909 года о расположении объектов. обсуждения этой проблемы [1] Вместо этого некоторые источники называют проблему Вебера проблемой Ферма – Вебера . [8] но другие используют это название для невзвешенной геометрической медианной задачи. [9]

Весоловский (1993) представляет обзор проблемы геометрической медианы. См. Fekete, Mitchell & Beurer (2005) для обобщения проблемы на недискретные множества точек.

Определение

[ редактировать ]

Формально для заданного набора из m точек с каждым , геометрическая медиана определяется как сумма L 2 минимизаторов расстояний

Здесь arg min означает значение аргумента что минимизирует сумму. В данном случае это точка в n -мерном евклидовом пространстве, откуда сумма всех евклидовых расстояний до это минимум.

Характеристики

[ редактировать ]
  • Для одномерного случая геометрическая медиана совпадает с медианой . Это связано с тем, что одномерная медиана также минимизирует сумму расстояний от точек. (Точнее, если точки p 1 , ..., p n в таком порядке, геометрическая медиана является средней точкой если n нечетно, но не определено однозначно, если n четно, когда это может быть любая точка на отрезке между двумя средними точками и .) [10] [11]
  • Геометрическая медиана уникальна , если точки не лежат на одной прямой . [12]
  • Геометрическая медиана эквивариантна для евклидовых преобразований подобия , включая перемещение и вращение . [13] [10] Это означает, что можно получить один и тот же результат, либо преобразовав геометрическую медиану, либо применив то же преобразование к выборочным данным и найдя геометрическую медиану преобразованных данных. Это свойство следует из того, что геометрическая медиана определяется только по попарным расстояниям и не зависит от системы ортогональных декартовых координат , в которой представлены выборочные данные. Напротив, покомпонентная медиана для многомерного набора данных, как правило, не является инвариантом вращения и не зависит от выбора координат. [13]
  • Геометрическая медиана имеет точку пробоя 0,5. [13] То есть до половины выборочных данных могут быть произвольно повреждены, а медиана выборок по-прежнему будет обеспечивать надежную оценку местоположения неповрежденных данных.

Особые случаи

[ редактировать ]
  • Для 3 (неколлинеарных ) точек, если какой-либо угол треугольника, образованного этими точками, равен 120 ° или более, то геометрической медианой является точка в вершине этого угла. Если все углы меньше 120 °, геометрическая медиана — это точка внутри треугольника, которая образует угол 120 ° с каждыми тремя парами вершин треугольника. [10] Это также известно как точка Ферма треугольника, образованного тремя вершинами. (Если три точки лежат на одной прямой, то геометрическая медиана — это точка между двумя другими точками, как в случае с одномерной медианой.)
  • Для четырех компланарных точек, если одна из четырех точек находится внутри треугольника, образованного тремя другими точками, то этой точкой является геометрическая медиана. В противном случае четыре точки образуют выпуклый четырехугольник , а геометрическая медиана является точкой пересечения диагоналей четырехугольника. Геометрическая медиана четырех копланарных точек такая же, как уникальная точка Радона из четырех точек. [14]

Вычисление

[ редактировать ]

Несмотря на то, что геометрическая медиана является простой для понимания концепцией, ее вычисление представляет собой сложную задачу. Центроид до каждой точки, может быть найден по простой формуле или центр масс , определяемый аналогично геометрической медиане как минимизация суммы квадратов расстояний — его координаты представляют собой средние значения координат точек — но он имеет Было показано, что ни явная формула , ни точный алгоритм, включающий только арифметические операции и корни k для геометрической медианы вообще не может существовать возможны только численные или символические приближения к решению этой проблемы -й степени. Следовательно, в рамках этой модели вычислений . [15]

Однако вычислить приближение к геометрической медиане несложно, используя итерационную процедуру, в которой каждый шаг дает более точное приближение. Процедуры этого типа можно вывести из того факта, что сумма расстояний до точек выборки является выпуклой функцией , поскольку расстояние до каждой точки выборки является выпуклым, а сумма выпуклых функций остается выпуклой. Следовательно, процедуры, уменьшающие сумму расстояний на каждом шаге, не могут попасть в ловушку локального оптимума .

Один из распространенных подходов этого типа, названный алгоритмом Вайсфельда в честь работы Эндре Вайсфельда , [16] представляет собой форму итеративно перевзвешенного метода наименьших квадратов . Этот алгоритм определяет набор весов, которые обратно пропорциональны расстояниям от текущей оценки до точек выборки, и создает новую оценку, которая представляет собой средневзвешенное значение выборки в соответствии с этими весами. То есть,

Этот метод сходится почти для всех начальных положений, но может не сходиться, когда одна из его оценок попадает в одну из заданных точек. Для обработки этих случаев его можно модифицировать, чтобы он сходился во всех начальных точках. [12]

Бозе, Махешвари и Морин (2003) описывают более сложные процедуры геометрической оптимизации для поиска приблизительно оптимальных решений этой проблемы. Коэн и др. (2016) показывают, как вычислить геометрическую медиану с произвольной точностью практически за линейное время .Отметим также, что задачу можно сформулировать как программу конуса второго порядка

которая может быть решена за полиномиальное время с использованием обычных решателей оптимизации .

Характеристика геометрической медианы

[ редактировать ]

Если y отличается от всех заданных точек , xi то y является геометрической медианой тогда и только тогда, когда она удовлетворяет:

Это эквивалентно:

который тесно связан с алгоритмом Вейцфельда.

В общем, y является геометрической медианой тогда и только тогда, когда существуют векторы u i такие, что:

где для x i y ,

и для x i = y ,

Эквивалентная формулировка этого условия:

Его можно рассматривать как обобщение свойства медианы в том смысле, что любое разделение точек, в частности, индуцированное любой гиперплоскостью, проходящей через y , имеет одинаковую и противоположную сумму положительных направлений от y с каждой стороны. В одномерном случае гиперплоскостью является сама точка y , а сумма направлений упрощается до (направленной) считающей меры.

Обобщения

[ редактировать ]

Геометрическую медиану можно обобщить с евклидовых пространств на общие римановы многообразия (и даже на метрические пространства ), используя ту же идею, которая используется для определения среднего значения Фреше на римановом многообразии. [17] [18] Позволять — риманово многообразие с соответствующей функцией расстояния , позволять быть суммы весов равны 1, и пусть быть наблюдения от . Затем мы определяем взвешенную геометрическую медиану (или взвешенная медиана Фреше) точек данных как

.

Если все веса равны, мы просто говорим, что является геометрической медианой.

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ Jump up to: а б с Дрезнер и др. (2002)
  2. ^ Цеслик (2006) .
  3. ^ Лавера и Томпсон (1993) .
  4. ^ Додж и Руссон (1999) .
  5. ^ Эйсельт и Марианов (2011) .
  6. ^ Краруп и Вайда (1997) .
  7. ^ Испания (1996) .
  8. ^ Бримберг (1995) .
  9. ^ Бозе, Махешвари и Морин (2003) .
  10. ^ Jump up to: а б с Холдейн (1948)
  11. ^ Утверждение 18.10, Геометрические методы и задачи оптимизации , В. Болтянски, Х. Мартини, В. Солтан, Springer, 1999.
  12. ^ Jump up to: а б Варди и Чжан (2000)
  13. ^ Jump up to: а б с Лопухаа и Руссеу (1991)
  14. ^ Цеслик (2006) , с. 6; Пластрия (2006) . Выпуклый случай был первоначально доказан Джованни Фаньяно .
  15. ^ Баджадж (1986) ; Баджадж (1988) . Ранее Кокейн и Мельзак (1969) доказали, что точку Штейнера для 5 точек на плоскости невозможно построить с помощью линейки и циркуля.
  16. ^ Вайсфельд (1937) ; Кун (1973) ; Чандрасекаран и Тамир (1989) .
  17. ^ Флетчер, П. Томас; Венкатасубраманиан, Суреш; Джоши, Саранг (23 июня 2008 г.). «Надежная статистика римановых многообразий через геометрическую медиану» . Конференция IEEE 2008 г. по компьютерному зрению и распознаванию образов . Конференция IEEE по компьютерному зрению и распознаванию образов. Анкоридж, штат Алабама, США: IEEE.
  18. ^ Флетчер, Венкатасубраманиан и Джоши (2009) .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: b7cc6ced533844bdeaad8902d8074fa3__1716730080
URL1:https://arc.ask3.ru/arc/aa/b7/a3/b7cc6ced533844bdeaad8902d8074fa3.html
Заголовок, (Title) документа по адресу, URL1:
Geometric median - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)