Выравнивание случайных точек
Изучение расположения случайных точек на плоскости направлено на обнаружение подмножеств точек, которые занимают приблизительно прямую линию внутри большего набора точек, случайно расположенных в плоской области.Исследования показали, что такие совпадения происходят случайно и с большей частотой, чем можно было интуитивно ожидать.
Это было выдвинуто как демонстрация того, что лей-линии и другие подобные загадочные выравнивания, которые некоторые считают явлениями глубокого значения, могут существовать исключительно благодаря случайности, в отличие от сверхъестественных или антропологических объяснений, выдвинутых их сторонниками. Эта тема также изучалась в области компьютерного зрения и астрономии .
В ряде исследований изучалась математика выравнивания случайных точек на плоскости. [1] [2] [3] [4] Во всех них важна ширина линии — допустимое смещение положений точек от идеально прямой линии. Это учитывает тот факт, что реальные объекты не являются математическими точками, и что их положения не обязательно должны точно совпадать, чтобы их можно было считать выровненными. Альфред Уоткинс в своей классической работе о силовых линиях «Старый прямой путь » использовал ширину карандашной линии на карте в качестве порога допуска того, что можно рассматривать как выравнивание. Например, если использовать карандашную линию толщиной 1 мм для рисования трасс на масштаба 1:50 000 карте артиллерийской службы , соответствующая ширина на местности составит 50 м. [5]
Оценка вероятности случайных совпадений
[ редактировать ]Вопреки интуиции, поиск совпадений между случайно расположенными точками на ландшафте становится все проще по мере увеличения рассматриваемой географической области. Один из способов понять это явление — увидеть, что увеличение числа возможных комбинаций наборов точек в этой области перевешивает уменьшение вероятности того, что любой данный набор точек в этой области выстроится в линию.
Одним из определений, выражающих общепринятое значение слова «выравнивание», является:
Набор точек, выбранных из заданного набора ориентиров, все из которых лежат в пределах хотя бы одного прямого пути заданной ширины.
Точнее, путь шириной w можно определить как совокупность всех точек на расстоянии w/2 от прямой линии на плоскости, большого круга на сфере или вообще любой геодезической на любом другом виде. многообразие . Обратите внимание, что, как правило, любой набор точек, выровненных таким образом, будет содержать большое количество бесконечно различных прямых путей. Следовательно, для определения того, является ли набор точек трассой, необходимо только наличие хотя бы одного прямого пути. По этой причине легче считать наборы точек, а не сами пути. Количество найденных выравниваний очень чувствительно к разрешенной ширине w , увеличиваясь примерно пропорционально w. к -2 , где k — количество точек в трассе.
Ниже приводится очень приблизительная оценка вероятности совпадения по порядку величины, предполагающая, что плоскость покрыта равномерно распределенными «значимыми» точками.
Рассмотрим набор из n точек в компактной области с приблизительным диаметром L и площадью примерно L. 2 . Допустимой линией считается линия, каждая точка которой находится на расстоянии w /2 от линии (т. е. лежит на дорожке шириной w , где w ≪ L ).
Рассмотрим все неупорядоченные множества из k точек из n точек, из которых:
( обозначения см. в факториале и биномиальном коэффициенте ).
Чтобы грубо оценить вероятность того, что любое заданное подмножество из k точек приблизительно коллинеарно , как описано выше, рассмотрим линию между «самой левой» и «самой правой» двумя точками в этом подмножестве (для некоторой произвольной левой/правой оси: верх и низ могут быть выбраны для исключительно вертикального случая). Через эти две точки тривиально можно провести прямую линию. Для каждой из оставшихся k -2 точек в подмножестве вероятность того, что точка находится «достаточно близко» к линии, равна примерно w / L , что можно увидеть, рассмотрев соотношение площадей зоны допуска линии (примерно wL ) и общую площадь (примерно L 2 ).
Итак, основываясь на приведенных выше приблизительных оценках, ожидаемое количество выравниваний по k-точкам в общем наборе можно примерно оценить как примерно равное
Среди прочего, это можно использовать, чтобы показать, что, вопреки интуиции, количество линий из k -точек, ожидаемых по случайности в плоскости, покрытой точками с заданной плотностью, для заданной ширины линии, увеличивается гораздо более чем линейно с увеличением размер рассматриваемой области, поскольку комбинаторный взрыв роста числа возможных комбинаций точек более чем компенсирует увеличение сложности построения любой данной комбинации.
Более точная оценка ожидаемого количества выравниваний.
[ редактировать ]Используя аналогичный, но более тщательный анализ, более точное выражение для количества трехточечных выравниваний максимальной ширины w и максимальной длины d, ожидаемых случайно среди n точек, случайно расположенных на квадрате со стороной L, можно найти как [2]
Если d ≈ L и k = 3, можно видеть, что это дает тот же прогноз, что и приведенная выше грубая оценка, с точностью до постоянного множителя.
Если включены краевые эффекты (потеря выравнивания за границами квадрата), то выражение принимает вид
Обобщение выравнивания по k -точкам (без учета краевых эффектов) [3]
которое имеет примерно такие же асимптотические масштабирующие свойства, что и грубое приближение из предыдущего раздела, по той же причине; этот комбинаторный взрыв для больших n подавляет эффекты других переменных.
Компьютерное моделирование центровки
[ редактировать ]Компьютерное моделирование показывает, что точки на плоскости имеют тенденцию образовывать линии, подобные тем, которые обнаруживают охотники за лей, в количествах, соответствующих приведенным выше оценкам порядка величины, что позволяет предположить, что лей-линии также могут генерироваться случайно. Это явление происходит независимо от того, генерируются ли точки псевдослучайным образом компьютером или на основе наборов данных обыденных объектов, таких как или пиццерии телефонные будки .
На карте шириной в десятки километров легко найти трассы от 4 до 8 точек даже в относительно небольших наборах объектов с w = 50 м. Выбор больших площадей, более плотных наборов объектов или больших значений w позволяет легко найти выравнивания из 20 и более точек.
См. также
[ редактировать ]- Апофения
- Кластерная иллюзия
- Совпадение
- Полная пространственная случайность
- Общее положение
- Распознавание образов
- Прокрустов анализ
- Теория Рамсея для понятия «неизбежных совпадений».
- Статистический анализ формы
Ссылки
[ редактировать ]- ^ Кендалл, Дэвид Г.; Кендалл, Уилфрид С. (1980). «Трассы в двумерных случайных наборах точек» . Достижения в области прикладной теории вероятности . 12 (2): 380–424. дои : 10.2307/1426603 . ISSN 0001-8678 .
- ^ Jump up to: а б Эдмундс, МГ; Джордж, GH (апрель 1981 г.). «Случайное расположение квазаров» . Природа . 290 (5806): 481–483. дои : 10.1038/290481a0 . ISSN 1476-4687 .
- ^ Jump up to: а б Джордж, GH (3 августа 2003 г.). «Докторская диссертация Глина Джорджа: Выравнивание и кластеризация квазаров» . Проверено 17 февраля 2017 г.
- ^ Лезама, Хосе; Джой, Рафаэль Громпоне фон; Морель, Жан-Мишель; Рэндалл, Грегори (6 марта 2014 г.), A Contrario 2D Point Alignment Detection , получено 29 сентября 2023 г.
- ^ Уоткинс, Альфред (1988). Старая прямая тропа: ее курганы, маяки, рвы, места и отметки-камни . Счеты. ISBN 9780349137070 .