Полная пространственная случайность
![]() | Эта статья требует внимания эксперта по статистике . смотрите на странице обсуждения Подробности ( июнь 2009 г. ) |
Полная пространственная случайность ( CSR ) описывает точечный процесс , при котором точечные события происходят в пределах заданной области исследования совершенно случайным образом. Это синоним однородного пространственного процесса Пуассона . [1] Такой процесс моделируется с использованием всего одного параметра , т.е. плотность точек внутри определенной области. Термин «полная пространственная случайность» обычно используется в прикладной статистике в контексте изучения определенных шаблонов точек, тогда как в большинстве других статистических контекстов он относится к концепции пространственного процесса Пуассона. [1]
Модель
[ редактировать ]Данные в виде набора точек, неравномерно распределенных внутри области пространства, возникают в самых разных контекстах; примеры включают расположение деревьев в лесу, гнезд птиц, ядер в тканях, больных людей в группе риска. Мы называем любой такой набор данных шаблоном пространственных точек и называем местоположения событиями, чтобы отличать их от произвольных точек рассматриваемого региона. Гипотеза полной пространственной случайности для пространственной структуры точек утверждает, что количество событий в любом регионе соответствует распределению Пуассона с заданным средним количеством на одно однородное подразделение. События паттерна независимо и равномерно распределены в пространстве; другими словами, события с равной вероятностью могут произойти где угодно и не взаимодействуют друг с другом.
«Равномерный» используется в смысле следования равномерному распределению вероятностей по исследуемому региону, а не в смысле «равномерного» распределения по изучаемому региону. [2] Между событиями нет взаимодействия, и интенсивность событий не меняется в зависимости от плоскости. Например, предположение о независимости будет нарушено, если существование одного события либо будет способствовать, либо препятствовать возникновению других событий в окрестностях.
Распределение
[ редактировать ]Вероятность найти именно точки внутри области с плотностью событий поэтому:
Первый момент которого, среднее количество точек в районе, просто . Это значение интуитивно понятно, поскольку оно является параметром скорости Пуассона.
Вероятность обнаружения сосед любой данной точки на некотором радиальном расстоянии является:
где количество измерений, - параметр, зависящий от плотности, определяемый формулой и - это гамма-функция , которая, когда ее аргумент является целым числом, является просто функцией факториала , т.е. для интеграла .
Ожидаемая стоимость может быть получена с помощью гамма-функции с использованием статистических моментов. Первый момент — это среднее расстояние между случайно распределенными частицами в размеры.
Приложения
[ редактировать ]Исследование CSR необходимо для сравнения точечных данных измерений из экспериментальных источников. Как метод статистического тестирования тест на CSR имеет множество применений в социальных науках и астрономических исследованиях. [3] КСО часто является стандартом, по которому проверяются наборы данных. В общих чертах один из подходов к проверке гипотезы КСО выглядит следующим образом: [4]
- Используйте статистику , которая является функцией расстояния от каждого события до следующего ближайшего события.
- Сначала сосредоточьтесь на конкретном событии и сформулируйте метод проверки того, насколько близко (или далеко) это событие и следующее ближайшее событие.
- Затем рассмотрим все события и сформулируем метод проверки того, является ли среднее расстояние от каждого события до следующего ближайшего события значительно коротким (или длинным).
В тех случаях, когда аналитическое вычисление статистики испытаний затруднено, используются численные методы, такие как моделирование методом Монте-Карло , путем многократного моделирования стохастического процесса. [4]
Ссылки
[ редактировать ]- ^ Jump up to: а б О. Маймон, Л. Рокач, Справочник по интеллектуальному анализу данных и обнаружению знаний , второе издание, Springer 2010, страницы 851–852.
- ^ Л.А. Уоллер, К.А. Готвей , Прикладная пространственная статистика для данных общественного здравоохранения , том 1, Wiley Chichester, 2004, страницы 119–121,123–127, 137, 139–141, 146–148,150–151, 157, 203.
- ^ «Статистика Венеры: кратеры и катастрофы» .
- ^ Jump up to: а б А. Окабе, К. Сугихара, «Пространственный сетевой анализ – статистические и вычислительные методы», том 1, Wiley Chichester, 2012 г., страницы 135–136.
Дальнейшее чтение
[ редактировать ]- Диггл, Пи Джей (2003). Статистический анализ пространственных точечных рисунков (2-е изд.). Нью-Йорк: Академическая пресса. ISBN 0340740701 .