ГеоДа
GeoDa — бесплатный пакет программного обеспечения, который проводит пространственный анализ данных , геовизуализацию , пространственную автокорреляцию и пространственное моделирование.
Он работает на различных версиях Windows , Mac OS и Linux . Первоначально пакет был разработан Лабораторией пространственного анализа Университета Иллинойса в Урбана-Шампейн под руководством Люка Анселина . С 2016 года разработка продолжается в Центре пространственных данных (CSDS) Чикагского университета . [1]
GeoDa обладает мощными возможностями для выполнения пространственного анализа, многомерного разведочного анализа данных, а также глобальной и локальной пространственной автокорреляции . Он также выполняет базовую линейную регрессию . Что касается пространственных моделей, как модель пространственного лага , так и модель пространственной ошибки , обе оцениваемые по максимальному правдоподобию включены .
OpenGeoDa выпускается под лицензией GNU GPL версии 3.0. [2]
История
[ редактировать ]GeoDa заменил то, что ранее называлось DynESDA, модуль, который работал под старой версией ArcView 3.x для выполнения исследовательского анализа пространственных данных (или ESDA ). Текущие версии GeoDa больше не зависят от наличия ArcView или других пакетов ГИС в системе.
Функциональность
[ редактировать ]Проекты в GeoDa в основном состоят из шейп-файла , определяющего данные решетки, и таблицы атрибутов в формате .dbf. Таблицу атрибутов можно редактировать внутри GeoDa.
Пакет специализируется на исследовательском анализе данных и геовизуализации, где используются методы динамического связывания и очистки . Это означает, что когда у пользователя есть несколько представлений или окон в проекте, выбор объекта в одном из них выделит тот же объект во всех остальных окнах.
GeoDa также способна создавать гистограммы , коробчатые диаграммы и диаграммы рассеяния для проведения простого исследовательского анализа данных. Однако самым важным является возможность картографировать и связывать эти статистические устройства с пространственным распределением явления, которое изучают пользователи.
Динамическое связывание и чистка в GeoDa
[ редактировать ]Динамическое связывание и чистка являются мощными инструментами, поскольку они позволяют пользователям в интерактивном режиме обнаруживать или подтверждать предполагаемые закономерности пространственного расположения данных или иным образом отвергать их существование. Это позволяет пользователям извлекать информацию из данных в пространственном расположении, что в противном случае могло бы потребовать очень тяжелых компьютерных процедур для обработки чисел и получения полезных статистических результатов. Последнее также может стоить пользователям довольно дорого с точки зрения экспертных знаний и возможностей программного обеспечения.
График рассеяния Морана Анселина
[ редактировать ]Анселина Очень интересное устройство, доступное в GeoDa для исследования глобальных закономерностей автокорреляции в космосе, — это диаграмма рассеяния Морана . изображена стандартизованная переменная На этом графике по оси X в зависимости от пространственного лага этой стандартизованной переменной. Пространственное отставание — это не что иное, как совокупность эффектов соседних пространственных единиц. Эта сводка получается с помощью матрицы пространственных весов, которая может принимать различные формы, но очень часто используется матрица смежности . Матрица смежности представляет собой массив, который имеет значение единицы в позиции (i, j) всякий раз, когда пространственная единица j смежна с единицей i. Для удобства эта матрица стандартизирована таким образом, что сумма строк равна единице путем деления каждого значения на сумму строк исходной матрицы.
По сути, диаграмма рассеяния Морана Анселина представляет отношение переменной в местоположении i к значениям этой переменной в соседних местоположениях. По построению наклон линии на диаграмме рассеяния эквивалентен I-коэффициенту Морана. Последнее является хорошо известной статистикой, которая объясняет глобальную пространственную автокорреляцию. Если этот наклон положительный, это означает, что существует положительная пространственная автокорреляция: высокие значения переменной в местоположении i имеют тенденцию группироваться с высокими значениями той же переменной в местоположениях, которые являются соседями i , и наоборот. Если наклон диаграммы рассеяния отрицательный, это означает, что мы имеем своего рода шахматную доску или своего рода пространственную конкуренцию, в которой высокие значения переменной в местоположении i имеют тенденцию совпадать с более низкими значениями в соседних местоположениях.
На диаграмме рассеяния Морана Анселина наклон кривой рассчитывается и отображается в верхней части графика. В данном случае это значение положительное, что означает, что районы с высоким уровнем преступности, как правило, имеют соседей с высоким уровнем преступности, и наоборот.
Глобальный и локальный анализ в GeoDa
[ редактировать ]На глобальном уровне мы можем говорить о кластеризации , т.е. об общей тенденции кластеризации карты; на локальном уровне мы можем говорить о кластерах , т.е. мы можем точно определить местоположение кластеров. Последнее можно оценить с помощью Локальных индикаторов пространственной ассоциации – LISA . Анализ LISA позволяет нам определить, где находятся области с высокими значениями переменной, которые окружены высокими значениями в соседних областях, то есть так называемые кластеры с высокими-высокими значениями. Одновременно с этим в результате этого анализа также идентифицируются кластеры «низкий-низкий».
Другой тип явления, который важно проанализировать в этом контексте, — это существование выбросов, которые представляют высокие значения переменной в данном месте, окруженные низкими значениями в соседних местах. Эта функциональность доступна в GeoDa посредством диаграммы рассеяния Морана Анселина. Однако обратите внимание, что тот факт, что значение является высоким по сравнению со значениями в соседних местах, не обязательно означает, что оно является выбросом, поскольку нам необходимо оценить статистическую значимость этой взаимосвязи. Другими словами, мы можем найти области, где кажется, что существует кластеризация, или где может показаться, что кластеры существуют, но при проведении статистических процедур они оказываются статистически незначимыми кластерами или выбросами. Процедуры, используемые для оценки статистической значимости, состоят из моделирования Монте-Карло различных расположений данных и построения эмпирического распределения смоделированной статистики. После этого первоначально полученное значение сравнивается с распределением смоделированных значений, и если значение превышает 95-часовой процентиль, говорят, что найденное соотношение значимо на уровне 5%.
Ссылки
[ редактировать ]- ^ "О" . Центр пространственных данных Чикагского университета . Архивировано из оригинала 7 июля 2016 года . Проверено 23 сентября 2020 г.
- ^ «Релиз ГеоДа» . Центр GeoDa Чикагского университета . Проверено 23 сентября 2020 г.
Дальнейшее чтение
[ редактировать ]- Анселин, Люк, Сюнь Ли и Юлия Кощинская (2021). GeoDa, От рабочего стола к экосистеме для исследования пространственных данных. Препринт
- Анселин, Люк, Ибну Сябри и Юнгин Хо (2006). GeoDa: Введение в анализ пространственных данных. Географический анализ 38, 5-22
- Анселин, Люк, Рей, Серджио Дж. (2014). Современная пространственная эконометрика на практике: Руководство по GeoDa, GeoDaSpace и PySAL. GeoDa Press LLC, Чикаго, Иллинойс