Проблема с модифицируемой единицей площади
Проблема модифицируемой единицы площади ( MAUP ) является источником статистической систематической ошибки , которая может существенно повлиять на результаты проверки статистических гипотез . MAUP влияет на результаты, когда точечные измерения пространственных явлений объединяются в пространственные подразделения или территориальные единицы (такие как регионы или районы ), как, например, плотность населения или уровень заболеваемости . [1] [2] На полученные сводные значения (например, итоги, доли, доли, плотности) влияют как форма, так и масштаб единицы агрегирования. [3]
Например, данные переписи могут быть объединены в округа, переписные участки, почтовые индексы, полицейские участки или любое другое произвольное пространственное разделение. Таким образом, результаты агрегирования данных зависят от выбора картографом, какую «изменяемую единицу площади» использовать в своем анализе. переписи населения Картографическая карта , рассчитывающая плотность населения с использованием границ штатов, даст радикально иные результаты, чем карта, которая рассчитывает плотность населения на основе границ округов. Кроме того, границы переписных округов также могут со временем меняться. [4] это означает, что MAUP необходимо учитывать при сравнении прошлых данных с текущими данными.
Фон
[ редактировать ]Эту проблему впервые осознали Гельке и Биль в 1934 году. [5] и позже подробно описан в статье (1984) в серии «Концепции и методы в современной географии » (CATMOG) Стэна Опеншоу и в книге Джузеппе Арбиа (1988). В частности, Опеншоу (1984) заметил, что «единицы площади (зональные объекты), используемые во многих географических исследованиях, произвольны, поддаются изменению и зависят от прихотей и фантазий того, кто выполняет или делал агрегирование». [6] Проблема особенно очевидна, когда совокупные данные используются для кластерного анализа в целях пространственной эпидемиологии , пространственной статистики или картографии , в которых легко могут быть сделаны неверные интерпретации, даже не осознавая этого. Многие области науки, особенно гуманитарная география, склонны игнорировать MAUP при выводе выводов из статистики на основе агрегированных данных. [2] MAUP тесно связан с темой экологических ошибок и экологических предубеждений (Arbia, 1988). Работа Стэна Опеншоу по этой теме привела к тому, что Майкл Ф. Гудчайлд предложил назвать это «эффектом Опеншоу». [7]
Экологическая погрешность, вызванная MAUP, была задокументирована как два отдельных эффекта, которые обычно возникают одновременно во время анализа агрегированных данных. Во-первых, эффект масштаба вызывает различия в статистических результатах между разными уровнями агрегации (радиальное расстояние). Таким образом, связь между переменными зависит от размера единиц площади, по которым сообщаются данные. Как правило, корреляция увеличивается по мере увеличения размера единицы площади. Эффект зонирования описывает изменение статистики корреляции, вызванное перегруппировкой данных в разные конфигурации одного и того же масштаба (формы площади). [8]
С 1930-х годов исследования обнаружили дополнительные различия в статистических результатах из-за MAUP. Стандартные методы расчета внутригрупповой и межгрупповой дисперсии не учитывают дополнительную дисперсию, наблюдаемую в исследованиях MAUP при изменении группировок. MAUP можно использовать в качестве методологии для расчета верхних и нижних пределов, а также средних параметров регрессии для нескольких наборов пространственных группировок. MAUP является важнейшим источником ошибок в пространственных исследованиях, будь то наблюдательных или экспериментальных. Таким образом, согласованность единиц измерения, особенно в контексте поперечного сечения временных рядов (TSCS), имеет важное значение. Кроме того, следует регулярно проводить проверки устойчивости единиц чувствительности к альтернативным пространственным агрегациям, чтобы смягчить связанные с этим систематические ошибки в результирующих статистических оценках.
Предлагаемые решения
[ редактировать ]В литературе было сделано несколько предложений по уменьшению систематической ошибки агрегирования во время регрессионного анализа . Исследователь может скорректировать дисперсионно-ковариационную матрицу, используя выборки из данных индивидуального уровня. [9] В качестве альтернативы можно сосредоточиться на локальной пространственной регрессии, а не на глобальной регрессии. Исследователь может также попытаться спроектировать территориальные единицы, чтобы максимизировать конкретный статистический результат. [6] Другие утверждали, что может быть сложно построить единый набор оптимальных единиц агрегирования для нескольких переменных, каждая из которых может демонстрировать нестационарность и пространственную автокорреляцию в пространстве по-разному. Другие предложили разработать статистику, которая изменяется в разных масштабах предсказуемым образом, возможно, используя фрактальную размерность как независимую от масштаба меру пространственных отношений. Другие предложили байесовские иерархические модели в качестве общей методологии объединения агрегированных данных и данных индивидуального уровня для экологических выводов.
Исследования MAUP, основанные на эмпирических данных, могут дать лишь ограниченное понимание из-за неспособности контролировать отношения между несколькими пространственными переменными. Моделирование данных необходимо для контроля над различными свойствами данных индивидуального уровня. Исследования с помощью моделирования показали, что пространственная поддержка переменных может повлиять на величину экологической предвзятости, вызванной агрегированием пространственных данных. [10]
Анализ чувствительности МАУП
[ редактировать ]Используя моделирование одномерных данных, Ларсен выступал за использование коэффициента дисперсии для исследования влияния пространственной конфигурации, пространственной ассоциации и агрегации данных. [11] Подробное описание изменения статистики из-за MAUP представлено Рейнольдсом, который демонстрирует важность пространственного расположения и пространственной автокорреляции значений данных. [12] Симуляционные эксперименты Рейнольдса были расширены Свифтом, в котором серия из девяти упражнений началась с моделирования регрессионного анализа и пространственной тенденции, а затем сосредоточилась на теме MAUP в контексте пространственной эпидемиологии. Представлен метод анализа чувствительности МАУП, который показывает, что МАУП не является полностью проблемой. [10] MAUP можно использовать в качестве аналитического инструмента, помогающего понять пространственную неоднородность и пространственную автокорреляцию .
Эта тема имеет особое значение, поскольку в некоторых случаях агрегирование данных может скрыть сильную корреляцию между переменными, в результате чего связь будет выглядеть слабой или даже отрицательной. И наоборот, MAUP может привести к появлению случайных величин так, как будто существует значительная связь там, где ее нет. Параметры многомерной регрессии более чувствительны к MAUP, чем коэффициенты корреляции. До тех пор, пока не будет найдено более аналитическое решение MAUP, в качестве методологии оценки неопределенности коэффициентов корреляции и регрессии из-за экологической предвзятости рекомендуется анализ пространственной чувствительности с использованием различных единиц площади. Доступен пример моделирования и повторной агрегации данных с использованием библиотеки ArcPy. [13] [14]
При транспортном планировании MAUP связан с зонированием анализа дорожного движения (TAZ). Основной отправной точкой в понимании проблем транспортного анализа является признание того, что пространственный анализ имеет некоторые ограничения, связанные с дискретизацией пространства. Среди них изменяемые территориальные единицы и проблемы границ прямо или косвенно связаны с планированием и анализом перевозок посредством проектирования зон анализа дорожного движения – большинство транспортных исследований требуют прямо или косвенно определения ТАЗ. Изменяемым границам и вопросам масштаба следует уделять особое внимание во время спецификации TAZ из-за влияния, которое эти факторы оказывают на статистические и математические свойства пространственных структур (т. е. проблема изменяемых единиц площади – MAUP). В исследованиях Вьегаса, Мартинеса и Сильвы (2009, 2009b) [14] авторы предлагают метод, в котором результаты, полученные при изучении пространственных данных, не являются независимыми от масштаба, а эффекты агрегирования заложены в выборе зональных границ. Разграничение зональных границ ТАЗ оказывает непосредственное влияние на реальность и точность результатов, получаемых с помощью моделей прогнозирования перевозок. В этой статье влияние MAUP на определение TAZ и модели спроса на транспортировку измеряется и анализируется с использованием различных сеток (по размеру и по местоположению происхождения). Этот анализ был разработан путем создания приложения, интегрированного в коммерческое программное обеспечение ГИС, и использования тематического исследования (пригород Лиссабона) для проверки его реализуемости и производительности. Результаты выявляют конфликт между статистической и географической точностью и их связь с потерей информации на этапе назначения трафика в моделях транспортного планирования. [14]
См. также
[ редактировать ]- Закон географии Арбиа
- Граничная задача (в пространственном анализе)
- Изменяемая проблема временных единиц
- Проблема усреднения эффекта соседства
- Теория представлений
- Пространственный анализ
- Проблема неопределенного географического контекста
- Проблема эталонного класса
- Приложения
- Джерримандеринг
- Красные штаты и синие штаты
- Пространственная эконометрика
- Пространственная эпидемиология
Ссылки
[ редактировать ]- ^ Опеншоу, Стэн (1983). Проблема изменяемой единицы площади (PDF) . ISBN 0-86094-134-5 .
- ^ Перейти обратно: а б Чен, Сян; Да, Синьюэ; Уайденер, Майкл Дж.; Делмелль, Эрик; Кван, Мэй-По; Шеннон, Джерри; Расин, Расин Ф.; Адамс, Аарон; Лян, Лу; Пэн, Цзя (27 декабря 2022 г.). «Систематический обзор проблемы модифицируемых единиц площади (MAUP) в общественных исследованиях окружающей среды в области продуктов питания» . Городская информатика . 1 . дои : 10.1007/s44212-022-00021-1 . S2CID 255206315 .
- ^ «MAUP | Определение – ГИС-словарь поддержки Esri» . support.esri.com . Проверено 9 марта 2017 г.
- ^ География, Бюро переписи населения США. «Примечания об изменении географических границ» . www.census.gov . Проверено 24 февраля 2017 г.
- ^ Гельке и Биль 1934 г.
- ^ Перейти обратно: а б Опеншоу 1984 , с. 3
- ^ Гудчайлд, Майкл Ф. (2022). «Эффект Опеншоу» . Международный журнал географической информатики . 36 : 1697–1698. дои : 10.1080/13658816.2022.2102637 . Проверено 24 января 2024 г.
- ^ Фотерингем, AS; Роджерсон, Пенсильвания (2008). «Проблема изменяемой единицы площади (MAUP)». Справочник SAGE по пространственному анализу . Мудрец. стр. 105–124. ISBN 978-1-4129-1082-8 .
- ^ Холт Д., Стил Д., Транмер М., Ригли Н. (1996). «Агрегация и экологические эффекты в географических данных». «Географический анализ» 28:244{261
- ^ Перейти обратно: а б Свифт А., Лю Л. и Убер Дж. (2008) «Уменьшение систематической ошибки MAUP в статистике корреляции между качеством воды и заболеваниями желудочно-кишечного тракта». Компьютеры, окружающая среда и городские системы 32, 134–148.
- ^ Ларсен, Дж. (2000). «Проблема изменяемой единицы площади: проблема или источник пространственной информации?» Докторская диссертация, Университет штата Огайо.
- ^ Рейнольдс, Х. (1998). «Проблема единицы изменяемой площади: эмпирический анализ посредством статистического моделирования». Кандидатская диссертация, факультет географии Университета Торонто, http://www.badpets.net/Thesis
- ^ Свифт, А. (2017). «Моделирование данных картирования преступности», https://app.box.com/s/a84w16x7hffljjvkhtlr72eisj4qiene.
- ^ Перейти обратно: а б с Вьегас, Хосе Мануэль; Мартинес, Л. Мигель; Сильва, Элизабете А. (январь 2009 г.). «Влияние проблемы изменяемой единицы площади на разграничение зон анализа дорожного движения». Окружающая среда и планирование B: Планирование и дизайн . 36 (4): 625–643. дои : 10.1068/b34033 . S2CID 54840846 .
Источники
[ редактировать ]- Арбия, Джузеппе (1988). Конфигурация пространственных данных в статистическом анализе региональных экономических и связанных с ними проблем . Дордрехт: Kluwer Academic Publishers.
- Эта статья содержит цитаты из проблемы с изменяемыми единицами площади на GIS Wiki, которая доступна по лицензии Creative Commons Attribution 3.0 Unported (CC BY 3.0) .
- Гельке, CE; Биль, Кэтрин (март 1934 г.). «Определенные эффекты группировки на размер коэффициента корреляции в материале переписного участка». Журнал Американской статистической ассоциации . 29 (185А): 169–170. дои : 10.2307/2277827 . JSTOR 2277827 .
- Опеншоу, Стэн (1984). Задача о модифицируемой единице площади . Норвик: Географические книги. ISBN 0860941345 . OCLC 12052482 .
- Анвин, диджей (1996). «ГИС, пространственный анализ и пространственная статистика». Прогресс в человеческой географии. 20 : 540–551.
- Кресси, Н. (1996). «Изменение поддержки и проблема изменяемой единицы площади». «Географические системы», 3:159–180.
- Виегас Дж., Э.А. Сильва, Л. Мартинес (2009a). «Влияние проблемы изменяемой единицы площади на разграничение зон анализа дорожного движения», «Окружающая среда и планирование B - Планирование и проектирование», 36 (4): 625–643.
- Виегас Дж., Э.А. Сильва, Л. Мартинес (2009a). «Определение зоны анализа дорожного движения: новая методология и алгоритм» «Транспорт». 36 (5): 6 дюймов, 36 (5): 6 .
Дальнейшее чтение
[ редактировать ]- Кресси, Ноэль А. (1996). «Смена опоры и проблема модифицируемых единиц площади». Географические системы . 3 (2–3): 159–180.
- Холт, Дэвид; Сталь, Дэвид; Транмер, Марк; Ригли, Нил (июль 1996 г.). «Агрегация и экологические эффекты в географических данных» . Географический анализ . 28 (3): 244–261. дои : 10.1111/j.1538-4632.1996.tb00933.x .
- Хорнер, Марк В.; Мюррей, Алан Т. (январь 2002 г.). «Чрезмерное количество поездок на работу и проблема изменяемой единицы площади» (PDF) . Городские исследования . 39 (1): 131–139. дои : 10.1080/00420980220099113 . S2CID 56418131 . Архивировано из оригинала (PDF) 22 апреля 2017 г. Проверено 5 июля 2015 г.
- Кван, Мэй-По (2012). «Проблема неопределенного географического контекста» (PDF) . Анналы Ассоциации американских географов . 102 (5): 958–968. дои : 10.1080/00045608.2012.687349 . S2CID 52024592 .
- Менон, Карло (март 2012 г.). «Светлая сторона МАУП: определение новых мер промышленной агломерации» (PDF) . Статьи по региональной науке . 91 (1): 3–28. дои : 10.1111/j.1435-5957.2011.00350.x .
- Анвин, Дэвид Дж. (декабрь 1996 г.). «ГИС, пространственный анализ и пространственная статистика» . Прогресс в человеческой географии . 20 (4): 540–551. дои : 10.1177/030913259602000408 . S2CID 129487607 .
- Вонг, Дэвид (2009). «Проблема модифицируемой единицы площади (MAUP)» . В Фотерингеме Стюарт; Роджерсон, Питер (ред.). Справочник SAGE по пространственному анализу . Лос-Анджелес: Сейдж. стр. 105–124. ISBN 9781412910828 . OCLC 85898184 .
- Ригли, Нил (1995). «Возврат к проблеме модифицируемых единиц площади и экологической ошибке». В Клиффе, Эндрю Д. (ред.). Распространяющаяся география: эссе Питера Хаггетта . Серия специальных публикаций Института британских географов . Том. 31. Оксфорд; Кембридж, Массачусетс: Блэквелл. стр. 123–181. ISBN 0631195343 . ОСЛК 30895028 .
- Чжан, Мин; Кукадия, Нишант (январь 2005 г.). «Метрики городской формы и проблема модифицируемых единиц площади». Отчет о транспортных исследованиях: Журнал Совета по транспортным исследованиям . 1902 : 71–79. дои : 10.3141/1902-09 .