Jump to content

Проблема с модифицируемой единицей площади

(Перенаправлено из подразделения «Ареал» )
Пример искажения MAUP
Пример проблемы модифицируемой единицы площади и искажения расчетов ставок

Проблема модифицируемой единицы площади ( MAUP ) является источником статистической систематической ошибки , которая может существенно повлиять на результаты проверки статистических гипотез . MAUP влияет на результаты, когда точечные измерения пространственных явлений объединяются в пространственные подразделения или территориальные единицы (такие как регионы или районы ), как, например, плотность населения или уровень заболеваемости . [1] [2] На полученные сводные значения (например, итоги, доли, доли, плотности) влияют как форма, так и масштаб единицы агрегирования. [3]

Например, данные переписи могут быть объединены в округа, переписные участки, почтовые индексы, полицейские участки или любое другое произвольное пространственное разделение. Таким образом, результаты агрегирования данных зависят от выбора картографом, какую «изменяемую единицу площади» использовать в своем анализе. переписи населения Картографическая карта , рассчитывающая плотность населения с использованием границ штатов, даст радикально иные результаты, чем карта, которая рассчитывает плотность населения на основе границ округов. Кроме того, границы переписных округов также могут со временем меняться. [4] это означает, что MAUP необходимо учитывать при сравнении прошлых данных с текущими данными.

Эту проблему впервые осознали Гельке и Биль в 1934 году. [5] и позже подробно описан в статье (1984) в серии «Концепции и методы в современной географии » (CATMOG) Стэна Опеншоу и в книге Джузеппе Арбиа (1988). В частности, Опеншоу (1984) заметил, что «единицы площади (зональные объекты), используемые во многих географических исследованиях, произвольны, поддаются изменению и зависят от прихотей и фантазий того, кто выполняет или делал агрегирование». [6] Проблема особенно очевидна, когда совокупные данные используются для кластерного анализа в целях пространственной эпидемиологии , пространственной статистики или картографии , в которых легко могут быть сделаны неверные интерпретации, даже не осознавая этого. Многие области науки, особенно гуманитарная география, склонны игнорировать MAUP при выводе выводов из статистики на основе агрегированных данных. [2] MAUP тесно связан с темой экологических ошибок и экологических предубеждений (Arbia, 1988). Работа Стэна Опеншоу по этой теме привела к тому, что Майкл Ф. Гудчайлд предложил назвать это «эффектом Опеншоу». [7]

Экологическая погрешность, вызванная MAUP, была задокументирована как два отдельных эффекта, которые обычно возникают одновременно во время анализа агрегированных данных. Во-первых, эффект масштаба вызывает различия в статистических результатах между разными уровнями агрегации (радиальное расстояние). Таким образом, связь между переменными зависит от размера единиц площади, по которым сообщаются данные. Как правило, корреляция увеличивается по мере увеличения размера единицы площади. Эффект зонирования описывает изменение статистики корреляции, вызванное перегруппировкой данных в разные конфигурации одного и того же масштаба (формы площади). [8]

С 1930-х годов исследования обнаружили дополнительные различия в статистических результатах из-за MAUP. Стандартные методы расчета внутригрупповой и межгрупповой дисперсии не учитывают дополнительную дисперсию, наблюдаемую в исследованиях MAUP при изменении группировок. MAUP можно использовать в качестве методологии для расчета верхних и нижних пределов, а также средних параметров регрессии для нескольких наборов пространственных группировок. MAUP является важнейшим источником ошибок в пространственных исследованиях, будь то наблюдательных или экспериментальных. Таким образом, согласованность единиц измерения, особенно в контексте поперечного сечения временных рядов (TSCS), имеет важное значение. Кроме того, следует регулярно проводить проверки устойчивости единиц чувствительности к альтернативным пространственным агрегациям, чтобы смягчить связанные с этим систематические ошибки в результирующих статистических оценках.

Ручная карта с различными пространственными узорами. Примечание: p — вероятность q -статистики; * означает статистическую значимость на уровне 0,05, ** для 0,001, *** для уровня менее 10. −3 ;(D) индексы 1, 2, 3 у q и p обозначают страты Z1+Z2 с Z3, Z1 с Z2+Z3, а также Z1 и Z2 и Z3 по отдельности соответственно; (E) индексы 1 и 2 у q и p обозначают страты Z1+Z2 с Z3+Z4 и Z1+Z3 с Z2+Z4 соответственно.

Предлагаемые решения

[ редактировать ]

В литературе было сделано несколько предложений по уменьшению систематической ошибки агрегирования во время регрессионного анализа . Исследователь может скорректировать дисперсионно-ковариационную матрицу, используя выборки из данных индивидуального уровня. [9] В качестве альтернативы можно сосредоточиться на локальной пространственной регрессии, а не на глобальной регрессии. Исследователь может также попытаться спроектировать территориальные единицы, чтобы максимизировать конкретный статистический результат. [6] Другие утверждали, что может быть сложно построить единый набор оптимальных единиц агрегирования для нескольких переменных, каждая из которых может демонстрировать нестационарность и пространственную автокорреляцию в пространстве по-разному. Другие предложили разработать статистику, которая изменяется в разных масштабах предсказуемым образом, возможно, используя фрактальную размерность как независимую от масштаба меру пространственных отношений. Другие предложили байесовские иерархические модели в качестве общей методологии объединения агрегированных данных и данных индивидуального уровня для экологических выводов.

Исследования MAUP, основанные на эмпирических данных, могут дать лишь ограниченное понимание из-за неспособности контролировать отношения между несколькими пространственными переменными. Моделирование данных необходимо для контроля над различными свойствами данных индивидуального уровня. Исследования с помощью моделирования показали, что пространственная поддержка переменных может повлиять на величину экологической предвзятости, вызванной агрегированием пространственных данных. [10]

Анализ чувствительности МАУП

[ редактировать ]

Используя моделирование одномерных данных, Ларсен выступал за использование коэффициента дисперсии для исследования влияния пространственной конфигурации, пространственной ассоциации и агрегации данных. [11] Подробное описание изменения статистики из-за MAUP представлено Рейнольдсом, который демонстрирует важность пространственного расположения и пространственной автокорреляции значений данных. [12] Симуляционные эксперименты Рейнольдса были расширены Свифтом, в котором серия из девяти упражнений началась с моделирования регрессионного анализа и пространственной тенденции, а затем сосредоточилась на теме MAUP в контексте пространственной эпидемиологии. Представлен метод анализа чувствительности МАУП, который показывает, что МАУП не является полностью проблемой. [10] MAUP можно использовать в качестве аналитического инструмента, помогающего понять пространственную неоднородность и пространственную автокорреляцию .

Эта тема имеет особое значение, поскольку в некоторых случаях агрегирование данных может скрыть сильную корреляцию между переменными, в результате чего связь будет выглядеть слабой или даже отрицательной. И наоборот, MAUP может привести к появлению случайных величин так, как будто существует значительная связь там, где ее нет. Параметры многомерной регрессии более чувствительны к MAUP, чем коэффициенты корреляции. До тех пор, пока не будет найдено более аналитическое решение MAUP, в качестве методологии оценки неопределенности коэффициентов корреляции и регрессии из-за экологической предвзятости рекомендуется анализ пространственной чувствительности с использованием различных единиц площади. Доступен пример моделирования и повторной агрегации данных с использованием библиотеки ArcPy. [13] [14]

При транспортном планировании MAUP связан с зонированием анализа дорожного движения (TAZ). Основной отправной точкой в ​​понимании проблем транспортного анализа является признание того, что пространственный анализ имеет некоторые ограничения, связанные с дискретизацией пространства. Среди них изменяемые территориальные единицы и проблемы границ прямо или косвенно связаны с планированием и анализом перевозок посредством проектирования зон анализа дорожного движения – большинство транспортных исследований требуют прямо или косвенно определения ТАЗ. Изменяемым границам и вопросам масштаба следует уделять особое внимание во время спецификации TAZ из-за влияния, которое эти факторы оказывают на статистические и математические свойства пространственных структур (т. е. проблема изменяемых единиц площади – MAUP). В исследованиях Вьегаса, Мартинеса и Сильвы (2009, 2009b) [14] авторы предлагают метод, в котором результаты, полученные при изучении пространственных данных, не являются независимыми от масштаба, а эффекты агрегирования заложены в выборе зональных границ. Разграничение зональных границ ТАЗ оказывает непосредственное влияние на реальность и точность результатов, получаемых с помощью моделей прогнозирования перевозок. В этой статье влияние MAUP на определение TAZ и модели спроса на транспортировку измеряется и анализируется с использованием различных сеток (по размеру и по местоположению происхождения). Этот анализ был разработан путем создания приложения, интегрированного в коммерческое программное обеспечение ГИС, и использования тематического исследования (пригород Лиссабона) для проверки его реализуемости и производительности. Результаты выявляют конфликт между статистической и географической точностью и их связь с потерей информации на этапе назначения трафика в моделях транспортного планирования. [14]

См. также

[ редактировать ]
Приложения
  1. ^ Опеншоу, Стэн (1983). Проблема изменяемой единицы площади (PDF) . ISBN  0-86094-134-5 .
  2. ^ Перейти обратно: а б Чен, Сян; Да, Синьюэ; Уайденер, Майкл Дж.; Делмелль, Эрик; Кван, Мэй-По; Шеннон, Джерри; Расин, Расин Ф.; Адамс, Аарон; Лян, Лу; Пэн, Цзя (27 декабря 2022 г.). «Систематический обзор проблемы модифицируемых единиц площади (MAUP) в общественных исследованиях окружающей среды в области продуктов питания» . Городская информатика . 1 . дои : 10.1007/s44212-022-00021-1 . S2CID   255206315 .
  3. ^ «MAUP | Определение – ГИС-словарь поддержки Esri» . support.esri.com . Проверено 9 марта 2017 г.
  4. ^ География, Бюро переписи населения США. «Примечания об изменении географических границ» . www.census.gov . Проверено 24 февраля 2017 г.
  5. ^ Гельке и Биль 1934 г.
  6. ^ Перейти обратно: а б Опеншоу 1984 , с. 3
  7. ^ Гудчайлд, Майкл Ф. (2022). «Эффект Опеншоу» . Международный журнал географической информатики . 36 : 1697–1698. дои : 10.1080/13658816.2022.2102637 . Проверено 24 января 2024 г.
  8. ^ Фотерингем, AS; Роджерсон, Пенсильвания (2008). «Проблема изменяемой единицы площади (MAUP)». Справочник SAGE по пространственному анализу . Мудрец. стр. 105–124. ISBN  978-1-4129-1082-8 .
  9. ^ Холт Д., Стил Д., Транмер М., Ригли Н. (1996). «Агрегация и экологические эффекты в географических данных». «Географический анализ» 28:244{261
  10. ^ Перейти обратно: а б Свифт А., Лю Л. и Убер Дж. (2008) «Уменьшение систематической ошибки MAUP в статистике корреляции между качеством воды и заболеваниями желудочно-кишечного тракта». Компьютеры, окружающая среда и городские системы 32, 134–148.
  11. ^ Ларсен, Дж. (2000). «Проблема изменяемой единицы площади: проблема или источник пространственной информации?» Докторская диссертация, Университет штата Огайо.
  12. ^ Рейнольдс, Х. (1998). «Проблема единицы изменяемой площади: эмпирический анализ посредством статистического моделирования». Кандидатская диссертация, факультет географии Университета Торонто, http://www.badpets.net/Thesis
  13. ^ Свифт, А. (2017). «Моделирование данных картирования преступности», https://app.box.com/s/a84w16x7hffljjvkhtlr72eisj4qiene.
  14. ^ Перейти обратно: а б с Вьегас, Хосе Мануэль; Мартинес, Л. Мигель; Сильва, Элизабете А. (январь 2009 г.). «Влияние проблемы изменяемой единицы площади на разграничение зон анализа дорожного движения». Окружающая среда и планирование B: Планирование и дизайн . 36 (4): 625–643. дои : 10.1068/b34033 . S2CID   54840846 .

Источники

[ редактировать ]
  • Арбия, Джузеппе (1988). Конфигурация пространственных данных в статистическом анализе региональных экономических и связанных с ними проблем . Дордрехт: Kluwer Academic Publishers.
  • Эта статья содержит цитаты из проблемы с изменяемыми единицами площади на GIS Wiki, которая доступна по лицензии Creative Commons Attribution 3.0 Unported (CC BY 3.0) .
  • Гельке, CE; Биль, Кэтрин (март 1934 г.). «Определенные эффекты группировки на размер коэффициента корреляции в материале переписного участка». Журнал Американской статистической ассоциации . 29 (185А): 169–170. дои : 10.2307/2277827 . JSTOR   2277827 .
  • Опеншоу, Стэн (1984). Задача о модифицируемой единице площади . Норвик: Географические книги. ISBN  0860941345 . OCLC   12052482 .
  • Анвин, диджей (1996). «ГИС, пространственный анализ и пространственная статистика». Прогресс в человеческой географии. 20 : 540–551.
  • Кресси, Н. (1996). «Изменение поддержки и проблема изменяемой единицы площади». «Географические системы», 3:159–180.
  • Виегас Дж., Э.А. Сильва, Л. Мартинес (2009a). «Влияние проблемы изменяемой единицы площади на разграничение зон анализа дорожного движения», «Окружающая среда и планирование B - Планирование и проектирование», 36 (4): 625–643.
  • Виегас Дж., Э.А. Сильва, Л. Мартинес (2009a). «Определение зоны анализа дорожного движения: новая методология и алгоритм» «Транспорт». 36 (5): 6 дюймов, 36 (5): 6 .

Дальнейшее чтение

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 43f84d0897fa3f497bae173b977cf51d__1720049340
URL1:https://arc.ask3.ru/arc/aa/43/1d/43f84d0897fa3f497bae173b977cf51d.html
Заголовок, (Title) документа по адресу, URL1:
Modifiable areal unit problem - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)