Индекс несходства
Эта статья нуждается в дополнительных цитатах для проверки . ( июль 2018 г. ) |
Индекс несходства — это демографический показатель равномерности распределения двух групп по составляющим географическим регионам, составляющим большую территорию. Группа распределяется равномерно, когда каждая географическая единица имеет такой же процент членов группы, как и общая численность населения. Показатель индекса также можно интерпретировать как процент одной из двух групп, включенных в расчет, которым придется переехать в разные географические районы, чтобы получить распределение, соответствующее распределению на большей территории. Индекс несходства можно использовать как меру сегрегации . Нулевой балл (0%) отражает полностью интегрированную среду; балл 1 (100%) отражает полную сегрегацию. С точки зрения сегрегации черно-белых, показатель 0,60 означает, что 60 процентам чернокожих придется поменяться местами с белыми в других единицах, чтобы добиться равномерного географического распределения. [1] [2]
Основная формула
[ редактировать ]Основная формула индекса несходства:
где (например, сравнивая черное и белое население):
- a i = численность группы A в i й территория, например, переписной участок
- A = общая численность населения в группе A в большом географическом субъекте, для которого рассчитывается индекс несходства.
- b i = численность группы B в i й область
- B = общая численность населения в группе B в большом географическом субъекте, для которого рассчитывается индекс несходства.
Индекс несходства применим к любой категориальной переменной (как демографической, так и нет) и благодаря своим простым свойствам полезен для ввода в программы многомерного масштабирования и кластеризации. Он широко использовался при изучении социальной мобильности для сравнения распределения профессиональных категорий происхождения (или назначения).
Перспектива линейной алгебры
[ редактировать ]Формулу индекса несходства можно сделать гораздо более компактной и значимой, если рассматривать ее с точки зрения линейной алгебры . Предположим, мы изучаем распределение богатых и бедных людей в городе (например, в Лондоне ). Предположим, в нашем городе есть блоки:
Давайте создадим вектор который показывает количество богатых людей в каждом квартале нашего города:
Аналогично создадим вектор который показывает количество бедных людей в каждом квартале нашего города:
Теперь -норма вектора — это просто сумма (величин) каждого элемента этого вектора. [3] То есть для вектора , у нас есть -норма:
Если мы обозначим как общее количество богатых людей в нашем городе, чем компактный способ подсчета было бы использовать -норма:
Аналогично, если мы обозначим как общее количество бедняков в нашем городе, то:
Когда мы делим вектор по его норме мы получаем то, что называется нормализованным вектором или Единичным вектором. :
Давайте нормализуем богатый вектор и бедный вектор :
Наконец, вернемся к формуле индекса несходства ( ); оно просто равно половине -норма разности векторов и :
(в обозначениях линейной алгебры)
Численный пример
[ редактировать ]Рассмотрим город, состоящий из четырех кварталов по 2 человека в каждом. Один блок состоит из 2-х богатых людей. Один блок состоит из 2 бедняков. Два блока состоят из 1 богатого и 1 бедного человека. Каков индекс непохожести этого города?

Во-первых, давайте найдем богатый вектор и плохой вектор :
Далее посчитаем общее количество богатых и бедных людей в нашем городе:
Далее давайте нормализуем векторы богатых и бедных:
Теперь мы можем вычислить разницу :
Наконец, найдем индекс несходства ( ):
Эквивалентность формул
[ редактировать ]Мы можем доказать, что формула линейной алгебры для идентична основной формуле для . Начнем с формулы линейной алгебры:
Заменим нормализованные векторы и с:
Наконец, из определения -норма, мы знаем, что можем заменить ее суммированием:
Таким образом, мы доказываем, что формула линейной алгебры для показателя несходства эквивалентна основной формуле для него:
Нулевая сегрегация
[ редактировать ]Когда индекс несходства равен нулю, это означает, что в изучаемом нами сообществе отсутствует сегрегация. Например, если мы изучаем сегрегацию богатых и бедных людей в городе, то если , это означает, что:
- В городе нет кварталов, которые были бы «богатыми кварталами», и нет в городе кварталов, которые были бы «бедными кварталами».
- По всему городу равномерно распределены богатые и бедные люди.
Если мы установим в линейно-алгебраической формуле получаем необходимое условие наличия нулевой сегрегации:
Например, предположим, что у вас есть город с двумя кварталами. В каждом блоке по 4 богатых и 100 бедных:
Тогда общее число богатых людей составит , а общее число бедных людей равно . Таким образом:
Потому что , таким образом, в этом городе нет сегрегации.
В качестве другого примера предположим, что у вас есть город с 3 кварталами:
Тогда у нас есть богатые люди в нашем городе, и бедные люди. Таким образом:
Опять же, потому что , таким образом, в этом городе также отсутствует сегрегация.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Бюро переписи населения США. «Схемы жилищного строительства: Приложение B: Меры жилищной сегрегации» . Census.gov . Проверено 28 апреля 2022 г.
- ^ Мэсси, Дуглас С.; Ротвелл, Джонатан; Домина, Терстон (26 октября 2009 г.). «Изменение основ сегрегации в Соединенных Штатах» . Анналы Американской академии политических и социальных наук . 626 (1): 74–90. дои : 10.1177/0002716209343558 . ISSN 0002-7162 . ПМЦ 3844132 . ПМИД 24298193 .
- ^ Wolfram MathWorld: Норма L1