Jump to content

Распределение по рангу и размеру

Распределение населения стран по рангам и численности следует растянутому экспоненциальному распределению. [1] за исключением случаев двух « королей »: Китая и Индии .

Распределение по рангам – это распределение размеров по рангам в порядке убывания размера. Например, если набор данных состоит из элементов размеров 5, 100, 5 и 8, распределение по размерам будет равно 100, 8, 5, 5 (ранги с 1 по 4). Это также известно как ранг-частотное распределение , когда исходные данные взяты из частотного распределения . Это особенно интересно, когда данные значительно различаются по масштабу, например, по размеру города или частоте слов. Эти распределения часто следуют степенному закону или менее известным, таким как растянутая экспоненциальная функция или параболическое фрактальное распределение , по крайней мере приблизительно для определенных диапазонов рангов; см. ниже.

Распределение по размерам не является распределением вероятностей или кумулятивной функцией распределения . Скорее, это дискретная форма функции квантиля (обратное кумулятивное распределение) в обратном порядке, определяющая размер элемента данного ранга.

Простые распределения рангов и размеров

[ редактировать ]

В случае городского населения результирующее распределение в стране, регионе или мире будет характеризоваться его крупнейшим городом, при этом другие города уменьшаются в размерах соответственно ему, сначала быстрыми темпами, а затем более медленными. В результате появляется несколько крупных городов и гораздо большее количество городов на порядки меньше. Например, в городе 3-го ранга будет проживать одна треть населения крупнейшего города страны, в городе 4-го ранга будет проживать одна четверть населения крупнейшего города и так далее. [2]

Сегментация

[ редактировать ]
График частоты слов в Википедии, показывающий три сегмента с различным поведением.

Распределение по размеру ранга (или по частоте рангов) часто разбивается на диапазоны. Часто это делается произвольно или из-за внешних факторов, особенно при сегментации рынка , но также может быть связано с различным поведением при изменении ранга.

Наиболее просто и обычно распределение можно разделить на две части, называемые головой и хвостом . Если распределение разбито на три части, третья (средняя) часть имеет несколько членов, обычно middle , [3] также живот , [4] туловище , [5] и тело . [6] К ним часто добавляются некоторые прилагательные, в первую очередь длинный хвост , а также толстый живот , [4] «коренастый средний» и т. д. В более традиционных терминах их можно назвать «высший уровень» , «средний уровень» и «нижний уровень» .

Относительные размеры и веса этих сегментов (сколько рангов в каждом сегменте и какая доля общей совокупности находится в данном сегменте) качественно характеризуют распределение, аналогично асимметрии или эксцессу распределения вероятностей. А именно: доминируют ли в нем несколько ведущих членов (тяжеловесные, как прибыли в индустрии звукозаписи), или в нем доминируют множество мелких участников (тяжеловесные, как поисковые запросы в Интернете), или они распределяются каким-то другим способом? Практически это определяет стратегию: на чем следует сосредоточить внимание?

Эти различия могут быть сделаны по разным причинам. Например, они могут возникать из-за различных свойств населения, как в случае с принципом 90–9–1 , который утверждает, что в интернет-сообществе 90% участников сообщества только просматривают контент, а 9% участников редактируют контент. , а 1% участников активно создают новый контент. Другой пример: в маркетинге можно прагматично рассматривать главу как всех членов, которым уделяется индивидуальное внимание, например, личные телефонные звонки; в то время как хвост — это все остальное, чему не уделяется индивидуального внимания, например, получение бланков писем ; и линия просто устанавливается в точке, которую позволяют ресурсы, или где имеет смысл остановиться.

Чисто количественно, традиционный способ разделения распределения на голову и хвост состоит в том, чтобы считать голову первой частью p рангов, которые составляют от общей численности населения, как в принципе Парето 80:20 , где верхние 20% (голова) составляют 80% от общей численности населения. Точный порог зависит от распределения — каждое распределение имеет одну такую ​​точку отсечения — а для мощности законы можно вычислить на основе индекса Парето .

Сегменты могут возникать естественным образом из-за реальных изменений в поведении распределения по мере изменения ранга. Наиболее распространенным является эффект короля , когда поведение нескольких верхних элементов не соответствует модели остальных, как показано вверху для населения страны и выше для наиболее распространенных слов в английской Википедии. Для более высоких рангов поведение может измениться в какой-то момент и хорошо моделироваться различными отношениями в разных регионах; в целом кусочной функцией . Например, если два разных степенных закона лучше подходят для разных регионов, можно использовать нарушенный степенной закон для общего соотношения ; Частота слова в английской Википедии (вверху) также демонстрирует это.

Распределение Юла-Саймона , возникающее в результате предпочтительной привязанности (интуитивно, «богатые становятся богаче» и «успех порождает успех») имитирует нарушенный степенной закон и, как было показано, «очень хорошо фиксирует» распределение частоты слов в зависимости от рангов. [7] Он возник в результате попытки объяснить соотношение популяции и ранга у разных видов. Также было показано, что он лучше соответствует населению города и лучше ранжируется. [8]

Правило размера ранга

[ редактировать ]

Правило размера ранга (или закон ) описывает замечательную закономерность во многих явлениях, включая распределение размеров городов, размеров предприятий, размеров частиц (таких как песок), длины рек, частоты использования слов и т. д. и богатство среди людей.

Все это наблюдения реального мира, которые подчиняются степенным законам , таким как закон Ципфа , распределение Юла или распределение Парето . Если составить рейтинг численности населения городов в данной стране или во всем мире и вычислить натуральный логарифм ранга и численности населения города, то полученный график покажет линейную закономерность. Это распределение по рангам. [9]

Известные исключения из простых распределений по размеру ранга

[ редактировать ]

Хотя закон Ципфа во многих случаях работает хорошо, он, как правило, не подходит для крупнейших городов многих стран; один тип отклонения известен как эффект Кинга . Исследование 2002 года показало, что закон Ципфа был отклонен в 53 из 73 стран, что намного больше, чем можно было бы ожидать, исходя из случайности. [10] Исследование также показало, что вариации показателя Парето лучше объясняются политическими переменными, чем переменными экономической географии, такими как показатели экономии за счет масштаба или транспортных расходов. [11] Исследование 2004 года показало, что закон Ципфа не сработал в пяти крупнейших городах шести стран. [12] В более богатых странах распределение оказалось более равномерным, чем прогнозировалось. Например, в Соединенных Штатах , хотя в крупнейшем городе Нью-Йорке население более чем в два раза превышает население Лос-Анджелеса , занимающего второе место , мегаполисы этих двух городов (также двух крупнейших в стране) гораздо ближе по численности населения. . По численности населения Нью-Йорк всего в 1,3 раза превышает Лос-Анджелес. В других странах самый крупный город будет доминировать гораздо больше, чем ожидалось. Например, в Демократической Республике Конго столица Киншаса более чем в восемь раз больше второго по величине города Лубумбаши . При рассмотрении всего распределения городов, включая самые мелкие, правило ранговой величины не выполняется. Вместо этого распределение является логарифмически нормальным . Это следует из Гибрата закона пропорционального роста .

Поскольку исключения так легко найти, функция правила для анализа городов сегодня заключается в сравнении городских систем в разных странах. Правило размера ранга — это общий стандарт, согласно которому устанавливается первенство городов. Такое распределение, как в Соединенных Штатах или Китае, не демонстрирует закономерности первенства, но страны с доминирующим « городом-приматом » явно отклоняются от правила рангового размера в противоположном направлении. Таким образом, это правило помогает классифицировать национальные (или региональные) городские системы в соответствии со степенью доминирования крупнейшего города. Например, страны, в которых есть города-приматы, обычно имеют колониальную историю, которая объясняет такую ​​структуру городов. Если ожидается, что нормальная модель распределения городов будет следовать правилу рангового размера (т. е. если принцип рангового размера коррелирует с теорией центрального места), то это предполагает, что те страны или регионы, распределение которых не соответствует этому правилу, испытали некоторые условия. которые изменили нормальную картину распределения. Например, наличие нескольких регионов в крупных странах, таких как Китай и США, имеет тенденцию благоприятствовать модели, при которой появляется больше крупных городов, чем предсказывает правило. Напротив, небольшие страны, которые были связаны (например, колониально/экономически) с гораздо более крупными территориями, будут демонстрировать распределение, при котором самый крупный город намного больше, чем соответствует правилу, по сравнению с другими городами - теоретически чрезмерный размер города. проистекает из его связи с более крупной системой, а не из естественной иерархии, которую предсказывает теория центрального места внутри этой одной страны или региона.

См. также

[ редактировать ]
  1. ^ «Растянутые экспоненциальные распределения в природе и экономике: «толстые хвосты» с характерными масштабами» , Ж. Лаэррер и Д. Сорнетт
  2. ^ «200 крупнейших городов США по численности населения в 2021 году» . worldpopulationreview.com . Проверено 28 марта 2021 г.
  3. Иллюстрация «длинного хвоста» , Рэнд Фишкин, 24 ноября 2009 г.
  4. ^ Перейти обратно: а б Выкопай этот толстый живот! , Роберт Янг, 4 сентября 2006 г.
  5. ^ Руководство по оптимизации ключевых слов с длинным хвостом — Как получить прибыль от ключевых слов с длинным хвостом , 3 августа 2009 г., Том Демерс
  6. ^ Маленькая голова, среднее тело и длинный хвост… и где же Microsoft? Архивировано 17 ноября 2015 г. в Wayback Machine , 12 марта 2005 г., Отчет Лоуренса Лю изнутри.
  7. ^ Линь, Жуокуан; Ма, Цяньли Д.Ю.; Бянь, Чуньхуа (2014). «Законы масштабирования в человеческой речи, уменьшение появления новых слов и обобщенной модели». arXiv : 1412.4846 [ cs.CL ].
  8. ^ Дэйси, МФ (1 апреля 1979 г.). «Процесс роста законов Ципфа и Юла о размерах городов». Окружающая среда и планирование А. 11 (4): 361–372. дои : 10.1068/a110361 . S2CID   122325866 .
  9. ^ Закон Ципфа, или Распределение рангов и размеров. Архивировано 13 февраля 2007 г. в Wayback Machine Стивен Брэкман, Гарри Гарретсен и Чарльз ван Марревийк.
  10. ^ «Квок Тонг Су (2002)» (PDF) .
  11. ^ Закон Ципфа, или Распределение рангов и размеров. Архивировано 2 марта 2007 г. в Wayback Machine.
  12. ^ Куберес, Дэвид, Взлет и упадок городов, Чикагский университет, 29 сентября 2004 г.,

Дальнейшее чтение

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 9bb46de5b0320a52a409a47a21f47898__1719154860
URL1:https://arc.ask3.ru/arc/aa/9b/98/9bb46de5b0320a52a409a47a21f47898.html
Заголовок, (Title) документа по адресу, URL1:
Rank–size distribution - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)