Параболическое фрактальное распределение
![]() | Эта статья включает список литературы , связанную литературу или внешние ссылки , но ее источники остаются неясными, поскольку в ней отсутствуют встроенные цитаты . ( январь 2023 г. ) |
В теории вероятности и статистике параболическое фрактальное распределение — это тип дискретного распределения вероятностей , в котором логарифм частоты или размера объектов в популяции представляет собой квадратичный полином от логарифма ранга (самый большой пример имеет ранг 1). Это может заметно улучшить соответствие по сравнению с простым степенным соотношением (см. ссылки ниже).
В приведенной ниже статье Лаэррера/Деёвеля примеры включают размеры галактик (отсортированные по светимости), города (в США, Франции и мире), разговорные языки (по количеству носителей) в мире и нефтяные месторождения в мире (по количеству носителей). размер). Они также упоминают полезность этого распределения для подбора сейсмических событий (примеров нет). Авторы утверждают, что преимущество этого распределения заключается в том, что его можно подобрать с использованием крупнейших известных примеров моделируемой популяции, которые часто легко доступны и полны, а затем найденные подобранные параметры можно использовать для расчета размера всей популяции. Так, например, население ста крупнейших городов планеты можно отсортировать и подогнать, а найденные параметры использовать для экстраполяции на самые маленькие деревни для оценки населения планеты. Другой пример — оценка общих мировых запасов нефти с использованием крупнейших месторождений.
В ряде приложений существует так называемый эффект Кинга , когда элементы с самым высоким рейтингом имеют значительно большую частоту или размер, чем прогнозирует модель на основе других элементов. В статье Лаэррера/Деёвеля показан пример Парижа при сортировке городов Франции по размерам. На момент написания статьи Париж был крупнейшим городом с населением около десяти миллионов человек, но в следующем по величине городе проживало всего около 1,5 миллиона человек. Города во Франции, за исключением Парижа, следуют параболическому распределению, причем достаточно хорошо, чтобы 56 крупнейших городов дали очень хорошую оценку численности населения страны. Но такое распределение предполагает, что в крупнейшем городе будет проживать около двух миллионов жителей, а не 10 миллионов. Эффект короля назван в честь идеи, что король должен победить всех соперников за трон и забрать их богатство, поместья и власть, тем самым создавая буфер между собой и следующим по богатству из своих подданных. Этот конкретный эффект (созданный намеренно) может применяться к корпорациям, где крупнейшие предприятия используют свое богатство для скупки более мелких конкурентов. При отсутствии намерения эффект короля может возникнуть в результате какого-либо постоянного преимущества роста, обусловленного масштабом, или какого-то уникального преимущества. Крупные города являются более эффективными связующими звеньями людей, талантов и других ресурсов. Уникальные преимущества могут включать в себя статус портового города, столицы, где принимаются законы, или центра деятельности, где физическая близость увеличивает возможности и создает петлю обратной связи. Примером может служить киноиндустрия; где актеры, писатели и другие работники переезжают туда, где больше всего студий, и там же создаются новые студии, потому что именно там проживает больше всего талантов.
Чтобы проверить эффект короля, распределение должно быть подобрано, исключая элементы с самым высоким рейтингом «k», но без присвоения новых ранговых номеров оставшимся членам группы. население. Например, во Франции звания (по состоянию на 2010 год):
- Париж, 12,09М
- Лион, 2.12М
- Марсель, 1,72 м.
- Тулуза, 1,20 м.
- Лилль, 1,15 м.
Алгоритм аппроксимации будет обрабатывать пары {(1,12.09), (2,2.12), (3,1.72), (4,1.20), (5,1.15)} и находить параметры для наилучшего параболического аппроксимации этих точек. Чтобы проверить эффект Кинга, мы просто исключаем первую пару (или первые пары «k») и находим параболические параметры, соответствующие остальным точкам. Так что для Франции мы бысоответствуют четырем точкам {(2,2.12), (3,1.72), (4,1.20), (5,1.15)}. Затем мы можем использовать эти параметры, чтобы оценить размер городов с рейтингом [1,k] и определить, являются ли они членами King Effect или обычными членами.
Для сравнения: закон Ципфа проводит линию через точки (также используя логарифм ранга и логарифм значения). Парабола ( с еще одним параметром) подойдет лучше, но вдали от вершины парабола также почти линейна. Таким образом, хотя это и является суждением статистика, если подобранные параметры помещают вершину далеко от подобранных точек или если параболическая кривая не является значительно лучшим соответствием, чем линия, это может быть симптомом переподбора (т. е. переобучения). параметризация). Линия (с двумя параметрами вместо трех), вероятно, является лучшим обобщением. Больше параметров всегда лучше подходит, но ценой добавления необъяснимых параметров или необоснованных предположений (например, предположения, что небольшая параболическая кривая является более подходящей моделью, чем прямая).
В качестве альтернативы можно заставить подобранную параболу иметь вершину в позиции ранга 1. В этом случае нет уверенности в том, что парабола подойдет лучше (имеет меньшую ошибку), чем прямая линия; и выбор может быть сделан между двумя на основании того, какой из них имеет наименьшую ошибку.
Определение
[ редактировать ]Функция массы вероятности определяется как функция ранга n следующим образом:
где b и c — параметры распределения.
См. также
[ редактировать ]Ссылки
[ редактировать ]- Лаэррер Дж., Деевельс П. (1996) « Параболические фрактальные» распределения в природе, ( http://www.hubbertpeak.com/laherrere/fractal).htm ) Труды Академии наук , Серия II a: Науки о Земле и планетах , 322, (7), 535–541
- Се, С.; Ян, Ю.Г.; Бао, З.Я.; Ке, XZ; Лю, XL (2009). «Анализ минеральных ресурсов с помощью параболических фракталов». Горная наука и технология (Китай) . 19 : 91–96. дои : 10.1016/S1674-5264(09)60017-X .