Закон Ципфа – Мандельброта
Параметры | ( целое число ) ( настоящий ) ( настоящий ) | ||
---|---|---|---|
Поддерживать | |||
ПМФ | |||
CDF | |||
Иметь в виду | |||
Режим | |||
Энтропия |
В теории вероятностей и статистике закон Ципфа-Мандельброта представляет собой дискретное распределение вероятностей . Также известный как закон Парето -Ципфа, это степенное распределение ранжированных данных , названное в честь лингвиста Джорджа Кингсли Зипфа , который предложил более простое распределение, называемое законом Ципфа , и математика Бенуа Мандельброта , который впоследствии обобщил его.
Функция массы вероятности определяется выражением
где дается
которое можно рассматривать как обобщение гармонического числа . В формуле - это ранг данных, и и являются параметрами распределения. В пределе как приближается к бесконечности, это становится дзета-функцией Гурвица . Для конечного и закон Ципфа-Мандельброта становится законом Ципфа . Для бесконечности и оно становится дзета-распределением .
Приложения
[ редактировать ]Распределение слов, ранжированных по их частоте, в случайном текстовом корпусе аппроксимируется степенным законом распределения, известным как закон Ципфа .
Если построить график частотного ранга слов, содержащихся в корпусе текстовых данных среднего размера, в зависимости от количества вхождений или фактических частот, можно получить степенное , распределение с показателем близким к единице (но см. Powers, 1998 и Gelbukh & Sidorov, 2001). Закон Ципфа неявно предполагает фиксированный размер словаря, но гармонический ряд с s = 1 не сходится, в то время как обобщение Ципфа – Мандельброта с s > 1 сходится. Более того, есть свидетельства того, что закрытый класс функциональных слов, определяющих язык, подчиняется распределению Ципфа – Мандельброта с параметрами, отличными от открытых классов содержательных слов, которые различаются в зависимости от темы, области и регистра. [1]
В полевых экологических исследованиях часто обнаруживается, что распределение относительной численности (т.е. график количества наблюдаемых видов в зависимости от их численности) соответствует закону Ципфа-Мандельброта. [2]
В музыке многие показатели измерения «приятной» музыки соответствуют распределениям Ципфа – Мандельброта. [3]
Примечания
[ редактировать ]- ^ Пауэрс, Дэвид М.В. (1998). «Приложения и объяснения закона Ципфа». Новые методы обработки речи и компьютерного изучения естественного языка . Совместная конференция по новым методам обработки речи и компьютерному изучению естественного языка. Ассоциация компьютерной лингвистики. стр. 151–160.
- ^ Муйо, Д.; Лепретр, А. (2000). «Введение индексов распределения относительной численности (RAD), оцененных по диаграммам ранг-частота (RFD), для оценки изменений в разнообразии сообщества» . Экологический мониторинг и оценка . 63 (2). Спрингер: 279–295. дои : 10.1023/А:1006297211561 . S2CID 102285701 . Проверено 24 декабря 2008 г.
- ^ Манарис, Б.; Воган, Д.; Вагнер, CS; Ромеро, Дж.; Дэвис, Р.Б. «Эволюционная музыка и закон Ципфа-Мандельброта: развитие функций приспособленности для приятной музыки» . Материалы 1-го европейского семинара по эволюционной музыке и искусству (EvoMUSART2003) . 611 .
Ссылки
[ редактировать ]- Мандельброт, Бенуа (1965). «Теория информации и психолингвистика». В Б. Б. Вольмане и Э. Нагеле (ред.). Научная психология . Основные книги. Перепечатано как
- Мандельброт, Бенуа (1968) [1965]. «Теория информации и психолингвистика». В RC Oldfield и JC Marchall (ред.). Язык . Книги о пингвинах.
- Пауэрс, Дэвид М.В. (1998). «Приложения и объяснения закона Ципфа». Новые методы обработки речи и компьютерного изучения естественного языка . Совместная конференция по новым методам обработки речи и компьютерному изучению естественного языка. Ассоциация компьютерной лингвистики . стр. 151–160.
- Зипф, Джордж Кингсли (1932). Избранные исследования принципа относительной частоты в языке . Кембридж, Массачусетс: Издательство Гарвардского университета.
- Ван Дрогенброк Ф.Дж. (2019). «Существенная перефразировка закона Ципфа-Мандельброта для решения задач установления авторства с помощью статистики Гаусса» .