Эмпирические статистические законы
Эмпирический статистический закон или (в популярной терминологии) закон статистики представляет собой тип поведения, который был обнаружен в ряде наборов данных и, более того, в различных типах наборов данных. [1] Многие из этих наблюдений были сформулированы и доказаны в виде статистических или вероятностных теорем, и в эти теоремы был перенесен термин «закон». Существуют и другие статистические и вероятностные теоремы, в названия которых также входит слово «закон», но которые явно не возникли на основе эмпирических наблюдений . Однако оба типа «закона» можно рассматривать как примеры научного закона в области статистики. Что отличает эмпирический статистический закон от формальной статистической теоремы, так это то, как эти закономерности просто проявляются в естественных распределениях без предварительного теоретического рассуждения о данных.
Примеры [ править ]
Таких популярных «законов статистики» несколько.
Принцип Парето является популярным примером такого «закона». В нем говорится, что примерно 80% последствий происходят от 20% причин, и поэтому оно также известно как правило 80/20. [2] В бизнесе правило 80/20 гласит, что 80% вашего бизнеса обеспечивается всего лишь 20% ваших клиентов. [3] В разработке программного обеспечения часто говорят, что 80% ошибок вызваны всего лишь 20% ошибок. [4] 20% мира создают примерно 80% мирового ВВП. [5] 80% расходов на здравоохранение в США приходится на 20% населения. [6]
Закон Ципфа , описанный как «эмпирический статистический закон» лингвистики , [7] это еще один пример. Согласно «закону», при наличии некоторого набора данных текста частота слова обратно пропорциональна его частотному рангу. Другими словами, второе по распространенности слово должно появляться примерно в два раза реже, чем самое распространенное слово, а пятый по распространенности мир будет появляться примерно раз в пять раз, когда появляется самое распространенное слово. Однако то, что делает закон Ципфа «эмпирическим статистическим законом», а не просто теоремой лингвистики, заключается в том, что он применим и к явлениям за пределами своей области. Например, ранжированный список населения мегаполисов США также соответствует закону Ципфа: [8] и даже забывание подчиняется закону Ципфа. [9] Этот акт суммирования нескольких закономерностей естественных данных с помощью простых правил является определяющей характеристикой этих «эмпирических статистических законов».
Примеры статистических законов, основанных на эмпирическом опыте и имеющих прочную теоретическую основу, включают:
Примеры «законов» с более слабой основой включают:
Примеры «законов», которые представляют собой более общие наблюдения, чем имеющие теоретическую основу:
Примеры предполагаемых «законов», которые являются неверными, включают:
См. также [ править ]
Примечания [ править ]
- ^ Китчер и Лосось (2009) стр.51
- ^ Банкли, Ник (3 марта 2008 г.). «Джозеф Джуран, 103 года, пионер в области контроля качества, умер» . Нью-Йорк Таймс . ISSN 0362-4331 . Проверено 5 мая 2017 г.
- ^ Персонал, Инвестопедия (04.11.2010). «Правило 80-20» . Инвестопедия . Проверено 5 мая 2017 г.
- ^ Руни, Паула (3 октября 2002 г.). «Генеральный директор Microsoft: Правило 80-20 применимо к ошибкам, а не только к функциям» . КРН . Проверено 5 мая 2017 г.
- ^ Отчет о человеческом развитии 1992 года . Программа развития ООН. Нью-Йорк: Издательство Оксфордского университета. 1992.
{{cite book}}
: CS1 maint: другие ( ссылка ) - ^ «Диаграмма 1: Процент общих расходов на здравоохранение, понесенных различными процентилями населения США: 2002 г.» . Исследования в действии, выпуск 19 . Роквилл, Мэриленд: Агентство медицинских исследований и качества. Июнь 2006 года.
- ^ Gelbukh & Sidorov (2008)
- ^ Габай, Ксавье (2011). «Площадь и население городов: новый взгляд на города с другой точки зрения» (PDF) . Американский экономический обзор . 101 (5): 2205–2225. arXiv : 1001.5289 . дои : 10.1257/aer.101.5.2205 . S2CID 4998367 .
- ^ Андерсон, Джон Р.; Шулер, Лаэль Дж. (ноябрь 1991 г.). «Отражения окружающей среды в памяти» (PDF) . Психологическая наука . 2 (6): 396–408. дои : 10.1111/j.1467-9280.1991.tb00174.x . S2CID 8511110 .
Ссылки [ править ]
- Китчер П., Салмон В.К. (редакторы) (2009) Научное объяснение . Университет Миннесоты Пресс. ISBN 978-0-8166-5765-0
- Гельбух А., Сидоров Г. (2008). Коэффициенты законов Ципфа и Хипса зависят от языка. В: Компьютерная лингвистика и интеллектуальная обработка текста (стр. 332–335), Springer. ISBN 978-3-540-41687-6 . ссылка на аннотацию