Статистическое население
В статистике популяция набор представляет собой схожих предметов или событий, представляющих интерес для какого-либо вопроса или эксперимента . [1] Статистическая совокупность может представлять собой группу существующих объектов (например, совокупность всех звезд в Млечный Путь галактике ) или гипотетическую и потенциально бесконечную группу объектов, задуманную как обобщение опыта (например, совокупность всех возможных рук в игре покер ). [2] Общей целью статистического анализа является получение информации о некоторой выбранной совокупности. [3]
При статистическом выводе подмножество населения (статистическая выборка ) выбирается для представления населения в статистическом анализе. [4] Более того, статистическая выборка должна быть объективной и точно моделировать совокупность (каждая единица совокупности имеет равные шансы на отбор). Отношение размера этой статистической выборки к размеру генеральной совокупности называется долей выборки . Затем можно оценить параметры популяции, используя соответствующую выборочную статистику .
Среднее [ править ]
, Среднее значение совокупности или ожидаемое значение совокупности , является мерой центральной тенденции либо распределения вероятностей , либо случайной величины, характеризуемой этим распределением. [5] В дискретном распределении вероятностей случайной величины X среднее значение равно сумме всех возможных значений, взвешенных по вероятности этого значения; то есть он вычисляется путем произведения каждого возможного значения x числа X на его вероятность p ( x ), а затем сложения всех этих произведений вместе, что дает . [6] [7] Аналогичная формула применима и к случаю непрерывного распределения вероятностей . Не каждое распределение вероятностей имеет определенное среднее значение (см. распределения Коши пример ). Более того, для некоторых распределений среднее значение может быть бесконечным.
Для конечной популяции среднее значение свойства равно среднему арифметическому данного свойства с учетом каждого члена популяции. Например, средний рост популяции равен сумме высот каждого человека, разделенной на общее количество особей. Среднее значение выборки может отличаться от среднего значения генеральной совокупности, особенно для небольших выборок. Закон больших чисел гласит, что чем больше размер выборки, тем больше вероятность того, что среднее значение выборки будет близко к среднему генеральной совокупности. [8]
Подгруппа населения [ править ]
Подмножество популяции, которое имеет один или несколько общих дополнительных свойств, называется подпопуляцией . Например, если население состоит исключительно из египтян, подгруппа населения состоит из всех египтян мужского пола; Если совокупность представляет собой все аптеки мира, то подгруппа населения представляет собой все аптеки Египта. Напротив, выборка представляет собой подмножество совокупности, которая не выбрана для совместного использования каких-либо дополнительных свойств.
Описательная статистика может давать разные результаты для разных подгрупп населения. Например, определенное лекарство может оказывать различное воздействие на разные подгруппы населения, и эти эффекты могут быть скрыты или отвергнуты, если такие особые подгруппы не будут выявлены и исследованы изолированно.
Точно так же часто можно оценить параметры более точно, если выделить подгруппы: распределение роста среди людей лучше моделировать, например, рассматривая мужчин и женщин как отдельные подгруппы.
Популяции, состоящие из подпопуляций, можно моделировать с помощью смешанных моделей , которые объединяют распределения внутри подпопуляций в общее распределение населения. Даже если подгруппы населения хорошо смоделированы с помощью заданных простых моделей, совокупность в целом может плохо соответствовать данной простой модели – плохое соответствие может быть свидетельством существования подгрупп населения. Например, при наличии двух равных субпопуляций, нормально распределенных, если они имеют одинаковое стандартное отклонение, но разные средние значения, общее распределение будет демонстрировать низкий эксцесс по сравнению с одним нормальным распределением – средние значения подгрупп ложатся на плечи общее распределение. Если они достаточно разделены, они образуют бимодальное распределение ; в противном случае он просто имеет широкий пик. Кроме того, оно будет демонстрировать чрезмерную дисперсию относительно одного нормального распределения с заданным изменением. В качестве альтернативы, учитывая две подгруппы с одинаковым средним значением, но разными стандартными отклонениями, общая популяция будет демонстрировать высокий эксцесс с более острым пиком и более тяжелыми хвостами (и, соответственно, более пологими плечами), чем одно распределение.
См. также [ править ]
- Система сбора данных
- Оценщик Хорвица – Томпсона
- Выборка (статистика)
- Выборка (статистика)
- Стратум (статистика)
Ссылки [ править ]
- ^ «Словарь статистических терминов: Население» . Статистика.com . Проверено 22 февраля 2016 г.
- ^ Вайсштейн, Эрик В. «Статистическое население» . Математический мир .
- ^ Йейтс, Дэниел С.; Мур, Дэвид С; Старнс, Дарен С. (2003). Практика статистики (2-е изд.). Нью-Йорк: Фриман . ISBN 978-0-7167-4773-4 . Архивировано из оригинала 9 февраля 2005 г.
- ^ «Словарь статистических терминов: Выборка» . Статистика.com . Проверено 22 февраля 2016 г.
- ^ Феллер, Уильям (1950). Введение в теорию вероятностей и ее приложения, Том I. Уайли. п. 221. ИСБН 0471257087 .
- ^ Элементарная статистика Роберта Р. Джонсона и Патрисии Дж. Куби, стр. 279
- ^ Вайсштейн, Эрик В. «Среднее население» . mathworld.wolfram.com . Проверено 21 августа 2020 г.
- ^ Очерк теории и проблем вероятности Шаума, написанный Сеймуром Липшуцем и Марком Липсоном, с. 141