Статистика
Статистика — это любая величина , (единственное число) или выборочная статистика рассчитанная на основе значений выборки , которая учитывается в статистических целях. Статистические цели включают оценку параметра совокупности , описание выборки или оценку гипотезы. Среднее (или среднее) значений выборки — это статистика. Термин статистика используется как для функции, так и для значения функции в данной выборке. Когда статистика используется для определенной цели, на нее можно ссылаться по имени, указывающему ее цель.
Когда статистика используется для оценки параметра совокупности, она называется оценщиком . Параметром популяции является любая характеристика изучаемой популяции, но когда невозможно напрямую измерить значение параметра популяции, используются статистические методы для вывода вероятного значения параметра на основе статистики, рассчитанной на основе выборки. взято у населения. Например, выборочное среднее является несмещенной оценкой генерального среднего значения . Это означает, что ожидаемое значение выборочного среднего равняется истинному среднему значению генеральной совокупности. [1]
используется Описательная статистика для обобщения выборочных данных. Тестовая статистика используется при проверке статистических гипотез . Одну статистику можно использовать для нескольких целей — например, выборочное среднее можно использовать для оценки среднего значения генеральной совокупности, для описания выборочного набора данных или для проверки гипотезы.
Примеры [ править ]
Некоторые примеры статистики:
- «В недавнем опросе американцев 52% республиканцев говорят , что происходит глобальное потепление».
В данном случае «52%» — это статистика, а именно процент республиканцев в выборке опроса, которые верят в глобальное потепление. Население представляет собой совокупность всех республиканцев в Соединенных Штатах, а оцениваемый параметр населения представляет собой процент всех республиканцев в Соединенных Штатах, а не только опрошенных, которые верят в глобальное потепление.
- «Менеджер крупного отеля, расположенного недалеко от Диснейленда, сообщил, что средняя продолжительность пребывания 20 выбранных гостей составила 5,6 дней».
В этом примере «5,6 дней» — это статистика, а именно средняя продолжительность пребывания в нашей выборке из 20 гостей отеля. Население — это совокупность всех гостей этого отеля, а оцениваемый параметр населения — это средняя продолжительность пребывания всех гостей. [2] Является ли оценщик несмещенным в этом случае, зависит от процесса отбора выборки; см. парадокс проверки .
Существует множество функций, которые используются для расчета статистики. Некоторые включают в себя:
- Выборочное среднее , выборочная медиана и режим выборки
- Выборочная дисперсия и выборочное стандартное отклонение
- Выборочные квантили помимо медианы , например, квартили и процентили
- Тестовая статистика , такая как t-статистика , статистика хи-квадрат , f-статистика
- Статистика заказов , включая образец максимума и минимума
- Примеры моментов и их функции, включая эксцесс и асимметрию
- Различные функционалы эмпирической функции распределения
Свойства [ править ]
Наблюдаемость [ править ]
Статистики часто рассматривают параметризованное семейство вероятностных распределений , любой член которого может быть распределением некоторого измеримого аспекта каждого члена совокупности, из которого случайным образом формируется выборка. Например, параметром может быть средний рост 25-летних мужчин Северной Америки. Измерен рост членов выборки из 100 таких мужчин; среднее из этих 100 чисел является статистикой. Среднее значение роста всех членов населения не является статистикой, если оно не было каким-либо образом установлено (например, путем измерения каждого члена населения). Средний рост, который можно рассчитать с использованием всех индивидуальных показателей роста всех 25-летних мужчин Северной Америки, является параметром, а не статистикой.
Статистические свойства [ править ]
Важные потенциальные свойства статистики включают полноту , непротиворечивость , достаточность , несмещенность , минимальную среднеквадратическую ошибку , низкую дисперсию , надежность и удобство вычислений.
Информация статистики [ править ]
Статистическая информация о параметрах модели может быть определена несколькими способами. Наиболее распространенной является информация Фишера , которая определяется на основе статистической модели, вызванной статистикой. информационную меру Кульбака Также можно использовать .
См. также [ править ]
- Статистика
- Статистическая теория
- Описательная статистика
- Статистическая проверка гипотез
- Сводная статистика
- Хорошая статистика
Ссылки [ править ]
- ^ Кокоска 2015 , стр. 296-308.
- ^ Кокоска 2015 , стр. 296-297.
- Кокоска, Стивен (2015). Вводная статистика: подход к решению проблем (2-е изд.). Нью-Йорк: WH Freeman and Company. ISBN 978-1-4641-1169-3 .
- Паркер, Сибил П. (главный редактор). «Статистика». Словарь научных и технических терминов МакГроу-Хилла. Пятое издание. МакГроу-Хилл, Инк. 1994. ISBN 0-07-042333-4 . Страница 1912.
- ДеГрут и Шервиш. «Определение статистики». Вероятность и статистика. Международное издание. Третье издание. Эддисон Уэсли. 2002. ISBN 0-321-20473-5 . Страницы 370–371.