Описательная статистика
Часть серии о |
Исследовать |
---|
Философский портал |
Описательная статистика (в смысле существительного ) — это сводная статистика , которая количественно описывает или суммирует характеристики из набора информации . [1] в то время как описательная статистика (в смысле массового существительного ) — это процесс использования и анализа этой статистики. Описательная статистика отличается от статистики выводов (или индуктивной статистики) своей целью обобщить выборку , а не использовать данные для изучения совокупности , которую, как предполагается, представляет выборка данных. [2] Обычно это означает, что описательная статистика, в отличие от статистики вывода, не разрабатывается на основе теории вероятностей и часто является непараметрической статистикой . [3] Даже когда анализ данных делает основные выводы с использованием статистических выводов, обычно также представляется описательная статистика. [4] Например, в статьи, посвященные людям, обычно включается таблица с указанием общего размера выборки , размеров выборки в важных подгруппах (например, для каждой группы лечения или воздействия), а также демографических или клинических характеристик, таких как средний возраст, доля субъектов каждого пола, доля субъектов с соответствующими сопутствующими заболеваниями и т. д.
Некоторые меры, которые обычно используются для описания набора данных, — это меры центральной тенденции и меры изменчивости или дисперсии . Меры центральной тенденции включают среднее значение , медиану и моду , тогда как меры изменчивости включают стандартное отклонение (или дисперсию ), минимальное и максимальное значения переменных, эксцесс и асимметрию . [5]
Использование в статистическом анализе
[ редактировать ]Описательная статистика предоставляет простые сводки о выборке и сделанных наблюдениях. Такие сводки могут быть как количественными , т. е. сводной статистикой , так и визуальными, т. е. простыми для понимания графиками. Эти сводки могут либо лечь в основу первоначального описания данных в рамках более обширного статистического анализа, либо могут быть достаточными сами по себе для конкретного расследования.
Например, процент попаданий в баскетбол — это описательная статистика, которая суммирует результативность игрока или команды. Это число представляет собой количество сделанных снимков, разделенное на количество сделанных снимков. Например, игрок, который бросает 33%, делает примерно один бросок из каждых трёх. Процент суммирует или описывает несколько отдельных событий. Учитывайте также средний балл . Это единственное число описывает общую успеваемость студента на протяжении всего курса. [6]
Использование описательной и сводной статистики имеет обширную историю, и, действительно, простое табулирование населения и экономических данных было первым способом появления темы статистики . Совсем недавно был сформулирован набор методов обобщения под заголовком исследовательского анализа данных : примером такого метода является коробчатая диаграмма .
В мире бизнеса описательная статистика предоставляет полезную сводку многих типов данных. Например, инвесторы и брокеры могут использовать исторический отчет о динамике доходности, выполняя эмпирический и аналитический анализ своих инвестиций, чтобы принимать более эффективные инвестиционные решения в будущем.
Одномерный анализ
[ редактировать ]Одномерный анализ включает описание распределения одной переменной, включая ее центральную тенденцию (включая среднее значение , медиану и моду ) и дисперсию (включая диапазон и квартили набора данных, а также меры разброса, такие как дисперсия и стандартное отклонение) . ). Форму распределения можно также описать с помощью таких показателей, как асимметрия и эксцесс . Характеристики распределения переменной также могут быть изображены в графическом или табличном формате, включая гистограммы и отображение стеблей и листьев .
Двумерный и многомерный анализ
[ редактировать ]Если выборка состоит из более чем одной переменной, для описания взаимосвязи между парами переменных можно использовать описательную статистику. В этом случае описательная статистика включает в себя:
- Перекрестные таблицы и таблицы непредвиденных обстоятельств
- Графическое представление с помощью диаграмм рассеяния
- Количественные меры зависимости
- Описания условных распределений
Основная причина дифференциации одномерного и двумерного анализа заключается в том, что двумерный анализ представляет собой не только простой описательный анализ, но также описывает отношения между двумя разными переменными. [7] Количественные меры зависимости включают корреляцию (например, r Пирсона , когда обе переменные непрерывны, или rho Спирмена, если одна или обе не являются непрерывными) и ковариацию (которая отражает масштабные переменные, на которых измеряются). Наклон в регрессионном анализе также отражает взаимосвязь между переменными. Нестандартизованный наклон указывает на единичное изменение критериальной переменной при изменении предиктора на одну единицу . Стандартизованный наклон указывает на это изменение в стандартизированных единицах ( z-показателя ). Сильно искаженные данные часто преобразуются путем логарифмирования. Использование логарифмов делает графики более симметричными и более похожими на нормальное распределение , что упрощает их интуитивную интерпретацию. [8] : 47
Ссылки
[ редактировать ]- ^ Манн, Прем С. (1995). Вводная статистика (2-е изд.). Уайли. ISBN 0-471-31009-3 .
- ^ «Как сделать выводы на основе данных: описательная статистика, логическая статистика и проверка гипотез» , «Интерпретация и использование статистики в психологических исследованиях » , Таузенд Оукс, Калифорния: SAGE Publications, Inc, стр. 145–183, 2017, doi : 10.4135/9781506304144.n6 , ISBN 978-1-5063-0416-8 , получено 1 июня 2021 г.
- ^ Додж, Ю. (2003). Оксфордский словарь статистических терминов . ОУП. ISBN 0-19-850994-4 .
- ^ «Как сделать выводы на основе данных: описательная статистика, логическая статистика и проверка гипотез» , «Интерпретация и использование статистики в психологических исследованиях » , Таузенд Оукс, Калифорния: SAGE Publications, Inc, стр. 145–183, 2017, doi : 10.4135/9781506304144.n6 , ISBN 978-1-5063-0416-8 , получено 1 июня 2021 г.
- ^ Инвестопедия, Термины описательной статистики
- ^ Трохим, Уильям МК (2006). «Описательная статистика» . База знаний о методах исследования . Проверено 14 марта 2011 г.
- ^ Бэбби, Эрл Р. (2009). Практика социальных исследований (12-е изд.). Уодсворт. стр. 436–440 . ISBN 978-0-495-59841-1 .
- ^ Ник, Тодд Г. (2007). «Описательная статистика». Темы биостатистики . Методы молекулярной биологии . Том. 404. Нью-Йорк: Спрингер. стр. 33–52. дои : 10.1007/978-1-59745-530-5_3 . ISBN 978-1-58829-531-6 . ПМИД 18450044 .
Внешние ссылки
[ редактировать ]- Лекция по описательной статистике: Суперкурс Питтсбургского университета: http://www.pitt.edu/~super1/lecture/lec0421/index.htm