Jump to content

Описательная статистика

Описательная статистика смысле существительного ) — это сводная статистика , которая количественно описывает или суммирует характеристики из набора информации . [1] в то время как описательная статистика смысле массового существительного ) — это процесс использования и анализа этой статистики. Описательная статистика отличается от статистики выводов (или индуктивной статистики) своей целью обобщить выборку , а не использовать данные для изучения совокупности , которую, как предполагается, представляет выборка данных. [2] Обычно это означает, что описательная статистика, в отличие от статистики вывода, не разрабатывается на основе теории вероятностей и часто является непараметрической статистикой . [3] Даже когда анализ данных делает основные выводы с использованием статистических выводов, обычно также представляется описательная статистика. [4] Например, в статьи, посвященные людям, обычно включается таблица с указанием общего размера выборки , размеров выборки в важных подгруппах (например, для каждой группы лечения или воздействия), а также демографических или клинических характеристик, таких как средний возраст, доля субъектов каждого пола, доля субъектов с соответствующими сопутствующими заболеваниями и т. д.

Некоторые меры, которые обычно используются для описания набора данных, — это меры центральной тенденции и меры изменчивости или дисперсии . Меры центральной тенденции включают среднее значение , медиану и моду , тогда как меры изменчивости включают стандартное отклонение (или дисперсию ), минимальное и максимальное значения переменных, эксцесс и асимметрию . [5]

Использование в статистическом анализе

[ редактировать ]

Описательная статистика предоставляет простые сводки о выборке и сделанных наблюдениях. Такие сводки могут быть как количественными , т. е. сводной статистикой , так и наглядными, т. е. простыми для понимания графиками. Эти сводки могут либо лечь в основу первоначального описания данных в рамках более обширного статистического анализа, либо могут быть достаточными сами по себе для конкретного расследования.

Например, процент попаданий в баскетбол — это описательная статистика, которая суммирует результативность игрока или команды. Это число представляет собой количество сделанных снимков, разделенное на количество сделанных снимков. Например, игрок, который бросает 33%, делает примерно один бросок из каждых трех. Процент суммирует или описывает несколько отдельных событий. Учитывайте также средний балл . Это единственное число описывает общую успеваемость студента на протяжении всего курса. [6]

Использование описательной и сводной статистики имеет обширную историю, и, действительно, простое табулирование населения и экономических данных было первым способом появления темы статистики . Совсем недавно был сформулирован набор методов обобщения под заголовком исследовательского анализа данных : примером такого метода является коробчатая диаграмма .

В деловом мире описательная статистика предоставляет полезную сводку многих типов данных. Например, инвесторы и брокеры могут использовать исторический отчет о динамике доходности, выполняя эмпирический и аналитический анализ своих инвестиций, чтобы принимать более эффективные инвестиционные решения в будущем.

Одномерный анализ

[ редактировать ]

Одномерный анализ включает описание распределения одной переменной, включая ее центральную тенденцию (включая среднее значение , медиану и моду ) и дисперсию (включая диапазон и квартили набора данных, а также меры разброса, такие как дисперсия и стандартное отклонение) . ). Форму распределения можно также описать с помощью таких показателей, как асимметрия и эксцесс . Характеристики распределения переменной также могут быть изображены в графическом или табличном формате, включая гистограммы и отображение стеблей и листьев .

Двумерный и многомерный анализ

[ редактировать ]

Когда выборка состоит из более чем одной переменной, для описания взаимосвязи между парами переменных можно использовать описательную статистику. В этом случае описательная статистика включает в себя:

Основная причина дифференциации одномерного и двумерного анализа заключается в том, что двумерный анализ представляет собой не только простой описательный анализ, но также описывает отношения между двумя разными переменными. [7] Количественные меры зависимости включают корреляцию (например, r Пирсона , когда обе переменные непрерывны, или rho Спирмена, если одна или обе не являются непрерывными) и ковариацию (которая отражает масштабные переменные, на которых измеряются). Наклон в регрессионном анализе также отражает взаимосвязь между переменными. Нестандартизированный наклон указывает на единичное изменение критериальной переменной при изменении предиктора на одну единицу . Стандартизированный наклон указывает на это изменение в стандартизированных единицах ( z-показателя ). Сильно искаженные данные часто преобразуются путем логарифмирования. Использование логарифмов делает графики более симметричными и более похожими на нормальное распределение , что упрощает их интуитивную интерпретацию. [8] : 47 

  1. ^ Манн, Прем С. (1995). Вводная статистика (2-е изд.). Уайли. ISBN  0-471-31009-3 .
  2. ^ «Как сделать выводы на основе данных: описательная статистика, логическая статистика и проверка гипотез» , «Интерпретация и использование статистики в психологических исследованиях » , Таузенд Оукс, Калифорния: SAGE Publications, Inc, стр. 145–183, 2017, doi : 10.4135/9781506304144.n6 , ISBN  978-1-5063-0416-8 , получено 1 июня 2021 г.
  3. ^ Додж, Ю. (2003). Оксфордский словарь статистических терминов . ОУП. ISBN  0-19-850994-4 .
  4. ^ «Как сделать выводы на основе данных: описательная статистика, логическая статистика и проверка гипотез» , «Интерпретация и использование статистики в психологических исследованиях » , Таузенд Оукс, Калифорния: SAGE Publications, Inc, стр. 145–183, 2017, doi : 10.4135/9781506304144.n6 , ISBN  978-1-5063-0416-8 , получено 1 июня 2021 г.
  5. ^ Инвестопедия, Термины описательной статистики
  6. ^ Трохим, Уильям МК (2006). «Описательная статистика» . База знаний о методах исследования . Проверено 14 марта 2011 г.
  7. ^ Бэбби, Эрл Р. (2009). Практика социальных исследований (12-е изд.). Уодсворт. стр. 436–440 . ISBN  978-0-495-59841-1 .
  8. ^ Ник, Тодд Г. (2007). «Описательная статистика». Темы биостатистики . Методы молекулярной биологии . Том. 404. Нью-Йорк: Спрингер. стр. 33–52. дои : 10.1007/978-1-59745-530-5_3 . ISBN  978-1-58829-531-6 . ПМИД   18450044 .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: ec09feebcb6491f503e32915090e839e__1720772460
URL1:https://arc.ask3.ru/arc/aa/ec/9e/ec09feebcb6491f503e32915090e839e.html
Заголовок, (Title) документа по адресу, URL1:
Descriptive statistics - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)