Одномерный (статистика)
Одномерность — это термин, обычно используемый в статистике для описания типа данных, который состоит из наблюдений только по одной характеристике или атрибуту. Простым примером одномерных данных может служить заработная плата рабочих в промышленности. [1] Как и все другие данные, одномерные данные можно визуализировать с помощью графиков, изображений или других инструментов анализа после того, как данные измерены, собраны, представлены и проанализированы. [2]
Одномерные типы данных [ править ]
Некоторые одномерные данные состоят из чисел (например, рост 65 дюймов или вес 100 фунтов), тогда как другие нечисловые (например, цвет глаз коричневого или синего цвета). термины «категориальные одномерные данные» и «числовые Обычно для различения этих типов используются одномерные данные».
Категориальные одномерные данные [ править ]
Категориальные одномерные данные состоят из нечисловых наблюдений , которые можно отнести к категориям. Он включает метки или имена, используемые для идентификации атрибута каждого элемента. Категориальные одномерные данные обычно используют либо номинальную , либо порядковую шкалу измерения . [3]
Числовые одномерные данные [ править ]
Числовые одномерные данные состоят из наблюдений, которые являются числами. Они получаются с использованием интервальной или относительной шкалы измерения. Этот тип одномерных данных можно разделить еще на две подкатегории: дискретные и непрерывные . [2] Числовые одномерные данные являются дискретными, если набор всех возможных значений конечен или счетно бесконечен . Дискретные одномерные данные обычно связаны со счетом (например, количество книг, прочитанных человеком). Числовые одномерные данные являются непрерывными, если набор всех возможных значений представляет собой интервал чисел. Непрерывные одномерные данные обычно связаны с измерениями (например, вес людей).
данных приложения и Анализ
Одномерный анализ — это самая простая форма анализа данных. Uni означает «один», поэтому данные имеют только одну переменную ( одномерную ). [4] Одномерные данные требуют анализа каждой переменной отдельно. Данные собираются с целью ответа на вопрос или, точнее, исследовательский вопрос. Одномерные данные не отвечают на исследовательские вопросы о взаимосвязях между переменными, а скорее используются для описания одной характеристики или атрибута, который варьируется от наблюдения к наблюдению. [5] Обычно исследователь может преследовать две цели. Первый — ответить на исследовательский вопрос с помощью описательного исследования, а второй — получить знания о том, как атрибут изменяется в зависимости от индивидуального воздействия переменной в регрессионном анализе . Существует несколько способов описания закономерностей, обнаруженных в одномерных данных, которые включают графические методы, меры центральной тенденции и меры изменчивости. [6]
Как и другие формы статистики, она может быть умозрительной или описательной . Ключевым фактом является то, что задействована только одна переменная.
Одномерный анализ может дать ошибочные результаты в тех случаях, когда многомерный анализ более уместен .
центральной тенденции Меры
Центральная тенденция — одна из наиболее распространенных числовых описательных мер. Он используется для оценки центрального местоположения одномерных данных путем расчета среднего значения , медианы и моды . [7] Каждый из этих расчетов имеет свои преимущества и ограничения. Преимущество среднего значения состоит в том, что его расчет включает в себя каждое значение набора данных, но оно особенно подвержено влиянию выбросов . Медиана является лучшим показателем, когда набор данных содержит выбросы. Режим легко найти.
Никто не ограничен использованием только одного из этих показателей центральной тенденции. Если анализируемые данные являются категориальными, то единственной мерой центральной тенденции, которую можно использовать, является мода. Однако, если данные имеют числовой характер ( порядковый номер или интервал / отношение ), то для описания данных можно использовать моду, медиану или среднее значение. Использование более чем одного из этих показателей обеспечивает более точное описательное изложение центральной тенденции для одномерной величины. [8]
Меры изменчивости
Мера изменчивости или дисперсии (отклонения от среднего значения) одномерного набора данных может более полно выявить форму одномерного распределения данных. Он предоставит некоторую информацию о различиях между значениями данных. Показатели изменчивости вместе с показателями центральной тенденции дают лучшее представление о данных, чем только показатели центральной тенденции. [9] Тремя наиболее часто используемыми мерами изменчивости являются диапазон , дисперсия и стандартное отклонение . [10] Уместность каждой меры будет зависеть от типа данных, формы распределения данных и того, какой показатель центральной тенденции используется. Если данные категориальны, то нет никакой меры изменчивости, о которой можно было бы сообщить. Для числовых данных возможны все три меры. Если распределение данных симметрично, то мерами изменчивости обычно являются дисперсия и стандартное отклонение. Однако если данные искажены , то мерой изменчивости, подходящей для этого набора данных, является диапазон. [3]
Описательные методы [ править ]
Описательная статистика описывает выборку или популяцию. Они могут быть частью исследовательского анализа данных . [11]
Соответствующая статистика зависит от уровня измерения . Для номинальных переменных таблицы частот и списка режимов . достаточно Для порядковых переменных медиану можно рассчитать как меру центральной тенденции , а диапазон (и его вариации) — как меру дисперсии. Для переменных уровня интервала среднее арифметическое (среднее) и стандартное отклонение в набор инструментов добавляются , а для переменных уровня отношения мы добавляем среднее геометрическое и среднее гармоническое как меры центральной тенденции и коэффициент вариации как меру дисперсии.
Для данных на уровне интервалов и отношений дополнительные дескрипторы включают асимметрию переменной и эксцесс .
Методы вывода [ править ]
Методы вывода позволяют нам делать выводы от выборки к генеральной совокупности. [11] Для номинальной переменной односторонний критерий хи-квадрат (степень соответствия) может помочь определить, соответствует ли наша выборка выборке некоторой совокупности. [12] Для данных на уровне интервалов и отношений одновыборочный t-тест может позволить нам сделать вывод, соответствует ли среднее значение в нашей выборке некоторому предложенному числу (обычно 0). Другие доступные тесты местоположения включают одновыборочный знаковый критерий и знаковый ранговый критерий Уилкоксона .
Графические методы [ править ]
Наиболее часто используемые графические иллюстрации одномерных данных:
Таблицы распределения частот [ править ]
Частота – это сколько раз встречается число. Частота наблюдения в статистике говорит нам, сколько раз наблюдение встречается в данных. Например, в следующем списке чисел { 1, 2, 3, 4, 6, 9, 9, 8, 5, 1, 1, 9, 9, 0, 6, 9 } частота числа 9 равна 5 (потому что в этом наборе данных оно встречается 5 раз).
Гистограммы [ править ]
Гистограмма представляет собой график, состоящий из прямоугольных столбцов. Эти столбцы фактически представляют количество или процент наблюдений существующих категорий в переменной. Длина высота или полос дает визуальное представление о пропорциональных различиях между категориями.
Гистограммы [ править ]
Гистограммы используются для оценки распределения данных, при этом частота значений присваивается диапазону значений, называемому интервалом . [13]
Круговые диаграммы [ править ]
Круговая диаграмма представляет собой круг, разделенный на части, которые представляют относительные частоты или проценты населения или выборки, принадлежащих к различным категориям.
распределения Одномерные
Одномерное распределение — это тип дисперсии одной случайной величины, описываемый либо функцией массы вероятности (pmf) для дискретного распределения вероятностей , либо функцией плотности вероятности (pdf) для непрерывного распределения вероятностей . [14] Его не следует путать с многомерным распределением .
распределения дискретные Общие
- Равномерное распределение (дискретное)
- Распределение Бернулли
- Биномиальное распределение
- Геометрическое распределение
- Отрицательное биномиальное распределение
- Распределение Пуассона
- Гипергеометрическое распределение
- Зета-распределение
распределения непрерывные Общие
- Равномерное распределение (непрерывное)
- Нормальное распределение
- Гамма-распределение
- Экспоненциальное распределение
- Распределение Вейбулла
- Распределение Коши
- Бета-дистрибутив
См. также [ править ]
- Одномерный
- Одномерное распределение
- Двумерный анализ
- Многомерный анализ
- Список вероятностных распределений
Ссылки [ править ]
- ^ Качиган, Сэм Каш (1986). Статистический анализ: междисциплинарное введение в одномерные и многомерные методы . Нью-Йорк: Радиус Пресс. ISBN 0-942154-99-1 .
- ^ Jump up to: Перейти обратно: а б Лаке, Прем С. Манн; с помощью Кристофера Джея (2010). Вводная статистика (7-е изд.). Хобокен, Нью-Джерси: John Wiley & Sons. ISBN 978-0-470-44466-5 .
{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Jump up to: Перейти обратно: а б Андерсон, Дэвид Р.; Суини, Деннис Дж.; Уильямс, Томас А. Статистика для бизнеса и экономики (Десятое изд.). Cengage Обучение. п. 1018. ИСБН 978-0-324-80926-8 .
- ^ «Одномерный анализ» . статус .
- ^ «Одномерные данные» . исследование.com .
- ^ Трохим, Уильям. «Описательная статистика» . Интернет-центр методов социальных исследований . Проверено 15 февраля 2017 г. .
- ^ О'Рурк, Норм; Хэтчер, Ларри; Степански, Эдвард Дж. (2005). Пошаговый подход к использованию SAS для одномерной и многомерной статистики (2-е изд.). Нью-Йорк: Wiley-Interscience. ISBN 1-59047-417-1 .
- ^ Лонгнекер, Р. Лайман Отт, Майкл (2009). Введение в статистические методы и анализ данных (6-е изд., Международное изд.). Пасифик Гроув, Калифорния: Брукс/Коул. ISBN 978-0-495-10914-3 .
{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Мелун, Милан; Милицкий, Иржи (2011). Практическое руководство Статистический анализ данных . Woodhead Pub Ltd. . Нью-Дели: ISBN 978-0-85709-109-3 .
- ^ Первс, Дэвид Фридман; Роберт Пизани; Роджер (2007). Статистика (4-е изд.). Нью-Йорк [ua]: Нортон. ISBN 978-0-393-92972-0 .
{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Jump up to: Перейти обратно: а б Эверитт, Брайан (1998). Кембриджский статистический словарь . Кембридж, Великобритания, Нью-Йорк: Издательство Кембриджского университета. ISBN 0521593468 .
- ^ «Односторонний хи-квадрат» .
- ^ Дьес, Дэвид М.; Барр, Кристофер Д.; Четинкая-Рундел, Майн (2015). Статистика OpenIntro (3-е изд.). ОпенИнтро, Инк. п. 30. ISBN 978-1-9434-5003-9 .
- ^ Саманиего, Франциско Дж. (2014). Стохастическое моделирование и математическая статистика: учебник для статистиков и специалистов по количественному анализу . Бока-Ратон: CRC Press. п. 167. ИСБН 978-1-4665-6046-8 .