Данные подсчета
Эта статья нуждается в дополнительных цитатах для проверки . ( август 2009 г. ) |
В статистике данные подсчета — это статистический тип данных , описывающий исчисляемые количества , данные , которые могут принимать только счетные числа , неотрицательные целые значения {0, 1, 2, 3, ...}, и где эти целые числа возникают в результате подсчета, а не чем рейтинг . Статистическая обработка данных подсчета отличается от обработки двоичных данных , в которых наблюдения могут принимать только два значения, обычно представленных 0 и 1, и от порядковых данных , которые также могут состоять из целых чисел, но где отдельные значения попадают в числовые значения. масштаб произволен, и важен только относительный ранжирование. [ нужен пример ]
Подсчет переменных [ править ]
Отдельный фрагмент данных счетчика часто называют переменной счетчика . Когда такая переменная рассматривается как случайная величина , пуассоновское , биномиальное и отрицательное биномиальное для представления ее распределения обычно используются распределения.
Графическое исследование [ править ]
Графическому исследованию данных подсчета может помочь использование преобразований данных, выбранных так, чтобы они имели свойство стабилизировать выборочную дисперсию. В частности, преобразование квадратного корня можно использовать, когда данные можно аппроксимировать распределением Пуассона (хотя другие преобразования имеют несколько улучшенные свойства), тогда как обратное синусоидальное преобразование доступно, когда биномиальное распределение предпочтительнее .
Связь данных подсчета с другими переменными [ править ]
Здесь переменная count будет рассматриваться как зависимая переменная . Статистические методы, такие как метод наименьших квадратов и дисперсионный анализ, предназначены для работы с непрерывными зависимыми переменными. Их можно адаптировать для работы с данными подсчета, используя преобразования данных, такие как преобразование квадратного корня , но такие методы имеют несколько недостатков; они в лучшем случае приблизительны и оценивают параметры , которые часто трудно интерпретировать.
Распределение Пуассона может служить основой для некоторого анализа данных подсчета, и в этом случае регрессию Пуассона можно использовать . Это частный случай класса обобщенных линейных моделей , который также содержит конкретные формы модели, способные использовать биномиальное распределение ( биномиальная регрессия , логистическая регрессия ) или отрицательное биномиальное распределение , когда предположения модели Пуассона нарушаются, в частности, когда диапазон значений счетчика ограничен или имеется избыточная дисперсия .
См. также [ править ]
Дальнейшее чтение [ править ]
![]() | Эта статья включает список литературы , связанную литературу или внешние ссылки , но ее источники остаются неясными, поскольку в ней отсутствуют встроенные цитаты . ( Ноябрь 2009 г. ) |
- Кэмерон, AC ; Триведи, ПК (2013). Регрессионный анализ книги данных подсчета (второе изд.). Издательство Кембриджского университета. ISBN 978-1-107-66727-3 .
- Хильбе, Джозеф М. (2011). Отрицательная биномиальная регрессия (второе изд.). Издательство Кембриджского университета. ISBN 978-0-521-19815-8 .
- Винкельманн, Райнер (2008). Эконометрический анализ данных подсчета (Пятое изд.). Спрингер. дои : 10.1007/978-3-540-78389-3 . ISBN 978-3-540-77648-2 .