Стандартная оценка
В статистике стандартная оценка — это количество стандартных отклонений , на которые значение исходной оценки (т. е. наблюдаемое значение или точка данных) выше или ниже среднего значения того, что наблюдается или измеряется. Необработанные баллы выше среднего имеют положительные стандартные баллы, а те, которые ниже среднего, имеют отрицательные стандартные баллы.
Он рассчитывается путем вычитания среднего значения совокупности из индивидуального исходного балла и последующего деления разницы на стандартное отклонение совокупности . Этот процесс преобразования исходной оценки в стандартную оценку называется стандартизацией или нормализацией (однако «нормализация» может относиться ко многим типам отношений; см. в разделе «Нормализация дополнительную информацию »).
Стандартные оценки чаще всего называются z -показателями ; эти два термина могут использоваться как взаимозаменяемые, как и в этой статье. Другие эквивалентные термины, используемые включают z-значение , z-статистику , нормальную оценку , стандартизированную переменную и притяжение в физике высоких энергий, . [1] [2]
Для расчета z-показателя требуется знание среднего и стандартного отклонения всей совокупности, к которой принадлежит точка данных; если у вас есть только выборка наблюдений из совокупности, то аналогичное вычисление с использованием выборочного среднего и выборочного стандартного отклонения дает t -статистику .
Расчет
[ редактировать ]Если известно среднее значение генеральной совокупности и стандартное отклонение генеральной совокупности, можно получить необработанный балл. x преобразуется в стандартную оценку с помощью [3]
где:
- μ — среднее значение генеральной совокупности,
- σ — стандартное отклонение генеральной совокупности.
Абсолютное значение z представляет собой расстояние между этим исходным показателем x и средним значением генеральной совокупности в единицах стандартного отклонения. z является отрицательным, когда исходный балл ниже среднего, и положительным, когда выше среднего.
Для расчета z с использованием этой формулы необходимо использовать среднее значение генеральной совокупности и стандартное отклонение генеральной совокупности, а не выборочное среднее или выборочное отклонение. Однако знание истинного среднего значения и стандартного отклонения популяции часто является нереалистичным ожиданием, за исключением таких случаев, как стандартизированное тестирование , когда измеряется вся совокупность.
Когда среднее значение генеральной совокупности и стандартное отклонение генеральной совокупности неизвестны, стандартный балл можно оценить, используя выборочное среднее значение и стандартное отклонение выборки в качестве оценок значений генеральной совокупности. [4] [5] [6] [7]
В этих случаях z -показатель определяется выражением
где:
- среднее значение выборки,
- S — стандартное отклонение выборки.
Хотя это всегда следует констатировать, различие между использованием статистики генеральной совокупности и выборочной статистики часто не проводится. В любом случае числитель и знаменатель уравнений имеют одинаковые единицы измерения, так что единицы сокращаются при делении, а z остается безразмерной величиной .
Приложения
[ редактировать ]Z-тест
[ редактировать ]Z-показатель часто используется в z-тесте стандартизированного тестирования – аналоге t-критерия Стьюдента для популяции, параметры которой известны, а не оцениваются. Поскольку знание всей совокупности очень необычно, t-критерий используется гораздо более широко.
Интервалы прогнозирования
[ редактировать ]Стандартную оценку можно использовать при расчете интервалов прогнозирования . Интервал прогнозирования [ L , U ], состоящий из нижней конечной точки, обозначенной L , и верхней конечной точки, обозначенной U , представляет собой интервал, в котором будущее наблюдение X будет лежать в интервале с высокой вероятностью. , то есть
Для стандартной оценки Z из X это дает: [8]
Определив квантиль z такой, что
следует:
Управление процессом
[ редактировать ]В приложениях управления процессами значение Z дает оценку степени отклонения процесса от запланированного.
Сравнение баллов, полученных по разным шкалам: ACT и SAT.
[ редактировать ]Когда баллы измеряются по разным шкалам, их можно преобразовать в z-показатели, чтобы облегчить сравнение. Дитц и др. [9] Приведите следующий пример, сравнивая результаты учащихся по (старым) SAT и ACT школьным тестам . В таблице показано среднее и стандартное отклонение общего количества баллов по SAT и ACT. Предположим, что студент А набрал 1800 баллов по SAT, а студент Б — 24 балла по ACT. Какой студент показал лучшие результаты по сравнению с другими участниками теста?
СБ | ДЕЙСТВОВАТЬ | |
---|---|---|
Иметь в виду | 1500 | 21 |
Стандартное отклонение | 300 | 5 |
Z-показатель для студента А равен
Z-показатель для студента Б равен
Поскольку у студента А более высокий z-показатель, чем у студента Б, студент А показал лучшие результаты по сравнению с другими участниками теста, чем студент Б.
Процент наблюдений ниже z-показателя
[ редактировать ]Продолжая пример с баллами ACT и SAT, если можно предположить, что баллы как ACT, так и SAT нормально распределены (что примерно верно), тогда z-показатели можно использовать для расчета процента тестируемых, получивших более низкую оценку. баллы, чем у студентов А и Б.
Кластерный анализ и многомерное масштабирование
[ редактировать ]«Для некоторых многомерных методов, таких как многомерное масштабирование и кластерный анализ, концепция расстояния между единицами данных часто представляет значительный интерес и важность… Когда переменные в многомерном наборе данных находятся в разных масштабах, имеет больше смысла рассчитывать расстояния после некоторой формы стандартизации». [10]
Анализ основных компонентов
[ редактировать ]При анализе главных компонентов «переменные, измеренные в разных масштабах или в одной шкале с сильно различающимися диапазонами, часто стандартизируются». [11]
Относительная важность переменных в множественной регрессии: стандартизированные коэффициенты регрессии
[ редактировать ]Стандартизация переменных перед множественным регрессионным анализом иногда используется в качестве вспомогательного средства для интерпретации. [12] (стр. 95) заявляют следующее.
«Наклон стандартизированной регрессии — это наклон уравнения регрессии, если X и Y стандартизированы… Стандартизация X и Y осуществляется путем вычитания соответствующих средних значений из каждого набора наблюдений и деления на соответствующие стандартные отклонения… В множественной регрессии, когда несколько Используются переменные X, стандартизированные коэффициенты регрессии количественно определяют относительный вклад каждой переменной X».
Однако Катнер и др. [13] (стр. 278) делают следующее предостережение: «… нужно быть осторожным при интерпретации любых коэффициентов регрессии, независимо от того, стандартизированы они или нет. Причина в том, что, когда переменные-предикторы коррелируют между собой,… на коэффициенты регрессии влияют другие переменные-предикторы. в модели… На величины стандартизированных коэффициентов регрессии влияет не только наличие корреляций между переменными-предикторами, но и интервалы наблюдений по каждой из этих переменных. Иногда эти интервалы могут быть совершенно произвольными. обычно неразумно интерпретировать величины стандартизированных коэффициентов регрессии как отражающие сравнительную важность переменных-предикторов».
Стандартизация в математической статистике
[ редактировать ]В математической статистике случайная величина X стандартизируется ожидаемого путем вычитания ее значения. и разделив разницу на ее стандартное отклонение
Если рассматриваемая случайная величина является выборочным средним случайной выборки из X :
тогда стандартизированная версия
- При этом дисперсия стандартизованного выборочного среднего рассчитывалась следующим образом:
Т-оценка
[ редактировать ]В оценке образования T-показатель представляет собой стандартный балл Z, сдвинутый и масштабированный так, чтобы его среднее значение составляло 50, а стандартное отклонение - 10. [14] [15] [16] На японском языке оно также известно как хенсати , где это понятие гораздо более широко известно и используется при поступлении в среднюю школу и университет.
При измерении плотности костей Т-показатель представляет собой стандартный показатель измерения по сравнению с популяцией здоровых 30-летних взрослых и имеет обычное среднее значение 0 и стандартное отклонение 1. [17]
См. также
[ редактировать ]- Нормализация (статистика)
- соотношение омега
- Стандартное нормальное отклонение
- Расстояние Махаланобис
- Функция ошибки
- Стьюдентизированный остаток
Ссылки
[ редактировать ]- ^ Малдерс, Мартин; Зандериги, Джулия, ред. (2017). Европейская школа физики высоких энергий 2015: Банско, Болгария, 02–15 сентября 2015 г. Желтые отчеты ЦЕРН: Школьные материалы. Женева: ЦЕРН. ISBN 978-92-9083-472-4 .
- ^ Гросс, Эйлам (06 ноября 2017 г.). «Практическая статистика по физике высоких энергий» . Желтые отчеты ЦЕРН: Школьные материалы . 4/2017: 165–186. дои : 10.23730/CYRSP-2017-004.165 .
- ^ Э. Крейциг (1979). Высшая инженерная математика (Четвертое изд.). Уайли. п. 880, экв. 5. ISBN 0-471-02140-7 .
- ^ Шпигель, Мюррей Р.; Стивенс, Ларри Дж. (2008), Статистика очертаний Шаума (Четвертое изд.), McGraw Hill, ISBN 978-0-07-148584-5
- ^ Менденхолл, Уильям; Синчич, Терри (2007), Статистика техники и наук (Пятое изд.), Пирсон / Прентис Холл, ISBN 978-0131877061
- ^ Гланц, Стэнтон А.; Слинкер, Брайан К.; Нейландс, Торстен Б. (2016), Учебник по прикладной регрессии и дисперсионному анализу (Третье изд.), McGraw Hill, ISBN 978-0071824118
- ^ Ахо, Кен А. (2014), Фундаментальная и прикладная статистика для биологов (первое издание), Chapman & Hall / CRC Press, ISBN 978-1439873380
- ^ Э. Крейциг (1979). Высшая инженерная математика (Четвертое изд.). Уайли. п. 880, экв. 6. ISBN 0-471-02140-7 .
- ^ Дьес, Дэвид; Барр, Кристофер; Четинкая-Рундель, Моя (2012), Статистика OpenIntro (второе изд.), openintro.org
- ^ Эверитт, Брайан; Хотхорн, Торстен Дж. (2011), Введение в прикладной многомерный анализ с помощью R , Springer, ISBN 978-1441996497
- ^ Джонсон, Ричард; Wichern, Wichern (2007), Прикладной многомерный статистический анализ , Пирсон / Прентис Холл
- ^ Афифи, Абдельмонем; Мэй, Сюзанна К.; Кларк, Вирджиния А. (2012), Практический многомерный анализ (пятое изд.), Chapman & Hall/CRC, ISBN 978-1439816806
- ^ Катнер, Майкл; Нахтсхайм, Кристофер; Нетер, Джон (204), Прикладные модели линейной регрессии (Четвертое изд.), McGraw Hill, ISBN 978-0073014661
- ^ Джон Сальвиа; Джеймс Исселдайк; Сара Уитмер (29 января 2009 г.). Оценка: в специальном и инклюзивном образовании . Cengage Обучение. стр. 43–. ISBN 978-0-547-13437-6 .
- ^ Эдвард С. Нойкруг; Р. Чарльз Фосетт (1 января 2014 г.). Основы тестирования и оценки: практическое руководство для консультантов, социальных работников и психологов . Cengage Обучение. стр. 133–. ISBN 978-1-305-16183-2 .
- ^ Рэнди В. Кампхаус (16 августа 2005 г.). Клиническая оценка интеллекта детей и подростков . Спрингер. стр. 123–. ISBN 978-0-387-26299-4 .
- ^ «Измерение костной массы: что означают цифры» . Национальный ресурсный центр NIH по остеопорозу и связанным с ним заболеваниям костей . Национальный институт здоровья . Проверено 5 августа 2017 г.
Дальнейшее чтение
[ редактировать ]- Кэрролл, Сьюзан Ровецци; Кэрролл, Дэвид Дж. (2002). Статистика стала простой для руководителей школ (иллюстрированное издание). Роуман и Литтлфилд. ISBN 978-0-8108-4322-6 . Проверено 7 июня 2009 г.
- Ларсен, Ричард Дж.; Маркс, Моррис Л. (2000). Введение в математическую статистику и ее приложения (Третье изд.). п. 282. ИСБН 0-13-922303-7 .