Стандартная оценка

В статистике стандартная оценка — это количество стандартных отклонений , на которые значение исходной оценки (т. е. наблюдаемое значение или точка данных) выше или ниже среднего значения того, что наблюдается или измеряется. Необработанные баллы выше среднего имеют положительные стандартные баллы, а те, которые ниже среднего, имеют отрицательные стандартные баллы.

Он рассчитывается путем вычитания среднего значения совокупности из индивидуального исходного балла и последующего деления разницы на стандартное отклонение совокупности . Этот процесс преобразования исходной оценки в стандартную оценку называется стандартизацией или нормализацией (однако «нормализация» может относиться ко многим типам отношений; см. в разделе «Нормализация дополнительную информацию »).

Стандартные оценки чаще всего называются z -показателями ; эти два термина могут использоваться как взаимозаменяемые, как и в этой статье. Другие эквивалентные термины, используемые включают z-значение , z-статистику , нормальную оценку , стандартизированную переменную и притяжение в физике высоких энергий, . ^[1]^[2]

Для расчета z-показателя требуется знание среднего значения и стандартного отклонения всей совокупности, к которой принадлежит точка данных; если у вас есть только выборка наблюдений из совокупности, то аналогичное вычисление с использованием выборочного среднего и выборочного стандартного отклонения дает t -статистику .

Расчет

Если известно среднее значение генеральной совокупности и стандартное отклонение генеральной совокупности, можно получить необработанный балл. x преобразуется в стандартную оценку с помощью ^[3]

z={x-\mu  \over \sigma }

где:

μ — среднее значение генеральной совокупности,

σ — стандартное отклонение генеральной совокупности.

Абсолютное значение z представляет собой расстояние между этим исходным показателем x и средним значением генеральной совокупности в единицах стандартного отклонения. z является отрицательным, когда исходный балл ниже среднего, и положительным, когда выше среднего.

Для расчета z с использованием этой формулы необходимо использовать среднее значение генеральной совокупности и стандартное отклонение генеральной совокупности, а не выборочное среднее или выборочное отклонение. Однако знание истинного среднего значения и стандартного отклонения популяции часто является нереалистичным ожиданием, за исключением таких случаев, как стандартизированное тестирование , когда измеряется вся совокупность.

Когда среднее значение генеральной совокупности и стандартное отклонение генеральной совокупности неизвестны, стандартный балл можно оценить, используя выборочное среднее значение и стандартное отклонение выборки в качестве оценок значений генеральной совокупности. ^[4]^[5]^[6]^[7]

В этих случаях z -показатель определяется выражением

z={x-{\bar {x}} \over S}

где:

{\bar {x}}

среднее значение выборки,

S — стандартное отклонение выборки.

Хотя это всегда следует констатировать, различие между использованием статистики генеральной совокупности и выборочной статистики часто не проводится. В любом случае числитель и знаменатель уравнений имеют одинаковые единицы измерения, так что единицы сокращаются при делении, а z остается безразмерной величиной .

Приложения

Z-тест

Z-показатель часто используется в z-тесте стандартизированного тестирования – аналоге t-критерия Стьюдента для популяции, параметры которой известны, а не оцениваются. Поскольку знание всей совокупности очень необычно, t-критерий используется гораздо более широко.

Интервалы прогнозирования

Стандартную оценку можно использовать при расчете интервалов прогнозирования . Интервал прогнозирования [ L , U ], состоящий из нижней конечной точки, обозначенной L , и верхней конечной точки, обозначенной U , представляет собой интервал, в котором будущее наблюдение X будет лежать в интервале с высокой вероятностью. $\gamma$ , то есть

P(L<X<U)=\gamma ,

Для стандартной оценки Z из X это дает: ^[8]

P\left({\frac {L-\mu }{\sigma }}<Z<{\frac {U-\mu }{\sigma }}\right)=\gamma .

Определив квантиль z такой, что

P\left(-z<Z<z\right)=\gamma

следует:

L=\mu -z\sigma ,\ U=\mu +z\sigma

Управление процессом

В приложениях управления процессами значение Z дает оценку степени отклонения процесса от запланированного.

Сравнение баллов, полученных по разным шкалам: ACT и SAT.

Когда баллы измеряются по разным шкалам, их можно преобразовать в z-показатели, чтобы облегчить сравнение. Дитц и др. ^[9] Приведите следующий пример, сравнивая результаты учащихся по (старым) SAT и ACT школьным тестам . В таблице показано среднее и стандартное отклонение общего количества баллов по SAT и ACT. Предположим, что студент А набрал 1800 баллов по SAT, а студент Б — 24 балла по ACT. Какой студент показал лучшие результаты по сравнению с другими участниками теста?

	СБ	ДЕЙСТВОВАТЬ
Иметь в виду	1500	21
Стандартное отклонение	300	5

Z-показатель для студента А равен $z={x-\mu \over \sigma }={1800-1500 \over 300}=1$

Z-показатель для студента Б равен $z={x-\mu \over \sigma }={24-21 \over 5}=0.6$

Поскольку у студента А более высокий z-показатель, чем у студента Б, студент А показал лучшие результаты по сравнению с другими участниками теста, чем студент Б.

Процент наблюдений ниже z-показателя

Продолжая пример с баллами ACT и SAT, если можно далее предположить, что баллы как ACT, так и SAT нормально распределены (что приблизительно верно), тогда z-показатели можно использовать для расчета процента тестируемых, получивших более низкую оценку. баллы, чем у студентов А и Б.

Кластерный анализ и многомерное масштабирование

«Для некоторых многомерных методов, таких как многомерное масштабирование и кластерный анализ, концепция расстояния между единицами данных часто представляет значительный интерес и важность… Когда переменные в многомерном наборе данных находятся в разных масштабах, имеет больше смысла рассчитывать расстояния после некоторой формы стандартизации». ^[10]

Анализ основных компонентов

При анализе главных компонентов «переменные, измеренные в разных масштабах или в одной шкале с сильно различающимися диапазонами, часто стандартизируются». ^[11]

Относительная важность переменных в множественной регрессии: стандартизированные коэффициенты регрессии

Стандартизация переменных перед множественным регрессионным анализом иногда используется в качестве вспомогательного средства для интерпретации. ^[12](стр. 95) заявляют следующее.

«Наклон стандартизированной регрессии — это наклон уравнения регрессии, если X и Y стандартизированы… Стандартизация X и Y осуществляется путем вычитания соответствующих средних значений из каждого набора наблюдений и деления на соответствующие стандартные отклонения… В множественной регрессии, когда несколько Используются переменные X, стандартизированные коэффициенты регрессии количественно определяют относительный вклад каждой переменной X».

Однако Катнер и др. ^[13] (стр. 278) делают следующее предостережение: «… нужно быть осторожным при интерпретации любых коэффициентов регрессии, независимо от того, стандартизированы они или нет. Причина в том, что, когда переменные-предикторы коррелируют между собой,… на коэффициенты регрессии влияют другие переменные-предикторы. в модели… На величины стандартизированных коэффициентов регрессии влияет не только наличие корреляций между переменными-предикторами, но и интервалы наблюдений по каждой из этих переменных. Иногда эти интервалы могут быть совершенно произвольными. обычно неразумно интерпретировать величины стандартизированных коэффициентов регрессии как отражающие сравнительную важность переменных-предикторов».

Стандартизация в математической статистике

В математической статистике случайная величина X стандартизируется ожидаемого путем вычитания ее значения. $\operatorname {E} [X]$ и разделив разницу на ее стандартное отклонение $\sigma (X)={\sqrt {\operatorname {Var} (X)}}:$

Z={X-\operatorname {E} [X] \over \sigma (X)}

Если рассматриваемая случайная величина является выборочным средним случайной выборки $\ X_{1},\dots ,X_{n}$ из X :

{\bar {X}}={1 \over n}\sum _{i=1}^{n}X_{i}

тогда стандартизированная версия

Z={\frac {{\bar {X}}-\operatorname {E} [{\bar {X}}]}{\sigma (X)/{\sqrt {n}}}}

При этом дисперсия стандартизированного выборочного среднего рассчитывалась следующим образом:

{\begin{array}{l}\operatorname {Var} \left(\sum x_{i}\right)=\sum \operatorname {Var} (x_{i})=n\operatorname {Var} (x_{i})=n\sigma ^{2}\\\operatorname {Var} ({\overline {X}})=\operatorname {Var} \left({\frac {\sum x_{i}}{n}}\right)={\frac {1}{n^{2}}}\operatorname {Var} \left(\sum x_{i}\right)={\frac {n\sigma ^{2}}{n^{2}}}={\frac {\sigma ^{2}}{n}}\end{array}}

Т-оценка

В оценке образования T-показатель представляет собой стандартный балл Z, сдвинутый и масштабированный так, чтобы его среднее значение составляло 50, а стандартное отклонение - 10. ^[14]^[15]^[16] На японском языке оно также известно как хенсати , где это понятие гораздо более широко известно и используется при поступлении в среднюю школу и университет.

При измерении плотности костей Т-показатель представляет собой стандартный показатель измерения по сравнению с популяцией здоровых 30-летних взрослых и имеет обычное среднее значение 0 и стандартное отклонение 1. ^[17]

См. также

Ссылки

^ Малдерс, Мартин; Зандериги, Джулия, ред. (2017). Европейская школа физики высоких энергий 2015: Банско, Болгария, 02–15 сентября 2015 г. Желтые отчеты ЦЕРН: Школьные материалы. Женева: ЦЕРН. ISBN 978-92-9083-472-4 .
^ Гросс, Эйлам (06 ноября 2017 г.). «Практическая статистика по физике высоких энергий» . Желтые отчеты ЦЕРН: Школьные материалы . 4/2017: 165–186. дои : 10.23730/CYRSP-2017-004.165 .
^ Э. Крейциг (1979). Высшая инженерная математика (Четвертое изд.). Уайли. п. 880, экв. 5. ISBN 0-471-02140-7 .
^ Шпигель, Мюррей Р.; Стивенс, Ларри Дж. (2008), Статистика очертаний Шаума (Четвертое изд.), McGraw Hill, ISBN 978-0-07-148584-5
^ Менденхолл, Уильям; Синчич, Терри (2007), Статистика техники и наук (Пятое изд.), Пирсон / Прентис Холл, ISBN 978-0131877061
^ Гланц, Стэнтон А.; Слинкер, Брайан К.; Нейландс, Торстен Б. (2016), Учебник по прикладной регрессии и дисперсионному анализу (Третье изд.), McGraw Hill, ISBN 978-0071824118
^ Ахо, Кен А. (2014), Фундаментальная и прикладная статистика для биологов (первое издание), Chapman & Hall / CRC Press, ISBN 978-1439873380
^ Э. Крейциг (1979). Высшая инженерная математика (Четвертое изд.). Уайли. п. 880, экв. 6. ISBN 0-471-02140-7 .
^ Дьес, Дэвид; Барр, Кристофер; Четинкая-Рундель, Моя (2012), Статистика OpenIntro (второе изд.), openintro.org
^ Эверитт, Брайан; Хотхорн, Торстен Дж. (2011), Введение в прикладной многомерный анализ с помощью R , Springer, ISBN 978-1441996497
^ Джонсон, Ричард; Wichern, Wichern (2007), Прикладной многомерный статистический анализ , Пирсон / Прентис Холл
^ Афифи, Абдельмонем; Мэй, Сюзанна К.; Кларк, Вирджиния А. (2012), Практический многомерный анализ (пятое изд.), Chapman & Hall/CRC, ISBN 978-1439816806
^ Катнер, Майкл; Нахтсхайм, Кристофер; Нетер, Джон (204), Прикладные модели линейной регрессии (Четвертое изд.), McGraw Hill, ISBN 978-0073014661
^ Джон Сальвиа; Джеймс Исселдайк; Сара Уитмер (29 января 2009 г.). Оценка: в специальном и инклюзивном образовании . Cengage Обучение. стр. 43–. ISBN 978-0-547-13437-6 .
^ Эдвард С. Нойкруг; Р. Чарльз Фосетт (1 января 2014 г.). Основы тестирования и оценки: практическое руководство для консультантов, социальных работников и психологов . Cengage Обучение. стр. 133–. ISBN 978-1-305-16183-2 .
^ Рэнди В. Кампхаус (16 августа 2005 г.). Клиническая оценка интеллекта детей и подростков . Спрингер. стр. 123–. ISBN 978-0-387-26299-4 .
^ «Измерение костной массы: что означают цифры» . Национальный ресурсный центр NIH по остеопорозу и связанным с ним заболеваниям костей . Национальный институт здоровья . Проверено 5 августа 2017 г.

Дальнейшее чтение

Кэрролл, Сьюзан Ровецци; Кэрролл, Дэвид Дж. (2002). Статистика стала простой для руководителей школ (иллюстрированное издание). Роуман и Литтлфилд. ISBN 978-0-8108-4322-6 . Проверено 7 июня 2009 г.
Ларсен, Ричард Дж.; Маркс, Моррис Л. (2000). Введение в математическую статистику и ее приложения (Третье изд.). п. 282. ИСБН 0-13-922303-7 .

Внешние ссылки

калькулятор z-оценки

[1] Малдерс, Мартин; Зандериги, Джулия, ред. (2017). Европейская школа физики высоких энергий 2015: Банско, Болгария, 02–15 сентября 2015 г. Желтые отчеты ЦЕРН: Школьные материалы. Женева: ЦЕРН. ISBN 978-92-9083-472-4 .

[2] Гросс, Эйлам (06 ноября 2017 г.). «Практическая статистика по физике высоких энергий» . Желтые отчеты ЦЕРН: Школьные материалы . 4/2017: 165–186. дои : 10.23730/CYRSP-2017-004.165 .

[3] Э. Крейциг (1979). Высшая инженерная математика (Четвертое изд.). Уайли. п. 880, экв. 5. ISBN 0-471-02140-7 .

[SpiegelStephens2008-4] Шпигель, Мюррей Р.; Стивенс, Ларри Дж. (2008), Статистика очертаний Шаума (Четвертое изд.), McGraw Hill, ISBN 978-0-07-148584-5

[Mendenhall2007-5] Менденхолл, Уильям; Синчич, Терри (2007), Статистика техники и наук (Пятое изд.), Пирсон / Прентис Холл, ISBN 978-0131877061

[GlantzSlinker2016-6] Гланц, Стэнтон А.; Слинкер, Брайан К.; Нейландс, Торстен Б. (2016), Учебник по прикладной регрессии и дисперсионному анализу (Третье изд.), McGraw Hill, ISBN 978-0071824118

[Aho2014-7] Ахо, Кен А. (2014), Фундаментальная и прикладная статистика для биологов (первое издание), Chapman & Hall / CRC Press, ISBN 978-1439873380

[8] Э. Крейциг (1979). Высшая инженерная математика (Четвертое изд.). Уайли. п. 880, экв. 6. ISBN 0-471-02140-7 .

[Diez2012-9] Дьес, Дэвид; Барр, Кристофер; Четинкая-Рундель, Моя (2012), Статистика OpenIntro (второе изд.), openintro.org

[EverittHothorn2011-10] Эверитт, Брайан; Хотхорн, Торстен Дж. (2011), Введение в прикладной многомерный анализ с помощью R , Springer, ISBN 978-1441996497

[JohnsonWichern2007-11] Джонсон, Ричард; Wichern, Wichern (2007), Прикладной многомерный статистический анализ , Пирсон / Прентис Холл

[AfifiMayClark2012-12] Афифи, Абдельмонем; Мэй, Сюзанна К.; Кларк, Вирджиния А. (2012), Практический многомерный анализ (пятое изд.), Chapman & Hall/CRC, ISBN 978-1439816806

[KutnerNachtsheim2004-13] Катнер, Майкл; Нахтсхайм, Кристофер; Нетер, Джон (204), Прикладные модели линейной регрессии (Четвертое изд.), McGraw Hill, ISBN 978-0073014661

[14] Джон Сальвиа; Джеймс Исселдайк; Сара Уитмер (29 января 2009 г.). Оценка: в специальном и инклюзивном образовании . Cengage Обучение. стр. 43–. ISBN 978-0-547-13437-6 .

[15] Эдвард С. Нойкруг; Р. Чарльз Фосетт (1 января 2014 г.). Основы тестирования и оценки: практическое руководство для консультантов, социальных работников и психологов . Cengage Обучение. стр. 133–. ISBN 978-1-305-16183-2 .

[16] Рэнди В. Кампхаус (16 августа 2005 г.). Клиническая оценка интеллекта детей и подростков . Спрингер. стр. 123–. ISBN 978-0-387-26299-4 .

[17] «Измерение костной массы: что означают цифры» . Национальный ресурсный центр NIH по остеопорозу и связанным с ним заболеваниям костей . Национальный институт здоровья . Проверено 5 августа 2017 г.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]