Jump to content

Нормализация (статистика)

В статистике и ее приложениях нормализация может иметь разные значения. [1] В простейших случаях нормализация рейтингов означает приведение значений, измеренных по разным шкалам, к условно общей шкале, часто перед усреднением. В более сложных случаях нормализация может относиться к более сложным корректировкам, цель которых состоит в том, чтобы привести в соответствие все распределения вероятностей скорректированных значений. В случае нормализации баллов при оценивании образования может возникнуть намерение привести распределения к нормальному распределению . Другой подход к нормализации распределений вероятностей — это квантильная нормализация , при которой квантили различных показателей выравниваются.

В другом использовании в статистике нормализация относится к созданию смещенных и масштабированных версий статистики, цель которой состоит в том, чтобы эти нормализованные значения позволяли сравнивать соответствующие нормализованные значения для разных наборов данных таким образом, чтобы исключить эффекты определенных грубых влияний, например в аномальном временном ряду . Некоторые типы нормализации включают только изменение масштаба для получения значений относительно некоторой переменной размера. С точки зрения уровней измерения такие отношения имеют смысл только для измерений отношений (где отношения измерений имеют смысл), а не интервальных измерений (где имеют значение только расстояния, но не отношения).

В теоретической статистике параметрическая нормализация часто может привести к основным величинам – функциям, выборочное распределение которых не зависит от параметров – и к вспомогательной статистике – основным величинам, которые можно вычислить на основе наблюдений, не зная параметров.

В статистике существуют различные типы нормализации – безразмерные отношения ошибок, остатков, средних и стандартных отклонений , которые, следовательно, являются масштабно-инвариантными – некоторые из них можно резюмировать следующим образом. Обратите внимание, что с точки зрения уровней измерения эти отношения имеют смысл только для измерений отношений (где отношения измерений имеют смысл), а не интервальных измерений (где имеют значение только расстояния, но не отношения). См. также Категория: Статистические коэффициенты .

Имя Формула Использовать
Стандартная оценка Ошибки нормализации, когда параметры популяции известны. Хорошо работает для популяций, которые обычно распределены [2]
Т-статистика Стьюдента отклонение расчетного значения параметра от его гипотетического значения, нормированного на его стандартную ошибку.
Стьюдентизированный остаток Нормализация остатков при оценке параметров, особенно по различным точкам данных в регрессионном анализе .
Стандартизированный момент Нормирующие моменты с использованием стандартного отклонения как мера масштаба.
Коэффициент
вариация
Нормализация дисперсии с использованием среднего значения как мера масштаба, особенно для положительного распределения, такого как экспоненциальное распределение и распределение Пуассона .
Мин-макс масштабирование функций Масштабирование признаков используется для приведения всех значений в диапазон [0,1]. Это также называется нормализацией на основе единицы. Это можно обобщить, чтобы ограничить диапазон значений в наборе данных между любыми произвольными точками. и , используя, например .

Обратите внимание, что некоторые другие отношения, такие как отношение дисперсии к среднему, , также выполняются для нормализации, но не являются безразмерными: единицы не сокращаются, и, следовательно, отношение имеет единицы и не является масштабно-инвариантным.

Другие типы

[ редактировать ]

Другие безразмерные нормализации, которые можно использовать без каких-либо предположений о распределении, включают:

  • Назначение процентилей . Это обычное явление в стандартизированных тестах. См. также квантильную нормализацию .
  • Нормализация путем сложения и/или умножения на константы, чтобы значения находились в диапазоне от 0 до 1. Это используется для функций плотности вероятности с приложениями в таких областях, как квантовая механика, при присвоении вероятностей | ψ | 2 .

См. также

[ редактировать ]
  1. ^ Додж, Ю. (2003) Оксфордский словарь статистических терминов , OUP. ISBN   0-19-920613-9 (запись для нормализации оценок)
  2. ^ Фридман, Дэвид; Пизани, Роберт; Первс, Роджер (20 февраля 2007 г.). Статистика: Четвертое международное студенческое издание . WW Нортон и компания. ISBN  9780393930436 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: fca5bd494ec79e22f2720bccc2042359__1707098280
URL1:https://arc.ask3.ru/arc/aa/fc/59/fca5bd494ec79e22f2720bccc2042359.html
Заголовок, (Title) документа по адресу, URL1:
Normalization (statistics) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)