Jump to content

Смещение оценщика

(Перенаправлено с предвзятости оценщика )

В статистике смещение оценщика (или функции смещения ) — это разница между оценщика этого ожидаемым значением и истинным значением оцениваемого параметра. Оценщик или правило принятия решения с нулевым смещением называется несмещенным . В статистике «предвзятость» — это объективное свойство оценщика. Смещение - это понятие, отличное от последовательности : непротиворечивые оценки сходятся по вероятности к истинному значению параметра, но могут быть смещенными или несмещенными; см . предвзятость и последовательность подробнее .

При прочих равных условиях несмещенная оценка предпочтительнее, чем смещенная, хотя на практике часто используются смещенные оценки (как правило, с небольшой погрешностью). При использовании смещенной оценки вычисляются границы смещения. Смещенная оценка может использоваться по разным причинам: потому что несмещенная оценка не существует без дополнительных предположений о совокупности; потому что оценку сложно вычислить (как при несмещенной оценке стандартного отклонения ); потому что смещенная оценка может быть несмещенной по отношению к различным мерам центральной тенденции ; потому что смещенная оценка дает более низкое значение некоторой функции потерь (особенно среднеквадратичной ошибки ) по сравнению с несмещенными оценками (особенно в оценках усадки ); или потому, что в некоторых случаях несмещенность является слишком строгим условием, и единственные несмещенные оценки бесполезны.

Смещение также можно измерить по отношению к медиане , а не к среднему (ожидаемому значению), и в этом случае можно отличить медианное несмещенное от обычного свойства средней несмещенной. Несмещенность к среднему не сохраняется при нелинейных преобразованиях , хотя несмещенность к среднему сохраняется (см. § Эффект преобразований ); например, выборочная дисперсия является смещенной оценкой генеральной дисперсии. Все это проиллюстрировано ниже.

Непредвзятая оценка параметра не всегда должна существовать. Например, не существует несмещенной оценки обратной величины параметра биномиальной случайной величины. [1]

Определение

[ редактировать ]

Предположим, у нас есть статистическая модель , параметризованная действительным числом θ , что приводит к распределению вероятностей для наблюдаемых данных: и статистика который служит оценкой θ данных на основе любых наблюдаемых . То есть мы предполагаем, что наши данные подчиняются некоторому неизвестному распределению. (где θ — фиксированная неизвестная константа, являющаяся частью этого распределения), а затем мы строим некоторую оценку который сопоставляет наблюдаемые данные со значениями, которые, как мы надеемся, близки к θ . Предвзятость относительно определяется как [2]

где обозначает ожидаемое значение по распределению (т.е. усреднение по всем возможным наблюдениям ). Второе уравнение следует из того, что θ измеримо относительно условного распределения .

Оценщик считается несмещенным , если его смещение равно нулю для всех значений параметра θ или, что то же самое, если ожидаемое значение средства оценки соответствует ожидаемому значению параметра. [3] Непредвзятость не гарантирована. Например, если является несмещенной оценкой параметра θ , не гарантируется, что g( ) является несмещенной оценкой g( θ). [4]

В моделирующем эксперименте, касающемся свойств оценщика, смещение оценщика можно оценить, используя среднюю знаковую разность .

Выборочная дисперсия

[ редактировать ]

Выборочная дисперсия случайной величины демонстрирует два аспекта систематической ошибки оценки: во-первых, наивная оценка является смещенной, что можно исправить с помощью масштабного коэффициента; во-вторых, несмещенная оценка не является оптимальной с точки зрения среднеквадратической ошибки (MSE), которую можно минимизировать, используя другой масштабный коэффициент, что приводит к смещенной оценке с более низким MSE, чем у несмещенной оценки. Конкретно, наивная оценка суммирует квадраты отклонений и делит их на n, что является смещением. Вместо этого деление на n - 1 дает несмещенную оценку. И наоборот, MSE можно минимизировать путем деления на другое число (в зависимости от распределения), но это приводит к смещенной оценке. Это число всегда больше, чем n - 1, поэтому оно известно как оценка сокращения , поскольку оно «сжимает» несмещенную оценку к нулю; для нормального распределения оптимальное значение равно n + 1.

Предположим, что X 1 , ..., X n независимые и одинаково распределенные (iid) случайные величины с математическим ожиданием µ и дисперсией σ. 2 . Если выборочное среднее и неисправленная выборочная дисперсия определяются как

тогда С 2 является смещенной оценкой σ 2 , потому что

В продолжение заметим, что вычитая с обеих сторон , мы получаем

Значение (путем перекрестного умножения) . Тогда предыдущее становится:

В этом можно убедиться, обратив внимание на следующую формулу, которая следует из формулы Бьенеме для члена неравенства для ожидания неисправленной выборочной дисперсии выше: .

Другими словами, ожидаемое значение неисправленной выборочной дисперсии не равно популяционной дисперсии σ. 2 , если не умножено на коэффициент нормализации. С другой стороны, выборочное среднее является несмещенным. [5] оценщик среднего значения совокупности μ . [3]

Обратите внимание, что обычное определение выборочной дисперсии таково: , и это несмещенная оценка дисперсии генеральной совокупности.

Алгебраически говоря, является объективным, потому что:

где переход ко второй строке использует результат, полученный выше для смещенной оценки. Таким образом , и поэтому - несмещенная оценка генеральной дисперсии, σ 2 . Отношение между смещенной (нескорректированной) и несмещенной оценками дисперсии известно как поправка Бесселя .

Причина того, что неисправленная выборочная дисперсия S 2 , является смещенным, связано с тем, что выборочное среднее представляет собой обычную оценку методом наименьших квадратов (OLS) для µ : это число, которое составляет сумму как можно меньше. То есть, когда в эту сумму подставляется любое другое число, сумма может только увеличиваться. В частности, выбор дает,

а потом

Приведенное выше обсуждение можно понять в геометрических терминах: вектор можно разложить на «среднюю часть» и «дисперсионную часть», проецируя в направлении и к ортогональной дополнительной гиперплоскости этого направления. Получаешь для части вместе и для дополнительной части. Поскольку это ортогональное разложение, теорема Пифагора гласит: , и приняв ожидания, получим , как указано выше (но раз ).Если распределение является вращательно-симметричным, как и в случае, когда выбираются из гауссова, то в среднем размерность вдоль способствует в равной степени, как направления, перпендикулярные , так что и . В целом это действительно так, как объяснялось выше.

Оценка вероятности Пуассона

[ редактировать ]

Гораздо более крайний случай, когда смещенная оценка лучше, чем любая несмещенная оценка, возникает из распределения Пуассона . [6] [7] Предположим, что X имеет распределение Пуассона с математическим ожиданием λ . Предположим, что требуется оценить

с выборкой размером 1. (Например, если входящие вызовы на телефонном коммутаторе моделируются как процесс Пуассона, а λ — среднее количество вызовов в минуту, то e −2 мин. — вероятность того, что в течение следующих двух минут не поступит ни одного звонка.)

Так как математическое ожидание несмещенной оценки δ ( X ) равно оценке , т.е.

единственная функция данных, составляющих несмещенную оценку, - это

Чтобы убедиться в этом, заметим, что при разложении e л из приведенного выше выражения для ожидания оставшаяся сумма представляет собой ряд Тейлора разложение e в л а также, что дает e л и л = и −2 мин. (см. Характеристики показательной функции ).

Если наблюдаемое значение X равно 100, то оценка равна 1, хотя истинное значение оцениваемой величины, скорее всего, будет около 0, что является противоположным крайним значением. А если X равен 101, то оценка становится еще более абсурдной: она равна -1, хотя оцениваемая величина должна быть положительной.

(Смещенная) оценка максимального правдоподобия

намного лучше, чем эта несмещенная оценка. Его значение не только всегда положительно, но и более точно в том смысле, что его среднеквадратическая ошибка

меньше; сравнить СКО несмещенной оценки

СКО являются функциями истинного значения λ . Смещение оценки максимального правдоподобия:

Максимум дискретного равномерного распределения

[ редактировать ]

Смещение оценок максимального правдоподобия может быть существенным. Рассмотрим случай, когда n билетов с номерами от 1 до n помещены в коробку, и один из них выбирается случайным образом, что дает X. значение Если n неизвестно, то оценкой максимального правдоподобия n является X , даже если математическое ожидание X при заданном n равно только ( n + 1)/2; мы можем быть уверены только в том, что n не меньше X , а возможно, и больше. В этом случае естественная несмещенная оценка равна 2 X − 1.

Медианно-несмещенные оценки

[ редактировать ]

Теория медианно -несмещенных оценок была возрождена Джорджем Брауном в 1947 году: [8]

Оценка одномерного параметра θ будет называться несмещенной по медиане, если при фиксированном θ медиана распределения оценки равна значению θ; т. е. оценка занижается так же часто, как и переоценивается. Кажется, что для большинства целей это требование удовлетворяет тем же требованиям, что и требование несмещенности по среднему, и обладает дополнительным свойством, состоящим в том, что оно инвариантно относительно взаимно однозначного преобразования.

Дополнительные свойства несмещенных по медиане оценок были отмечены Леманном, Бирнбаумом, ван дер Ваартом и Пфанзаглем. [9] В частности, несмещенные по медиане оценки существуют в тех случаях, когда несмещенные по среднему значению и оценки максимального правдоподобия не существуют оценки, . Они инвариантны относительно взаимно однозначных преобразований .

Существуют методы построения несмещенных по медиане оценок для распределений вероятностей, которые имеют монотонные функции правдоподобия , такие как однопараметрические экспоненциальные семейства, чтобы гарантировать, что они оптимальны (в смысле, аналогичном свойству минимальной дисперсии, рассматриваемому для несмещенных к среднему оценок). . [10] [11] Одна из таких процедур является аналогом процедуры Рао-Блэквелла для несмещенных в среднее оценок: эта процедура справедлива для меньшего класса распределений вероятностей, чем процедура Рао-Блэквелла для несмещенной в среднем оценки, но для более широкого класса функций потерь. [11]

Смещение по отношению к другим функциям потерь

[ редактировать ]

с минимальной дисперсией Любая несмещенная в среднем оценка минимизирует риск ( ожидаемые потери квадратичной ошибки ) по отношению к функции потерь (среди несмещенных в среднем оценок), как заметил Гаусс . [12] -несмещенная оценка с минимальным средним абсолютным отклонением Медианно минимизирует риск в отношении функции абсолютных потерь (среди медианно-несмещенных оценок), как заметил Лаплас . [12] [13] Другие функции потерь используются в статистике, особенно в робастной статистике . [12] [14]

Эффект преобразований

[ редактировать ]

Для одномерных параметров несмещенные по медиане оценки остаются несмещенными по медиане при преобразованиях , которые сохраняют порядок (или обратный порядок).Обратите внимание, что когда преобразование применяется к несмещенной к среднему оценке, результат не обязательно должен быть несмещенной к среднему оценке соответствующей статистики населения. Согласно неравенству Йенсена , выпуклая функция при преобразовании будет вносить положительное смещение, тогда как вогнутая функция будет вносить отрицательное смещение, а функция смешанной выпуклости может вносить смещение в любом направлении, в зависимости от конкретной функции и распределения. То есть для нелинейной функции f и несмещенной в среднем оценки U параметра p составная оценка f ( U ) не обязательно должна быть несмещенной в среднем оценкой f ( p ). Например, квадратный корень из несмещенной оценки дисперсии генеральной совокупности не несмещенной является оценкой стандартного отклонения генеральной совокупности : квадратный корень из несмещенной дисперсии выборки , скорректированное стандартное отклонение выборки , является смещенным. Смещение зависит как от выборочного распределения оценщика, так и от преобразования, и его расчет может быть весьма сложным - см. несмещенная оценка стандартного отклонения для обсуждения в этом случае.

Смещение, дисперсия и среднеквадратическая ошибка

[ редактировать ]
Выборочные распределения двух альтернативных оценок параметра β 0 . Хотя β 1 ^ несмещен, то он явно уступает смещенному β 2 ^ .

Ридж-регрессия является одним из примеров метода, в котором допущение небольшой систематической ошибки может привести к значительному уменьшению дисперсии и повышению надежности оценок в целом.

Хотя смещение количественно определяет среднюю ожидаемую разницу между оценщиком и базовым параметром, можно дополнительно ожидать, что оценщик, основанный на конечной выборке, будет отличаться от параметра из-за случайности в выборке.Оценщик, который минимизирует смещение, не обязательно минимизирует среднеквадратическую ошибку.Одной из мер, которая используется для отражения обоих типов различий, является среднеквадратическая ошибка . [2]

Можно показать, что оно равно квадрату смещения плюс дисперсия: [2]

Если параметр является вектором, применяется аналогичное разложение: [15]

где - след (диагональная сумма) ковариационной матрицы средства оценки и – норма квадратного вектора .

Пример: оценка дисперсии генеральной совокупности.

[ редактировать ]

Например, [16] предположим, что имеется оценка формы

ищется дисперсия генеральной совокупности, как указано выше, но на этот раз для минимизации MSE:

Если переменные X 1 ... X n имеют нормальное распределение, то nS 2 /п 2 имеет распределение хи-квадрат с n - 1 степенями свободы, что дает:

и так

С помощью небольшой алгебры можно подтвердить, что именно c = 1/( n + 1) минимизирует эту объединенную функцию потерь, а не c = 1/( n - 1), которая минимизирует только квадрат смещения.

В более общем плане только в ограниченных классах задач будет существовать средство оценки, которое минимизирует MSE независимо от значений параметров.

Однако очень часто можно предположить, что существует компромисс между смещением и дисперсией , когда небольшое увеличение смещения можно обменять на большее уменьшение дисперсии, что в целом приводит к более желательной оценке.

Байесовский взгляд

[ редактировать ]

Большинство байесовцев совершенно не беспокоится о несмещенности (по крайней мере, в формальном смысле теории выборки, изложенном выше) своих оценок. Например, Гельман и соавторы (1995) пишут: «С байесовской точки зрения принцип несмещенности разумен в пределах больших выборок, но в остальном он потенциально вводит в заблуждение». [17]

По сути, разница между байесовским подходом и описанным выше подходом теории выборки заключается в том, что в подходе теории выборки параметр считается фиксированным, а затем рассматриваются вероятностные распределения статистики на основе прогнозируемого выборочного распределения данных. Однако для байесовского подхода это данные , которые известны и фиксированы, и это неизвестный параметр, для которого делается попытка построить распределение вероятностей, используя теорему Байеса :

Здесь второй член — вероятность данных при неизвестном значении параметра θ — зависит только от полученных данных и моделирования процесса генерации данных. Однако байесовский расчет также включает в себя первый член, априорную вероятность для θ, которая учитывает все, что аналитик может знать или подозревать о θ до того, как поступят данные. Эта информация не играет никакой роли в подходе теории выборки; действительно, любая попытка включить его будет рассматриваться как «отклонение» от того, на что указывают исключительно данные. Поскольку байесовские расчеты включают в себя априорную информацию, поэтому практически неизбежно, что их результаты не будут «несмещенными» с точки зрения теории выборки.

Но результаты байесовского подхода могут отличаться от подхода теории выборки, даже если байесовский подход пытается принять «неинформативный» априор.

Например, рассмотрим еще раз оценку неизвестной генеральной дисперсии σ 2 нормального распределения с неизвестным средним значением, где желательно оптимизировать c в функции ожидаемых потерь

Стандартным выбором неинформативного априора для этой задачи является априор Джеффриса , , что эквивалентно принятию априорной плоскости, инвариантной к масштабированию, для ln(σ 2 ) .

Одним из последствий принятия этого априора является то, что S 2 /п 2 остается ключевой величиной , т.е. распределением вероятностей S 2 /п 2 зависит только от S 2 /п 2 , независимо от значения S 2 или σ 2 :

Однако в то время как

в отличие

- когда ожидание принимается за распределение вероятностей σ 2 учитывая S 2 , как в байесовском случае, а не S 2 учитывая σ 2 , уже нельзя брать σ 4 как константу и вынесите ее на множитель. Следствием этого является то, что по сравнению с расчетом по теории выборки байесовский расчет придает больший вес большим значениям σ. 2 , правильно принимая во внимание (чего не могут сделать вычисления по теории выборки), что при этой функции квадрата потерь следствие недооценки больших значений σ 2 с точки зрения квадрата потерь обходится дороже, чем переоценка малых значений σ. 2 .

Разработанный байесовский расчет дает масштабированное обратное распределение хи-квадрат с n - 1 степенями свободы для апостериорного распределения вероятностей σ. 2 . Ожидаемые потери минимизируются, когда cnS 2 = <σ 2 >; это происходит, когда c = 1/( n − 3).

Таким образом, даже при неинформативном априорном подходе байесовский расчет может не дать такого же результата по минимизации ожидаемых потерь, как соответствующий расчет по теории выборки.

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ «Почему для биномиального распределения не существует несмещенной оценки для $1/p$?» . Математический обмен стеками . Проверено 27 декабря 2023 г.
  2. ^ Перейти обратно: а б с Коздрон, Михаил (март 2016 г.). «Оценка качества оценщика: смещение, среднеквадратическая ошибка, относительная эффективность (глава 3)» (PDF) . stat.math.uregina.ca . Проверено 11 сентября 2020 г.
  3. ^ Перейти обратно: а б Тейлор, Кортни (13 января 2019 г.). «Непредвзятые и смещенные оценки» . МысльКо . Проверено 12 сентября 2020 г.
  4. ^ Деккинг, Мишель, изд. (2005). Современное введение в вероятность и статистику: понимание почему и как . Тексты Спрингера в статистике. Лондон [Гейдельберг]: Springer. ISBN  978-1-85233-896-1 .
  5. ^ Ричард Арнольд Джонсон; Дин В. Вичерн (2007). Прикладной многомерный статистический анализ . Пирсон Прентис Холл. ISBN  978-0-13-187715-3 . Проверено 10 августа 2012 г.
  6. ^ Романо, Япония; Сигел, А.Ф. (1986). Контрпримеры в теории вероятности и статистике . Монтерей, Калифорния, США: Уодсворт и Брукс / Коул. п. 168.
  7. ^ Харди, М. (1 марта 2003 г.). «Ясный контрпример». Американский математический ежемесячник . 110 (3): 234–238. arXiv : math/0206006 . дои : 10.2307/3647938 . ISSN   0002-9890 . JSTOR   3647938 .
  8. ^ Браун (1947), стр. 583
  9. ^ Леманн 1951 ; Бирнбаум 1961 ; Ван дер Ваарт 1961 ; Пфанзагль 1994 г.
  10. ^ Пфанзагль, Иоганн (1979). «Об оптимальных медианных несмещенных оценках при наличии мешающих параметров» . Анналы статистики . 7 (1): 187–193. дои : 10.1214/aos/1176344563 .
  11. ^ Перейти обратно: а б Браун, Л.Д.; Коэн, Артур; Стродерман, МЫ (1976). «Теорема о полном классе для строгого монотонного отношения правдоподобия с приложениями» . Энн. Статист . 4 (4): 712–722. дои : 10.1214/aos/1176343543 .
  12. ^ Перейти обратно: а б с Додж, Ядола, изд. (1987). Статистический анализ данных на основе L 1 -нормы и родственных методов . Материалы Первой международной конференции, состоявшейся в Невшателе, 31 августа – 4 сентября 1987 г. Амстердам: Северная Голландия. ISBN  0-444-70273-3 .
  13. ^ Джейнс, ET (2007). Теория вероятностей: Логика науки . Кембридж: Кембриджский университет. Нажимать. п. 172. ИСБН  978-0-521-59271-0 .
  14. ^ Клебанов Лев Борисович; Рачев Светлозар Т.; Фабоцци, Фрэнк Дж. (2009). «Функции потерь и теория несмещенной оценки». Робастные и неробастные модели в статистике . Нью-Йорк: Нова Сайентифик. ISBN  978-1-60741-768-2 .
  15. ^ Табога, Марко (2010). «Лекции по теории вероятностей и математической статистике» .
  16. ^ ДеГрут, Моррис Х. (1986). Вероятность и статистика (2-е изд.). Аддисон-Уэсли. стр. 414 –5. ISBN  0-201-11366-Х . Но сравните это, например, с обсуждением в Казелла; Бергер (2001). Статистический вывод (2-е изд.). Даксбери. п. 332. ИСБН  0-534-24312-6 .
  17. ^ Гельман А.; и др. (1995). Байесовский анализ данных . Чепмен и Холл. п. 108. ИСБН  0-412-03991-5 .
  • Браун, Джордж В. «Об оценке малой выборки». Анналы математической статистики , вып. 18, нет. 4 (декабрь 1947 г.), стр. 582–585. JSTOR   2236236 .
  • Леманн, Э.Л. (декабрь 1951 г.). «Общая концепция беспристрастности». Анналы математической статистики . 22 (4): 587–592. JSTOR   2236928 .
  • Бирнбаум, Аллан (март 1961 г.). «Единая теория оценки, I». Анналы математической статистики . 32 (1): 112–135. {{cite journal}}: CS1 maint: дата и год ( ссылка )
  • Ван дер Ваарт, HR (июнь 1961 г.). «Некоторые расширения идеи предвзятости» . Анналы математической статистики . 32 (2): 436–447. {{cite journal}}: CS1 maint: дата и год ( ссылка )
  • Пфанзагль, Иоганн (1994). Параметрическая статистическая теория . Вальтер де Грюйтер.
  • Стюарт, Алан; Орд, Кейт; Арнольд, Стивен [Ф.] (2010). Классический вывод и линейная модель . Продвинутая теория статистики Кендалла. Том. 2А. Уайли. ISBN  978-0-4706-8924-0 . .
  • Воинов, Василий [Г.]; Никулин, Михаил [С.] (1993). Несмещенные оценки и их приложения . Том. 1: Одномерный случай. Дордрект: Kluwer Academic Publishers. ISBN  0-7923-2382-3 .
  • Воинов, Василий [Г.]; Никулин, Михаил [С.] (1996). Несмещенные оценки и их приложения . Том. 2: Многомерный случай. Дордрект: Kluwer Academic Publishers. ISBN  0-7923-3939-8 .
  • Клебанов, Лев [Б.]; Рачев, Светлозар [Т.]; Фабоцци, Фрэнк [Дж.] (2009). Робастные и неробастные модели в статистике . Нью-Йорк: Издательство Nova Scientific. ISBN  978-1-60741-768-2 .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 479c09410b123eed25a9b384edb87073__1719687660
URL1:https://arc.ask3.ru/arc/aa/47/73/479c09410b123eed25a9b384edb87073.html
Заголовок, (Title) документа по адресу, URL1:
Bias of an estimator - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)