Смещение оценщика

Из Википедии, бесплатной энциклопедии

В статистике смещение оценщика (или функции смещения ) — это разница между оценщика этого ожидаемым значением и истинным значением оцениваемого параметра. Оценщик или правило принятия решения с нулевым смещением называется несмещенным . В статистике «предвзятость» — это объективное свойство оценщика. Смещение - это понятие, отличное от последовательности : непротиворечивые оценки сходятся по вероятности к истинному значению параметра, но могут быть смещенными или несмещенными; см. предвзятость и последовательность для получения дополнительной информации.

При прочих равных условиях несмещенная оценка предпочтительнее, чем смещенная, хотя на практике часто используются смещенные оценки (как правило, с небольшой погрешностью). При использовании смещенной оценки вычисляются границы смещения. Смещенная оценка может использоваться по разным причинам: потому что несмещенная оценка не существует без дополнительных предположений о совокупности; потому что оценщик трудно вычислить (как при несмещенной оценке стандартного отклонения ); потому что смещенная оценка может быть несмещенной по отношению к различным мерам центральной тенденции ; потому что смещенная оценка дает более низкое значение некоторой функции потерь (особенно среднеквадратичной ошибки ) по сравнению с несмещенными оценками (особенно в оценках усадки ); или потому, что в некоторых случаях несмещенность является слишком строгим условием, и единственные несмещенные оценки бесполезны.

Смещение также можно измерить относительно медианы , а не среднего (ожидаемого значения), и в этом случае можно отличить медианное несмещенное от обычного свойства средней несмещенной. Несмещенность к среднему не сохраняется при нелинейных преобразованиях , хотя несмещенность к среднему сохраняется (см. § Эффект преобразований ); например, выборочная дисперсия является смещенной оценкой генеральной дисперсии. Все это проиллюстрировано ниже.

Непредвзятая оценка параметра не всегда должна существовать. Например, не существует несмещенной оценки обратной величины параметра биномиальной случайной величины. [1]

Определение [ править ]

Предположим, у нас есть статистическая модель , параметризованная действительным числом θ , что приводит к распределению вероятностей для наблюдаемых данных: и статистика служит оценкой θ который на основе любых наблюдаемых данных . То есть мы предполагаем, что наши данные подчиняются некоторому неизвестному распределению. (где θ — фиксированная неизвестная константа, являющаяся частью этого распределения), а затем мы строим некоторую оценку который сопоставляет наблюдаемые данные со значениями, которые, как мы надеемся, близки к θ . Предвзятость относительно определяется как [2]

где обозначает ожидаемое значение по распределению (т.е. усреднение по всем возможным наблюдениям ). Второе уравнение следует из того, что θ измеримо относительно условного распределения .

Оценщик считается несмещенным, если его смещение равно нулю для всех значений параметра θ или, что то же самое, если ожидаемое значение средства оценки соответствует ожидаемому значению параметра. [3] Непредвзятость не гарантирована. Например, если является несмещенной оценкой параметра θ , не гарантируется, что g( ) является несмещенной оценкой g( θ). [4]

В моделирующем эксперименте, касающемся свойств оценщика, смещение оценщика можно оценить, используя среднюю знаковую разность .

Примеры [ править ]

Выборочная дисперсия [ править ]

Выборочная дисперсия случайной величины демонстрирует два аспекта систематической ошибки оценки: во-первых, наивная оценка является смещенной, что можно исправить с помощью масштабного коэффициента; во-вторых, несмещенная оценка не является оптимальной с точки зрения среднеквадратической ошибки (MSE), которую можно минимизировать, используя другой масштабный коэффициент, что приводит к смещенной оценке с более низким MSE, чем у несмещенной оценки. Конкретно, наивная оценка суммирует квадраты отклонений и делит их на n, что является смещением. Вместо этого деление на n - 1 дает несмещенную оценку. И наоборот, MSE можно минимизировать путем деления на другое число (в зависимости от распределения), но это приводит к смещенной оценке. Это число всегда больше, чем n - 1, поэтому оно известно как оценка сжатия , поскольку оно «сжимает» несмещенную оценку к нулю; для нормального распределения оптимальное значение равно n + 1.

Предположим, что X 1 , ..., X n независимые и одинаково распределенные (iid) случайные величины с математическим ожиданием µ и дисперсией σ. 2 . Если выборочное среднее и неисправленная выборочная дисперсия определяются как

тогда С 2 является смещенной оценкой σ 2 , потому что

В продолжение заметим, что вычитая с обеих сторон , мы получаем

Значение (путем перекрестного умножения) . Тогда предыдущее становится:

В этом можно убедиться, обратив внимание на следующую формулу, которая следует из формулы Бьенеме для члена неравенства для ожидания неисправленной выборочной дисперсии выше: .

Другими словами, ожидаемое значение неисправленной выборочной дисперсии не равно популяционной дисперсии σ. 2 , если не умножено на коэффициент нормализации. С другой стороны, выборочное среднее является несмещенным. [5] оценщик среднего значения совокупности μ . [3]

Обратите внимание, что обычное определение выборочной дисперсии таково: , и это несмещенная оценка дисперсии генеральной совокупности.

Алгебраически говоря, является объективным, потому что:

где переход ко второй строке использует результат, полученный выше для смещенной оценки. Таким образом , и поэтому - несмещенная оценка генеральной дисперсии, σ 2 . Отношение между смещенной (нескорректированной) и несмещенной оценками дисперсии известно как поправка Бесселя .

Причина того, что неисправленная выборочная дисперсия S 2 , является смещенным, связано с тем, что выборочное среднее представляет собой обычную оценку методом наименьших квадратов (OLS) для μ : это число, которое составляет сумму как можно меньше. То есть, когда в эту сумму подставляется любое другое число, сумма может только увеличиваться. В частности, выбор дает,

а потом

Приведенное выше обсуждение можно понять в геометрических терминах: вектор можно разложить на «среднюю часть» и «дисперсионную часть», проецируя в направлении и к ортогональной дополнительной гиперплоскости этого направления. Получаешь для части вместе и для дополнительной части. Поскольку это ортогональное разложение, теорема Пифагора гласит: , и приняв ожидания, получим , как указано выше (но раз ). Если распределение является вращательно-симметричным, как и в случае, когда выбираются из гауссова, то в среднем размерность вдоль способствует в равной степени, как направления, перпендикулярные , так что и . В целом это действительно так, как объяснялось выше.

Пуассона Оценка вероятности

Гораздо более крайний случай, когда смещенная оценка лучше, чем любая несмещенная оценка, возникает из распределения Пуассона . [6] [7] Предположим, что X имеет распределение Пуассона с математическим ожиданием λ . Предположим, что требуется оценить

с выборкой размером 1. (Например, если входящие вызовы на телефонном коммутаторе моделируются как процесс Пуассона, а λ — среднее количество вызовов в минуту, то e −2 мин. — вероятность того, что в течение следующих двух минут не поступит ни одного звонка.)

Так как математическое ожидание несмещенной оценки δ ( X ) равно оценке , т.е.

единственная функция данных, составляющих несмещенную оценку, - это

Чтобы убедиться в этом, заметим, что при разложении e л из приведенного выше выражения для ожидания оставшаяся сумма представляет собой ряд Тейлора разложение e в л а также, что дает e л Это л = и −2 мин. (см. Характеристики показательной функции ).

Если наблюдаемое значение X равно 100, то оценка равна 1, хотя истинное значение оцениваемой величины, скорее всего, будет около 0, что является противоположным крайним значением. А если X равен 101, то оценка становится еще более абсурдной: она равна -1, хотя оцениваемая величина должна быть положительной.

(Смещенная) оценка максимального правдоподобия

намного лучше, чем эта несмещенная оценка. Его значение не только всегда положительно, но и более точно в том смысле, что его среднеквадратическая ошибка

меньше; сравнить СКО несмещенной оценки

СКО являются функциями истинного значения λ . Смещение оценки максимального правдоподобия:

дискретного Максимум распределения равномерного

Смещение оценок максимального правдоподобия может быть существенным. Рассмотрим случай, когда n билетов с номерами от 1 до n выбирается случайным образом, что дает значение X. помещены в коробку, и один из них Если n неизвестно, то оценкой максимального правдоподобия n является X , даже если математическое ожидание X при заданном n равно только ( n + 1)/2; мы можем быть уверены только в том, что n не меньше X , а возможно, и больше. В этом случае естественная несмещенная оценка равна 2 X − 1.

- оценки несмещенные Медианно

Теория медианно -несмещенных оценок была возрождена Джорджем Брауном в 1947 году: [8]

Оценка одномерного параметра θ будет называться несмещенной по медиане, если при фиксированном θ медиана распределения оценки равна значению θ; т. е. оценка занижается так же часто, как и переоценивается. Кажется, что для большинства целей это требование удовлетворяет тем же требованиям, что и требование несмещенности по среднему, и обладает дополнительным свойством, состоящим в том, что оно инвариантно относительно взаимно однозначного преобразования.

Дополнительные свойства несмещенных по медиане оценок были отмечены Леманном, Бирнбаумом, ван дер Ваартом и Пфанзаглем. [ нужна цитата ] В частности, несмещенные по медиане оценки существуют в тех случаях, когда , несмещенные по среднему значению и оценки максимального правдоподобия не существуют оценки . Они инвариантны относительно взаимно однозначных преобразований .

Существуют методы построения несмещенных по медиане оценок для распределений вероятностей, которые имеют монотонные функции правдоподобия , такие как однопараметрические экспоненциальные семейства, чтобы гарантировать, что они оптимальны (в смысле, аналогичном свойству минимальной дисперсии, рассматриваемому для несмещенных к среднему оценок). . [9] [10] Одна из таких процедур является аналогом процедуры Рао-Блэквелла для несмещенных в среднем оценок: процедура справедлива для меньшего класса распределений вероятностей, чем процедура Рао-Блэквелла для несмещенной в среднем оценки, но для более широкого класса функций потерь. [10]

отношению к другим функциям потерь по Смещение

с минимальной дисперсией Любая несмещенная по среднему оценщик минимизирует риск ( ожидаемые потери квадратичной ошибки ) по отношению к функции потерь (среди несмещенных по среднему оценок), как заметил Гаусс . [11] -несмещенная оценка с минимальным средним абсолютным отклонением Медианно минимизирует риск в отношении функции абсолютных потерь (среди медианно-несмещенных оценок), как заметил Лаплас . [11] [12] Другие функции потерь используются в статистике, особенно в робастной статистике . [11] [13]

Эффект трансформаций [ править ]

Для одномерных параметров несмещенные по медиане оценки остаются несмещенными по медиане при преобразованиях , которые сохраняют порядок (или обратный порядок). Обратите внимание, что когда преобразование применяется к несмещенной к среднему оценке, результат не обязательно должен быть несмещенной к среднему оценке соответствующей статистики населения. Согласно неравенству Йенсена , выпуклая функция при преобразовании будет вносить положительное смещение, тогда как вогнутая функция будет вносить отрицательное смещение, а функция смешанной выпуклости может вносить смещение в любом направлении, в зависимости от конкретной функции и распределения. То есть для нелинейной функции f и несмещенной в среднем оценки U параметра p составная оценка f ( U ) не обязательно должна быть несмещенной в среднем оценкой f ( p ). Например, квадратный корень из несмещенной оценки дисперсии является генеральной совокупности не несмещенной оценкой стандартного отклонения генеральной совокупности : квадратный корень из несмещенной дисперсии выборки , скорректированное стандартное отклонение выборки , является смещенным. Смещение зависит как от выборочного распределения оценщика, так и от преобразования, и его расчет может быть весьма сложным - см. несмещенная оценка стандартного отклонения для обсуждения в этом случае.

среднеквадратическая ошибка Смещение , дисперсия и

Выборочные распределения двух альтернативных оценок параметра β 0 . Хотя β 1 ^ несмещен, то он явно уступает смещенному β 2 ^ .

Ридж-регрессия является одним из примеров метода, в котором допущение небольшой систематической ошибки может привести к значительному уменьшению дисперсии и более надежным оценкам в целом.

Хотя смещение количественно определяет среднюю ожидаемую разницу между оценщиком и базовым параметром, можно дополнительно ожидать, что оценщик, основанный на конечной выборке, будет отличаться от параметра из-за случайности в выборке. Оценщик, который минимизирует смещение, не обязательно минимизирует среднеквадратическую ошибку. Одной из мер, которая используется для отражения обоих типов различий, является среднеквадратическая ошибка . [2]

Можно показать, что оно равно квадрату смещения плюс дисперсия: [2]

Если параметр является вектором, применяется аналогичное разложение: [14]

где - след (диагональная сумма) ковариационной матрицы средства оценки и – норма квадратного вектора .

Пример: Оценка дисперсии генеральной совокупности [ править ]

Например, [15] предположим, что имеется оценка формы

ищется дисперсия генеральной совокупности, как указано выше, но на этот раз для минимизации MSE:

Если переменные X 1 ... X n имеют нормальное распределение, то nS 2 /п 2 имеет распределение хи-квадрат с n - 1 степенями свободы, что дает:

и так

С помощью небольшой алгебры можно подтвердить, что именно c = 1/( n + 1) минимизирует эту комбинированную функцию потерь, а не c = 1/( n - 1), которая минимизирует только квадрат смещения.

В более общем смысле только в ограниченных классах задач будет существовать средство оценки, которое минимизирует MSE независимо от значений параметров.

Однако очень часто можно предположить, что существует компромисс между смещением и дисперсией , когда небольшое увеличение смещения можно обменять на большее уменьшение дисперсии, что в целом приводит к более желательной оценке.

Байесовский взгляд [ править ]

Большинство байесовцев совершенно не беспокоится о несмещенности (по крайней мере, в формальном смысле теории выборки, изложенном выше) своих оценок. Например, Гельман и соавторы (1995) пишут: «С байесовской точки зрения принцип несмещенности разумен в пределах больших выборок, но в остальном он потенциально вводит в заблуждение». [16]

По сути, разница между байесовским подходом и описанным выше подходом теории выборки заключается в том, что в подходе теории выборки параметр считается фиксированным, а затем рассматриваются распределения вероятностей статистики на основе прогнозируемого выборочного распределения данных. Однако для байесовского подхода это данные , которые известны и фиксированы, и это неизвестный параметр, для которого делается попытка построить распределение вероятностей, используя теорему Байеса :

Здесь второй член — вероятность данных при неизвестном значении параметра θ — зависит только от полученных данных и моделирования процесса генерации данных. Однако байесовский расчет также включает в себя первый член, априорную вероятность для θ, которая учитывает все, что аналитик может знать или подозревать о θ до того, как поступят данные. Эта информация не играет никакой роли в подходе теории выборки; действительно, любая попытка включить его будет рассматриваться как «отклонение» от того, на что указывают исключительно данные. Поскольку байесовские расчеты включают в себя априорную информацию, поэтому практически неизбежно, что их результаты не будут «несмещенными» в терминах теории выборки.

Но результаты байесовского подхода могут отличаться от подхода теории выборки, даже если байесовский подход пытается принять «неинформативный» априор.

Например, рассмотрим еще раз оценку неизвестной генеральной дисперсии σ 2 нормального распределения с неизвестным средним значением, где желательно оптимизировать c в функции ожидаемых потерь

Стандартным выбором неинформативного априора для этой задачи является априор Джеффриса , , что эквивалентно принятию априорной плоскости, инвариантной к масштабированию, для ln(σ 2 ) .

Одним из последствий принятия этого априора является то, что S 2 /п 2 остается ключевой величиной , т.е. распределением вероятностей S 2 /п 2 зависит только от S 2 /п 2 , независимо от значения S 2 или σ 2 :

Однако в то время как

в отличие

- когда ожидание принимается за распределение вероятностей σ 2 учитывая S 2 , как в байесовском случае, а не S 2 учитывая σ 2 , уже нельзя брать σ 4 как константу и вынесите ее на множитель. Следствием этого является то, что по сравнению с расчетом по теории выборки байесовский расчет придает больший вес большим значениям σ. 2 , правильно принимая во внимание (чего не могут сделать расчеты по теории выборки), что при этой функции квадрата потерь следствие недооценки больших значений σ 2 с точки зрения квадрата потерь обходится дороже, чем переоценка малых значений σ. 2 .

Разработанный байесовский расчет дает масштабированное обратное распределение хи-квадрат с n - 1 степенями свободы для апостериорного распределения вероятностей σ. 2 . Ожидаемые потери минимизируются, когда cnS 2 = <σ 2 >; это происходит, когда c = 1/( n − 3).

Таким образом, даже при неинформативном априорном подходе байесовский расчет может не дать такого же результата по минимизации ожидаемых потерь, как соответствующий расчет по теории выборки.

См. также [ править ]

Примечания [ править ]

  1. ^ «Почему для биномиального распределения не существует несмещенной оценки для $1/p$?» . Математический обмен стеками . Проверено 27 декабря 2023 г.
  2. ^ Перейти обратно: а б с Коздрон, Михаил (март 2016 г.). «Оценка качества оценщика: смещение, среднеквадратическая ошибка, относительная эффективность (глава 3)» (PDF) . stat.math.uregina.ca . Проверено 11 сентября 2020 г.
  3. ^ Перейти обратно: а б Тейлор, Кортни (13 января 2019 г.). «Непредвзятые и смещенные оценки» . МысльКо . Проверено 12 сентября 2020 г.
  4. ^ Деккинг, Мишель, изд. (2005). Современное введение в вероятность и статистику: понимание почему и как . Тексты Спрингера в статистике. Лондон [Гейдельберг]: Springer. ISBN  978-1-85233-896-1 .
  5. ^ Ричард Арнольд Джонсон; Дин В. Вичерн (2007). Прикладной многомерный статистический анализ . Пирсон Прентис Холл. ISBN  978-0-13-187715-3 . Проверено 10 августа 2012 г.
  6. ^ Романо, Япония; Сигел, А.Ф. (1986). Контрпримеры в теории вероятности и статистике . Монтерей, Калифорния, США: Уодсворт и Брукс / Коул. п. 168.
  7. ^ Харди, М. (1 марта 2003 г.). «Ясный контрпример». Американский математический ежемесячник . 110 (3): 234–238. arXiv : math/0206006 . дои : 10.2307/3647938 . ISSN   0002-9890 . JSTOR   3647938 .
  8. ^ Браун (1947), стр. 583
  9. ^ Пфанзагль, Иоганн (1979). «Об оптимальных медианных несмещенных оценках при наличии мешающих параметров» . Анналы статистики . 7 (1): 187–193. дои : 10.1214/aos/1176344563 .
  10. ^ Перейти обратно: а б Браун, Л.Д.; Коэн, Артур; Стродерман, МЫ (1976). «Теорема о полном классе для строгого монотонного отношения правдоподобия с приложениями» . Анна. Статист . 4 (4): 712–722. дои : 10.1214/aos/1176343543 .
  11. ^ Перейти обратно: а б с Додж, Ядола, изд. (1987). Статистический анализ данных на основе L 1 -нормы и родственных методов . Материалы Первой международной конференции, состоявшейся в Невшателе, 31 августа – 4 сентября 1987 г. Амстердам: Северная Голландия. ISBN  0-444-70273-3 .
  12. ^ Джейнс, ET (2007). Теория вероятностей: Логика науки . Кембридж: Кембриджский университет. Нажимать. п. 172. ИСБН  978-0-521-59271-0 .
  13. ^ Клебанов Лев Борисович; Рачев Светлозар Т.; Фабоцци, Фрэнк Дж. (2009). «Функции потерь и теория несмещенной оценки». Робастные и неробастные модели в статистике . Нью-Йорк: Нова Сайентифик. ISBN  978-1-60741-768-2 .
  14. ^ Табога, Марко (2010). «Лекции по теории вероятностей и математической статистике» .
  15. ^ ДеГрут, Моррис Х. (1986). Вероятность и статистика (2-е изд.). Аддисон-Уэсли. стр. 414 –5. ISBN  0-201-11366-Х . Но сравните это, например, с обсуждением в Казелла; Бергер (2001). Статистический вывод (2-е изд.). Даксбери. п. 332. ИСБН  0-534-24312-6 .
  16. ^ Гельман А.; и другие. (1995). Байесовский анализ данных . Чепмен и Холл. п. 108. ИСБН  0-412-03991-5 .

Ссылки [ править ]

  • Браун, Джордж В. «Об оценке малой выборки». Анналы математической статистики , вып. 18, нет. 4 (декабрь 1947 г.), стр. 582–585. JSTOR   2236236 .
  • Леманн, Э.Л. «Общая концепция несмещенности» Анналы математической статистики , вып. 22, нет. 4 (декабрь 1951 г.), стр. 587–592. JSTOR   2236928 .
  • Аллан Бирнбаум , 1961. «Единая теория оценки, I», Анналы математической статистики , том. 32, нет. 1 (март 1961 г.), стр. 112–135.
  • Ван дер Ваарт, HR, 1961. « Некоторые расширения идеи предвзятости » Анналы математической статистики , том. 32, нет. 2 (июнь 1961 г.), стр. 436–447.
  • Пфанцагль, Иоганн. 1994. Параметрическая статистическая теория . Вальтер де Грютер.
  • Стюарт, Алан; Орд, Кейт; Арнольд, Стивен [Ф.] (2010). Классический вывод и линейная модель . Продвинутая теория статистики Кендалла. Том. 2А. Уайли. ISBN  978-0-4706-8924-0 . .
  • Воинов, Василий [Г.]; Никулин, Михаил [С.] (1993). Несмещенные оценки и их приложения . Том. 1: Одномерный случай. Дордрект: Kluwer Academic Publishers. ISBN  0-7923-2382-3 .
  • Воинов, Василий [Г.]; Никулин, Михаил [С.] (1996). Несмещенные оценки и их приложения . Том. 2: Многомерный случай. Дордрект: Kluwer Academic Publishers. ISBN  0-7923-3939-8 .
  • Клебанов, Лев [Б.]; Рачев, Светлозар [Т.]; Фабоцци, Фрэнк [Дж.] (2009). Робастные и неробастные модели в статистике . Нью-Йорк: Издательство Nova Scientific. ISBN  978-1-60741-768-2 .

Внешние ссылки [ править ]