Jump to content

Предвзятость оценки

(Перенаправлено из срединной оценки )

В статистике смещение оценки (или функции смещения ) является разницей между оценки этой ожидаемым значением и истинным значением оцениваемого параметра. Оценка или правило принятия решений с нулевым смещением называются беспристрастными . В статистике «смещение» является объективным свойством оценки. Предвзятость - это отличная концепция от согласованности : последовательные оценки сходятся в вероятности к истинному значению параметра, но могут быть смещенными или беспристрастными (см. Предвзятость в зависимости от согласованности для большего).

При прочих равных, непредвзятая оценка предпочтительнее предвзятой оценки, хотя на практике часто используются смещенные оценки (с в целом небольшим смещением). Когда используется смещенная оценка, рассчитываются границы смещения. Предвзятая оценка может использоваться по разным причинам: потому что непредвзятая оценка не существует без дальнейших предположений о популяции; потому что оценка трудно вычислить (как при беспристрастной оценке стандартного отклонения ); потому что предвзятая оценка может быть беспристрастным в отношении различных показателей центральной тенденции ; потому что смещенная оценка дает более низкое значение некоторой функции потерь (особенно средней квадратной ошибки ) по сравнению с непредвзятыми оценщиками (особенно в оценках усадки ); Или потому, что в некоторых случаях непредвзято слишком сильное состояние, а единственные непредвзятые оценки не полезны.

Смещение также может быть измерено в отношении медианы , а не среднего (ожидаемого значения), и в этом случае человек отличает медиана , не связанную с обычным средним значением. Средняя невозмутимость не сохраняется при нелинейных преобразованиях , хотя средняя унбиация составляет (см. § Эффект преобразований ); Например, дисперсия выборки представляет собой предвзятую оценку для дисперсии населения. Все они проиллюстрированы ниже.

Не всегда необходимо существовать объективная оценка для параметра. Например, не существует непредвзятой оценки для взаимного параметра биномиальной случайной величины. [ 1 ]

Определение

[ редактировать ]

Предположим, что у нас есть статистическая модель , параметризованная реальным числом θ , что приводит к распределению вероятности для наблюдаемых данных, и статистика который служит оценкой θ данных на основе любых наблюдаемых Полем То есть мы предполагаем, что наши данные следует за некоторым неизвестным распределением (где θ - фиксированная неизвестная константа, которая является частью этого распределения), а затем мы строим некоторую оценку Эти карты наблюдали данные о значениях, которые, как мы надеемся, близки к θ . Предвзятость относительно определяется как [ 2 ]

где обозначает ожидаемую стоимость по сравнению с распределением (т.е. усреднение по всем возможным наблюдениям ) Второе уравнение следует, поскольку θ измеримо относительно условного распределения .

Оценка считается беспристрастной , если его смещение равна нулю для всех значений параметра θ или эквивалентно, если ожидаемое значение оценки соответствует значению параметра. [ 3 ] Беспризнанство не гарантированно перенесено. Например, если это непредвзятая оценка для параметра θ , не гарантируется, что G ( ) является беспристрастной оценкой для G ( θ). [ 4 ]

В имитационном эксперименте, касающемся свойств оценки, смещение оценки может быть оценено с использованием средней подписанной разницы .

Пример дисперсия

[ редактировать ]

Отклонность выбора случайной величины демонстрирует два аспекта смещения оценки: во -первых, наивная оценка смещена, что может быть скорректировано с помощью масштабного коэффициента; Во -вторых, непредвзятая оценка не является оптимальной с точки зрения средней квадратной ошибки (MSE), которая может быть сведена к минимуму с помощью другого масштабного коэффициента, что приводит к смещению оценки с более низкой MSE, чем объективная оценка. Конкретно наивная оценка суммирует квадратные отклонения и делится на n, что предвзято. Разделение вместо этого n - 1 дает непредвзятую оценку. И наоборот, MSE может быть сведен к минимуму путем деления на другое число (в зависимости от распределения), но это приводит к смещению оценки. Это число всегда больше n - 1, поэтому это известно как оценка усадки , поскольку оно «сжимает» объективную оценку в направлении нуля; Для нормального распределения оптимальное значение n + 1.

Предположим , X 1 , ..., x n являются независимыми и идентично распределенными (IID) случайными переменными с ожиданием μ и дисперсией σ 2 Полем Если среднее значение выборки и некорректированная дисперсия выборки определяются как

тогда с 2 предвзятая оценка σ 2 , потому что

Чтобы продолжить, отмечаем, что вычитая с обеих сторон , мы получаем

Значение, (перекрестной мультиплизацией) Полем Затем предыдущее становится:

Это можно увидеть, отметив следующую формулу, которая следует из формулы Bienaymé , для термина в неравенстве для ожидания некорректированной дисперсии выборки выше: .

Другими словами, ожидаемое значение некорректированной дисперсии выборки не равняется дисперсии популяции σ 2 , если не умножено на коэффициент нормализации. Среднее среднее выборку, с другой стороны, является объективным [ 5 ] Оценка среднего значения популяции μ . [ 3 ]

Обратите внимание, что обычное определение дисперсии выборки , и это непредвзятая оценка дисперсии населения.

Алгебраически говоря, это непредвзято, потому что:

где переход ко второй строке использует результат, полученный выше для смещенной оценки. Таким образом и поэтому является беспристрастной оценкой дисперсии популяции, σ 2 Полем Соотношение между смещенными (некорректными) и беспристрастными оценками дисперсии известно как коррекция Бесселя .

Причина, по которой некорректированная дисперсия выборки, s 2 , является смещенным стеблями от того факта, что среднее значение выборки является обычной оценкой наименьших квадратов (OLS) для μ : это число, которое делает сумму как можно меньше. То есть, когда любое другое число подключено к этой сумме, сумма может только увеличиваться. В частности, выбор дает,

а потом

Приведенное выше обсуждение можно понять в геометрических терминах: вектор может быть разложено на «среднюю часть» и «дисперсионную часть», проецируя направление и к этому направлению ортогональный комплемент гиперплоскость. Один получает вдоль части и для дополнительной части. Поскольку это ортогональное разложение, пифагорейская теорема говорит , и принимая ожидания, которые мы получаем , как указано выше (но времена ) Если распределение вращательно симметрично, как в случае, когда отбираются из гауссовского, а затем в среднем, размер вдоль способствует одинаково как направления перпендикулярно , так что и Полем Это на самом деле верно в целом, как объяснено выше.

Оценка вероятности Пуассона

[ редактировать ]

Гораздо более экстремальный случай предвзятого оценщика лучше, чем любая беспристрастная оценка, возникает из распределения Пуассона . [ 6 ] [ 7 ] Предположим, что X имеет распределение Пуассона с ожиданием λ . Предположим, что желательно оценить

С образцом размера 1. (например, при входящих вызовах на телефонном плане моделируется как процесс Пуассона, а λ - среднее количество вызовов в минуту, затем e −2 l вероятность того, что звонки не появятся в ближайшие две минуты.)

Поскольку ожидание непредвзятого оценки Δ ( x ) равно оценке , т.е.

Единственная функция данных, составляющих непредвзятую оценку, - это

Чтобы увидеть это, обратите внимание, что при разложении E - λ Из приведенного выше выражения для ожидания оставшаяся сумма представляет собой серии Тейлор расширение - λ также, давая E - λ и - λ = и −2 l (См. Характеристики экспоненциальной функции ).

Если наблюдаемое значение x составляет 100, то оценка составляет 1, хотя истинное значение оцениваемой величины, скорее всего, будет почти 0, что является противоположным крайним. И, если x наблюдается 101, то оценка еще более абсурдно: это -1, хотя оцениваемое количество должно быть положительным.

(Смещенная) оценка максимального вероятности

гораздо лучше, чем эта непредвзятая оценка. Мало того, что его значение всегда положительное, но также более точное в том смысле, что его средняя квадратная ошибка

меньше; Сравните MSE с непредвзятой оценкой

MSE являются функциями истинного значения λ . Предвзятость оценки максимального правдоподобия:

Максимум дискретного равномерного распределения

[ редактировать ]

Предвзятость оценок максимального правдоподобия может быть существенным. Рассмотрим случай, когда билеты N , пронумерованные от 1 до N, помещаются в коробку, а один выбирается случайным образом, что дает значение x . Если n неизвестно, то оценка максимального правдоподобия N равен x , даже если ожидание x watch n составляет только ( n + 1)/2; Мы можем быть уверены только, что n - это как минимум x и, вероятно, больше. В этом случае естественная беспристрастная оценка составляет 2 x - 1.

Срединно-неуклюжие оценки

[ редактировать ]

Теория срединных оценок была возрождена Джорджем В. Брауном в 1947 году: [ 8 ]

Оценка одномерного параметра θ будет считаться срединной невозмутимой, если для фиксированного θ медиана распределения оценки находится в значении θ; т.е. оценка недооценивает так же часто, как она переоценивает. Это требование, по-видимому, для большинства целей достигает столько же, сколько среднего непревзойденного требования, и обладает дополнительным свойством, что оно является инвариантным при преобразовании один к одному.

Дальнейшие свойства срединно-неуверенных оценок были отмечены Лемманом, Брнбаумом, Ван дер Ваэртом и Пфанзаглом. [ 9 ] В частности, срединно-несущественные оценки существуют в тех случаях, когда среднего непревзойденного и максимального правдоподобия не существуют. Они инвариантны при преобразовании один к одному .

Существуют методы среднего построения в срединно-увольнении оценки для распределений вероятностей, которые имеют монотонные функции правдоподобия , такие как экспоненциальные семейства однопараметрических экспонент, чтобы гарантировать, что они являются оптимальными (в некотором смысле, аналогичном минимально-вариантному свойству, рассматриваемым для средних неудовлетворенных оценок)) Полем [ 10 ] [ 11 ] Одна из таких процедур является аналогом процедуры RAO-Blackwell для средних невозмутимых оценок: процедура содержит для меньшего класса распределений вероятностей, чем процедура RAO-Blackwell для средней оценки, но для более крупного класса функций потерь. [ 11 ]

Предвзятость в отношении других функций потерь

[ редактировать ]

Любое минимальное среднее значение- UnbiaSed оценка сводит к минимуму риск ( ожидаемую потерю ) в отношении функции потерь в квадрате-ошибках (среди средних несчастных оценок), что наблюдается Gauss . [ 12 ] Минимально абсолютного отклонения средняя оценка среднего -Unbiased оценка сводит к минимуму риск в отношении абсолютной функции потерь (среди срединно-неуверенных оценок), как наблюдается Лаплас . [ 12 ] [ 13 ] Другие функции потерь используются в статистике, особенно в надежной статистике . [ 12 ] [ 14 ]

Эффект преобразований

[ редактировать ]

Для одномерных параметров срединно-несущественные оценки остаются в срединной унбиации при трансформациях , которые сохраняют порядок (или обратный порядок). Обратите внимание, что, когда трансформация применяется к средней невозмутимой оценке, результат не должен быть средне-непревзойденной оценкой его соответствующей статистики населения. Благодаря неравенству Дженсена , выпуктная функция как преобразование будет вводить положительное смещение, в то время как вогнутая функция будет вводить отрицательное смещение, а функция смешанной выпуклости может вводить смещение в любом направлении, в зависимости от конкретной функции и распределения. То есть, для нелинейной функции F и средне-непревзойденной оценки U параметра P , составная оценка F ( u ) не должна быть средне-невозмутимой оценкой f ( p ). Например, квадратный корень населения непредвзятой оценки дисперсии является не среднеквадратичной оценкой стандартного отклонения популяции : квадратный корень из беспристрастной дисперсии выборки , скорректированное стандартное отклонение выборки , является смещением. Смещение зависит как от распределения отбора проб, так и от преобразования, и может быть довольно вовлечено для расчета - см. Беспризнанная оценка стандартного отклонения для обсуждения в этом случае.

Предвзятость, дисперсия и средняя ошибка в квадрате

[ редактировать ]
Распределения отбора проб двух альтернативных оценок для параметра β 0 . Хотя β 1 ^ это непредвзято, он явно уступает смещению β 2 ^ .

Регрессия хребта является одним из примеров метода, в которой разрешение небольшого уклона может привести к значительному снижению дисперсии и более надежных оценках в целом.

В то время как смещение количественно определяет среднюю разницу, которую можно ожидать между оценкой и базовым параметром, можно также ожидать, что оценка, основанная на конечной выборке, может отличаться от параметра из -за случайности в выборке. Оценка, которая минимизирует смещение, не обязательно минимизирует среднюю квадратную ошибку. Одной из мер, которая используется для попытки отразить оба типа различий, является средняя квадратная ошибка , [ 2 ]

Это может быть показано, что равняется квадрату смещения, плюс дисперсия: [ 2 ]

Когда параметр является вектором, применяется аналогичное разложение: [ 15 ]

где это след (диагональная сумма) ковариационной матрицы оценки и это квадратная векторная норма .

Пример: оценка дисперсии населения

[ редактировать ]

Например, [ 16 ] Предположим, оценка формы

стремится к дисперсии населения, как указано выше, но на этот раз, чтобы минимизировать MSE:

Если переменные x 1 ... x n следуют нормальному распределению, то ns 2 2 имеет распределение хи-квадрат с n -1 градусами свободы, давая:

и так

С небольшой алгеброй можно подтвердить, что это C = 1/( n + 1), что сводит к минимуму эту комбинированную функцию потерь, а не C = 1/( N - 1), которая минимизирует только квадрат смещения.

В более общем плане только в ограниченных классах проблем будет оценка, которая минимизирует MSE независимо от значений параметров.

Однако очень распространено, что можно воспринимать компромисс предвзятости и варианта , так что небольшое увеличение смещения может быть обменено для большего снижения дисперсии, что приводит к более желательной оценке в целом.

Байесовский вид

[ редактировать ]

Большинство байесовцев довольно не заботятся о непредвзятости (по крайней мере, в формальном смысле теории выборки выше) их оценок. Например, Gelman и Coauthors (1995) пишут: «С точки зрения байесовского языка, принцип беспристрастности является разумным в пределах больших образцов, но в остальном он потенциально вводит в заблуждение». [ 17 ]

По сути, разница между байесовским подходом и приведенным выше подходом отбора проб состоит в том, что при подходе к теории выборки параметр принимается в качестве фиксированного, а затем рассматриваются распределения вероятностей статистики на основе прогнозируемого распределения отбора проб. Для байесовской, однако, это известные и фиксированные данные , и это неизвестный параметр, для которого предпринимается попытка построить распределение вероятностей, используя теорему Байеса :

Здесь второй термин, вероятность данных с учетом неизвестного значения параметра θ, зависит только от полученных данных и моделирования процесса генерации данных. Однако байесовский расчет также включает в себя первый термин, предшествующую вероятность θ, которая учитывает все, что аналитик может знать или подозревать о θ до появления данных. Эта информация не играет нечто не играет в подход к теории отбора проб; Действительно, любая попытка включить это будет считаться «предвзятостью» от того, что указывалось исключительно данными. В той степени, в которой байесовские расчеты включают предварительную информацию, поэтому в основном неизбежно, что их результаты не будут «беспристрастными» в терминах теории отбора проб.

Но результаты байесовского подхода могут отличаться от подхода теории отбора проб, даже если байесовский старается принять «неинформативную» ранее.

Например, еще раз рассмотрим оценку неизвестной дисперсии населения σ 2 нормального распределения с неизвестным средним, где желательно оптимизировать C в функции ожидаемой потери

Стандартным выбором неинформативного предыдущего для этой проблемы Jeffreys является , что эквивалентно принятию перекалирующей инвариантной плоской предыдущей для LN (σ 2 ) .

Одним из последствий принятия этого ранее является то, что S 2 2 остается ключевой величиной , то есть распределение вероятностей 2 2 зависит только от S 2 2 , независимо от значения S 2 или σ 2 :

Однако, пока

в отличие

- Когда ожидание воспринимается по поводу распределения вероятности σ 2 данный с 2 , как это в байесовском случае, а не S 2 данный σ 2 , нельзя больше принимать σ 4 как константа и учитывать это. Следствием этого является то, что, по сравнению с расчетом теории отбора проб, байесовский расчет придает больший вес на большие значения σ 2 , должным образом принятие во внимание (как не может быть расчеты отбора проб), что при этой функции по умолчанию в квадрате следствие недооценки больших значений σ 2 более дорогостоящий в условиях потери квадрата, чем для переоценки небольших значений σ 2 .

Проработанный байесовский расчет дает масштабированное обратное распределение хи-квадрат с n -1 градусами свободы для заднего распределения вероятности σ 2 Полем Ожидаемая потеря сводится к минимуму, когда ЦНС 2 = <σ 2 >; Это происходит, когда c = 1/( n - 3).

Следовательно, даже при неинформативном предварительном отношении байесовский расчет может не привести к тому же результату минимизации ожидаемого потери, что и соответствующий расчет теории отбора проб.

Смотрите также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ «Для биномиального распределения, почему не существует непредвзятой оценки за $ 1/P $?» Полем Математический обмен стеком . Получено 2023-12-27 .
  2. ^ Jump up to: а беременный в Коздрон, Майкл (март 2016 г.). «Оценка доброты оценки: смещение, средняя ошибка квадрата, относительная эффективность (глава 3)» (PDF) . stat.math.uregina.ca . Получено 2020-09-11 .
  3. ^ Jump up to: а беременный Тейлор, Кортни (13 января 2019 г.). «Бесвязные и предвзятые оценки» . Мыслить . Получено 2020-09-12 .
  4. ^ Деккинг, Мишель, изд. (2005). Современное введение в вероятность и статистику: понимание почему и как . Спрингерские тексты в статистике. Лондон [Гейдельберг]: Спрингер. ISBN  978-1-85233-896-1 .
  5. ^ Ричард Арнольд Джонсон; Дин В. Вишерн (2007). Применяемый многомерный статистический анализ . Пирсон Прентис Холл. ISBN  978-0-13-187715-3 Полем Получено 10 августа 2012 года .
  6. ^ Романо, JP; Siegel, AF (1986). Контрпримеры в вероятности и статистике . Монтерей, Калифорния, США: Wadsworth & Brooks / Cole. п. 168.
  7. ^ Харди, М. (1 марта 2003 г.). "Освещающий контрпример". Американский математический ежемесячный . 110 (3): 234–238. arxiv : математика/0206006 . doi : 10.2307/3647938 . ISSN   0002-9890 . JSTOR   3647938 .
  8. ^ Браун (1947), стр. 583
  9. ^ Lehmann 1951 ; Бирнбаум 1961 ; Ван дер Ваарт 1961 ; Pfanzagl 1994
  10. ^ Пфанзагл, Иоганн (1979). «О оптимальных медианных объективных оценках в присутствии параметров неприятностей» . Анналы статистики . 7 (1): 187–193. doi : 10.1214/aos/1176344563 .
  11. ^ Jump up to: а беременный Браун, Ld; Коэн, Артур; Strawderman, мы (1976). «Полная теорема класса для строгого монотонного соотношения правдоподобия с приложениями» . Энн. Статистика . 4 (4): 712–722. doi : 10.1214/aos/1176343543 .
  12. ^ Jump up to: а беременный в Додж, Ядола, изд. (1987). Статистический анализ данных на основе L 1 -н -н -н -н -н -н -а также связанных с ними методов . Документы с первой международной конференции, состоявшейся в Neuchâtel, 31 августа-4 сентября 1987 года. Амстердам: Северная Голландия. ISBN  0-444-70273-3 .
  13. ^ Jaynes, ET (2007). Теория вероятности: логика науки . Кембридж: Cambridge Univ. Нажимать. п. 172. ISBN  978-0-521-59271-0 .
  14. ^ Klebanov, Lev B.; Rachev, Svetlozar T.; Fabozzi, Frank J. (2009). «Функции потерь и теория беспристрастной оценки». Надежные и не надежные модели в статистике . Нью -Йорк: Nova Scientific. ISBN  978-1-60741-768-2 .
  15. ^ Табога, Марко (2010). Полем
  16. ^ Degroot, Morris H. (1986). Вероятность и статистика (2 -е изд.). Аддисон-Уэсли. С. 414 –5. ISBN  0-201-11366-х Полем Но сравните, например, с обсуждением в Казелла; Бергер (2001). Статистический вывод (2 -е изд.). Даксбери. п. 332. ISBN  0-534-24312-6 .
  17. ^ Гелман, А.; и др. (1995). Байесовский анализ данных . Чепмен и Холл. п. 108. ISBN  0-412-03991-5 .
  • Браун, Джордж В. "по оценке малой выборки". Анналы математической статистики , вып. 18, нет. 4 (декабрь 1947 г.), с. 582–585. JSTOR   2236236 .
  • Lehmann, El (декабрь 1951 г.). «Общая концепция беспристрастности». Анналы математической статистики . 22 (4): 587–592. JSTOR   2236928 .
  • Бирнбаум, Аллан (март 1961 г.). «Единая теория оценки, я». Анналы математической статистики . 32 (1): 112–135. {{cite journal}}: Cs1 Maint: дата и год ( ссылка )
  • Ван дер Ваарт, HR (июнь 1961 г.). «Некоторые расширения идеи предвзятости» . Анналы математической статистики . 32 (2): 436–447. {{cite journal}}: Cs1 Maint: дата и год ( ссылка )
  • Putagl, John (1994). Паралетрическая статистическая теория . Уолтер Гриритер.
  • Стюарт, Алан; Орд, Кит; Арнольд, Стивен [Ф.] (2010). Классический вывод и линейная модель . Усовершенствованная теория статистики Кендалла. Тол. 2A. Уайли. ISBN  978-0-4706-8924-0 . .
  • Voinov, Vassily [G.]; Никулин, Михаил [S.] (1993). Бесвязные оценки и их приложения . Тол. 1: однофакторный случай. Dordrect: Kluwer Academic Publishers. ISBN  0-7923-2382-3 .
  • Voinov, Vassily [G.]; Никулин, Михаил [S.] (1996). Бесвязные оценки и их приложения . Тол. 2: многомерный случай. Dordrect: Kluwer Academic Publishers. ISBN  0-7923-3939-8 .
  • Клебанов, Лев [Б.]; Рэйчев, Светлозар [Т.]; Fabozzi, Frank [J.] (2009). Надежные и не надежные модели в статистике . Нью -Йорк: Nova Scientific Publishers. ISBN  978-1-60741-768-2 .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 106318e12c41dc97db523f849d4b9963__1723306320
URL1:https://arc.ask3.ru/arc/aa/10/63/106318e12c41dc97db523f849d4b9963.html
Заголовок, (Title) документа по адресу, URL1:
Bias of an estimator - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)