Jump to content

Оценщик Джеймса – Штейна

Оценка Джеймса -Стейна представляет собой смещенную оценку среднего значения . , (возможно) коррелированных гауссовых распределенных случайных величин неизвестными средствами .

Оно возникло последовательно в двух основных опубликованных работах. Более ранняя версия оценщика была разработана в 1956 году. [ 1 ] когда Чарльз Стайн пришел к относительно шокирующему выводу, что, хотя обычная в то время оценка среднего значения, выборочное среднее , допустимо когда , недопустимо , когда . Штейн предложил возможное улучшение средства оценки, которое сокращает выборочные средние значения. к более центральному среднему вектору (который может быть выбран априори или обычно как «среднее среднее» выборочных средних, при условии, что все выборки имеют одинаковый размер). Это наблюдение обычно называют примером или парадоксом Штейна . В 1961 году Уиллард Джеймс и Чарльз Стайн упростили первоначальный процесс. [ 2 ]

Можно показать, что оценщик Джеймса – Стейна доминирует над «обычным» методом наименьших квадратов , а это означает, что оценщик Джеймса – Стейна имеет меньшую или равную среднеквадратичную ошибку , чем «обычный» оценщик наименьших квадратов.

Подобно оценке Ходжеса , оценка Джеймса-Стейна является сверхэффективной и нерегулярной при . [ 3 ]

Параметр

[ редактировать ]

Позволять где вектор это неизвестное среднее значение , что -переменная нормально распределена и с известной ковариационной матрицей .

Мы заинтересованы в получении оценки, , из на основе одного наблюдения, , из .

В реальных приложениях это обычная ситуация, когда происходит выборка набора параметров, и выборки искажаются независимым гауссовским шумом . Поскольку среднее значение этого шума равно нулю, может быть разумно использовать сами выборки в качестве оценки параметров. Этот подход представляет собой оценку методом наименьших квадратов , которая .

Штейн продемонстрировал, что с точки зрения среднеквадратической ошибки , оценка методом наименьших квадратов, , неоптимален для оценщиков на основе усадки, таких как оценщик Джеймса – Стейна , . [ 1 ] Парадоксальный результат состоит в том, что существует (возможно) лучшая и никогда не худшая оценка Среднеквадратическая ошибка по сравнению со средним значением выборки стала известна как пример Штейна .

Оценка Джеймса – Стейна

[ редактировать ]
MSE (R) оценки наименьших квадратов (ML) по сравнению с оценкой Джеймса – Штейна (JS). Оценка Джеймса – Стейна дает наилучшую оценку, когда норма фактического вектора параметров θ близка к нулю.

Если известна, оценка Джеймса – Стейна имеет вид

Джеймс и Стейн показали, что приведенная выше оценка доминирует. для любого , что означает, что оценщик Джеймса – Стейна всегда обеспечивает меньшую среднеквадратическую ошибку (MSE), чем оценщик максимального правдоподобия . [ 2 ] [ 4 ] По определению это делает оценку методом наименьших квадратов неприемлемой , когда .

Обратите внимание, что если тогда эта оценка просто принимает естественную оценку и сжимает его к началу координат 0 . На самом деле это не единственное направление усадки работающее . Пусть ν — произвольный фиксированный вектор размерности . Тогда существует оценка типа Джеймса–Стейна, сжимающаяся к ν , а именно

Оценка Джеймса–Стейна доминирует над обычной оценкой для любого ν . Естественный вопрос: независимо ли улучшение по сравнению с обычной оценкой от выбора ν . Ответ — нет. Улучшение незначительно, если большой. некоторое знание местоположения θ Таким образом, чтобы получить очень большое улучшение , необходимо . Конечно, именно эту величину мы пытаемся оценить, поэтому у нас нет этих знаний априори . Но мы можем иметь некоторое представление о том, что такое средний вектор. Это можно считать недостатком оценщика: выбор не объективен, поскольку может зависеть от убеждений исследователя. Тем не менее, результат Джеймса и Стайна состоит в том, что любое конечное предположение ν улучшает ожидаемую СКО по сравнению с оценщиком максимального правдоподобия, что равносильно использованию бесконечного ν , что, безусловно, является плохим предположением.

Интерпретация

[ редактировать ]

Рассмотрение оценки Джеймса – Стейна как эмпирического метода Байеса дает некоторое представление об этом результате: предполагается, что θ сама по себе является случайной величиной с априорным распределением. , где A оценивается на основе самих данных. Оценка A дает преимущество по сравнению с оценкой максимального правдоподобия только тогда, когда размерность достаточно велик; следовательно, это не работает для . Оценка Джеймса – Стейна является членом класса байесовских оценок, которые доминируют над оценкой максимального правдоподобия. [ 5 ]

Следствием приведенного выше обсуждения является следующий противоречивый результат: когда измеряются три или более несвязанных параметров, их общее MSE можно уменьшить с помощью комбинированного средства оценки, такого как средство оценки Джеймса – Стейна; тогда как когда каждый параметр оценивается отдельно, допустима оценка методом наименьших квадратов (LS) . Причудливым примером может служить оценка скорости света, потребления чая на Тайване и веса свиней в Монтане, вместе взятых. Оценка Джеймса – Стейна всегда улучшает общую MSE, т. е. сумму ожидаемых квадратов ошибок каждого компонента. Следовательно, общая MSE при измерении скорости света, потребления чая и веса свиньи улучшится при использовании оценщика Джеймса – Штейна. Однако любой конкретный компонент (например, скорость света) улучшится для некоторых значений параметра и ухудшится для других. Таким образом, хотя оценка Джеймса – Стейна доминирует над оценкой LS при оценке трех или более параметров, ни один отдельный компонент не доминирует над соответствующим компонентом оценки LS.

Вывод из этого гипотетического примера заключается в том, что измерения следует комбинировать, если кто-то заинтересован в минимизации их общей MSE. Например, в телекоммуникационных условиях разумно объединить измерения отводов каналов в сценарии оценки канала , поскольку цель состоит в том, чтобы минимизировать общую ошибку оценки канала.

Оценка Джеймса-Стейна также нашла применение в фундаментальной квантовой теории, где оценка использовалась для улучшения теоретических границ энтропийного принципа неопределенности для более чем трех измерений. [ 6 ]

Интуитивный вывод и интерпретация даются гальтонианским подходом. [ 7 ] Согласно этой интерпретации, мы стремимся предсказать средние значения совокупности, используя несовершенно измеренные средние выборочные значения . Уравнение оценщика МНК в гипотетической регрессии средних значений генеральной совокупности к выборочным средним дает оценку либо оценщика Джеймса – Стейна (когда мы заставляем пересечение МНК равным 0), либо оценщика Эфрона-Морриса ( когда мы позволяем отрезку изменяться).

Улучшения

[ редактировать ]

Несмотря на интуицию, что оценка Джеймса – Стейна уменьшает оценку максимального правдоподобия к , оценка фактически удаляется от для небольших значений как множитель на тогда отрицательный. Это можно легко исправить, заменив этот множитель нулем, когда он отрицательный. Полученная оценка называется оценкой Джеймса – Стейна с положительной частью и определяется выражением

Эта оценка имеет меньший риск, чем базовая оценка Джеймса – Стейна. Отсюда следует, что основная оценка Джеймса–Стейна сама по себе недопустима . [ 8 ]

Однако оказывается, что оценка с положительной частью также недопустима. [ 4 ] Это следует из общего результата, требующего, чтобы допустимые оценки были гладкими.

Расширения

[ редактировать ]

На первый взгляд может показаться, что оценка Джеймса–Стейна является результатом некоторой особенности постановки задачи. Фактически, оценщик демонстрирует очень широкий эффект; а именно, тот факт, что «обычная» оценка или метод наименьших квадратов часто неприемлема для одновременной оценки нескольких параметров. [ нужна ссылка ] Этот эффект получил название феномена Штейна и был продемонстрирован для нескольких различных задач, некоторые из которых кратко описаны ниже.

  • Джеймс и Стейн продемонстрировали, что представленную выше оценку все еще можно использовать, когда дисперсия неизвестно, заменив его стандартной оценкой дисперсии, . Результат доминирования остается справедливым при том же условии, а именно: . [ 2 ]
  • Результаты в этой статье относятся к случаю, когда только один вектор наблюдения y доступен . Для более общего случая, когда векторы доступны, результаты аналогичны: [ нужна ссылка ]
где это -средняя длина наблюдения.
  • Работа Джеймса и Стайна была распространена на случай общей ковариационной матрицы измерений, т. е. когда измерения могут быть статистически зависимыми и иметь различные дисперсии. [ 9 ] Можно построить аналогичную доминирующую оценку с соответствующим образом обобщенным условием доминирования. Это можно использовать для построения метода линейной регрессии , который превосходит стандартное применение оценщика LS. [ 9 ]
  • Результат Штейна был распространен на широкий класс распределений и функций потерь. Однако эта теория дает только результат существования, поскольку явные доминирующие оценки фактически не выявлялись. [ 10 ] Получить явные оценки, улучшающие обычную оценку, без конкретных ограничений на лежащие в ее основе распределения довольно сложно. [ 4 ]

См. также

[ редактировать ]
  1. ^ Jump up to: а б Штейн, К. (1956), «Недопустимость обычной оценки среднего многомерного распределения», Proc. Третий симпозиум Беркли. Математика. Статист. Проб. , том. 1, стр. 197–206, МР   0084922 , Збл   0073.35602
  2. ^ Jump up to: а б с Джеймс, В.; Штейн, К. (1961), "Оценка с квадратичными потерями", Proc. Четвертый симпозиум Беркли. Математика. Статист. Проб. , том. 1, стр. 361–379, МР   0133191
  3. ^ Беран, Р. (1995). РОЛЬ ТЕОРЕМЫ ХАЙЕКА О СВЕРТКЕ В СТАТИСТИЧЕСКОЙ ТЕОРИИ
  4. ^ Jump up to: а б с Леманн, Эль; Казелла, Г. (1998), Теория точечной оценки (2-е изд.), Нью-Йорк: Springer
  5. ^ Эфрон, Б.; Моррис, К. (1973). «Правило оценки Штейна и его конкуренты - эмпирический байесовский подход». Журнал Американской статистической ассоциации . 68 (341). Американская статистическая ассоциация: 117–130. дои : 10.2307/2284155 . JSTOR   2284155 .
  6. ^ Стандер, М. (2017), Использование средства оценки Штейна для коррекции границы энтропийного принципа неопределенности для более чем двух измерений , arXiv : 1702.02440 , Bibcode : 2017arXiv170202440S
  7. ^ Стиглер, Стивен М. (1 февраля 1990 г.). «Лекция памяти Неймана 1988 года: гальтоновский взгляд на средства оценки усадки» . Статистическая наука . 5 (1). дои : 10.1214/ss/1177012274 . ISSN   0883-4237 .
  8. ^ Андерсон, Т.В. (1984), Введение в многомерный статистический анализ (2-е изд.), Нью-Йорк: John Wiley & Sons.
  9. ^ Jump up to: а б Бок, МЭ (1975), «Минимаксные оценки среднего многомерного нормального распределения», Annals ofStatistics , 3 (1): 209–218, doi : 10.1214/aos/1176343009 , MR   0381064 , Zbl   0314.62005
  10. ^ Браун, Л.Д. (1966), «О допустимости инвариантных оценок одного или нескольких параметров местоположения», Анналы математической статистики , 37 (5): 1087–1136, doi : 10.1214/aoms/1177699259 , MR   0216647 , Zbl   0156.39401

Дальнейшее чтение

[ редактировать ]
  • Судья Джордж Г.; Бок, Мэн (1978). Статистическое значение претестовых оценок и оценок по правилам Штейна в эконометрике . Нью-Йорк: Северная Голландия. стр. 229–257. ISBN  0-7204-0729-Х .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 65f53dfe58d68764e3b9cb5f2118f72a__1716336600
URL1:https://arc.ask3.ru/arc/aa/65/2a/65f53dfe58d68764e3b9cb5f2118f72a.html
Заголовок, (Title) документа по адресу, URL1:
James–Stein estimator - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)