Jump to content

Пример Штейна

(Перенаправлено из примера Proof of Stein )

В теории принятия решений и оценки теории пример Штейна (также известный как феномен Штейна или парадокс Штейна ) представляет собой наблюдение, что, когда три или более параметров оцениваются одновременно, существуют комбинированные оценки, более точные в среднем (то есть имеющие более низкую ожидаемую среднеквадратическую ошибку). ), чем любой метод, который обрабатывает параметры отдельно. Он назван в честь Чарльза Стайна из Стэнфордского университета , открывшего это явление в 1955 году. [ 1 ]

Интуитивное объяснение состоит в том, что оптимизация среднеквадратической ошибки комбинированной оценки — это не то же самое, что оптимизация ошибок отдельных оценок отдельных параметров. С практической точки зрения, если комбинированная ошибка действительно представляет интерес, то следует использовать комбинированную оценку, даже если основные параметры независимы. Если вместо этого вас интересует оценка отдельного параметра, то использование комбинированной оценки не поможет и даже хуже.

Официальное заявление

[ редактировать ]

Ниже приводится простейшая форма парадокса, частный случай, когда количество наблюдений равно количеству оцениваемых параметров. Позволять быть вектором, состоящим из неизвестные параметры. Для оценки этих параметров необходимо одно измерение выполняется для каждого параметра , в результате чего получается вектор длины . измерения, как известно, являются независимыми гауссовыми Предположим, что случайными величинами со средним значением и дисперсия 1, т.е. . Таким образом, каждый параметр оценивается с использованием одного зашумленного измерения, и каждое измерение одинаково неточно.

В этих условиях интуитивно и общепринято использовать каждое измерение как оценку соответствующего ему параметра. Это так называемое «обычное» решающее правило можно записать как , который является оценкой максимального правдоподобия (MLE). Качество такой оценки измеряется ее функцией риска . Обычно используемой функцией риска является среднеквадратическая ошибка , определяемая как . Удивительно, но оказывается, что «обычное» решающее правило субоптимально ( недопустимо ) с точки зрения среднеквадратической ошибки, когда . Другими словами, в обсуждаемой здесь ситуации существуют альтернативные оценки, которые всегда достигают более низкой среднеквадратической ошибки, независимо от значения является. Для данного очевидно, можно определить идеальную «оценку», которая всегда справедлива. , но эта оценка была бы плохой для других значений .

Оценки парадокса Штейна для данного , лучше, чем «обычное» решающее правило для некоторых но обязательно хуже для других. Только в среднем они лучше. Точнее, оценщик говорят, что он доминирует над другой оценкой если для всех значений , риск ниже или равен риску , и если неравенство строгое для некоторого . Оценка называется допустимой, если ни одна другая оценка не доминирует над ней, в противном случае она недопустима . Таким образом, пример Штейна можно просто сформулировать следующим образом: «Обычное» решающее правило среднего многомерного гауссовского распределения недопустимо при риске среднеквадратической ошибки.

Многие простые и практичные средства оценки обеспечивают лучшую производительность, чем «обычное» решающее правило. Самый известный пример — оценка Джеймса–Стейна , которая сжимает к определенной точке (например, к началу координат) на величину, обратно пропорциональную расстоянию с этого момента. Набросок доказательства этого результата см. в разделе « Доказательство примера Стейна» . Альтернативное доказательство принадлежит Ларри Брауну: он доказал, что обычная оценка для -мерный многомерный нормальный средний вектор допустим тогда и только тогда, когда -мерное броуновское движение рекуррентно. [ 2 ] Поскольку броуновское движение не является рекуррентным для , MLE не допускается для .

Интуитивное объяснение

[ редактировать ]

Для любого конкретного значения новый оценщик улучшит хотя бы одну из отдельных среднеквадратических ошибок Это несложно – например, если находится между −1 и 1, и , то оценка, которая линейно сжимается в сторону 0 на 0,5 (т.е. , мягкая установка порога с порогом ) будет иметь меньшую среднеквадратическую ошибку, чем сам. Но есть и другие ценности для которого эта оценка хуже, чем сам. Хитрость оценщика Штейна и других, приводящих к парадоксу Штейна, заключается в том, что они корректируют сдвиг таким образом, что всегда (для любого вектор) хотя бы один чья среднеквадратическая ошибка улучшена, и ее улучшение более чем компенсирует любое ухудшение среднеквадратической ошибки, которое может произойти для другого . Беда в том, что, не зная , вы не знаете, какой из Среднеквадратические ошибки улучшены, поэтому вы не можете использовать оценщик Штейна только для этих параметров.

Пример приведенной выше настройки встречается при оценке канала , например, в телекоммуникациях, поскольку на общую производительность канала влияют различные факторы.

Подразумеваемое

[ редактировать ]

Пример Штейна удивителен, поскольку «обычное» правило принятия решений интуитивно понятно и широко используется. Фактически, многочисленные методы построения оценщика, включая оценку максимального правдоподобия , наилучшую линейную несмещенную оценку , оценку методом наименьших квадратов и оптимальную эквивариантную оценку , все приводят к «обычному» оценщику. Однако, как обсуждалось выше, эта оценка неоптимальна.

Чтобы продемонстрировать неинтуитивную природу примера Штейна, рассмотрим следующий пример из реальной жизни. Предположим, нам нужно оценить три несвязанных параметра, таких как урожай пшеницы в США в 1993 году, количество зрителей на теннисном турнире Уимблдона в 2001 году и вес случайно выбранного шоколадного батончика из супермаркета. Предположим, у нас есть независимые гауссовы измерения каждой из этих величин. Пример Штейна теперь говорит нам, что мы можем получить лучшую оценку (в среднем) вектора трех параметров, одновременно используя три несвязанных измерения.

На первый взгляд кажется, что каким-то образом мы получаем лучшую оценку урожайности пшеницы в США, измеряя некоторые другие несвязанные статистические данные, такие как количество зрителей на Уимблдоне и вес шоколадного батончика. Однако мы не получили лучшую оценку урожайности пшеницы в США как таковую, но мы создали оценку для вектора средних всех трех случайных величин, которая имеет уменьшенный общий риск. Это происходит потому, что стоимость плохой оценки в одном компоненте вектора компенсируется лучшей оценкой в ​​другом компоненте. Кроме того, конкретный набор из трех оцененных средних значений, полученных с помощью нового оценщика, не обязательно будет лучше, чем обычный набор (измеренные значения). Новая оценка лучше только в среднем.

Набросанное доказательство

[ редактировать ]

Функция риска решающего правила является

Теперь рассмотрим решающее правило

где . Мы покажем это является лучшим правилом принятия решения, чем . Функция риска – это

— квадратичное по . Мы можем упростить средний термин, рассматривая общую функцию «хорошего поведения». и используя интегрирование по частям . Для , для любого непрерывно дифференцируемого растет достаточно медленно для больших у нас есть:

Поэтому,

(Этот результат известен как лемма Штейна .) Теперь выбираем

Если удовлетворяли условию «хорошего поведения» (это не так, но это можно исправить — см. ниже), мы бы

и так

Затем вернемся к функции риска :

Этот квадратичный в минимизируется при , давая

что, конечно, удовлетворяет изготовление недопустимое решающее правило.

Осталось обосновать использование

Эта функция не является непрерывно дифференцируемой, так как она сингулярна при . Однако функция

непрерывно дифференцируема, и после прохождения алгебры и пропуска , получаем тот же результат.

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ Эфрон, Б .; Моррис, К. (1977), «Парадокс Штейна в статистике» (PDF) , Scientific American , 236 (5): 119–127, Бибкод : 1977SciAm.236e.119E , doi : 10.1038/scientificamerican0577-119
  2. ^ Браун, Л.Д. (1971). «Допустимые оценки, рекуррентные диффузии и неразрешимые краевые задачи» . Анналы математической статистики . 42 (3): 855–903. дои : 10.1214/aoms/1177693318 . ISSN   0003-4851 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 4f596b3f85b8f3a2fb1ecd7cbf3bad61__1677690540
URL1:https://arc.ask3.ru/arc/aa/4f/61/4f596b3f85b8f3a2fb1ecd7cbf3bad61.html
Заголовок, (Title) документа по адресу, URL1:
Stein's example - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)