Jump to content

Теорема Рао – Блэквелла

(Перенаправлено из теоремы Рао-Блэквелла )

В статистике теорема Рао-Блэквелла , иногда называемая теоремой Рао-Блэквелла-Колмогорова , представляет собой результат, характеризующий преобразование сколь угодно грубой оценки в оценку, оптимальную по критерию среднеквадратической ошибки или любому из множество схожих критериев.

Теорема Рао–Блэквелла утверждает, что если g ( X ) является какой-либо оценкой параметра θ, то условное ожидание g ( X ) при условии T ( X ), где T достаточная статистика , обычно является лучшей оценкой параметра θ. θ, и никогда не бывает хуже. Иногда можно очень легко построить очень грубую оценку g ( X ), а затем вычислить это условное ожидаемое значение, чтобы получить оценку, которая является в различных смыслах оптимальной.

Теорема названа в честь Ч.Р. Рао и Дэвида Блэквелла . Процесс преобразования средства оценки с использованием теоремы Рао–Блэквелла можно назвать « рао–Блэквеллизацией» . Преобразованная оценка называется оценкой Рао – Блэквелла . [1] [2] [3]

Определения [ править ]

  • Оценка ( δ( X ) — это наблюдаемая случайная величина т.е. статистика ), используемая для оценки некоторой ненаблюдаемой величины. Например, невозможно наблюдать средний рост всех студентов мужского пола в Университете X, но можно наблюдать рост случайной выборки из 40 из них. Средний рост этих 40 человек — «средний выборочный показатель» — может использоваться в качестве оценки ненаблюдаемого «среднего показателя населения».
  • Достаточной статистикой T ( X ) является статистика, рассчитанная на основе данных X для оценки некоторого параметра θ, для которого никакая другая статистика, которая может быть рассчитана на основе данных X, не предоставляет никакой дополнительной информации о θ. Она определяется как наблюдаемая случайная величина, такая, что условное распределение вероятностей всех наблюдаемых данных X при заданном T ( X ) не зависит от ненаблюдаемого параметра θ, такого как среднее или стандартное отклонение всей совокупности, из которой данные X. были получены взятый. В наиболее часто приводимых примерах «ненаблюдаемые» величины представляют собой параметры, которые параметризуют известное семейство вероятностных распределений, согласно которым распределяются данные.
Другими словами, достаточная статистика T(X) для параметра θ — это статистика , такая, что условная вероятность данных X при заданном T ( X ) не зависит от параметра θ.
  • Оценка Рао –Блэквелла δ 1 ( X ) ненаблюдаемой величины θ — это условное математическое ожидание E(δ( X ) | T ( X )) некоторой оценки δ( X ) при достаточной статистике T ( X ). Назовем δ( X ) «исходной оценкой» , а δ1 ( X ) « улучшенной оценкой» . Важно, чтобы улучшенная оценка была наблюдаемой , т. е. не зависела от θ. Обычно условное математическое ожидание одной функции этих данных при другой функции этих данных действительно зависит от θ, но из самого определения достаточности, данного выше, следует, что эта функция не зависит.
  • Среднеквадратическая ошибка оценщика — это ожидаемое значение квадрата его отклонения от оцениваемой ненаблюдаемой величины θ.

Теорема [ править ]

Версия со среднеквадратической ошибкой [ править ]

Один из случаев теоремы Рао – Блэквелла гласит:

Среднеквадратическая ошибка оценки Рао–Блэквелла не превышает ошибку исходной оценки.

Другими словами,

Важными инструментами доказательства, помимо приведенного выше определения, являются закон полного ожидания и тот факт, что для любой случайной величины Y E( Y 2 ) не может быть меньше [E( Y )] 2 . Это неравенство представляет собой случай неравенства Йенсена , хотя можно также показать, что оно сразу же следует из часто упоминаемого факта, что

Точнее, среднеквадратическая ошибка оценки Рао-Блэквелла имеет следующее разложение: [4]

С , немедленно следует теорема Рао-Блэквелла.

потерь Обобщение выпуклых

Более общая версия теоремы Рао-Блэквелла говорит об «ожидаемых потерях» или функции риска :

где «функция потерь» L может быть любой выпуклой функцией . Если функция потерь дважды дифференцируема, как в случае среднеквадратической ошибки, то мы имеем более точное неравенство [4]

Свойства [ править ]

Улучшенная оценка является несмещенной тогда и только тогда, когда исходная оценка несмещена, в чем можно сразу убедиться, используя закон полного ожидания . Теорема справедлива независимо от того, используются ли смещенные или несмещенные оценки.

Теорема кажется очень слабой: она говорит лишь о том, что оценка Рао–Блэквелла не хуже исходной. Однако на практике улучшение зачастую бывает огромным. [5]

Пример [ править ]

Телефонные звонки поступают на коммутатор в соответствии с процессом Пуассона со средней скоростью λ в минуту. Эта скорость не наблюдаема, но наблюдаются числа X 1 , ..., X n телефонных звонков, поступивших в течение n последовательных одноминутных периодов. Требуется оценить вероятность e что следующая минута проходит без телефонных звонков.

Чрезвычайно грубая оценка желаемой вероятности:

т. е. он оценивает эту вероятность как 1, если в первую минуту не поступило ни одного телефонного звонка, и как нулевую в противном случае. Несмотря на очевидные ограничения этой оценки, результат, полученный с помощью ее Рао-Блэквеллизации, является очень хорошей оценкой.

Сумма

можно легко показать, что это достаточная статистика для λ, т. е. условное распределение данных X 1 , ..., X n зависит от λ только через эту сумму. Таким образом, мы находим оценку Рао–Блэквелла

После некоторых алгебраических действий мы имеем

Поскольку среднее количество вызовов, поступающих в течение первых n минут, равно n λ, можно не удивляться, если эта оценка имеет довольно высокую вероятность (если n велико) быть близкой к

Таким образом, δ 1, очевидно, является значительно улучшенной оценкой этой последней величины. Фактически, поскольку Sn Шеффе является полным и δ 0 является несмещенным, δ 1 является единственной несмещенной оценкой минимальной дисперсии по теореме Лемана– .

Идемпотентность [ править ]

Рао-Блэквеллизация — идемпотентная операция. Использование его для улучшения уже улучшенной оценки не приводит к дальнейшему улучшению, а просто возвращает на выходе ту же улучшенную оценку.

Полнота и минимальная дисперсия Лемана Шеффе

Если обуславливающая статистика является полной и достаточной , а начальная оценка несмещена, то оценка Рао-Блэквелла является уникальной « лучшей несмещенной оценкой »: см. теорему Лемана-Шеффе .

Пример улучшаемого улучшения Рао-Блэквелла при использовании минимальной достаточной статистики, которая не является полной , был предоставлен Галили и Мейлиджсоном в 2016 году. [6] Позволять быть случайной выборкой из равномерного по масштабу распределения с неизвестным средним значением и известный расчетный параметр . В поисках «наилучших» возможных несмещенных оценок для естественно рассмотреть в качестве первоначальной (грубой) несмещенной оценки для а затем попытаться улучшить его. С не является функцией , минимальная достаточная статистика для (где и ), его можно улучшить с помощью теоремы Рао–Блэквелла следующим образом:

Однако можно показать, что следующая несмещенная оценка имеет меньшую дисперсию:

Фактически, его можно было бы еще улучшить, если бы использовать следующую оценку:

Модель представляет собой масштабную модель . оптимальные эквивариантные оценки получить функций потерь для инвариантных . Затем можно [7]

См. также [ править ]

Ссылки [ править ]

  1. ^ Блэквелл, Д. (1947). «Условное ожидание и несмещенная последовательная оценка» . Анналы математической статистики . 18 (1): 105–110. дои : 10.1214/aoms/1177730497 . МР   0019903 . Збл   0033.07603 .
  2. ^ Kolmogorov, A. N. (1950). "Unbiased estimates". Izvestiya Akad. Nauk SSSR. Ser. Mat . 14 : 303–326. MR  0036479 .
  3. ^ Рао, К. Радхакришна (1945). «Информация и точность, достижимые при оценке статистических параметров». Бюллетень Калькуттского математического общества . 37 (3): 81–91.
  4. Перейти обратно: Перейти обратно: а б Дж. Г. Ляо; А. Берг (22 июня 2018 г.). «Уточнение неравенства Дженсена». Американский статистик . 73 (3): 278–281. arXiv : 1707.08644 . дои : 10.1080/00031305.2017.1419145 . S2CID   88515366 .
  5. ^ Карпентер, Боб (20 января 2020 г.). «Рао-блэквеллизация и дискретные параметры в Стэне» . Статистическое моделирование, причинный вывод и социальные науки . Проверено 13 сентября 2021 г. Теорема Рао-Блэквелла утверждает, что маржинальный подход имеет дисперсию, меньшую или равную прямому подходу. На практике эта разница может быть огромной.
  6. ^ Таль Галили; Исаак Мейлиджсон (31 марта 2016 г.). «Пример улучшаемого улучшения Рао – Блэквелла, неэффективной оценки максимального правдоподобия и несмещенной обобщенной оценки Байеса» . Американский статистик . 70 (1): 108–113. дои : 10.1080/00031305.2015.1100683 . ПМЦ   4960505 . ПМИД   27499547 .
  7. ^ Таральдсен, Гуннар (2020). «Миха Мандель (2020), «Возвращение к масштабированной однородной модели», Американский статистик, 74: 1, 98–100: Комментарий» . Американский статистик . 74 (3): 315. дои : 10.1080/00031305.2020.1769727 . ISSN   0003-1305 . S2CID   219493070 .

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: ed2984f23680fb53c98f021b8092a8bd__1700395800
URL1:https://arc.ask3.ru/arc/aa/ed/bd/ed2984f23680fb53c98f021b8092a8bd.html
Заголовок, (Title) документа по адресу, URL1:
Rao–Blackwell theorem - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)