Jump to content

Полнота (статистика)

(Перенаправлено с Полной статистики )

В статистике рассчитанной полнота — это свойство статистики , на выборочном наборе данных по отношению к параметрической модели набора данных. Это противоречит концепции вспомогательной статистики . Хотя вспомогательная статистика не содержит информации о параметрах модели, полная статистика содержит только информацию о параметрах и не содержит вспомогательной информации. Это тесно связано с концепцией достаточной статистики , которая содержит всю информацию о параметрах, которую предоставляет набор данных. [1]

Определение

[ редактировать ]

Рассмотрим случайную величину X , распределение вероятностей которой принадлежит параметрической модели P θ, параметризованной θ .

Скажем, T — это статистика ; то есть композиция измеримой функции со случайной выборкой X 1 ,..., X n .

Статистика T называется полной для распределения X , если для каждой измеримой функции g [2]

Статистика T называется ограниченно полной для распределения X , если это импликация справедлива для любой измеримой функции g , которая также ограничена.

Пример: модель Бернулли

[ редактировать ]

Модель Бернулли допускает полную статистику. [3] Пусть X случайная выборка размера n такая, что каждый X i имеет одинаковое распределение Бернулли с параметром p . Пусть T — количество единиц, наблюдаемых в выборке, т.е. . T — статистика X , которая имеет биномиальное распределение с параметрами ( n , p ). Если пространство параметров для p равно (0,1), то T — полная статистика. Чтобы увидеть это, обратите внимание, что

Заметим также, что ни p, ни 1 − p не могут быть равны 0. Следовательно, тогда и только тогда, когда:

Обозначая p /(1 − p ) через r , получаем:

Во-первых, обратите внимание, что диапазон r — это положительные действительные числа . Кроме того, E( g ( T )) является многочленом от r и, следовательно, может быть равен 0 только в том случае, если все коэффициенты равны 0, то есть g ( t ) = 0 для всех t .

Важно отметить, что результат, согласно которому все коэффициенты должны быть равны 0, был получен из-за диапазона r . Если бы пространство параметров было конечным и с числом элементов, меньшим или равным n , можно было бы решить линейные уравнения в g ( t ), полученные путем замены значений r, и получить решения, отличные от 0. Например, если n = 1 и пространство параметров равно {0,5}, одно наблюдение и одно значение параметра, T не является полным. Обратите внимание, что с определением:

тогда E( g ( T )) = 0, хотя g ( t ) не равно 0 ни для t = 0, ни для t = 1.

Пример: сумма нормалей

[ редактировать ]

Этот пример покажет, что в выборке X 1 , X 2 размера 2 из нормального распределения с известной дисперсией статистика X 1 + X 2 является полной и достаточной. Предположим, ( X 1 , X 2 ) — независимые , одинаково распределенные случайные величины, нормально распределенные с математическим ожиданием θ и дисперсией 1.Сумма

является полной статистикой для θ .

Чтобы это доказать, достаточно доказать, что не существует ненулевой функции. такое, что ожидание

остается нулевым независимо от значения θ .

Этот факт можно рассматривать следующим образом. Распределение вероятностей X 1 + X 2 является нормальным с математическим ожиданием 2 θ и дисперсией 2. Его функция плотности вероятности в следовательно, пропорциональна

Таким образом, ожидание g выше будет постоянным, раз

Немного алгебры сводит это к

где k ( θ ) нигде не равно нулю и

Как функция от θ это двустороннее преобразование Лапласа h ( X ) и не может быть тождественно нулевым, если h ( x ) не равно нулю почти всюду. [4] Экспонента не равна нулю, поэтому это может произойти только в том случае, если g ( x ) почти везде равно нулю.

Напротив, статистика достаточно, но не полно. Он допускает ненулевую несмещенную оценку нуля, а именно

Пример: расположение равномерного распределения

[ редактировать ]

Предполагать Затем независимо от стоимости Таким образом не является полным.

Отношение к достаточной статистике

[ редактировать ]

Для некоторых параметрических семейств не существует полной достаточной статистики (например, см. Galili and Meilijson 2016). [5] ).

Например, если вы возьмете выборку размером n > 2 из N ( θ , θ 2 ) распределение, тогда является минимальной достаточной статистикой и является функцией любой другой минимальной достаточной статистики, но имеет математическое ожидание 0 для всех θ , поэтому полной статистики быть не может.

Если существует минимально достаточная статистика, то любая полная достаточная статистика также является минимально достаточной. Но есть патологические случаи, когда минимально достаточной статистики не существует, даже если существует полная статистика.

Важность полноты

[ редактировать ]

Понятие полноты имеет множество приложений в статистике, особенно в следующих двух теоремах математической статистики.

Теорема Лемана – Шеффе

[ редактировать ]

Полнота возникает в теореме Лемана – Шеффе , [6] в котором говорится, что если статистика является несмещенной, полной и достаточной для некоторого параметра θ , то это лучшая несмещенная в среднем оценка для θ . Другими словами, эта статистика имеет меньшие ожидаемые потери для любой выпуклой функции потерь; во многих практических приложениях с квадратичной функцией потерь она имеет меньшую среднеквадратичную ошибку среди любых оценок с тем же ожидаемым значением .

Существуют примеры того, что, когда минимальная достаточная статистика не является полной , существует несколько альтернативных статистик для несмещенной оценки θ , при этом некоторые из них имеют меньшую дисперсию, чем другие. [7]

См. также несмещенную оценку минимальной дисперсии .

Теорема Басу

[ редактировать ]

Ограниченная полнота возникает в теореме Басу : [8] который утверждает, что статистика, которая является одновременно ограниченно полной и достаточной, не зависит от любой вспомогательной статистики .

Теорема Бахадура

[ редактировать ]

Ограниченная полнота также встречается в теореме Бахадура . В случае, когда существует хотя бы одна минимальная достаточная статистика, статистика, достаточная и ограниченно полная, обязательно является минимально достаточной.Другая форма теоремы Бахадура утверждает, что любая достаточная и ограниченно полная статистика в конечномерном координатном пространстве также является минимально достаточной. [9]

Примечания

[ редактировать ]
  1. ^ Казелла, Джордж; Бергер, Роджер В. (2001). Статистический вывод . ЦРК Пресс. ISBN  978-1-032-59303-6 .
  2. ^ Янг, Джорджия и Смит, Р.Л. (2005). Основы статистического вывода. (с. 94). Издательство Кембриджского университета.
  3. ^ Казелла, Г. и Бергер, Р.Л. (2001). Статистический вывод. (стр. 285–286). Даксбери Пресс.
  4. ^ Орлов, Джереми. «Уникальность преобразования Лапласа» (PDF) .
  5. ^ Таль Галили; Исаак Мейлиджсон (31 марта 2016 г.). «Пример улучшаемого улучшения Рао – Блэквелла, неэффективной оценки максимального правдоподобия и несмещенной обобщенной оценки Байеса» . Американский статистик . 70 (1): 108–113. дои : 10.1080/00031305.2015.1100683 . ПМК   4960505 . ПМИД   27499547 .
  6. ^ Казелла, Джордж; Бергер, Роджер Л. (2001). Статистический вывод (2-е изд.). Даксбери Пресс. ISBN  978-0534243128 .
  7. ^ Таль Галили; Исаак Мейлиджсон (31 марта 2016 г.). «Пример улучшаемого улучшения Рао – Блэквелла, неэффективной оценки максимального правдоподобия и несмещенной обобщенной оценки Байеса» . Американский статистик . 70 (1): 108–113. дои : 10.1080/00031305.2015.1100683 . ПМК   4960505 . ПМИД   27499547 .
  8. ^ Казелла, Г. и Бергер, Р.Л. (2001). Статистический вывод. (стр. 287). Даксбери Пресс.
  9. ^ «Конспекты лекций по статистическому выводу» (PDF) . 7 июля 2022 г.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 7ef6797c773b734440f28c28394b6105__1720128000
URL1:https://arc.ask3.ru/arc/aa/7e/05/7ef6797c773b734440f28c28394b6105.html
Заголовок, (Title) документа по адресу, URL1:
Completeness (statistics) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)