Jump to content

Полнота (статистика)

В статистике полнота это свойство статистики по отношению к параметризованной модели для набора наблюдаемых данных.

Полная статистика T — это статистика, для которой любое предлагаемое распределение в области T прогнозируется одним или несколькими априорными распределениями в пространстве параметров модели. Другими словами, пространство модели «достаточно богато», чтобы любое возможное распределение T можно было объяснить некоторым априорным распределением в пространстве параметров модели. Напротив, достаточная статистика T — это такая статистика, для которой любые два предыдущих распределения будут давать разные распределения для T. (Это последнее утверждение предполагает, что пространство модели идентифицируемо , т. е. что нет «дубликатов» значений параметров. Это второстепенный момент). .)

Другими словами: предположим, что у нас есть идентифицируемое модельное пространство, параметризованное и статистика (что фактически является просто функцией одной или нескольких случайных величин iid, взятых из модели). Затем рассмотрим карту который принимает каждое распределение по параметру модели к его индуцированному распределению по статистике . Статистика называется полным, когда сюръективно и достаточно , когда является инъективным.

Определение [ править ]

Рассмотрим случайную величину X , распределение вероятностей которой принадлежит параметрической модели P θ, параметризованной θ .

Скажем, T — это статистика ; то есть композиция измеримой функции со случайной выборкой X 1 ,..., X n .

Статистика T называется полной для распределения X , если для каждой измеримой функции g [1]

Статистика T называется ограниченно полной для распределения X , если это импликация справедлива для любой измеримой функции g , которая также ограничена.

Пример 1: Модель Бернулли [ править ]

Модель Бернулли допускает полную статистику. [2] Пусть X случайная выборка размера n такая, что каждый X i имеет одинаковое распределение Бернулли с параметром p . Пусть T — количество единиц, наблюдаемых в выборке, т.е. . T — статистика X , которая имеет биномиальное распределение с параметрами ( n , p ). Если пространство параметров для p равно (0,1), то T — полная статистика. Чтобы увидеть это, обратите внимание, что

Заметим также, что ни p, ни 1 − p не могут быть равны 0. Следовательно, тогда и только тогда, когда:

Обозначая p /(1 − p ) через r , получаем:

Во-первых, обратите внимание, что диапазон r — это положительные действительные числа . Кроме того, E( g ( T )) является многочленом от r и, следовательно, может быть равен 0 только в том случае, если все коэффициенты равны 0, то есть g ( t ) = 0 для всех t .

Важно отметить, что результат, согласно которому все коэффициенты должны быть равны 0, был получен из-за диапазона r . Если бы пространство параметров было конечным и с количеством элементов, меньшим или равным n , можно было бы решить линейные уравнения в g ( t ), полученные путем замены значений r, и получить решения, отличные от 0. Например, если n = 1 и пространство параметров равно {0,5}, одно наблюдение и одно значение параметра, T не является полным. Обратите внимание, что с определением:

тогда E( g ( T )) = 0, хотя g ( t ) не равно 0 ни для t = 0, ни для t = 1.

Пример 2: Сумма нормалей [ править ]

Этот пример покажет, что в выборке X 1 , X 2 размера 2 из нормального распределения с известной дисперсией статистика X 1 + X 2 является полной и достаточной. Предположим, ( X 1 , X 2 ) — независимые , одинаково распределенные случайные величины, нормально распределенные с математическим ожиданием θ и дисперсией 1.Сумма

является полной статистикой для θ .

Чтобы это доказать, достаточно доказать, что не существует ненулевой функции такое, что ожидание

остается нулевым независимо от значения θ .

Этот факт можно рассматривать следующим образом. Распределение вероятностей X 1 + X 2 является нормальным с математическим ожиданием 2 θ и дисперсией 2. Его функция плотности вероятности в следовательно, пропорциональна

Таким образом, ожидание g выше будет постоянным, раз

Немного алгебры сводит это к

где k ( θ ) нигде не равно нулю и

Как функция от θ это двустороннее преобразование Лапласа h ( X ) и не может быть тождественно нулевым, если h ( x ) не равно нулю почти всюду. [3] Экспонента не равна нулю, поэтому это может произойти только в том случае, если g ( x ) почти везде равно нулю.

Связь с достаточной статистикой [ править ]

Для некоторых параметрических семейств не существует полной достаточной статистики (например, см. Galili and Meilijson 2016). [4] ).

Например, если вы возьмете выборку размером n > 2 из N (θ,θ 2 ) распределение, тогда является минимальной достаточной статистикой и является функцией любой другой минимальной достаточной статистики, но имеет математическое ожидание 0 для всех θ, поэтому полной статистики быть не может.

Если существует минимально достаточная статистика, то любая полная достаточная статистика также является минимально достаточной. Но есть патологические случаи, когда минимально достаточной статистики не существует, даже если существует полная статистика.

Важность полноты [ править ]

Понятие полноты имеет множество приложений в статистике, особенно в следующих двух теоремах математической статистики.

Теорема Лемана–Шеффе [ править ]

Полнота возникает в теореме Лемана – Шеффе , [5] в котором говорится, что если статистика является несмещенной, полной и достаточной для некоторого параметра θ , то это лучшая несмещенная в среднем оценка для θ . Другими словами, эта статистика имеет меньшие ожидаемые потери для любой выпуклой функции потерь; во многих практических приложениях с квадратичной функцией потерь она имеет меньшую среднеквадратическую ошибку среди любых оценок с тем же ожидаемым значением .

Существуют примеры того, что, когда минимальная достаточная статистика не является полной , существует несколько альтернативных статистик для несмещенной оценки θ , при этом некоторые из них имеют меньшую дисперсию, чем другие. [6]

См. также несмещенную оценку минимальной дисперсии .

Теорема Басу [ править ]

Ограниченная полнота возникает в теореме Басу : [7] который утверждает, что статистика, которая является одновременно ограниченно полной и достаточной, не зависит от любой вспомогательной статистики .

Теорема Бахадура [ править ]

Ограниченная полнота также встречается в теореме Бахадура . В случае, когда существует хотя бы одна минимальная достаточная статистика, статистика, достаточная и ограниченно полная, обязательно является минимально достаточной.Другая форма теоремы Бахадура утверждает, что любая достаточная и ограниченно полная статистика в конечномерном координатном пространстве также является достаточно минимальной. [8]

Примечания [ править ]

  1. ^ Янг, Джорджия и Смит, Р.Л. (2005). Основы статистического вывода. (с. 94). Издательство Кембриджского университета.
  2. ^ Казелла, Г. и Бергер, Р.Л. (2001). Статистический вывод. (стр. 285–286). Даксбери Пресс.
  3. ^ Орлов, Джереми. «Уникальность преобразования Лапласа» (PDF) .
  4. ^ Таль Галили; Исаак Мейлиджсон (31 марта 2016 г.). «Пример улучшаемого улучшения Рао – Блэквелла, неэффективной оценки максимального правдоподобия и несмещенной обобщенной оценки Байеса» . Американский статистик . 70 (1): 108–113. дои : 10.1080/00031305.2015.1100683 . ПМЦ   4960505 . ПМИД   27499547 .
  5. ^ Казелла, Джордж; Бергер, Роджер Л. (2001). Статистический вывод (2-е изд.). Даксбери Пресс. ISBN  978-0534243128 .
  6. ^ Таль Галили; Исаак Мейлиджсон (31 марта 2016 г.). «Пример улучшаемого улучшения Рао – Блэквелла, неэффективной оценки максимального правдоподобия и несмещенной обобщенной оценки Байеса» . Американский статистик . 70 (1): 108–113. дои : 10.1080/00031305.2015.1100683 . ПМЦ   4960505 . ПМИД   27499547 .
  7. ^ Казелла, Г. и Бергер, Р.Л. (2001). Статистический вывод. (стр. 287). Даксбери Пресс.
  8. ^ «Конспекты лекций по статистическому выводу» (PDF) . 7 июля 2022 г.

Ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: c45983af9c5b51282dcadcdf5c813f74__1711367400
URL1:https://arc.ask3.ru/arc/aa/c4/74/c45983af9c5b51282dcadcdf5c813f74.html
Заголовок, (Title) документа по адресу, URL1:
Completeness (statistics) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)