Jump to content

Неравенство дисперсии биномиальной суммы

утверждает Неравенство дисперсии биномиальной суммы , что дисперсия суммы биномиально распределенных случайных величин всегда будет меньше или равна дисперсии биномиальной переменной с теми же параметрами n и p . В теории вероятностей и статистике сумма независимых биномиальных случайных величин сама по себе является биномиальной случайной величиной, если все составляющие переменные имеют одинаковую вероятность успеха. Если вероятности успеха различаются, распределение вероятностей суммы не является биномиальным. [1] Отсутствие единообразия в вероятностях успеха в независимых исследованиях приводит к меньшей дисперсии. [2] [3] [4] [5] [6] и является частным случаем более общей теоремы, касающейся ожидаемого значения выпуклых функций. [7] В некоторых статистических приложениях можно использовать стандартную систему оценки биномиальной дисперсии, даже если вероятности компонентов различаются, хотя и с оценкой дисперсии, которая имеет смещение вверх .

Заявление о неравенстве

[ редактировать ]

Рассмотрим сумму Z двух независимых биномиальных случайных величин X ~ B( m 0 , p 0 ) и Y ~ B( m 1 , p 1 ), где Z = X + Y . Тогда дисперсия Z меньше или равна ее дисперсии в предположении, что p 0 = p 1 , то есть, если Z имеет биномиальное распределение. [8] Символически, .

Доказательство

[ редактировать ]

Мы хотим доказать, что

Мы докажем это неравенство, найдя выражение для Var( Z ) и подставив его в левую часть, а затем показав, что неравенство всегда выполняется.

Если Z имеет биномиальное распределение с параметрами n и p , то ожидаемое значение Z p определяется как E[ Z ] = np а дисперсия Z определяется как Var[ Z ] = np (1 – , ). Полагая n = m 0 + m 1 и подставляя E[ Z ] вместо np , получаем

Случайные величины X и Y независимы, поэтому дисперсия суммы равна сумме дисперсий , то есть

Поэтому для доказательства теоремы достаточно доказать, что


Замена E[ X ] + E[ Y ] на E[ Z ] дает

Умножая скобки и вычитая E[X] + E[Y] из обеих частей, получаем

Умножение скобок дает

Вычитание E[X] и E[Y] из обеих частей и обращение неравенства дает

Разложение правой части дает

Умножение на урожайность

Вычитая правую часть, получаем соотношение

или эквивалентно

Квадрат действительного числа всегда больше или равен нулю, поэтому это верно для всех независимых биномиальных распределений, которые могут принимать X и Y. Этого достаточно для доказательства теоремы.


Хотя это доказательство было разработано для суммы двух переменных, его легко обобщить на сумму больше двух. Кроме того, если известны отдельные вероятности успеха, то известно, что дисперсия принимает вид [6]

где . Из этого выражения также следует, что дисперсия всегда меньше, чем у биномиального распределения с , поскольку стандартное выражение для дисперсии уменьшается на ns 2 , положительное число.

Приложения

[ редактировать ]

Неравенство может быть полезно в контексте множественного тестирования , когда множество проверок статистических гипотез в рамках конкретного исследования проводится . Каждый тест можно рассматривать как переменную Бернулли с вероятностью успеха p . обозначаемую S. Рассмотрим общее количество положительных тестов как случайную величину , Эта величина важна для оценки частоты ложных обнаружений (FDR) , которые количественно определяют неопределенность результатов испытаний. Если нулевая гипотеза верна для некоторых тестов, а альтернативная гипотеза верна для других тестов, то вероятность успеха, вероятно, будет различаться между этими двумя группами. Однако теорема о неравенстве дисперсии утверждает, что если тесты независимы, дисперсия S не будет больше, чем она была бы при биномиальном распределении.

  1. ^ Батлер, Кен; Стивенс, Майкл (1993). «Распределение суммы биномиальных случайных величин» (PDF) . Технический отчет № 467 . Статистический факультет Стэнфордского университета. Архивировано (PDF) из оригинала 11 апреля 2021 г.
  2. ^ Недельман, Дж. и Валлениус, Т., 1986. Испытания Бернулли, испытания Пуассона, неожиданные отклонения и неравенство Йенсена. Американский статистик, 40 (4): 286–289.
  3. ^ Феллер, В. 1968. Введение в теорию вероятностей и ее приложения (Том 1, 3-е изд.). Нью-Йорк: Джон Уайли.
  4. ^ Джонсон, Н.Л. и Коц, С. 1969. Дискретные распределения. Нью-Йорк: Джон Уайли
  5. ^ Кендалл, М. и Стюарт, А. 1977. Передовая теория статистики. Нью-Йорк: Макмиллан.
  6. ^ Jump up to: а б Дрезнер, Цви; Фарнум, Николас (1993). «Обобщенное биномиальное распределение». Коммуникации в статистике - теория и методы . 22 (11): 3051–3063. дои : 10.1080/03610929308831202 . ISSN   0361-0926 .
  7. ^ Хоффдинг, В. 1956. О распределении числа успехов в независимых испытаниях. Анналы математической статистики (27): 713–721.
  8. ^ Миллштейн, Дж.; Вольфсон, Д. (2013). «Вычислительно эффективная оценка доверительного интервала на основе перестановок для FDR хвостовой области» . Границы генетики . 4 (179): 1–11. дои : 10.3389/fgene.2013.00179 . ПМЦ   3775454 . ПМИД   24062767 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: f1c29d24d1ab32acfcd45ae215da4a05__1711489740
URL1:https://arc.ask3.ru/arc/aa/f1/05/f1c29d24d1ab32acfcd45ae215da4a05.html
Заголовок, (Title) документа по адресу, URL1:
Binomial sum variance inequality - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)