Jump to content

Неравенство Хефдинга

В теории вероятностей неравенство Хёффдинга обеспечивает верхнюю границу вероятности того , что сумма ограниченных независимых случайных величин отклоняется от своего ожидаемого значения более чем на определенную величину. Неравенство Хёффдинга было доказано Василием Хёффдингом в 1963 году. [ 1 ]

Неравенство Хеффдинга является частным случаем неравенства Азумы-Хеффдинга и неравенства Мак-Диармида . Она похожа на границу Чернова , но имеет тенденцию быть менее точной, особенно когда дисперсия случайных величин мала. [ 2 ] Оно похоже на одно из неравенств Бернштейна , но несравнимо с ним .

Заявление

[ редактировать ]

Пусть X 1 , ..., X n независимые случайные величины такие, что почти наверняка . Рассмотрим сумму этих случайных величин:

Тогда теорема Хеффдинга утверждает, что для всех t > 0 [ 3 ]

Здесь [ Sn ] значение Sn E ожидаемое .

Обратите внимание, что неравенства также выполняются, когда X i получено с использованием выборки без замены; в этом случае случайные величины больше не являются независимыми. Доказательство этого утверждения можно найти в статье Хеффдинга. Немного лучшие оценки в случае выборки без замещения см., например, в статье Серфлинга (1974) .

Обобщение

[ редактировать ]

Позволять быть независимыми наблюдениями такими, что и . Позволять . Тогда для любого , [ 4 ]

Особый случай: дома на колесах Бернулли

[ редактировать ]

Предполагать и для всех я . Это может произойти, когда X i являются независимыми случайными величинами Бернулли , хотя они не обязательно должны быть одинаково распределены. Тогда мы получаем неравенство [ 5 ]

или эквивалентно,

для всех . Это версия аддитивной границы Чернова , которая является более общей, поскольку она допускает случайные величины, которые принимают значения от нуля до единицы, но также и более слабая, поскольку граница Чернова дает лучшую хвостовую границу, когда случайные величины имеют небольшую дисперсию.

Общий случай ограниченных сверху случайных величин

[ редактировать ]

Неравенство Хёффдинга можно распространить на случай ограниченных сверху случайных величин. [ 6 ]

Пусть X 1 , ..., X n независимые случайные величины такие, что и почти наверняка . Обозначим через

Неравенство Хеффдинга для ограниченных из вышеперечисленных случайных величин утверждает, что для всех ,

В частности, если для всех , тогда для всех ,

Общий случай субгауссовских случайных величин

[ редактировать ]

Доказательство неравенства Хеффдинга можно обобщить на любое субгауссово распределение . Напомним, что случайная величина X называется субгауссовой, [ 7 ] если

для некоторых . Для любой ограниченной X переменной для для некоторого достаточно большого T . Затем для всех так принимая урожайность

для . Таким образом, каждая ограниченная переменная является субгауссовой.

Для случайной величины X следующая норма конечна тогда и только тогда, когда X субгауссова:

Тогда пусть X 1 , ..., X n — независимые субгауссовы случайные величины с нулевым средним, общая версия неравенства Хёффдинга гласит, что:

где c > 0 — абсолютная константа. [ 8 ]

Доказательство

[ редактировать ]

Доказательство неравенства Хеффдинга аналогично доказательству неравенства концентрации, такого как границы Чернова . [ 9 ] Основное отличие заключается в использовании леммы Хеффдинга :

Предположим, что X — действительная случайная величина такая, что почти наверняка . Затем

Используя эту лемму, мы можем доказать неравенство Хеффдинга. Как и в формулировке теоремы, предположим, что X 1 , ..., X n n независимых случайных величин таких, что почти наверняка для всех я , и пусть .

Тогда для s , t > 0 неравенство Маркова и независимость X i влекут за собой:

Эта верхняя граница является наилучшей для значения s, минимизирующего значение внутри экспоненты. Это можно легко сделать, оптимизировав квадратичное уравнение, дав

Записав приведенную выше оценку для этого значения s , мы получим желаемую оценку:

Использование

[ редактировать ]

Доверительные интервалы

[ редактировать ]

Неравенство Хёффдинга можно использовать для получения доверительных интервалов . Мы рассматриваем монету, у которой орёл появляется с вероятностью p, а решка — с вероятностью 1 − p . Мы подбрасываем монету n раз, генерируя n выборок. (которые являются ) случайными величинами Бернулли . количество Ожидаемое раз, когда монета выпадет орлом, равно pn . Более того, вероятность того, что монета выпадет орлом как минимум k раз, может быть точно определена количественно с помощью следующего выражения:

где H ( n ) — количество орлов при n бросках монеты.

Когда k = ( p + ε ) n для некоторого ε > 0 , неравенство Хеффдинга ограничивает эту вероятность членом, который экспоненциально мал по ε 2 н :

Поскольку эта оценка справедлива по обе стороны от среднего значения, неравенство Хеффдинга подразумевает, что количество орлов, которые мы видим, сконцентрировано вокруг среднего значения с экспоненциально маленьким хвостом.

Думая о как «наблюдаемое» среднее значение, эту вероятность можно интерпретировать как уровень значимости (вероятность совершения ошибки) для доверительного интервала около размера 2 ɛ :

Нахождение n для противоположного знака неравенства в приведенном выше примере, т. е. n , которое нарушает неравенство, но не равенство, указанное выше, дает нам:

Поэтому нам потребуется как минимум образцы для приобретения -доверительный интервал .

Следовательно, стоимость получения доверительного интервала сублинейна с точки зрения уровня достоверности и квадратична с точки зрения точности. Обратите внимание, что существуют более эффективные методы оценки доверительного интервала .

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ Хоффдинг (1963)
  2. ^ Vershynin (2018 , p. 19)
  3. ^ Хоффдинг (1963 , Теорема 2)
  4. ^ Вассерман, Ларри (2004). «Вся статистика» . Спрингеровские тексты в статистике . дои : 10.1007/978-0-387-21736-9 . ISSN   1431-875X .
  5. ^ Хоффдинг (1963 , Теорема 1)
  6. ^ Фан, Грама и Лю (2015 , следствие 2.7)
  7. ^ Кахане (1960)
  8. ^ Vershynin (2018 , Theorem 2.6.2)
  9. ^ Бушерон (2013)
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 497dd5acb322657dbb1e347e74ea18fb__1724172600
URL1:https://arc.ask3.ru/arc/aa/49/fb/497dd5acb322657dbb1e347e74ea18fb.html
Заголовок, (Title) документа по адресу, URL1:
Hoeffding's inequality - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)