Неравенство Хефдинга
В теории вероятностей неравенство Хёффдинга обеспечивает верхнюю границу вероятности того , что сумма ограниченных независимых случайных величин отклоняется от своего ожидаемого значения более чем на определенную величину. Неравенство Хёффдинга было доказано Василием Хёффдингом в 1963 году. [ 1 ]
Неравенство Хеффдинга является частным случаем неравенства Азумы-Хеффдинга и неравенства Мак-Диармида . Она похожа на границу Чернова , но имеет тенденцию быть менее точной, особенно когда дисперсия случайных величин мала. [ 2 ] Оно похоже на одно из неравенств Бернштейна , но несравнимо с ним .
Заявление
[ редактировать ]Пусть X 1 , ..., X n — независимые случайные величины такие, что почти наверняка . Рассмотрим сумму этих случайных величин:
Тогда теорема Хеффдинга утверждает, что для всех t > 0 [ 3 ]
Здесь [ Sn ] — значение Sn E ожидаемое .
Обратите внимание, что неравенства также выполняются, когда X i получено с использованием выборки без замены; в этом случае случайные величины больше не являются независимыми. Доказательство этого утверждения можно найти в статье Хеффдинга. Немного лучшие оценки в случае выборки без замещения см., например, в статье Серфлинга (1974) .
Обобщение
[ редактировать ]Позволять быть независимыми наблюдениями такими, что и . Позволять . Тогда для любого , [ 4 ]
Особый случай: дома на колесах Бернулли
[ редактировать ]Предполагать и для всех я . Это может произойти, когда X i являются независимыми случайными величинами Бернулли , хотя они не обязательно должны быть одинаково распределены. Тогда мы получаем неравенство [ 5 ]
или эквивалентно,
для всех . Это версия аддитивной границы Чернова , которая является более общей, поскольку она допускает случайные величины, которые принимают значения от нуля до единицы, но также и более слабая, поскольку граница Чернова дает лучшую хвостовую границу, когда случайные величины имеют небольшую дисперсию.
Общий случай ограниченных сверху случайных величин
[ редактировать ]Неравенство Хёффдинга можно распространить на случай ограниченных сверху случайных величин. [ 6 ]
Пусть X 1 , ..., X n — независимые случайные величины такие, что и почти наверняка . Обозначим через
Неравенство Хеффдинга для ограниченных из вышеперечисленных случайных величин утверждает, что для всех ,
В частности, если для всех , тогда для всех ,
Общий случай субгауссовских случайных величин
[ редактировать ]Доказательство неравенства Хеффдинга можно обобщить на любое субгауссово распределение . Напомним, что случайная величина X называется субгауссовой, [ 7 ] если
для некоторых . Для любой ограниченной X переменной для для некоторого достаточно большого T . Затем для всех так принимая урожайность
для . Таким образом, каждая ограниченная переменная является субгауссовой.
Для случайной величины X следующая норма конечна тогда и только тогда, когда X субгауссова:
Тогда пусть X 1 , ..., X n — независимые субгауссовы случайные величины с нулевым средним, общая версия неравенства Хёффдинга гласит, что:
где c > 0 — абсолютная константа. [ 8 ]
Доказательство
[ редактировать ]Доказательство неравенства Хеффдинга аналогично доказательству неравенства концентрации, такого как границы Чернова . [ 9 ] Основное отличие заключается в использовании леммы Хеффдинга :
- Предположим, что X — действительная случайная величина такая, что почти наверняка . Затем
- Предположим, что X — действительная случайная величина такая, что почти наверняка . Затем
Используя эту лемму, мы можем доказать неравенство Хеффдинга. Как и в формулировке теоремы, предположим, что X 1 , ..., X n — n независимых случайных величин таких, что почти наверняка для всех я , и пусть .
Тогда для s , t > 0 неравенство Маркова и независимость X i влекут за собой:
Эта верхняя граница является наилучшей для значения s, минимизирующего значение внутри экспоненты. Это можно легко сделать, оптимизировав квадратичное уравнение, дав
Записав приведенную выше оценку для этого значения s , мы получим желаемую оценку:
Использование
[ редактировать ]Доверительные интервалы
[ редактировать ]Неравенство Хёффдинга можно использовать для получения доверительных интервалов . Мы рассматриваем монету, у которой орёл появляется с вероятностью p, а решка — с вероятностью 1 − p . Мы подбрасываем монету n раз, генерируя n выборок. (которые являются ) случайными величинами Бернулли . количество Ожидаемое раз, когда монета выпадет орлом, равно pn . Более того, вероятность того, что монета выпадет орлом как минимум k раз, может быть точно определена количественно с помощью следующего выражения:
где H ( n ) — количество орлов при n бросках монеты.
Когда k = ( p + ε ) n для некоторого ε > 0 , неравенство Хеффдинга ограничивает эту вероятность членом, который экспоненциально мал по ε 2 н :
Поскольку эта оценка справедлива по обе стороны от среднего значения, неравенство Хеффдинга подразумевает, что количество орлов, которые мы видим, сконцентрировано вокруг среднего значения с экспоненциально маленьким хвостом.
Думая о как «наблюдаемое» среднее значение, эту вероятность можно интерпретировать как уровень значимости (вероятность совершения ошибки) для доверительного интервала около размера 2 ɛ :
Нахождение n для противоположного знака неравенства в приведенном выше примере, т. е. n , которое нарушает неравенство, но не равенство, указанное выше, дает нам:
Поэтому нам потребуется как минимум образцы для приобретения -доверительный интервал .
Следовательно, стоимость получения доверительного интервала сублинейна с точки зрения уровня достоверности и квадратична с точки зрения точности. Обратите внимание, что существуют более эффективные методы оценки доверительного интервала .
См. также
[ редактировать ]- Неравенство концентрации - сводка хвостовых границ случайных величин.
- Лемма Хёффдинга
- Неравенства Бернштейна (теория вероятностей)
Примечания
[ редактировать ]- ^ Хоффдинг (1963)
- ^ Vershynin (2018 , p. 19)
- ^ Хоффдинг (1963 , Теорема 2)
- ^ Вассерман, Ларри (2004). «Вся статистика» . Спрингеровские тексты в статистике . дои : 10.1007/978-0-387-21736-9 . ISSN 1431-875X .
- ^ Хоффдинг (1963 , Теорема 1)
- ^ Фан, Грама и Лю (2015 , следствие 2.7)
- ^ Кахане (1960)
- ^ Vershynin (2018 , Theorem 2.6.2)
- ^ Бушерон (2013)
Ссылки
[ редактировать ]- Серфлинг, Роберт Дж. (1974). «Вероятностные неравенства для суммы при выборке без замены» . Анналы статистики . 2 (1): 39–48. дои : 10.1214/aos/1176342611 . МР 0420967 .
- Хеффдинг, Василий (1963). «Вероятностные неравенства для сумм ограниченных случайных величин» (PDF) . Журнал Американской статистической ассоциации . 58 (301): 13–30. дои : 10.1080/01621459.1963.10500830 . JSTOR 2282952 . МР 0144363 .
- Фан, Х.; Грама, И.; Лю, К. (2015). «Экспоненциальные неравенства для мартингалов с приложениями» . Электрон. Дж. Вероятность . 20 (1): 1–22. arXiv : 1311.6273 . дои : 10.1214/EJP.v20-3496 .
- Вершинин, Роман (2018). Многомерная вероятность . Издательство Кембриджского университета. ISBN 9781108415194 .
- Бушерон, Стефан (2013). Неравенства концентрации: неасимптотическая теория независимости . Габор Лугоши, Паскаль Массар. Оксфорд: Издательство Оксфордского университета. ISBN 978-0-19-953525-5 . OCLC 837517674 .
- Кахане, JP (1960). «Локальные свойства случайных функций ряда Фурье». Стад. Математика . Полет. 19.стр. 1–25. [1] .