Неравенство концентрации
В вероятностей теории неравенства концентрации обеспечивают математические границы вероятности отклонения случайной величины от некоторого значения (обычно от ее ожидаемого значения ).
Закон больших чисел классической теории вероятностей гласит, что суммы независимых случайных величин в мягких условиях с высокой вероятностью концентрируются вокруг своего ожидания. Такие суммы являются простейшими примерами случайных величин, сосредоточенных вокруг их среднего значения .
Неравенства концентрации можно сортировать по тому, сколько информации о случайной величине необходимо для их использования. [ нужна ссылка ]
Неравенство Маркова
[ редактировать ]Позволять быть случайной величиной, которая неотрицательна ( почти наверняка ). Тогда для каждой константы ,
Обратите внимание на следующее расширение неравенства Маркова: если строго возрастающая и неотрицательная функция, то
Неравенство Чебышева
[ редактировать ]Неравенство Чебышева требует следующей информации о случайной величине :
- Ожидаемое значение конечно.
- Дисперсия конечно.
Тогда для каждой константы ,
или эквивалентно,
где стандартное отклонение .
Неравенство Чебышева можно рассматривать как частный случай обобщенного неравенства Маркова, примененного к случайной величине. с .
Vysochanskij–Petunin inequality
[ редактировать ]Пусть X — случайная величина с унимодальным распределением, средним значением µ и конечной ненулевой дисперсией σ. 2 . Тогда для любого
(Относительно элементарное доказательство см., например, [1] ).
Одностороннее неравенство Высочанского–Петунина.
[ редактировать ]Для унимодальной случайной величины и , одностороннее неравенство Высочанского-Петунина [2] имеет место следующее:
Неравенство Пэли – Зигмунда
[ редактировать ]В отличие от наиболее часто используемых неравенств концентрации, неравенство Пэли-Зигмунда дает нижнюю границу вероятности отклонения.
Неравенство Кантелли
[ редактировать ]Неравенство Гаусса
[ редактировать ]границы Чернова
[ редактировать ]Общая граница Чернова [3] : 63–65 требуется производящая момент функция , определяемый как Оно существует всегда, но может быть бесконечным. Из неравенства Маркова для каждого :
и для каждого :
Существуют различные границы Чернова для разных распределений и разных значений параметра . Видеть [4] : 5–7 для составления большего количества неравенств концентрации.
Границы сумм независимых ограниченных переменных
[ редактировать ]Позволять — независимые случайные величины такие, что для всех i :
Позволять быть их суммой, его ожидаемое значение и его дисперсия:
Часто бывает интересно определить разницу между суммой и ее ожидаемым значением. Можно использовать несколько неравенств.
1. Неравенство Хеффдинга гласит, что:
2. Случайная величина является частным случаем мартингейла , и . Следовательно, можно также использовать общую форму неравенства Азумы , которая дает аналогичную оценку:
Это обобщение метода Хоффдинга, поскольку оно может обрабатывать другие типы мартингалов, а также супермартингалы и субмартингалы . См. Fan et al. (2015). [5] Обратите внимание: если используется более простая форма неравенства Азумы, показатель степени в оценке будет хуже в 4 раза.
3. Функция суммы, , является частным случаем функции n переменных. Эта функция изменяется ограниченным образом: при изменении переменной i значение f изменяется не более чем на . Следовательно, неравенство Мак-Диармида можно также использовать , которое дает аналогичную оценку:
Это другое обобщение Хеффдинга, поскольку оно может обрабатывать и другие функции, помимо функции суммы, при условии, что они изменяются ограниченным образом.
4. Неравенство Беннета дает некоторое улучшение по сравнению с неравенством Хеффдинга, когда дисперсии слагаемых малы по сравнению с их почти надежными оценками C . Там говорится, что:
- где
5. Первое из неравенств Бернштейна гласит, что:
Это обобщение метода Хоффдинга, поскольку оно может обрабатывать случайные величины не только с почти навернякай границей, но и с почти навернякай границей, и с границей дисперсии.
6. Границы Чернова имеют особенно простой вид в случае суммы независимых переменных, поскольку .
Например, [6] предположим, что переменные удовлетворить , для . Тогда мы имеем нижнее хвостовое неравенство:
Если удовлетворяет , мы имеем верхнее хвостовое неравенство:
Если являются идентификаторами, и это дисперсия , типичная версия неравенства Чернова:
7. Подобные оценки можно найти в: Распределение Радемахера#Границы сумм.
Неравенство Эфрона – Штейна
[ редактировать ]Неравенство Эфрона – Штейна (или неравенство влияния, или ограничение MG на дисперсию) ограничивает дисперсию общей функции.
Предположим, что , независимы с и иметь одинаковое распределение для всех .
Позволять Затем
Доказательство можно найти, например, в. [7]
Неравенство Бретаньоля – Хубера – Кэрола
[ редактировать ]Неравенство Бретаньолла – Хубера – Кэрол ограничивает разницу между вектором полиномиально распределенных случайных величин и вектором ожидаемых значений. [8] [9] Простое доказательство появляется в [10] (Раздел Приложения).
Если случайный вектор имеет полиномиальное распределение с параметрами и удовлетворяет затем
Это неравенство используется для оценки общего расстояния вариации .
Неравенство Мэйсона и Ван Цвета
[ редактировать ]Неравенство Мэйсона и Ван Цвета [11] для полиномиальных случайных векторов речь идет о небольшой модификации классической статистики хи-квадрат.
Пусть случайный вектор быть полиномиально распределены с параметрами и такой, что для Тогда для каждого и существуют константы такой, что для всех и удовлетворяющий и у нас есть
Неравенство Дворецкого – Кифера – Вольфовица.
[ редактировать ]Неравенство Дворецкого-Кифера-Вольфовица ограничивает разницу между реальной и эмпирической кумулятивной функцией распределения .
Учитывая натуральное число , позволять быть действительными независимыми и одинаково распределенными случайными величинами с кумулятивной функцией распределения F (·). Позволять обозначают соответствующую эмпирическую функцию распределения, определяемую формулой
Так это вероятность того, что одна случайная величина меньше, чем , и это среднее количество случайных величин, меньших, чем .
Затем
Неравенства против концентрации
[ редактировать ]неравенства против концентрации С другой стороны, обеспечивают верхнюю границу того, насколько случайная величина может концентрироваться вокруг величины.
Например, Рао и Йегудаев. [12] показать, что существует некоторый такая, что для большинства направлений гиперкуба , верно следующее: [ нужны разъяснения ]
где извлекается равномерно из подмножества достаточно большого размера.
Такие неравенства важны в нескольких областях, включая сложность связи ( например , в доказательстве проблемы Хэмминга [13] ) и теория графов . [14]
Интересное неравенство антиконцентрации для взвешенных сумм независимых случайных величин Радемахера можно получить с помощью неравенств Пэли – Зигмунда и Хинчина . [15]
Ссылки
[ редактировать ]- ^ Пукельсхайм, Ф., 1994. Правило трех сигм. Американский статистик , 48 (2), стр. 88–91.
- ^ Меркадье, Матье; Штробель, Франк (16 ноября 2021 г.). «Одностороннее неравенство Высочанского-Петунина с финансовыми приложениями» . Европейский журнал операционных исследований . 295 (1): 374–377. дои : 10.1016/j.ejor.2021.02.041 . ISSN 0377-2217 .
- ^ Митценмахер, Майкл; Упфал, Эли (2005). Вероятность и вычисления: рандомизированные алгоритмы и вероятностный анализ . Издательство Кембриджского университета. ISBN 0-521-83540-2 .
- ^ Слэгл, НП (2012). «Сто статистических данных и вероятностных неравенств». arXiv : 2102.07234 .
- ^ Фан, Х.; Грама, И.; Лю, К. (2015). «Экспоненциальные неравенства для мартингалов с приложениями» . Электронный журнал вероятностей . 20 . Электрон. Дж. Пробаб. 20: 1–22. arXiv : 1311.6273 . дои : 10.1214/EJP.v20-3496 .
- ^ Чанг, Фан ; Лу, Линьюань (2010). «Старое и новое неравенство концентрации» (PDF) . Сложные графы и сети . Американское математическое общество . Проверено 14 августа 2018 г.
- ^ Бушерон, Сенфан; Лугоши, Г{\'а}бор; Буске, Оливье (2004). «Неравенства концентрации». Продвинутые лекции по машинному обучению: Летние школы ML 2003, Канберра, Австралия, 2–14 февраля 2003 г., Тюбинген, Германия, 4–16 августа 2003 г., Пересмотренные лекции . Springer: 208–240.
- ^ Бретаньоль, Жан; Хубер-Кэрол, Кэтрин (1978). Эмпирические законы и расстояние Прохорова . Конспект лекций по математике. Полет. 649.стр. 332–341. дои : 10.1007/BFb0064609 . ISBN 978-3-540-08761-8 .
- ^ ван дер Ваарт, AW; Веллнер, Дж. А. (1996). Слабая конвергенция и эмпирические процессы: с приложениями к статистике . Springer Science & Business Media.
- ^ Юто Усиода; Масато Танака; Томоми Мацуи (2022). «Методы Монте-Карло для определения индекса мощности Шепли – Шубика» . Игры . 13 (3): 44. arXiv : 2101.02841 . дои : 10.3390/g13030044 .
- ^ Мейсон, Дэвид М.; Виллем Р. Ван Цвет (1987). «Уточнение неравенства Гоминьдана для однородного эмпирического процесса» . Анналы вероятности . 15 (3): 871–884. дои : 10.1214/aop/1176992070 .
- ^ Рао, Ануп; Иегудаёв, Амир (2018). «Антиконцентрация по большинству направлений» . Электронный коллоквиум по вычислительной сложности.
- ^ Шерстов, Александр А. (2012). «Коммуникационная сложность расстояния Хэмминга» . Теория вычислений .
- ^ Мэтью Кван; Бенни Судаков; Туан Тран (2018). «Антиконцентрация для статистики подграфов». Журнал Лондонского математического общества . 99 (3): 757–777. arXiv : 1807.05202 . Бибкод : 2018arXiv180705202K . дои : 10.1112/jlms.12192 . S2CID 54065186 .
- ^ Вераар, Марк (2009). «О неравенствах Хинчина с весом». arXiv : 0909.2586v1 [ math.PR ].
Внешние ссылки
[ редактировать ]- Картик Шридхаран, « Нежное введение в неравенство концентрации » — Корнельский университет