Неравенство Бретаньоля – Хубера
В теории информации неравенство Бретаньоля – Хубера ограничивает общее расстояние вариации между двумя распределениями вероятностей. и вогнутой и ограниченной функцией расходимости Кульбака–Лейблера . Оценку можно рассматривать как альтернативу известному неравенству Пинскера : когда большой (например, больше 2). [ 1 ] ), неравенство Пинскера бессмысленно, а Бретаньолле – Хубера остается ограниченным и, следовательно, непустым. Он используется в статистике и машинном обучении для доказательства нижних границ теории информации на основе проверки гипотез. [ 2 ] ( Неравенство Бретаньолля – Хубера – Кэрола представляет собой вариант неравенства концентрации для полиномиально распределенных случайных величин, которое ограничивает общее расстояние вариации.)
Официальное заявление
[ редактировать ]Предварительные определения
[ редактировать ]Позволять и быть двумя распределениями вероятностей в измеримом пространстве . Напомним, что общая разница между и определяется
Расхождение Кульбака -Лейблера определяется следующим образом:
Вышеупомянутые обозначения означает абсолютную непрерывность относительно , и обозначает Радона–Никодима производную относительно .
Общее заявление
[ редактировать ]Неравенство Бретаньоля – Хубера гласит:
Альтернативная версия
[ редактировать ]Следующая версия напрямую подразумевается из приведенной выше оценки, но некоторые авторы [ 2 ] предпочитаю говорить об этом так. Позволять быть любое событие. Затем
где является дополнением .
Действительно, по определению полной вариации для любого ,
Переставляя, получаем заявленную нижнюю оценку .
Доказательство
[ редактировать ]Докажем основное утверждение, следуя идеям книги Цыбакова (лемма 2.6, стр. 89): [ 3 ] которые отличаются от оригинального доказательства [ 4 ] (см. примечание К.Канона [ 1 ] для модернизированной перезаписи их аргументов).
Доказательство состоит из двух шагов:
1. Докажите с помощью Коши–Шварца, что полная вариация связана с коэффициентом Бхаттачарьи (правая часть неравенства):
2. Докажите, используя умное применение неравенства Йенсена, что
- Шаг 1:
- Сначала заметьте, что
- Чтобы увидеть это, обозначим и без ограничения общности предположим, что такой, что . Тогда мы сможем переписать
- А затем добавление и удаление мы получаем оба тождества.
- Затем
- потому что
- Шаг 2:
- Мы пишем и применим неравенство Йенсена :
- Объединение результатов шагов 1 и 2 приводит к заявленной границе общей вариации.
Примеры приложений
[ редактировать ]Пример сложности необъективного подбрасывания монеты
[ редактировать ]Источник: [ 1 ]
Вопрос в том Сколько подбрасываний монеты мне нужно, чтобы отличить честную монету от необъективной?
Предположим, у вас есть 2 монеты, честная монета ( бернулли распределена со средним ) и -предвзятая монета ( ). Тогда, чтобы идентифицировать смещенную монету с вероятностью не менее (для некоторых ), по меньшей мере
Чтобы получить эту нижнюю оценку, мы предполагаем, что общее расстояние вариации между двумя последовательностями образцы как минимум . Это связано с тем, что верхняя граница общего отклонения ограничивает вероятность недооценки или переоценки средних значений монет. Обозначим и соответствующие совместные распределения подбрасывание монеты для каждой монеты, затем
У нас есть
Результат получается перестановкой слагаемых.
Теоретико-информационная нижняя оценка для k -вооруженными бандитами игр с
[ редактировать ]В многоруком бандите нижняя граница минимаксного сожаления любого бандитского алгоритма может быть доказана с использованием Бретаньоля – Хубера и его последствий при проверке гипотез (см. главу 15 « Бандитских алгоритмов»). [ 2 ] ).
История
[ редактировать ]Этот результат был впервые доказан в 1979 году Жаном Бретаньоллем и Катрин Юбер и опубликован в материалах Страсбургского семинара по теории вероятностей. [ 4 ] Книга Александра Цыбакова. [ 3 ] представляет собой раннюю переиздание неравенства и его приписывание Бретаньолю и Юберу, которое представлено как ранняя и менее общая версия леммы Ассуада (см. примечания 2.8). Постоянное улучшение Бретаньолле-Хубера было доказано в 2014 году как следствие расширения неравенства Фано . [ 5 ]
См. также
[ редактировать ]- Общая вариация для списка верхних границ
- Неравенство Бретаньоля – Хубера – Кэрола в неравенстве концентрации
Ссылки
[ редактировать ]- ^ Jump up to: а б с Канонн, Клеман (2022). «Краткая заметка о неравенстве между КЛ и ТВ». arXiv : 2202.07198 [ мат.PR ].
- ^ Jump up to: а б с Латтимор, Тор; Сепешвари, Чаба (2020). Бандитские алгоритмы (PDF) . Издательство Кембриджского университета . Проверено 18 августа 2022 г.
- ^ Jump up to: а б Цыбаков, Александр Б. (2010). Введение в непараметрическое оценивание . Серия Спрингера по статистике. Спрингер. дои : 10.1007/b13794 . ISBN 978-1-4419-2709-5 . OCLC 757859245 . S2CID 42933599 .
- ^ Jump up to: а б Бретаньолле, Ж.; Хубер, К. (1978), «Оценка плотностей: минимаксный риск» , Семинар по вероятностям XII , Конспекты лекций по математике, том. 649, Берлин, Гейдельберг: Springer Berlin Heidelberg, стр. 342–363, номер домена : 10.1007/bfb0064610 , ISBN. 978-3-540-08761-8 , S2CID 122597694 , получено 20 августа 2022 г.
- ^ Герчиновиц, Себастьян; Менар, Пьер; Штольц, Жиль (01 мая 2020 г.). «Неравенство Фано для случайных величин» . Статистическая наука . 35 (2). arXiv : 1702.05985 . дои : 10.1214/19-стс716 . ISSN 0883-4237 . S2CID 15808752 .