Jump to content

Неравенство Бретаньоля – Хубера

В теории информации неравенство Бретаньоля – Хубера ограничивает общее расстояние вариации между двумя распределениями вероятностей. и вогнутой и ограниченной функцией расходимости Кульбака–Лейблера . Оценку можно рассматривать как альтернативу известному неравенству Пинскера : когда большой (например, больше 2). [ 1 ] ), неравенство Пинскера бессмысленно, а Бретаньолле – Хубера остается ограниченным и, следовательно, непустым. Он используется в статистике и машинном обучении для доказательства нижних границ теории информации на основе проверки гипотез. [ 2 ]   ( Неравенство Бретаньолля – Хубера – Кэрола представляет собой вариант неравенства концентрации для полиномиально распределенных случайных величин, которое ограничивает общее расстояние вариации.)

Официальное заявление

[ редактировать ]

Предварительные определения

[ редактировать ]

Позволять и быть двумя распределениями вероятностей в измеримом пространстве . Напомним, что общая разница между и определяется

Расхождение Кульбака -Лейблера определяется следующим образом:

Вышеупомянутые обозначения означает абсолютную непрерывность относительно , и обозначает Радона–Никодима производную относительно .

Общее заявление

[ редактировать ]

Неравенство Бретаньоля – Хубера гласит:

Альтернативная версия

[ редактировать ]

Следующая версия напрямую подразумевается из приведенной выше оценки, но некоторые авторы [ 2 ] предпочитаю говорить об этом так. Позволять быть любое событие. Затем

где является дополнением .

Действительно, по определению полной вариации для любого ,

Переставляя, получаем заявленную нижнюю оценку .

Доказательство

[ редактировать ]

Докажем основное утверждение, следуя идеям книги Цыбакова (лемма 2.6, стр. 89): [ 3 ] которые отличаются от оригинального доказательства [ 4 ] (см. примечание К.Канона [ 1 ] для модернизированной перезаписи их аргументов).

Доказательство состоит из двух шагов:

1. Докажите с помощью Коши–Шварца, что полная вариация связана с коэффициентом Бхаттачарьи (правая часть неравенства):

2. Докажите, используя умное применение неравенства Йенсена, что

  • Шаг 1:
Сначала заметьте, что
Чтобы увидеть это, обозначим и без ограничения общности предположим, что такой, что . Тогда мы сможем переписать
А затем добавление и удаление мы получаем оба тождества.
Затем
потому что
  • Шаг 2:
Мы пишем и применим неравенство Йенсена :
Объединение результатов шагов 1 и 2 приводит к заявленной границе общей вариации.

Примеры приложений

[ редактировать ]

Пример сложности необъективного подбрасывания монеты

[ редактировать ]

Источник: [ 1 ]

Вопрос в том Сколько подбрасываний монеты мне нужно, чтобы отличить честную монету от необъективной?

Предположим, у вас есть 2 монеты, честная монета ( бернулли распределена со средним ) и -предвзятая монета ( ). Тогда, чтобы идентифицировать смещенную монету с вероятностью не менее (для некоторых ), по меньшей мере

Чтобы получить эту нижнюю оценку, мы предполагаем, что общее расстояние вариации между двумя последовательностями образцы как минимум . Это связано с тем, что верхняя граница общего отклонения ограничивает вероятность недооценки или переоценки средних значений монет. Обозначим и соответствующие совместные распределения подбрасывание монеты для каждой монеты, затем

У нас есть

Результат получается перестановкой слагаемых.

Теоретико-информационная нижняя оценка для k -вооруженными бандитами игр с

[ редактировать ]

В многоруком бандите нижняя граница минимаксного сожаления любого бандитского алгоритма может быть доказана с использованием Бретаньоля – Хубера и его последствий при проверке гипотез (см. главу 15 « Бандитских алгоритмов»). [ 2 ] ).

Этот результат был впервые доказан в 1979 году Жаном Бретаньоллем и Катрин Юбер и опубликован в материалах Страсбургского семинара по теории вероятностей. [ 4 ] Книга Александра Цыбакова. [ 3 ] представляет собой раннюю переиздание неравенства и его приписывание Бретаньолю и Юберу, которое представлено как ранняя и менее общая версия леммы Ассуада (см. примечания 2.8). Постоянное улучшение Бретаньолле-Хубера было доказано в 2014 году как следствие расширения неравенства Фано . [ 5 ]

См. также

[ редактировать ]
  1. ^ Jump up to: а б с Канонн, Клеман (2022). «Краткая заметка о неравенстве между КЛ и ТВ». arXiv : 2202.07198 [ мат.PR ].
  2. ^ Jump up to: а б с Латтимор, Тор; Сепешвари, Чаба (2020). Бандитские алгоритмы (PDF) . Издательство Кембриджского университета . Проверено 18 августа 2022 г.
  3. ^ Jump up to: а б Цыбаков, Александр Б. (2010). Введение в непараметрическое оценивание . Серия Спрингера по статистике. Спрингер. дои : 10.1007/b13794 . ISBN  978-1-4419-2709-5 . OCLC   757859245 . S2CID   42933599 .
  4. ^ Jump up to: а б Бретаньолле, Ж.; Хубер, К. (1978), «Оценка плотностей: минимаксный риск» , Семинар по вероятностям XII , Конспекты лекций по математике, том. 649, Берлин, Гейдельберг: Springer Berlin Heidelberg, стр. 342–363, номер домена : 10.1007/bfb0064610 , ISBN.  978-3-540-08761-8 , S2CID   122597694 , получено 20 августа 2022 г.
  5. ^ Герчиновиц, Себастьян; Менар, Пьер; Штольц, Жиль (01 мая 2020 г.). «Неравенство Фано для случайных величин» . Статистическая наука . 35 (2). arXiv : 1702.05985 . дои : 10.1214/19-стс716 . ISSN   0883-4237 . S2CID   15808752 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: dee9f3527205edac41f35541221e6237__1715742060
URL1:https://arc.ask3.ru/arc/aa/de/37/dee9f3527205edac41f35541221e6237.html
Заголовок, (Title) документа по адресу, URL1:
Bretagnolle–Huber inequality - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)