Jump to content

Неравенство Пинскера

В теории информации неравенство Пинскера , названное в честь его изобретателя Марка Семеновича Пинскера , представляет собой неравенство , которое ограничивает общее вариационное расстояние (или статистическое расстояние) с точки зрения расхождения Кульбака-Лейблера . Неравенство строго ограничено постоянными факторами. [ 1 ]

Официальное заявление

[ редактировать ]

Неравенство Пинскера гласит, что если и - это два распределения вероятностей в измеримом пространстве. , затем

где

это общее расстояние вариации (или статистическое расстояние) между и и

расхождение Кульбака–Лейблера в nats . Когда пространство выборки является конечным множеством, расходимость Кульбака–Лейблера определяется выражением

Заметим, что в терминах полной вариационной нормы подписанного мероприятия , неравенство Пинскера отличается от приведенного выше в два раза:

Доказательство неравенства Пинскера использует неравенство разделения для f -дивергенций .

Альтернативная версия

[ редактировать ]

Заметим, что выражение неравенства Пинскера зависит от того, какой базис логарифмирования используется при определении КЛ-дивергенции. определяется с помощью (логарифм по основанию ), тогда как обычно определяется с помощью (логарифм по основанию 2). Затем,

Учитывая приведенные выше комментарии, в некоторой литературе существует альтернативная формулировка неравенства Пинскера, которая связывает расхождение информации с вариационным расстоянием:

то есть

в котором

это (ненормализованное) расстояние вариации между двумя функциями плотности вероятности и на том же алфавите . [ 2 ]

Эта форма неравенства Пинскера показывает, что «сходимость по расхождению» является более сильным понятием, чем «сходимость по вариационному расстоянию».

Простое доказательство Джона Полларда можно получить, положив :

Здесь лемма Титу известна также как неравенство Седракяна .

Обратите внимание, что нижняя оценка неравенства Пинскера бессмысленна для любых распределений, где , поскольку полное вариационное расстояние не более . Для таких распределений можно использовать альтернативную оценку, предложенную Бретаньоллем и Хубером. [ 3 ] (см. также Цыбаков [ 4 ] ):

Пинскер первым доказал неравенство с большей константой. Неравенство в приведенной выше форме было независимо доказано Кульбаком , Чисаром и Кемперманом . [ 5 ]

Обратная задача

[ редактировать ]

Точное обратное неравенству не может иметь места: для любого , есть распределения с но . Простой пример — двухточечное пространство. с и . [ 6 ]

Однако на конечных пространствах справедливо обратное неравенство с постоянной, зависящей от . [ 7 ] Более конкретно, можно показать, что при определении у нас есть для любой меры который абсолютно непрерывен

Как следствие, если имеет полную поддержку (т. для всех ), затем

  1. ^ Чисар, Имре; Кернер, Янош (2011). Теория информации: теоремы кодирования для дискретных систем без памяти . Издательство Кембриджского университета. п. 44. ИСБН  9781139499989 .
  2. ^ Раймонд В., Юнг (2008). Теория информации и сетевое кодирование . Гонконг: Спрингер. п. 26. ISBN  978-0-387-79233-0 .
  3. ^ Бретаньолле, Дж.; Хубер, К., Оценка плотностей: минимаксный риск , Семинар по вероятностям, XII (Страсбургский университет, Страсбург, 1976/1977), стр. 342–363, Конспекты лекций по математике, 649, Springer, Берлин, 1978, Лемма 2.1 (на французском языке).
  4. ^ Цыбаков, Александр Б., Введение в непараметрическую оценку , переработанное и дополненное издание французского оригинала 2004 года. Перевод Владимира Зайца. Серия Спрингера по статистике. Спрингер, Нью-Йорк, 2009. xii+214 стр. ISBN   978-0-387-79051-0 , уравнение 2.25.
  5. ^ Цыбаков, Александр (2009). Введение в непараметрическую оценку . Спрингер. п. 132 . ISBN  9780387790527 .
  6. ^ Расхождение становится бесконечным, когда одно из двух распределений присваивает событию нулевую вероятность, а другое присваивает ему ненулевую вероятность (независимо от того, насколько она мала); см., например Басу, Митра; Хо, Тин Кам (2006). Сложность данных в распознавании образов . Спрингер. п. 161. ИСБН  9781846281723 . .
  7. ^ см. лемму 4.1 в Гетце, Фридрих; Самбале, Хольгер; Синулис, Артур (2019). «Концентрация высшего порядка для функций слабозависимых случайных величин». Электронный журнал вероятностей . 24 . arXiv : 1801.06348 . дои : 10.1214/19-EJP338 . S2CID   52200238 .

Дальнейшее чтение

[ редактировать ]
  • Томас М. Кавер и Джой А. Томас: Элементы теории информации , 2-е издание, Willey-Interscience, 2006 г.
  • Николо Чеза-Бьянки и Габор Лугоши: предсказание, обучение и игры , Cambridge University Press, 2006 г.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 6fb9681d43e4d27fe0fb397eccde41bb__1710771960
URL1:https://arc.ask3.ru/arc/aa/6f/bb/6fb9681d43e4d27fe0fb397eccde41bb.html
Заголовок, (Title) документа по адресу, URL1:
Pinsker's inequality - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)