Неравенство Пинскера
В теории информации неравенство Пинскера , названное в честь его изобретателя Марка Семеновича Пинскера , представляет собой неравенство , которое ограничивает общее вариационное расстояние (или статистическое расстояние) с точки зрения расхождения Кульбака-Лейблера . Неравенство строго ограничено постоянными факторами. [ 1 ]
Официальное заявление
[ редактировать ]Неравенство Пинскера гласит, что если и - это два распределения вероятностей в измеримом пространстве. , затем
где
это общее расстояние вариации (или статистическое расстояние) между и и
— расхождение Кульбака–Лейблера в nats . Когда пространство выборки является конечным множеством, расходимость Кульбака–Лейблера определяется выражением
Заметим, что в терминах полной вариационной нормы подписанного мероприятия , неравенство Пинскера отличается от приведенного выше в два раза:
Доказательство неравенства Пинскера использует неравенство разделения для f -дивергенций .
Альтернативная версия
[ редактировать ]Заметим, что выражение неравенства Пинскера зависит от того, какой базис логарифмирования используется при определении КЛ-дивергенции. определяется с помощью (логарифм по основанию ), тогда как обычно определяется с помощью (логарифм по основанию 2). Затем,
Учитывая приведенные выше комментарии, в некоторой литературе существует альтернативная формулировка неравенства Пинскера, которая связывает расхождение информации с вариационным расстоянием:
то есть
в котором
это (ненормализованное) расстояние вариации между двумя функциями плотности вероятности и на том же алфавите . [ 2 ]
Эта форма неравенства Пинскера показывает, что «сходимость по расхождению» является более сильным понятием, чем «сходимость по вариационному расстоянию».
Простое доказательство Джона Полларда можно получить, положив :
Здесь лемма Титу известна также как неравенство Седракяна .
Обратите внимание, что нижняя оценка неравенства Пинскера бессмысленна для любых распределений, где , поскольку полное вариационное расстояние не более . Для таких распределений можно использовать альтернативную оценку, предложенную Бретаньоллем и Хубером. [ 3 ] (см. также Цыбаков [ 4 ] ):
История
[ редактировать ]Пинскер первым доказал неравенство с большей константой. Неравенство в приведенной выше форме было независимо доказано Кульбаком , Чисаром и Кемперманом . [ 5 ]
Обратная задача
[ редактировать ]Точное обратное неравенству не может иметь места: для любого , есть распределения с но . Простой пример — двухточечное пространство. с и . [ 6 ]
Однако на конечных пространствах справедливо обратное неравенство с постоянной, зависящей от . [ 7 ] Более конкретно, можно показать, что при определении у нас есть для любой меры который абсолютно непрерывен
Как следствие, если имеет полную поддержку (т. для всех ), затем
Ссылки
[ редактировать ]- ^ Чисар, Имре; Кернер, Янош (2011). Теория информации: теоремы кодирования для дискретных систем без памяти . Издательство Кембриджского университета. п. 44. ИСБН 9781139499989 .
- ^ Раймонд В., Юнг (2008). Теория информации и сетевое кодирование . Гонконг: Спрингер. п. 26. ISBN 978-0-387-79233-0 .
- ^ Бретаньолле, Дж.; Хубер, К., Оценка плотностей: минимаксный риск , Семинар по вероятностям, XII (Страсбургский университет, Страсбург, 1976/1977), стр. 342–363, Конспекты лекций по математике, 649, Springer, Берлин, 1978, Лемма 2.1 (на французском языке).
- ^ Цыбаков, Александр Б., Введение в непараметрическую оценку , переработанное и дополненное издание французского оригинала 2004 года. Перевод Владимира Зайца. Серия Спрингера по статистике. Спрингер, Нью-Йорк, 2009. xii+214 стр. ISBN 978-0-387-79051-0 , уравнение 2.25.
- ^ Цыбаков, Александр (2009). Введение в непараметрическую оценку . Спрингер. п. 132 . ISBN 9780387790527 .
- ^ Расхождение становится бесконечным, когда одно из двух распределений присваивает событию нулевую вероятность, а другое присваивает ему ненулевую вероятность (независимо от того, насколько она мала); см., например Басу, Митра; Хо, Тин Кам (2006). Сложность данных в распознавании образов . Спрингер. п. 161. ИСБН 9781846281723 . .
- ^ см. лемму 4.1 в Гетце, Фридрих; Самбале, Хольгер; Синулис, Артур (2019). «Концентрация высшего порядка для функций слабозависимых случайных величин». Электронный журнал вероятностей . 24 . arXiv : 1801.06348 . дои : 10.1214/19-EJP338 . S2CID 52200238 .
Дальнейшее чтение
[ редактировать ]- Томас М. Кавер и Джой А. Томас: Элементы теории информации , 2-е издание, Willey-Interscience, 2006 г.
- Николо Чеза-Бьянки и Габор Лугоши: предсказание, обучение и игры , Cambridge University Press, 2006 г.