Неравенство Фано
В теории информации неравенство Фано (также известное как обращение Фано и лемма Фано ) связывает среднюю информацию, потерянную в зашумленном канале, с вероятностью ошибки категоризации. Он был выведен Робертом Фано в начале 1950-х годов, когда он преподавал докторскую степень. семинар по теории информации в Массачусетском технологическом институте и позже записан в его учебнике 1961 года.
Он используется для нахождения нижней границы вероятности ошибки любого декодера, а также нижних границ минимаксных рисков при оценке плотности .
Пусть дискретные случайные величины и представляют входные и выходные сообщения с совместной вероятностью . Позволять представлять возникновение ошибки; то есть, что , с является приблизительной версией . Неравенство Фано
где означает поддержку , обозначает мощность (количество элементов в) ,
- вероятность ошибки связи, а
— соответствующая двоичная энтропия .
Доказательство
[ редактировать ]Определить индикаторную случайную величину , что указывает на то, что наша оценка находится в ошибке,
Учитывать . Мы можем использовать правило цепочки для энтропий, чтобы расширить это двумя разными способами.
Приравнивание двух
Раскрывая правый самый член,
С означает ; придается значение позволяет нам узнать стоимость с уверенностью. Это делает термин . С другой стороны, означает, что , следовательно, учитывая значение , мы можем сузить к одному из разные значения, что позволяет нам определить верхнюю границу условной энтропии . Следовательно
Другой термин, , потому что кондиционирование уменьшает энтропию. Из-за способа определяется, , это означает, что . Собрав все это вместе,
Потому что является цепью Маркова, мы имеем неравенством обработки данных и, следовательно, , давая нам
Интуиция
[ редактировать ]Неравенство Фано можно интерпретировать как способ разделения неопределенности условного распределения на два вопроса с учетом произвольного предиктора. Первый вопрос, соответствующий термину , относится к неопределенности предиктора. Если прогноз верен, неопределенности больше не остается. Если прогноз неверен, неопределенность любого дискретного распределения имеет верхнюю границу энтропии равномерного распределения по всем вариантам, кроме неправильного прогноза. Это имеет энтропию . Если рассматривать крайние случаи, то если предиктор всегда верен, первый и второй члены неравенства равны 0, а существование идеального предиктора подразумевает полностью определяется , и так . Если предиктор всегда неверен, то первый член равен 0, и может быть ограничено только сверху с равномерным распределением по остальным вариантам.
Альтернативная формулировка
[ редактировать ]Позволять — случайная величина с плотностью, равной одному из возможные плотности . Более того, расхождение Кульбака–Лейблера между любой парой плотностей не может быть слишком большим:
- для всех
Позволять быть оценкой индекса. Затем
где вероятность , вызванная
Обобщение
[ редактировать ]Следующее обобщение принадлежит Ибрагимову и Хасминскому (1979), Ассуаду и Бирге (1983).
Пусть F — класс плотностей с подклассом из r + 1 плотностей ƒ θ такой, что для любого θ ≠ θ ′
Тогда в худшем случае ожидаемое значение ошибки оценивания ограничивается снизу:
где ƒ n — любая оценка плотности, основанная на выборке размера n .
Ссылки
[ редактировать ]- П. Ассуад, «Два замечания по оценке», Comptes Rendus de l’Académie des Sciences de Paris , Vol. 296, с. 1021–1024, 1983.
- Л. Бирге, «Оценка плотности при ограничениях порядка: неасимптотический минимаксный риск», Технический отчет, EBU экономических наук, Университет Париж X, Нантер, Франция, 1983.
- Т. Ковер, Дж. Томас (1991). Элементы теории информации . стр. 38–42 . ISBN 978-0-471-06259-2 .
- Л. Деврой, Курс оценки плотности . Прогресс в области вероятности и статистики, Том 14. Бостон, Биркхаузер, 1987. ISBN 0-8176-3365-0 , ISBN 3-7643-3365-0 .
- Фано, Роберт (1968). Передача информации: статистическая теория связи . Кембридж, Массачусетс: MIT Press. ISBN 978-0-262-56169-3 . OCLC 804123877 .
- также: Кембридж, Массачусетс, MIT Press, 1961. ISBN 0-262-06001-9
- Р. Фано, неравенства Фано» «Scholarpedia , 2008.
- И. А. Ибрагимов, Р. З. Хасьминский, Статистическое оценивание, асимптотическая теория . Приложения математики, вып. 16, Спрингер-Верлаг, Нью-Йорк, 1981 год. ISBN 0-387-90523-5