Jump to content

Изменение информации

В теории вероятностей и теории информации изменение информации или расстояние между общей информацией является мерой расстояния между двумя кластерами ( разделами элементов ). Это тесно связано с взаимной информацией ; на самом деле это простое линейное выражение, включающее взаимную информацию. Однако, в отличие от взаимной информации, изменение информации является истинной метрикой , поскольку она подчиняется неравенству треугольника . [1] [2] [3]

Информационная диаграмма, иллюстрирующая связь между информационной энтропией , взаимной информацией и изменением информации.

Определение

[ редактировать ]

Предположим, у нас есть два раздела и из набора на непересекающиеся подмножества , а именно и .

Позволять:

и

Тогда изменение информации между двумя разделами будет:

.

Это эквивалентно общему информационному расстоянию между случайными величинами i и j относительно равномерной вероятностной меры на определяется для .

Явный информационный контент

[ редактировать ]

Мы можем переписать это определение в терминах, которые явно подчеркивают информационное содержание этого показателя.

Набор всех разбиений множества образует компактную решетку , где частичный порядок индуцирует две операции: встречу и объединение , где максимум — это раздел только с одним блоком, т. е. все элементы сгруппированы вместе, а минимум равен , раздел, состоящий из всех элементов в виде одиночных элементов. Встреча двух перегородок и легко понять, поскольку это разделение образовано всеми парными пересечениями одного блока, , из и один, , из . Отсюда следует, что и .

Определим энтропию раздела как

,

где . Четко, и . Энтропия разбиения — монотонная функция на решетке разбиений в том смысле, что .

Тогда расстояние VI между и дается

.

Разница является псевдометрикой, поскольку не обязательно подразумевает это . Из определения , это .

Если в диаграмме Хассе мы проведем ребро от каждого разбиения к максимальному и присвойте ему вес, равный расстоянию VI между данным разделом и , мы можем интерпретировать расстояние VI как среднее значение различий весов ребер до максимального значения.

.

Для как определено выше, считается, что совместная информация двух разделов совпадает с энтропией встречи

и у нас тоже есть такое совпадает с условной энтропией места встречи (пересечения) относительно .

Личности

[ редактировать ]

Вариация информации удовлетворяет

,

где это энтропия , и это взаимная информация между и относительно равномерной вероятностной меры на . Это можно переписать как

,

где это энтропия совместная и , или

,

где и являются соответствующими условными энтропиями .

Изменение информации также может быть ограничено либо по количеству элементов:

,

Или относительно максимального количества кластеров, :

Неравенство треугольника

[ редактировать ]

Чтобы проверить неравенство треугольника , разверните, используя тождество . Достаточно доказать Правая часть имеет нижнюю границу что не меньше левой стороны.

  1. ^ П. Араби, С.А. Бурман, С.А., «Многомерное масштабирование меры расстояния между разделами», Журнал математической психологии (1973), том. 10, 2, стр. 148–203, doi: 10.1016/0022-2496(73)90012-6
  2. ^ WH Zurek, Nature, том 341, стр. 119 (1989); WH Zurek, Physics Review A, том 40, с. 4731 (1989)
  3. ^ Марина Мейла, «Сравнение кластеров по изменению информации», Теория обучения и машины ядра (2003), том. 2777, стр. 173–187, doi : 10.1007/978-3-540-45167-9_14 , Конспекты лекций по информатике, ISBN   978-3-540-40720-1

Дальнейшее чтение

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 096313c9cc404b3099b8f9a4d9ed9ec7__1719229140
URL1:https://arc.ask3.ru/arc/aa/09/c7/096313c9cc404b3099b8f9a4d9ed9ec7.html
Заголовок, (Title) документа по адресу, URL1:
Variation of information - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)