Jump to content

Структурная функция Колмогорова

В 1973 году Андрей Колмогоров предложил невероятностный подход к статистике и выбору моделей. Пусть каждый элемент данных представляет собой конечную двоичную строку, а модель — это конечный набор двоичных строк. Рассмотрим модельные классы, состоящие из моделей заданной максимальной колмогоровской сложности .Структурная функция Колмогорова отдельной строки данных выражает связь между ограничением уровня сложности класса модели и наименьшей логарифмической мощностью модели в классе, содержащем данные. Структурная функция определяет все стохастические свойства отдельной строки данных: для каждого класса ограниченной модели она определяет индивидуальную наиболее подходящую модель в классе независимо от того, находится ли истинная модель в рассматриваемом классе модели или нет. В классическом случае мы говорим о наборе данных с распределением вероятностей, а свойства соответствуют ожиданиям. Напротив, здесь мы имеем дело с отдельными строками данных и свойствами отдельной строки, на которых сосредоточено внимание. В этом случае свойство сохраняется с уверенностью, а не с высокой вероятностью, как в классическом случае. Структурная функция Колмогорова точно определяет степень соответствия отдельной модели отдельным данным.

Структурная функция Колмогорова используется в алгоритмической теории информации , также известной как теория колмогоровской сложности, для описания структуры строки с помощью моделей возрастающей сложности.

Определение Колмогорова [ править ]

Колмогоров (слева) рассуждает о структурной функции (см. рисунок на доске) в ( Таллин , 1973).

Структурная функция была первоначально предложена Колмогоровым в 1973 году на советском симпозиуме по теории информации в Таллинне, но эти результаты не были опубликованы. [1] п. 182. Но результаты были объявлены в [2] в 1974 году — единственная письменная запись самого Колмогорова. Одно из последних его научных высказываний таково (перевод с русского Л.А. Левина):

Каждому конструктивному объекту соответствует функция натурального числа k - лог минимальной мощности множеств, содержащих x, которые допускают определения сложности не выше k. Если сам элемент x допускает простое определение, то функция падает до 0 даже при малых k. При отсутствии такого определения элемент является «случайным» в отрицательном смысле. Но оно является положительно «вероятностно случайным» только тогда, когда функция приняв значение при относительно небольшом , то изменяется примерно как .

Колмогоров , заявление цитировано выше.

Современное определение

Это обсуждается в Ковер и Томас. [1] Он широко изучен у Верещагина и Витаньи. [3] где также разрешены основные свойства.Структурную функцию Колмогорова можно записать как

где представляет собой двоичную строку длины с где — это предполагаемая модель (набор строк длины n) для , это сложность колмогоровская и представляет собой неотрицательное целочисленное значение, ограничивающее сложность предполагаемого х. Ясно, что эта функция невозрастающая и достигает для где необходимое количество бит для изменения в и это сложность колмогоровская .

Алгоритмическая достаточная статистика [ править ]

Мы определяем набор содержащий такой, что

.

Функция никогда не уменьшается более чем на фиксированную независимую константу ниже диагонали, называемой линией достаточности L, определяемой формулой

.

С точностью до постоянного расстояния к нему приближается график для определенных аргументов (например, для ). Для этих у нас есть и соответствующая модель (свидетель ) называется оптимальным набором для и его описание битов, следовательно, является алгоритмической достаточной статистикой . По соглашению мы пишем «алгоритмическую» для «колмогоровской сложности». Основными свойствами алгоритмической достаточной статистики являются следующие: если является алгоритмической достаточной статистикой для , затем

.

То есть двухчастное описание используя модель и в качестве кода данных для модели индекс в перечислении в битов, так же краток, как кратчайший одночастный код в биты. Это легко увидеть следующим образом:

,
Структурные функции
Structure functions and minimal sufficient statistic.

используя прямые неравенства и свойство достаточности, находим, что . (Например, учитывая , мы можем описать саморазграничивающим (можно определить его конец) в бит.) Следовательно, дефицит случайности из в является константой, а это означает, что является типичным (случайным) элементом S. Однако могут существовать модели содержащий это не достаточная статистика. Алгоритмическая достаточная статистика для обладает дополнительным свойством, помимо того, что он является моделью наилучшего соответствия, что и, следовательно, по колмогоровской сложности симметрии информации (информация о в примерно то же самое, что и информация о в х) у нас есть : алгоритмическая достаточная статистика представляет собой модель наилучшего соответствия, которая практически полностью определяется . ( это самая короткая программа для .) Алгоритмическая достаточная статистика, связанная с наименьшим таким называется алгоритмической минимальной достаточной статистикой .

Что касается рисунка: Структурная функция MDL объясняется ниже. Структурная функция согласия это наименьший недостаток случайности (см. выше) среди любой модели. для такой, что . Эта структурная функция определяет степень соответствия модели. (содержащий x) для строки x. Когда он низкий, модель подходит хорошо, а когда высокий, модель не подходит. Если для некоторых тогда есть типичная модель для такой, что и является типичным (случайным) для S. Т.е. является наиболее подходящей моделью для x. Более подробную информацию см. [1] и особенно [3] и. [4]

Выбор недвижимости [ править ]

В тех условиях, что график опускается под углом не менее 45 градусов, он начинается в n и заканчивается примерно в , каждый граф (с точностью до аддитивный член по аргументу и значению) реализуется структурной функцией некоторых данных x и наоборот. Там, где график первым достигает диагонали, аргументом (сложностью) является минимально достаточная статистика. Определить это место невозможно. Видеть. [3]

Основная собственность [ править ]

Доказано, что на каждом уровне сложности функция структуры позволяет выбрать лучшую модель для отдельной строки x внутри полосы с уверенностью, а не с большой вероятностью. [3]

Вариант MDL [ править ]

Функция « Минимальная длина описания» (MDL): длина минимального двухчастного кода для x, состоящего из стоимости модели K(S) идлина индекса x в S в модельном классе множеств заданной максимальной колмогоровской сложности , сложность S, ограниченная сверху , задается функцией MDL или ограниченной оценкой MDL:

где — общая длина двухчастного кода x с помощью модели S.

Основная собственность [ править ]

Доказано, что на каждом уровне сложности структурная функция позволяет нам выбрать лучшую модель S для отдельной строки x внутри полосы с уверенностью, а не с большой вероятностью. [3]

Применение в статистике [ править ]

Развитая выше математика была взята за основу MDL ее изобретателем Йормой Риссаненом . [5]

Вероятностные модели [ править ]

Для каждого вычислимого распределения вероятностей это можно доказать [6] что

.

Например, если — некоторое вычислимое распределение на множестве строк длиной , то каждый имеет вероятность . Структурная функция Колмогорова становится

где x — двоичная строка длины n с где – предполагаемая модель (вычислимая вероятность -строки длины) для , это сложность колмогоровская и представляет собой целочисленное значение, ограничивающее сложность предполагаемого х. Ясно, что эта функция невозрастающая и достигает для где c — необходимое количество бит для изменения в и это колмогоровская сложность . Затем . Для любого уровня сложности функция — это версия максимального правдоподобия (ML) с колмогоровской сложностью.

Основная собственность [ править ]

Доказано, что на каждом уровне сложности функция структуры позволяет выбрать лучшую модель для отдельной строки в пределах полосы с уверенностью, а не с большой вероятностью. [3]

Вариант MDL модели и вероятностные

Функция MDL: длина минимального двухчастного кода для x, состоящего из стоимости модели K(P) идлина , в модельном классе вычислимых массовых функций вероятности заданной максимальной колмогоровской сложности , сложность P, ограниченная сверху , задается функцией MDL или ограниченной оценкой MDL:

где — общая длина двухчастного кода x с помощью модели P.

Основная собственность [ править ]

Доказано, что на каждом уровне сложности функция MDL позволяет нам выбрать лучшую модель P для отдельной строки x в полосе с уверенностью, а не с большой вероятностью. [3]

Расширение для оценки искажений и шумоподавления [ править ]

Оказывается, этот подход можно расширить до теории искажения скорости отдельных конечных последовательностей. и шумоподавление отдельных конечных последовательностей [7] используя сложность Колмогорова. Эксперименты с использованием реальных компрессорных программ были проведены с успехом. [8] Здесь предполагается, что для натуральных данных колмогоровская сложность не далека от длины сжатой версии с использованием хорошего компрессора.

Ссылки [ править ]

  1. ^ Jump up to: Перейти обратно: а б с Обложка, Томас М.; Томас, Джой А. (1991). Элементы теории информации . Нью-Йорк: Уайли. стр. 175–178 . ISBN  978-0471062592 .
  2. Аннотация доклада Московского математического общества в Успехах мат. Наук Том 29, Выпуск 4(178) в «Известиях Московского математического общества» стр. 155 (в русском издании, на английский язык не переведен)
  3. ^ Jump up to: Перейти обратно: а б с д и ж г Верещагин, НК; Витаньи, ПМБ (1 декабря 2004 г.). «Структурные функции Колмогорова и выбор модели». Транзакции IEEE по теории информации . 50 (12): 3265–3290. arXiv : cs/0204037 . дои : 10.1109/TIT.2004.838346 .
  4. ^ Гакс, П.; Тромп, Дж. Т.; Витаний, ПМБ (2001). «Алгоритмическая статистика». Транзакции IEEE по теории информации . 47 (6): 2443–2463. arXiv : math/0006233 . дои : 10.1109/18.945257 .
  5. ^ Риссанен, Йорма (2007). Информация и сложность статистического моделирования (Online-Ausg. Ed.). Нью-Йорк: Спрингер. ISBN  978-0-387-36610-4 .
  6. ^ А.Х. Шен, Понятие (α, β)-стохастичности в колмогоровском смысле и ее свойства, Сов. матем. Докл., 28:1(1983), 295--299.
  7. ^ Верещагин, Николай К.; Витаньи, Пол МБ (1 июля 2010 г.). «Скорость искажения и шумоподавления отдельных данных с использованием сложности Колмогорова». Транзакции IEEE по теории информации . 56 (7): 3438–3454. arXiv : cs/0411014 . дои : 10.1109/TIT.2010.2048491 .
  8. ^ де Рой, Стивен; Витаньи, Пол (1 марта 2012 г.). «Аппроксимация графиков искажения отдельных данных: эксперименты по сжатию с потерями и шумоподавлению». Транзакции IEEE на компьютерах . 61 (3): 395–407. arXiv : cs/0609121 . дои : 10.1109/TC.2011.25 .

Литература [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 470f94ed8d22bd09cf9b8cc4844388a9__1696350720
URL1:https://arc.ask3.ru/arc/aa/47/a9/470f94ed8d22bd09cf9b8cc4844388a9.html
Заголовок, (Title) документа по адресу, URL1:
Kolmogorov structure function - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)