Структурная функция Колмогорова
В 1973 году Андрей Колмогоров предложил невероятностный подход к статистике и выбору моделей. Пусть каждый элемент данных представляет собой конечную двоичную строку, а модель — это конечный набор двоичных строк. Рассмотрим модельные классы, состоящие из моделей заданной максимальной колмогоровской сложности .Структурная функция Колмогорова отдельной строки данных выражает связь между ограничением уровня сложности класса модели и наименьшей логарифмической мощностью модели в классе, содержащем данные. Структурная функция определяет все стохастические свойства отдельной строки данных: для каждого класса ограниченной модели она определяет индивидуальную наиболее подходящую модель в классе независимо от того, находится ли истинная модель в рассматриваемом классе модели или нет. В классическом случае мы говорим о наборе данных с распределением вероятностей, а свойства соответствуют ожиданиям. Напротив, здесь мы имеем дело с отдельными строками данных и свойствами отдельной строки, на которых сосредоточено внимание. В этом случае свойство сохраняется с уверенностью, а не с высокой вероятностью, как в классическом случае. Структурная функция Колмогорова точно определяет степень соответствия отдельной модели отдельным данным.
Структурная функция Колмогорова используется в алгоритмической теории информации , также известной как теория колмогоровской сложности, для описания структуры строки с помощью моделей возрастающей сложности.
Определение Колмогорова [ править ]
Структурная функция была первоначально предложена Колмогоровым в 1973 году на советском симпозиуме по теории информации в Таллинне, но эти результаты не были опубликованы. [1] п. 182. Но результаты были объявлены в [2] в 1974 году — единственная письменная запись самого Колмогорова. Одно из последних его научных высказываний таково (перевод с русского Л.А. Левина):
Каждому конструктивному объекту соответствует функция натурального числа k - лог минимальной мощности множеств, содержащих x, которые допускают определения сложности не выше k. Если сам элемент x допускает простое определение, то функция падает до 0 даже при малых k. При отсутствии такого определения элемент является «случайным» в отрицательном смысле. Но оно является положительно «вероятностно случайным» только тогда, когда функция приняв значение при относительно небольшом , то изменяется примерно как .
— Колмогоров , заявление цитировано выше.
Современное определение
Это обсуждается в Ковер и Томас. [1] Он широко изучен у Верещагина и Витаньи. [3] где также разрешены основные свойства.Структурную функцию Колмогорова можно записать как
где представляет собой двоичную строку длины с где — это предполагаемая модель (набор строк длины n) для , это сложность колмогоровская и представляет собой неотрицательное целочисленное значение, ограничивающее сложность предполагаемого х. Ясно, что эта функция невозрастающая и достигает для где необходимое количество бит для изменения в и это сложность колмогоровская .
Алгоритмическая достаточная статистика [ править ]
Мы определяем набор содержащий такой, что
- .
Функция никогда не уменьшается более чем на фиксированную независимую константу ниже диагонали, называемой линией достаточности L, определяемой формулой
- .
С точностью до постоянного расстояния к нему приближается график для определенных аргументов (например, для ). Для этих у нас есть и соответствующая модель (свидетель ) называется оптимальным набором для и его описание битов, следовательно, является алгоритмической достаточной статистикой . По соглашению мы пишем «алгоритмическую» для «колмогоровской сложности». Основными свойствами алгоритмической достаточной статистики являются следующие: если является алгоритмической достаточной статистикой для , затем
- .
То есть двухчастное описание используя модель и в качестве кода данных для модели индекс в перечислении в битов, так же краток, как кратчайший одночастный код в биты. Это легко увидеть следующим образом:
- ,
используя прямые неравенства и свойство достаточности, находим, что . (Например, учитывая , мы можем описать саморазграничивающим (можно определить его конец) в бит.) Следовательно, дефицит случайности из в является константой, а это означает, что является типичным (случайным) элементом S. Однако могут существовать модели содержащий это не достаточная статистика. Алгоритмическая достаточная статистика для обладает дополнительным свойством, помимо того, что он является моделью наилучшего соответствия, что и, следовательно, по колмогоровской сложности симметрии информации (информация о в примерно то же самое, что и информация о в х) у нас есть : алгоритмическая достаточная статистика представляет собой модель наилучшего соответствия, которая практически полностью определяется . ( это самая короткая программа для .) Алгоритмическая достаточная статистика, связанная с наименьшим таким называется алгоритмической минимальной достаточной статистикой .
Что касается рисунка: Структурная функция MDL объясняется ниже. Структурная функция согласия это наименьший недостаток случайности (см. выше) среди любой модели. для такой, что . Эта структурная функция определяет степень соответствия модели. (содержащий x) для строки x. Когда он низкий, модель подходит хорошо, а когда высокий, модель не подходит. Если для некоторых тогда есть типичная модель для такой, что и является типичным (случайным) для S. Т.е. является наиболее подходящей моделью для x. Более подробную информацию см. [1] и особенно [3] и. [4]
Выбор недвижимости [ править ]
В тех условиях, что график опускается под углом не менее 45 градусов, он начинается в n и заканчивается примерно в , каждый граф (с точностью до аддитивный член по аргументу и значению) реализуется структурной функцией некоторых данных x и наоборот. Там, где график первым достигает диагонали, аргументом (сложностью) является минимально достаточная статистика. Определить это место невозможно. Видеть. [3]
Основная собственность [ править ]
Доказано, что на каждом уровне сложности функция структуры позволяет выбрать лучшую модель для отдельной строки x внутри полосы с уверенностью, а не с большой вероятностью. [3]
Вариант MDL [ править ]
Функция « Минимальная длина описания» (MDL): длина минимального двухчастного кода для x, состоящего из стоимости модели K(S) идлина индекса x в S в модельном классе множеств заданной максимальной колмогоровской сложности , сложность S, ограниченная сверху , задается функцией MDL или ограниченной оценкой MDL:
где — общая длина двухчастного кода x с помощью модели S.
Основная собственность [ править ]
Доказано, что на каждом уровне сложности структурная функция позволяет нам выбрать лучшую модель S для отдельной строки x внутри полосы с уверенностью, а не с большой вероятностью. [3]
Применение в статистике [ править ]
Развитая выше математика была взята за основу MDL ее изобретателем Йормой Риссаненом . [5]
Вероятностные модели [ править ]
Для каждого вычислимого распределения вероятностей это можно доказать [6] что
- .
Например, если — некоторое вычислимое распределение на множестве строк длиной , то каждый имеет вероятность . Структурная функция Колмогорова становится
где x — двоичная строка длины n с где – предполагаемая модель (вычислимая вероятность -строки длины) для , это сложность колмогоровская и представляет собой целочисленное значение, ограничивающее сложность предполагаемого х. Ясно, что эта функция невозрастающая и достигает для где c — необходимое количество бит для изменения в и это колмогоровская сложность . Затем . Для любого уровня сложности функция — это версия максимального правдоподобия (ML) с колмогоровской сложностью.
Основная собственность [ править ]
Доказано, что на каждом уровне сложности функция структуры позволяет выбрать лучшую модель для отдельной строки в пределах полосы с уверенностью, а не с большой вероятностью. [3]
Вариант MDL модели и вероятностные
Функция MDL: длина минимального двухчастного кода для x, состоящего из стоимости модели K(P) идлина , в модельном классе вычислимых массовых функций вероятности заданной максимальной колмогоровской сложности , сложность P, ограниченная сверху , задается функцией MDL или ограниченной оценкой MDL:
где — общая длина двухчастного кода x с помощью модели P.
Основная собственность [ править ]
Доказано, что на каждом уровне сложности функция MDL позволяет нам выбрать лучшую модель P для отдельной строки x в полосе с уверенностью, а не с большой вероятностью. [3]
Расширение для оценки искажений и шумоподавления [ править ]
Оказывается, этот подход можно расширить до теории искажения скорости отдельных конечных последовательностей. и шумоподавление отдельных конечных последовательностей [7] используя сложность Колмогорова. Эксперименты с использованием реальных компрессорных программ были проведены с успехом. [8] Здесь предполагается, что для натуральных данных колмогоровская сложность не далека от длины сжатой версии с использованием хорошего компрессора.
Ссылки [ править ]
- ^ Jump up to: Перейти обратно: а б с Обложка, Томас М.; Томас, Джой А. (1991). Элементы теории информации . Нью-Йорк: Уайли. стр. 175–178 . ISBN 978-0471062592 .
- ↑ Аннотация доклада Московского математического общества в Успехах мат. Наук Том 29, Выпуск 4(178) в «Известиях Московского математического общества» стр. 155 (в русском издании, на английский язык не переведен)
- ^ Jump up to: Перейти обратно: а б с д и ж г Верещагин, НК; Витаньи, ПМБ (1 декабря 2004 г.). «Структурные функции Колмогорова и выбор модели». Транзакции IEEE по теории информации . 50 (12): 3265–3290. arXiv : cs/0204037 . дои : 10.1109/TIT.2004.838346 .
- ^ Гакс, П.; Тромп, Дж. Т.; Витаний, ПМБ (2001). «Алгоритмическая статистика». Транзакции IEEE по теории информации . 47 (6): 2443–2463. arXiv : math/0006233 . дои : 10.1109/18.945257 .
- ^ Риссанен, Йорма (2007). Информация и сложность статистического моделирования (Online-Ausg. Ed.). Нью-Йорк: Спрингер. ISBN 978-0-387-36610-4 .
- ^ А.Х. Шен, Понятие (α, β)-стохастичности в колмогоровском смысле и ее свойства, Сов. матем. Докл., 28:1(1983), 295--299.
- ^ Верещагин, Николай К.; Витаньи, Пол МБ (1 июля 2010 г.). «Скорость искажения и шумоподавления отдельных данных с использованием сложности Колмогорова». Транзакции IEEE по теории информации . 56 (7): 3438–3454. arXiv : cs/0411014 . дои : 10.1109/TIT.2010.2048491 .
- ^ де Рой, Стивен; Витаньи, Пол (1 марта 2012 г.). «Аппроксимация графиков искажения отдельных данных: эксперименты по сжатию с потерями и шумоподавлению». Транзакции IEEE на компьютерах . 61 (3): 395–407. arXiv : cs/0609121 . дои : 10.1109/TC.2011.25 .
Литература [ править ]
- Обложка, ТМ; П. Гач; Р. М. Грей (1989). «Вклад Колмогорова в теорию информации и алгоритмическую сложность» . Анналы вероятности . 17 (3): 840–865. дои : 10.1214/aop/1176991250 . JSTOR 2244387 .
- Колмогоров А.Н.; Успенский, В.А. (1 января 1987 г.). «Алгоритмы и случайность» . Теория вероятностей и ее приложения . 32 (3): 389–412. дои : 10.1137/1132060 .
- Ли, М., Витанья, ПМБ (2008). Введение в колмогоровскую сложность и ее приложения (3-е изд.). Нью-Йорк: Спрингер. ISBN 978-0387339986 .
{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка ) , особенно стр. 401–431 о структурной функции Колмогорова и стр. 613–629 об искажении скорости и шумоподавлении отдельных последовательностей. - Шен, А. (1 апреля 1999 г.). «Дискуссия о колмогоровской сложности и статистическом анализе». Компьютерный журнал . 42 (4): 340–342. дои : 10.1093/comjnl/42.4.340 .
- Вьюгин, В.В. (1987). «О дефекте случайности конечного объекта относительно меры с заданными границами сложности» . Теория вероятностей и ее приложения . 32 (3): 508–512. дои : 10.1137/1132071 .
- Вьюгин В.В. (1 апреля 1999 г.). «Алгоритмическая сложность и стохастические свойства конечных двоичных последовательностей». Компьютерный журнал . 42 (4): 294–317. дои : 10.1093/comjnl/42.4.294 .