Jump to content

Алгоритмическая вероятность

От состояний наблюдателя к физике через алгоритмическую вероятность [ нужны разъяснения ] [1]

В теории информации алгоритмической алгоритмическая вероятность , также известная как вероятность Соломонова , представляет собой математический метод присвоения априорной вероятности данному наблюдению. Его изобрел Рэй Соломонов в 1960-х годах. [2] Он используется в теории индуктивного вывода и анализе алгоритмов. В своей общей теории индуктивного вывода Соломонов использует этот метод вместе с правилом Байеса для получения вероятностей предсказания будущих результатов алгоритма. [3]

В используемом математическом формализме наблюдения имеют форму конечных двоичных строк, рассматриваемых как выходные данные машин Тьюринга , а универсальный априор представляет собой распределение вероятностей по множеству конечных двоичных строк, рассчитанное на основе распределения вероятностей по программам (то есть входных данных для универсальная машина Тьюринга ). Приор является универсальным вВ смысле вычислимости по Тьюрингу, то есть ни одна строка не имеет нулевой вероятности. Оно не вычислимо, но может быть аппроксимировано. [4]

Формально вероятность не является вероятностью и не поддается вычислению. Это всего лишь «нижняя полувычислимая» и «полумера». Под «полумерой» подразумевается, что . То есть «вероятность» на самом деле не равна единице, в отличие от реальных вероятностей. Это связано с тем, что некоторые входные данные машины Тьюринга заставляют ее никогда не останавливаться, а это означает, что масса вероятности, присвоенная этим входным данным, теряется. Под «нижней полувычислимостью» подразумевается, что существует машина Тьюринга, которая по входной строке , можно распечатать последовательность который сходится к снизу, но не существует такой машины Тьюринга, которая делала бы то же самое сверху.

Обзор [ править ]

Алгоритмическая вероятность является основным компонентом теории индуктивного вывода Соломонова, теории предсказания, основанной на наблюдениях; его изобрели с целью использовать его для машинного обучения; Учитывая последовательность символов, какой из них будет следующим? Теория Соломонова дает ответ, в определенном смысле оптимальный, хотя и неисчислимый. В отличие, например, Карла Поппера , от неформальной теории индуктивного вывода [ нужны разъяснения ] Соломонова математически строга.

Четырьмя основными источниками вдохновения для алгоритмической вероятности Соломонова были: бритва Оккама , принцип множественных объяснений Эпикура , современная теория вычислений (например, использование универсальной машины Тьюринга) и правило предсказания Байеса. [5]

Бритва Оккама и принцип Эпикура, по сути, являются двумя разными нематематическими аппроксимациями универсального априора .

  • Бритва Оккама: среди теорий, согласующихся с наблюдаемыми явлениями, следует выбрать самую простую теорию . [6]
  • Принцип множественных объяснений Эпикура: если наблюдениям соответствует более одной теории, сохраняйте все такие теории . [7]

В основе универсального априора лежит абстрактная модель компьютера, такая как универсальная машина Тьюринга. [8] Подойдет любой абстрактный компьютер, если он тьюринг-полный, т. е. каждая вычислимая функция имеет хотя бы одну программу, которая будет вычислять ее применение на абстрактном компьютере.

Абстрактный компьютер используется для придания точного значения фразе «простое объяснение». В используемом формализме объяснения или теории явлений представляют собой компьютерные программы, которые генерируют строки наблюдений при запуске на абстрактном компьютере. Каждой компьютерной программе присвоен вес, соответствующий ее длине. Универсальное распределение вероятностей — это распределение вероятностей для всех возможных выходных строк со случайными входными данными, при котором для каждого конечного выходного префикса q назначается сумма вероятностей программ, которые вычисляют что-то, начинающееся с q . [9] Таким образом, простое объяснение – это короткая компьютерная программа. Сложное объяснение — это длинная компьютерная программа. Простые объяснения более вероятны, поэтому цепочка наблюдений с высокой вероятностью генерируется короткой компьютерной программой или, возможно, любой из большого количества немного более длинных компьютерных программ. Строка наблюдения с низкой вероятностью может быть сгенерирована только с помощью длинной компьютерной программы.

Алгоритмическая вероятность тесно связана с понятием колмогоровской сложности . Введение Колмогоровым сложности было мотивировано теорией информации и проблемами случайности, тогда как Соломонов ввел алгоритмическую сложность по другой причине: индуктивным рассуждениям. Единственная универсальная априорная вероятность, которой можно заменить каждую фактическую априорную вероятность в правиле Байеса, была изобретена Соломоновым с колмогоровской сложностью в качестве побочного продукта. [10] Он предсказывает наиболее вероятное продолжение этого наблюдения и дает представление о том, насколько вероятным будет это продолжение. [ нужна ссылка ]

Перечислимая мера Соломонова универсальна в определенном смысле, но время вычислений может быть бесконечным. Одним из способов решения этой проблемы является вариант алгоритма поиска Леонида Левина: [11] что ограничивает время, затрачиваемое на вычисление успеха возможных программ, при этом более коротким программам уделяется больше времени. При работе в течение все более и более длительных периодов времени он будет генерировать последовательность аппроксимаций, сходящихся к универсальному распределению вероятностей. Другие методы решения этой проблемы включают ограничение пространства поиска путем включения обучающих последовательностей.

Соломонов доказал, что это распределение машинно-инвариантно в пределах постоянного множителя (так называемая теорема инвариантности ). [12]

Фундаментальные теоремы

Теорема инвариантности И. Колмогорова [ править ]

Теорема об инвариантности Колмогорова поясняет, что колмогоровская сложность или минимальная длина описания набора данных инвариантен к выбору полного по Тьюрингу языка, используемого для моделирования универсальной машины Тьюринга:

где .

Интерпретация [ править ]

Минимальное описание такой, что служит естественным представлением строки относительно полного по Тьюрингу языка . Более того, как невозможно сжать дальше является несжимаемой и, следовательно, невычислимой струной. Это соответствует представлению ученых о случайности и проясняет причину, по которой колмогоровская сложность не поддается вычислению.

Отсюда следует, что любой фрагмент данных имеет необходимое и достаточное представление в виде случайной строки.

Доказательство [ править ]

Следующее взято из [13]

Из теории компиляторов известно, что для любых двух Тьюринг-полных языков и , существует компилятор выраженный в который переводит программы, выраженные в в функционально эквивалентные программы, выраженные в .

Отсюда следует, что если мы позволим быть самой короткой программой, которая печатает заданную строку затем:

где , и по симметрии получаем противоположное неравенство.

II. Левина Универсальное распределение

Учитывая, что любой однозначно декодируемый код удовлетворяет неравенству Крафта-Макмиллана, беспрефиксная колмогоровская сложность позволяет нам вывести универсальную Распределение:

где тот факт, что может имитировать UTM без префиксов, подразумевает, что для двух различных описаний и , не подстрока и не является подстрокой .

Интерпретация [ править ]

В Вычислимой Вселенной, учитывая явление с кодированием генерируемый физическим процессом, вероятность этого явления четко определена и равна сумме вероятностей различных и независимых причин. Критерий без префиксов — это именно то, что гарантирует причинную независимость.

Доказательство [ править ]

Это непосредственное следствие неравенства Крафта-Макмиллана .

Неравенство Крафта утверждает, что данная последовательность строк существует префиксный код с кодовыми словами где тогда и только тогда, когда:

где размер алфавита .

Без ограничения общности предположим, что мы можем упорядочить такой, что:

Теперь префиксный код существует тогда и только тогда, когда на каждом шаге можно выбрать хотя бы одно кодовое слово, которое не содержит ни одного из предыдущих кодовые слова в качестве префикса. Из-за существования кодового слова на предыдущем шаге кодовые слова запрещены, поскольку они содержат в качестве префикса. Отсюда следует, что в общем случае префиксный код существует тогда и только тогда, когда:

Разделив обе части на , мы находим:

ЯВЛЯЕТСЯ

История [ править ]

Соломонов изобрел концепцию алгоритмической вероятности и связанную с ней теорему инвариантности примерно в 1960 году. [14] опубликовав отчет об этом: «Предварительный отчет по общей теории индуктивного вывода». [15] Он более полно разъяснил эти идеи в 1964 году в «Формальной теории индуктивного вывода», часть I. [16] и Часть II. [17]

Ключевые люди [ править ]

См. также [ править ]

Ссылки [ править ]

  1. ^ Маркус Мюллер. Закон без закона: от состояний наблюдателя к физике через алгоритмическую теорию информации. Quantum: открытый журнал квантовой науки. 06 июня 2020 г.
  2. ^ Соломонов Р., « Предварительный отчет по общей теории индуктивного вывода », отчет V-131, Zator Co., Кембридж, Массачусетс. (Пересмотр отчета от 4 февраля 1960 г., ноябрь 1960 г.).
  3. ^ Ли, М. и Витаньи, П., Введение в колмогоровскую сложность и ее применение , 3-е издание, Springer Science and Business Media, Нью-Йорк, 2008 г.
  4. ^ Хаттер М., Легг С. и Витаньи П., «Алгоритмическая вероятность» , Scholarpedia, 2 (8): 2572, 2007.
  5. ^ Ли и Витаньи, 2008, с. 347
  6. ^ Ли и Витаньи, 2008, с. 341
  7. ^ Ли и Витаньи, 2008, с. 339.
  8. ^ Хаттер, М., «Алгоритмическая теория информации» , Scholarpedia, 2 (3): 2519.
  9. ^ Соломонов Р., « Колмогоровская лекция: универсальное распределение и машинное обучение » , The Computer Journal , том 46, № 6, стр. 598, 2003.
  10. ^ Гач, П. и Витаньи, П., «Памяти Раймонда Дж. Соломонова», Информационный бюллетень Общества теории информации IEEE , Vol. Т. 61, № 1, март 2011 г., стр. 11.
  11. ^ Левин, Л.А., «Универсальные задачи поиска», в «Проблемах передачи информации», 9, стр. 115–116, 1973.
  12. ^ Соломонов, Р., « Системы индукции, основанные на сложности: сравнения и теоремы сходимости », IEEE Trans. по теории информации, Vol. ИТ-24, № 4, стр. 422-432, июль 1978 г.
  13. ^ Грюнвальд П. и Витани П. Алгоритмическая теория информации. Арксив. 2008.
  14. ^ Соломонов, Р., «Открытие алгоритмической вероятности» , Журнал компьютерных и системных наук , Vol. 55, № 1, стр. 73–88, август 1997 г.
  15. ^ Соломонов Р., « Предварительный отчет по общей теории индуктивного вывода », отчет V-131, Zator Co., Кембридж, Массачусетс. (Пересмотр отчета от 4 февраля 1960 г., ноябрь 1960 г.).
  16. ^ Соломонов Р., « Формальная теория индуктивного вывода, Часть I ». Информация и контроль , Том 7, № 1, стр. 1–22, март 1964 г.
  17. ^ Соломонов, Р., « Формальная теория индуктивного вывода, Часть II », Информация и контроль , Том 7, № 2, стр. 224–254, июнь 1964.

Источники [ править ]

  • Ли М. и Витаньи П., Введение в колмогоровскую сложность и ее применение , 3-е издание, Springer Science and Business Media, Нью-Йорк, 2008 г.
  • Хаттер, Маркус (2005). Универсальный искусственный интеллект: последовательные решения, основанные на алгоритмической вероятности . Тексты по теоретической информатике. Берлин Гейдельберг: Springer. ISBN  978-3-540-22139-5 .

Дальнейшее чтение [ править ]

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: ebbdc07c5daa8ae228d679800f5f553c__1714606320
URL1:https://arc.ask3.ru/arc/aa/eb/3c/ebbdc07c5daa8ae228d679800f5f553c.html
Заголовок, (Title) документа по адресу, URL1:
Algorithmic probability - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)