Jump to content

Минимальная длина сообщения

Минимальная длина сообщения ( MML ) — это байесовский метод теории информации для сравнения и выбора статистических моделей. [1] Он представляет собой формальное в теории информации переформулирование бритвы Оккама : даже когда модели равны по степени точности соответствия наблюдаемым данным, та модель, которая дает наиболее краткое объяснение с большей вероятностью будет правильной данных (когда объяснение состоит из формулировку модели с последующим без потерь кодированием данных с использованием заявленной модели). MML был изобретен Крисом Уоллесом , впервые появившимся в основополагающей статье «Информационная мера классификации». [2] ММЛ задуман не просто как теоретическая конструкция, а как метод, который можно применять на практике. [3] Он отличается от родственной концепции колмогоровской сложности тем, что не требует использования полного по Тьюрингу языка для моделирования данных. [4]

Определение

[ редактировать ]

Шеннона В «Математической теории связи» (1948) говорится, что в оптимальном коде длина сообщения (в двоичном формате) о событии , , где имеет вероятность , определяется .

Теорема Байеса утверждает, что вероятность (переменной) гипотезы при наличии фиксированных доказательств пропорционально , которая по определению условной вероятности равна . Нам нужна модель (гипотеза) с наибольшей такой апостериорной вероятностью . Предположим, мы кодируем сообщение, которое представляет (описывает) одновременно модель и данные. С , наиболее вероятная модель будет иметь самое короткое такое сообщение. Сообщение разбивается на две части: . Первая часть кодирует саму модель. Вторая часть содержит информацию (например, значения параметров или начальные условия и т. д.), которая при обработке моделью выводит наблюдаемые данные.

MML естественным и точным образом меняет сложность модели на ее соответствие. Более сложная модель требует больше времени для формулирования (более длинная первая часть), но, вероятно, лучше соответствует данным (более короткая вторая часть). Таким образом, метрика MML не будет выбирать сложную модель, если она не окупит себя.

Непрерывные параметры

[ редактировать ]

Одна из причин, по которой модель может быть длиннее, заключается в том, что ее различные параметры указываются с большей точностью, что требует передачи большего количества цифр. Большая часть возможностей MML заключается в том, как точно определять параметры модели, а также в различных приближениях, которые делают это возможным на практике. Это позволяет с пользой сравнивать, скажем, модель со многими неточно указанными параметрами с моделью с меньшим количеством параметров, более точно указанными.

Ключевые особенности ММЛ

[ редактировать ]
  • MML можно использовать для сравнения моделей различной структуры. Например, его самое раннее применение заключалось в поиске смешанных моделей с оптимальным количеством классов. Добавление дополнительных классов в смешанную модель всегда позволит подобрать данные с большей точностью, но согласно MML это необходимо сопоставлять с дополнительными битами, необходимыми для кодирования параметров, определяющих эти классы.
  • MML — это метод сравнения байесовских моделей . Это дает каждой модели балл.
  • MML масштабно-инвариантен и статистически инвариантен. В отличие от многих методов байесовского выбора, MML не заботится о том, переходите ли вы от измерения длины к объему или от декартовых координат к полярным координатам.
  • ММЛ статистически последователен. Для таких задач, как задача Неймана-Скотта (1948) или факторный анализ, где количество данных на параметр ограничено сверху, MML может оценить все параметры со статистической согласованностью .
  • MML обеспечивает точность измерений. Он использует информацию Фишера (в приближении Уоллеса-Фримена 1987 года или другие гиперобъемы в других приближениях ) для оптимальной дискретизации непрерывных параметров. Следовательно, апостериорное всегда является вероятностью, а не плотностью вероятности.
  • MML используется с 1968 года. Схемы кодирования MML были разработаны для нескольких дистрибутивов и многих видов машинного обучения, включая неконтролируемую классификацию, деревья и графики решений, последовательности ДНК, байесовские сети , нейронные сети (пока только однослойные), сжатие изображений, сегментация изображений и функций и т. д.

См. также

[ редактировать ]
  1. ^ Уоллес, CS (Кристофер С.), -2004 г. (2005). Статистический и индуктивный вывод по минимальной длине сообщения . Нью-Йорк: Спрингер. ISBN  9780387237954 . OCLC   62889003 . {{cite book}}: CS1 maint: несколько имен: список авторов ( ссылка ) CS1 maint: числовые имена: список авторов ( ссылка )
  2. ^ Уоллес, CS; Бултон, DM (1 августа 1968 г.). «Информационная мера классификации» . Компьютерный журнал . 11 (2): 185–194. дои : 10.1093/comjnl/11.2.185 . ISSN   0010-4620 .
  3. ^ Эллисон, Ллойд. (2019). Кодирование по «бритве Оккама» . Спрингер. ISBN  978-3030094881 . OCLC   1083131091 .
  4. ^ Перейти обратно: а б Уоллес, CS; Доу, Д.Л. (1 января 1999 г.). «Минимальная длина сообщения и колмогоровская сложность» . Компьютерный журнал . 42 (4): 270–283. дои : 10.1093/comjnl/42.4.270 . ISSN   0010-4620 .
[ редактировать ]

Оригинальная публикация:

Книги:

Ссылки по теме:

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 7c4517724f5aa028768cda8fc41b5981__1715308560
URL1:https://arc.ask3.ru/arc/aa/7c/81/7c4517724f5aa028768cda8fc41b5981.html
Заголовок, (Title) документа по адресу, URL1:
Minimum message length - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)