Метод несжимаемости
В математике метод несжимаемости является методом доказательства , таким же, как вероятностный метод , метод подсчета или принцип «ячейки» . Чтобы доказать, что объект определенного класса (в среднем) удовлетворяет определенному свойству, выберите несжимаемый объект этого класса . Если оно не удовлетворяет этому свойству, его можно сжать с помощью вычислимого кодирования. Поскольку в целом можно доказать, что почти все объекты в данном классе несжимаемы, аргумент демонстрирует, что почти все объекты в классе обладают указанным свойством (а не только средним). Выбор несжимаемого объекта неэффективен и не может быть выполнен с помощью компьютерной программы. Однако простой подсчет обычно показывает, что почти все объекты данного класса можно сжать всего на несколько бит (являются несжимаемыми).
История
[ редактировать ]Метод несжимаемости зависит от объективного, фиксированного представления о несжимаемости. Такое представление дала теория сложности Колмогорова , названная в честь Андрея Колмогорова . [ 1 ]
Одним из первых применений метода несжимаемости с колмогоровской сложностью в теории вычислений было доказательство того, что время работы одноленточной машины Тьюринга квадратично для принятия палиндромного языка, а алгоритмы сортировки требуют как минимум время сортировать предметы. [ 2 ] Одна из первых влиятельных статей, использующих метод несжимаемости, была опубликована в 1980 году. [ 3 ] Этот метод был применен к ряду областей, а его название было придумано в учебнике. [ 4 ]
Приложения
[ редактировать ]Теория чисел
[ редактировать ]Согласно изящному доказательству Евклида , существует бесконечное число простых чисел . Бернхард Риман продемонстрировал, что количество простых чисел меньше заданного числа связано с нулями дзета-функции Римана . Жак Адамар и Шарль Жан де ла Валле-Пуссен доказали в 1896 году, что это количество простых асимптотически чисел ; см. Теорему о простых числах (используйте для натурального логарифма для двоичного логарифма). Используя метод несжимаемости, Г. Я. Чайтин утверждал следующее: может быть описан его простой факторизацией (что уникально), где являются первыми простые числа, которые (максимум) а показатели степени (возможно) равны 0. Каждый показатель степени (не более) , и может быть описан биты. Описание можно дать в бит, при условии, что мы знаем значение (позволяя анализировать последовательные блоки показателей). Описать требуется только биты. Используя несжимаемость большинства натуральных чисел, для каждого есть целое положительное число двоичной длины который невозможно описать менее чем биты. Это показывает, что количество простых чисел меньше, чем , удовлетворяет
Более сложный подход, приписываемый Петру Берману (настоящее доказательство частично принадлежит Джону Тромпу ), описывает каждую несжимаемую массу. к и , где это наибольшее простое число, на которое делится . С несжимаема, длина этого описания должна превышать . Разобрать первый блок описания должно быть указано в префиксной форме , где — произвольная малая положительная функция. Поэтому, . Следовательно, с для специальной последовательности значений . Это показывает, что приведенное ниже выражение справедливо для этой специальной последовательности, а простое расширение показывает, что оно справедливо для любой :
Оба доказательства представлены более подробно. [ 4 ]
Теория графов
[ редактировать ]график Размеченный с узлы могут быть представлены строкой из бит, где каждый бит указывает наличие (или отсутствие) края между парой узлов в этой позиции. , и степень каждой вершины удовлетворяет
Чтобы доказать это методом несжимаемости, если отклонение больше, мы можем сжать описание ниже ; это обеспечивает требуемое противоречие. Эта теорема потребуется для более сложного доказательства, где аргумент несжимаемости используется несколько раз, чтобы показать, что количество непомеченных графов равно
Комбинаторика
[ редактировать ]Транзитивный турнир представляет собой полный ориентированный граф , ; если , . Рассмотрим множество всех транзитивных турниров на узлы. Поскольку турнир представляет собой помеченный ориентированный полный граф , его можно закодировать строкой из биты, где каждый бит указывает направление края между парой узлов в этой позиции. Используя эту кодировку, каждый транзитивный турнир содержит транзитивный подтурнир (по крайней мере) вершины с
Это было показано как первая проблема. [ 6 ] Она легко решается методом несжимаемости: [ 7 ] как и проблема взвешивания монет, количество покрывающих семейств и ожидаемых свойств; например, по крайней мере часть всех переходных турниров на вершины имеют транзитивные подтурниры не более чем на вершины. достаточно велик.
Если ряд событий независимы (в теории вероятностей ) друг от друга, вероятность того, что ни одно из событий не произойдет, можно легко вычислить. Если события зависимы, задача усложняется. Локальная лемма Ловаса [ 8 ] Это принцип, согласно которому, если события в основном независимы друг от друга и имеют индивидуально малую вероятность, существует положительная вероятность того, что ни одно из них не произойдет. [ 9 ] Это было доказано методом несжимаемости. [ 10 ] С помощью метода несжимаемости экспандеров и суперконцентраторов. было показано существование нескольких вариантов графов- [ 11 ]
Топологическая комбинаторика
[ редактировать ]В задаче о треугольнике Гейльбронна бросьте точки единичного квадрата и определите максимум минимальной площади треугольника, образованного тремя точками, при всех возможных расположениях. Эта проблема была решена для небольших устройств, и была проделана большая работа по асимптотическому выражению как функции . Первоначальная гипотеза Хайльбронна заключалась в следующем: в начале 1950-х годов. Пол Эрдеш доказал, что эта оценка верна для , простое число. Общая проблема остается нерешенной, если не считать наиболее известной нижней оценки (достижимо; следовательно, гипотеза Хейльбронна неверна для общего ) и верхняя граница (доказано Комлосом, Пинцем и Семереди в 1982 и 1981 годах соответственно). С помощью метода несжимаемости исследован средний случай. Было доказано, что если область слишком мала (или велика), ее можно сжать ниже колмогоровской сложности равномерно случайного расположения (высокая колмогоровская сложность). Это доказывает, что для подавляющего большинства расстановок (и математического ожидания) площадь наименьшего треугольника, образованного тремя точки, брошенные равномерно и случайным образом на единичном квадрате, - это . В этом случае метод несжимаемости доказывает нижнюю и верхнюю границы рассматриваемого свойства. [ 12 ]
Вероятность
[ редактировать ]закона повторного логарифма , закона больших чисел и свойства рекуррентности. С помощью метода несжимаемости показано выполнение [ 13 ] и закон нуля-единицы Колмогорова , [ 14 ] с нормальными числами, выраженными в виде двоичных строк (в смысле Э. Бореля ) и распределением нулей и единиц в двоичных строках высокой колмогоровской сложности. [ 15 ]
Временная сложность машины Тьюринга
[ редактировать ]Базовая машина Тьюринга, задуманная Аланом Тьюрингом в 1936 году, состоит из памяти: ленты потенциально бесконечных ячеек, на которых может быть записан символ, и конечного элемента управления с прикрепленной головкой чтения-записи, которая сканирует ячейку на лента. На каждом шаге головка чтения-записи может менять символ в сканируемой ячейке и перемещать одну ячейку влево, вправо или вообще не перемещать ее по команде конечного управления. Для удобства можно рассмотреть машины Тьюринга с двумя символами ленты, но это не существенно.
В 1968 году Ф. К. Хенни показал, что такая машина Тьюринга требует порядка. распознавать язык бинарных палиндромов в худшем случае . В 1977 году У. Дж. Пол [ 2 ] представил доказательство несжимаемости, которое показало, что порядок в среднем требуется время. Для каждого целого числа , рассмотрим все слова такой длины. Для удобства рассмотрим слова, средняя треть слова которых состоит из 0. Принимающая машина Тьюринга заканчивается состоянием принятия слева (начало ленты). Вычисление данного слова на машине Тьюринга дает для каждого местоположения (границы между соседними ячейками) последовательность пересечений слева направо и справа налево, причем каждое пересечение находится в определенном состоянии конечного управления. Все позиции в средней трети слова-кандидата имеют пересекающуюся последовательность длины. (при общем времени расчета ), или какая-то позиция имеет последовательность пересечений . В последнем случае слово (если оно является палиндромом ) можно идентифицировать по этой пересекающейся последовательности.
Если другие палиндромы (оканчивающиеся в принимающем состоянии слева) имеют ту же самую пересекающуюся последовательность, слово (состоящее из префикса до позиции задействованной пересекающейся последовательности) исходного палиндрома объединяется с суффиксом, равным оставшейся длине другого палиндрома. палиндром также будет принят. Взяв палиндром , колмогоровская сложность , описываемая бит — это противоречие.
в среднем случае Поскольку подавляющее большинство бинарных палиндромов имеют высокую колмогоровскую сложность, это дает нижнюю границу времени выполнения . Результат намного сложнее и показывает, что машины Тьюринга с рабочие ленты более мощные, чем те, у которых работа ленты в реальном времени (здесь по одному символу на шаг). [ 3 ]
В 1984 году В. Маасс [ 16 ] и М. Ли и ПМБ Витаньи [ 17 ] показали, что моделирование двух рабочих лент с помощью одной рабочей ленты машины Тьюринга занимает по времени детерминированно (оптимально — решение 30-летней открытой задачи ) и время недетерминировано [ 17 ] (в, [ 16 ] Это . Дополнительные результаты, касающиеся лент, стеков и очередей , детерминированных и недетерминированных, [ 17 ] были доказаны методом несжимаемости. [ 4 ]
Теория вычислений
[ редактировать ]Пирамидальная сортировка — это метод сортировки, изобретенный Дж. У. Дж. Уильямсом и усовершенствованный Р. У. Флойдом , который всегда работает в время. Сомнительно, что метод Флойда в среднем лучше, чем метод Уильямса, хотя в худшем случае он лучше. С помощью метода несжимаемости было показано [ 4 ] что метод Уильямса работает в среднем время и метод Флойда работает в среднем за время. Доказательство было предложено Яном Манро .
Сортировка Шелл , открытая Дональдом Шеллом в 1959 году, представляет собой сортировку сравнения , которая делит список, подлежащий сортировке, на подсписки и сортирует их отдельно. Затем отсортированные подсписки объединяются, образуя частично отсортированный список. Этот процесс повторяется несколько раз (количество проходов). Трудность анализа сложности процесса сортировки состоит в том, что она зависит от количества ключей для сортировки по количеству количество проходов и приращения, управляющие рассеянием в каждом проходе; подсписок — это список ключей, которые являются параметром приращения отдельно. Хотя этот метод сортировки вдохновил большое количество работ, был установлен только худший случай. По среднему времени работы только лучший вариант для двухпроходной сортировки Шелла. [ 18 ] и верхняя граница [ 19 ] для конкретной последовательности приращений трехпроходной сортировки Шелла. Общая нижняя граница среднего значения -пропуск Шеллсорта дан [ 20 ] что стало первым достижением в решении этой проблемы за четыре десятилетия. На каждом проходе сортировка сравнения перемещает ключ в другое место на определенное расстояние (длину пути). Все эти длины путей логарифмически закодированы по длине в правильном порядке (проходов и ключей). Это позволяет восстановить несортированный список из отсортированного списка. Если несортированный список несжимаем (или почти несжимаем), поскольку отсортированный список имеет близкую к нулю колмогоровскую сложность (а длины путей вместе дают определенную длину кода), сумма должна быть по крайней мере такой же большой, как колмогоровская сложность исходного списка. . Сумма длин путей соответствует времени работы, а время работы в этом аргументе ограничено снизу выражением . Это было улучшено до нижней границы
где . [ 21 ] Это подразумевает, например, нижнюю границу Цзяна-Ли-Витаньи для всех -пропускать последовательности приращений и улучшать нижнюю границу для конкретных последовательностей приращений; верхняя граница Янсона-Кнута совпадает с нижней границей для используемой последовательности приращений, показывая, что трехпроходная сортировка Шелла для этой последовательности приращений использует инверсии.
Другой пример заключается в следующем. являются натуральными числами и , было показано, что для каждого есть логическое значение матрица; каждый подматрица имеет ранг не ниже методом несжимаемости.
Логика
[ редактировать ]Согласно первой теореме Гёделя о неполноте , в каждой формальной системе с вычислимо перечислимыми теоремами (или доказательствами), достаточно сильными, чтобы содержать арифметику Пеано , существуют истинные (но недоказуемые) утверждения или теоремы. Это доказывается методом несжимаемости; каждая формальная система можно описать конечно (например, в биты). В такой формальной системе мы можем выразить поскольку он содержит арифметику. Данный и натуральное число , мы можем исчерпывающе искать доказательство того, что некоторая строка длины удовлетворяет . Таким образом, мы получаем первую такую строку; : противоречие. [ 22 ]
Сравнение с другими методами
[ редактировать ]Хотя вероятностный метод обычно показывает существование объекта с определенным свойством в классе, метод несжимаемости имеет тенденцию показывать, что подавляющее большинство объектов в классе (среднее или математическое ожидание) обладают этим свойством. Иногда легко превратить вероятностное доказательство в доказательство несжимаемости и наоборот. В некоторых случаях трудно или невозможно превратить доказательство по несжимаемости в вероятностное (или счетное доказательство). Практически во всех случаях временной сложности машины Тьюринга, упомянутых выше, метод несжимаемости решал проблемы, которые были открыты десятилетиями; никаких других доказательств неизвестно. Иногда доказательство несжимаемости можно превратить в доказательство путем подсчета, как это произошло в случае с общей нижней границей времени выполнения сортировки Шелла . [ 20 ]
Ссылки
[ редактировать ]- ^ А. Н. Колмогоров, "Три подхода к определению понятия "количество информации", Пробл. передачи информ. , 1:1 (1965), 3–11
- ^ Jump up to: а б У. Дж. Пол, «Колмогоровская сложность и нижние оценки», стр. 325–333 в: L. Budach Ed., Proc. 2-й Межд. Конф. Фонд. Вычислить. Теория , 1979.
- ^ Jump up to: а б У. Дж. Пол, Дж. И. Сейферас, Дж. Саймон, «Теоретико-информационный подход к временным ограничениям для онлайн-вычислений» (предварительная версия), Proc. 12-й симпозиум ACM. Теория вычислений (STOC) , 357–367, 1980. два : 10.1016/0022-0000(81)90009-X
- ^ Jump up to: а б с д М. Ли, П.М.Б. Витаний, Введение в колмогоровскую сложность и ее приложения , Springer, 1993, 1997, 2008, глава 6.
- ^ Х. М. Бурман, М. Ли, Дж. Т. Тромп, П. М. Витаньи, «Случайные графы Колмогорова и метод несжимаемости», SIAM J. Comput. , 29:2(1999), 590–599. дои : 10.1137/S0097539797327805
- ^ П. Эрдос, Дж. Спенсер, Вероятностные методы в комбинаторике , Academic Press, 1974.
- ^ М. Ли, П.М.Б. Витаньи, «Аргументы колмогоровской сложности в комбинаторике», J. Combinatorial Theory , Series A, 66:2 (1994), 226–236. дои : 10.1016/0097-3165(94)90064-7
- ^ П. Эрдеш, Л. Ловас, «Проблемы и результаты о 3-хроматических гиперграфах и некоторые связанные с этим вопросы», в А. Хайнале, Р. Радо и В.Т. Сос, ред. Бесконечные и конечные множества (Паулю Эрдешу к его 60-летию) . Северная Голландия. стр. 609–627.
- ^ Р. А. Мозер, Г. Тардос, «Конструктивное доказательство общей локальной леммы Ловаса», Журнал ACM (JACM) , 2:57 (2010), 11. дои : 10.1145/1667053.1667060
- ^ Л. Фортнов, «Доказательство сложности по Колмогорову локальной леммы Ловаса», Блог вычислительной сложности , 2 июня 2009 г.
- ^ У. Шонинг, «Построение расширителей и суперконцентраторов с использованием колмогоровской сложности», Случайные структуры и алгоритмы , 17:1 (2000), 64–77. два : 10.1002/1098-2418(200008)17:1<64::AID-RSA5>3.0.CO;2-3
- ^ Т. Цзян, М. Ли, ПМБ Витаньи, «Средняя площадь треугольников типа Хайльбронна», Случайные структуры и алгоритмы , 20:2 (2002), 206–219. два : 10.1002/rsa.10024
- ^ В. Г. Вовк, "Закон повторного логарифма для случайных колмогоровских или хаотических последовательностей", Теория вероятн. Прил. 3:32 (1988), 413–426. дои : 10.1137/1132061
- ^ М. Зиманд, «Закон сложности Колмогорова с высоким и низким уровнем, эквивалентный закону 0–1», Информ. Процесс. Письма , 57:2 (1996), 59–84. дои : 10.1016/0020-0190(95)00201-4
- ^ М. Ли, П.М.Б. Витаньи, «Статистические свойства конечных последовательностей с высокой колмогоровской сложностью», Теория математических систем , 27 (1994), 365–376. два : 10.1007/BF01192146
- ^ Jump up to: а б В. Маасс, «Комбинаторные аргументы нижней границы для детерминированных и недетерминированных машин Тьюринга», Trans. амер. Математика. Соц. 292 (1985), 675–693. два : 10.1090/S0002-9947-1985-0808746-4
- ^ Jump up to: а б с М. Ли, PMB Витаньи, «Лента против очереди и стеков: нижние границы», Information and Computation , 78:1 (1988), 56–85. два : 10.1016/0890-5401(88)90003-X
- ^ DE Кнут, Сортировка и поиск (Том 3 Искусство компьютерного программирования ), 2-е изд. Аддисон-Уэсли, 1998, стр. 83–95. ISBN 0201896850
- ^ С. Янсон, Д. Е. Кнут, «Сортировка Шелла с тремя приращениями», Алгоритмы случайных структур 10: 1–2 (1997), 125–142. arXiv : cs/9608105
- ^ Jump up to: а б Т. Цзян, М. Ли, ПМБ Витаньи, «Нижняя граница сложности сортировки Шелл в среднем», Журнал ACM (JACM) , 47:5 (2000) 905–911. дои : 10.1145/355483.355488
- ^ PMB Витаньи (2018), О сложности сортировки Шелла в среднем, Случайные структуры и алгоритмы, 52:2, 354–363 два : 10.1002/rsa.20737
- ^ Г. Дж. Чайтин, Алгоритмическая теория информации , издательство Кембриджского университета, 1977.