Анализ булевых функций
В математике и информатике теоретической анализ булевых функций — это изучение вещественных функций на или (такие функции иногда называют псевдобулевыми функциями ) со спектральной точки зрения. [1] Изучаемые функции часто, но не всегда, имеют булевы значения, что делает их булевыми функциями . Эта область нашла множество применений в комбинаторике , теории социального выбора , случайных графах и теоретической информатике, особенно в трудностях аппроксимации , тестировании свойств и PAC-обучении .
Основные понятия
[ редактировать ]В основном мы будем рассматривать функции, определенные в области определения . Иногда удобнее работать с доменом вместо. Если определяется на , то соответствующая функция, определенная на является
Аналогично, для нас булева функция — это -значная функция, хотя часто удобнее рассматривать вместо этого -значные функции.
Разложение Фурье
[ редактировать ]Любая вещественная функция имеет уникальное разложение в виде полилинейного многочлена:
(Обратите внимание, что даже если функция имеет значение 0–1, это не сумма по модулю 2, а обычная сумма действительных чисел.)
Это преобразование Адамара функции , что является преобразованием Фурье в группе . Коэффициенты известны как коэффициенты Фурье , а вся сумма известна как Фурье разложение . Функции известны как характеры Фурье и образуют ортонормированный базис пространства всех функций над , относительно внутреннего продукта .
Коэффициенты Фурье можно рассчитать с помощью внутреннего продукта:
В частности, это показывает, что , где ожидаемое значение берется относительно равномерного распределения по . Личность Парсеваля гласит, что
Если мы пропустим , то мы получим дисперсию :
Степень Фурье и уровни Фурье
[ редактировать ]Степень функции это максимум такой, что для какого-то набора размера . Другими словами, степень — его степень как полилинейного полинома.
Разложение Фурье удобно разложить на уровни : коэффициент Фурье находится на уровне .
Степень часть является
Его получают из путем обнуления всех коэффициентов Фурье, не находящихся на уровне .
Аналогично определяем .
Влияние
[ редактировать ]The '-ое влияние функции можно определить двумя эквивалентными способами:
Если тогда это логическое значение вероятность того, что переворот '-я координата переворачивает значение функции:
Если затем не зависит от 'я координата.
влияние Общее представляет собой сумму всех его влияний:
Общее влияние булевой функции также является средней чувствительностью функции. Чувствительность функции булевой в данной точке - это количество координат так что если мы перевернем '-я координата, значение функции изменяется. Среднее значение этой величины и есть полное влияние.
Общее влияние также можно определить с помощью дискретного лапласиана графа Хэмминга , нормализованного соответствующим образом: .
Обобщенной формой воздействия является -стабильное влияние, определяемое:
Соответствующие суммарные влияния
Можно доказать, что функция имеет максимум «постоянно» много«стабильно-влиятельные» координаты:
Шумоустойчивость
[ редактировать ]Данный , мы говорим, что два случайных вектора являются -коррелированы, если предельные распределения однородны, и . Конкретно, мы можем сгенерировать пару -коррелированные случайные величины при первом выборе равномерно случайным образом, а затем выбирая согласно одному из следующих двух эквивалентных правил, применяемых независимо к каждой координате:
Обозначим это распределение через .
Шумоустойчивость функции в можно определить двумя эквивалентными способами:
Для , чувствительность шумовая в является
Если является логическим, то это вероятность того, что значение изменится, если мы перевернем каждую координату с вероятностью , независимо.
Шумовой оператор
[ редактировать ]Шумовой оператор это оператор, принимающий функцию и возвращаем другую функцию данный
Когда , оператор шума также может быть определен с использованием цепи Маркова с непрерывным временем , в которой каждый бит инвертируется независимо со скоростью 1. Оператор соответствует запуску этой цепи Маркова для шаги, начиная с и взяв среднее значение в конечном состоянии. Эта цепь Маркова порождается лапласианом графа Хэмминга, и это связывает общее влияние с оператором шума.
Шумоустойчивость можно определить с помощью оператора шума: .
Гиперконтрактивность
[ редактировать ]Для , -норма функции определяется
Мы также определяем
Теорема о гиперсжатии утверждает, что для любого и ,
Гиперсжимаемость тесно связана с логарифмическими неравенствами Соболева функционального анализа . [2]
Аналогичный результат для известна как обратная гиперконтрактивность . [3]
р- предвзятый анализ
[ редактировать ]Во многих ситуациях входные данные функции распределены неравномерно. , но вместо этого имеет уклон в сторону или . В таких ситуациях принято рассматривать функции над областью определения. . Для , p -смещенная мера дается
Эту меру можно получить, выбрав каждую координату независимо равной 1 с вероятностью и 0 с вероятностью .
Классические характеры Фурье уже не ортогональны относительно этой меры. Вместо этого мы используем следующие символы:
- смещенное p разложение Фурье это расширение как линейная комбинация p -смещенных символов:
Мы можем расширить определения влияния и оператора шума на случай p -смещения, используя их спектральные определения.
Влияние
[ редактировать ]The влияние России определяется
Общее влияние представляет собой сумму отдельных влияний:
Шумовой оператор
[ редактировать ]Пара -коррелированные случайные величины можно получить, выбрав независимо и , где дается
Тогда оператор шума имеет вид
Используя это, мы можем определить шумоустойчивость и чувствительность к шуму, как и раньше.
Формула Руссо-Маргулиса
[ редактировать ]Формула Руссо-Маргулиса (также называемая формулой Маргулиса-Руссо) [1] ) утверждает, что для монотонных булевых функций ,
И влияние, и вероятности берутся относительно , а в правой части — средняя чувствительность . Если мы думаем о как свойство, то формула гласит, что поскольку варьируется, производная вероятности того, что происходит в равна средней чувствительности при .
Формула Руссо-Маргулиса является ключом к доказательству точных пороговых теорем, таких как теорема Фридгута .
Гауссово пространство
[ редактировать ]Один из самых глубоких результатов в этой области, принцип инвариантности , связывает распределение функций на булевом кубе. их распределению в гауссовском пространстве , которое представляет собой пространство наделенный стандартом -мерная гауссова мера .
Многие из основных концепций анализа Фурье в булевом кубе имеют аналоги в гауссовском пространстве:
- Аналогом разложения Фурье в гауссовском пространстве является разложение Эрмита, которое представляет собой разложение до бесконечной суммы (сходящееся в ) многомерных полиномов Эрмита .
- Аналогом общего влияния или средней чувствительности для индикаторной функции набора является площадь гауссовой поверхности, которая представляет собой содержание Минковского на границе набора.
- Аналогом оператора шума является оператор Орнштейна – Уленбека (связанный с преобразованием Мелера ), определяемый формулой или, альтернативно, , где это пара -коррелированные стандартные гауссианы.
- Гиперсжатие имеет место (с соответствующими параметрами) и в гауссовском пространстве.
Гауссово пространство более симметрично, чем булев куб (например, оно инвариантно вращению), и поддерживает непрерывные аргументы, которые может быть сложнее пройти в дискретной настройке булева куба. Принцип инвариантности связывает эти две настройки и позволяет выводить результаты в булевом кубе из результатов в гауссовском пространстве.
Основные результаты
[ редактировать ]Теорема Фридгута – Калаи – Наора
[ редактировать ]Если имеет степень не более 1, то либо константа, равна координате, либо равна отрицанию координаты. В частности, это диктатура : функция, зависящая не более чем от одной координаты.
Теорема Фридгута–Калаи–Наора, [4] также известная как теорема ФКН , утверждает, что если почти имеет степень 1, то это близко к диктатуре. Количественно, если и , затем является -близко к диктатуре, то есть, для некоторой булевой диктатуры или, что то же самое, для некоторой булевой диктатуры .
Аналогично, булева функция степени не более зависит максимум от координаты, что делает его хунтой (функция, зависящая от постоянного числа координат), где является абсолютной константой, равной не менее 1,5 и не более 4,41, как показал Велленс. [5] Теорема Киндлера–Сафры [6] обобщает теорему Фридгута – Калаи – Наора на этот случай. В нем говорится, что если удовлетворяет затем является -близко к булевой функции степени не более .
Теорема Кана–Калаи–Линиала
[ редактировать ]Неравенство Пуанкаре для булева куба (следующее из приведенных выше формул) утверждает, что для функции ,
Это означает, что .
Теорема Кана–Калаи–Линиала, [7] также известная как теорема ККЛ , утверждает, что если тогда это логическое значение .
Граница, данная теоремой Кана–Калаи–Линиала, является точной и достигается с помощью функции Трайба Бен-Ора и Линиала: [8]
Теорема Кана-Калаи-Линиала была одним из первых результатов в этой области и ввела гиперсжимаемость в контекст булевых функций.
Теорема Фридгута о хунте
[ редактировать ]Если это -хунта (функция, зависящая не более чем от координаты) тогда согласно неравенству Пуанкаре.
Теорема Фридгута [9] является обратным этому результату. В нем говорится, что для любого , функция является -близко к булевой хунте в зависимости от координаты.
В сочетании с леммой Руссо-Маргулиса теорема Фридгута о хунте означает, что для любого , каждая монотонная функция близка к хунте по отношению к для некоторых .
Принцип инвариантности
[ редактировать ]Принцип инвариантности [10] обобщает теорему Берри–Эссеена на нелинейные функции.
Теорема Берри–Эссеена утверждает (среди прочего), что если и нет слишком велико по сравнению с остальными, то распределение над близко к нормальному распределению с тем же средним значением и дисперсией.
Принцип инвариантности (в частном случае) неформально гласит, что если является полилинейным полиномом ограниченной степени над и все влияния малы, то распределение под единой мерой в течение близко к его распределению в гауссовском пространстве.
Более формально, пусть — одномерная липшицева функция , пусть , позволять , и пусть . Предположим, что . Затем
Выбрав подходящее , это означает, что распределения по обеим мерам близки по расстоянию CDF , которое определяется выражением .
Принцип инвариантности был ключевым ингредиентом в первоначальном доказательстве «Большинство стабильнее» теоремы .
Некоторые приложения
[ редактировать ]Проверка линейности
[ редактировать ]Булева функция является линейным, если оно удовлетворяет , где . Нетрудно показать, что булевы линейные функции — это в точности символы .
При тестировании свойств мы хотим проверить, является ли данная функция линейной. Естественно провести следующий тест: выберите равномерно случайным образом и проверьте, что . Если линейна, то она всегда проходит тест. Блюм, Люби и Рубинфельд [11] показал, что если тест проходит с вероятностью затем является -близко к фурье-характеру. Их доказательство было комбинаторным.
Белларе и др. [12] дал чрезвычайно простое фурье-аналитическое доказательство, которое также показывает, что если тест успешен с вероятностью , затем коррелирует с характером Фурье. Их доказательство основано на следующей формуле вероятности успеха теста:
Теорема Эрроу
[ редактировать ]Теорема невозможности Эрроу утверждает, что для трех и более кандидатов единственным правилом единогласного голосования, при котором всегда есть победитель Кондорсе, является диктатура.
Обычное доказательство теоремы Эрроу является комбинаторным. Калай [13] дал альтернативное доказательство этого результата в случае трех кандидатов с использованием анализа Фурье. Если - это правило, которое определяет победителя среди двух кандидатов с учетом их относительного порядка голосов, тогда вероятность того, что победит Кондорсе при равномерно случайном голосовании, равна , откуда легко следует теорема.
Теорема ФКН означает, что если это правило, по которому почти всегда есть победитель Кондорсе, тогда близок к диктатуре.
Острые пороги
[ редактировать ]Классический результат теории случайных графов гласит, что вероятность того, что случайный граф связен, имеет тенденцию к если . Это пример резкого порога : ширина «порогового окна», , асимптотически меньше самого порога, который примерно равен . Напротив, вероятность того, что граф содержит треугольник, стремится к когда . Здесь и пороговое окно, и сам порог , и так это грубый порог .
Точная пороговая теорема Фридгута [14] Грубо говоря, утверждается, что свойство монотонного графа (свойство графа — это свойство, не зависящее от имен вершин) имеет резкий порог, если только оно не коррелирует с появлением небольших подграфов. Эта теорема широко применялась для анализа случайных графов и перколяции .
Попутно из теоремы ККЛ следует, что ширина порогового окна всегда не превышает . [15]
Большинство наиболее стабильно
[ редактировать ]Позволять обозначим мажоритарную функцию на координаты. Формула Шеппарда дает асимптотическую шумовую устойчивость большинства:
Это связано с вероятностью того, что если мы выберем равномерно случайным образом и образуют переворачивая каждый бит с вероятностью , то большинство останется прежним:
- .
Существуют логические функции с большей шумоустойчивостью. Например, диктатура имеет шумоустойчивость .
Теорема «Большинство стабильнейших» гласит, неформально, что единственные функции, устойчивость к шуму большая, чем у большинства, имеют влиятельные координаты. Формально для каждого существует такое, что если имеет нулевое ожидание и , затем .
Первое доказательство этой теоремы использовало принцип инвариантности в сочетании с изопериметрической теоремой Борелла в гауссовском пространстве; с тех пор были изобретены более прямые доказательства. [16] [17]
Большинство стабильнее означает, что алгоритм аппроксимации Гоеманса-Вильямсона для MAX-CUT является оптимальным, если предположить гипотезу об уникальных играх . Этот вывод, по мнению Хота и др., [18] послужило толчком к доказательству теоремы.
Ссылки
[ редактировать ]- ^ Jump up to: Перейти обратно: а б О'Доннелл, Райан (2014). Анализ булевых функций . Издательство Кембриджского университета. arXiv : 2105.10386 . ISBN 978-1-107-03832-5 .
- ^ П. Диаконис ; Л. Салофф-Косте (август 1996 г.). «Логарифмические неравенства Соболева для конечных цепей Маркова» . Анналы прикладной теории вероятности . 6 (3): 695–750. дои : 10.1214/AOAP/1034968224 . ISSN 1050-5164 . МР 1410112 . Збл 0867.60043 . Викиданные Q62111462 .
- ^ Моссель, Эльханан; Олешкевич, Кшиштоф; Сен, Арнаб (2013). «Об обратной гиперконтрактивности» . Геометрический и функциональный анализ . 23 (3): 1062–1097. arXiv : 1108.1210 . дои : 10.1007/s00039-013-0229-4 . S2CID 15933352 .
- ^ Фридгут, Эхуд; Калаи, Гил; Наор, Ассаф (2002). «Булевы функции, преобразование Фурье которых сосредоточено на первых двух уровнях» . Достижения прикладной математики . 29 (3): 427–437. дои : 10.1016/S0196-8858(02)00024-6 .
- ^ Велленс, Джейк (2020). «Связь между количеством входов и другими мерами сложности булевых функций» . Дискретный анализ . arXiv : 2005.00566 . doi : 10.19086/da.57741 (неактивен 25 апреля 2024 г.).
{{cite journal}}
: CS1 maint: DOI неактивен по состоянию на апрель 2024 г. ( ссылка ) - ^ Киндлер, Гай (2002). «Глава 16» (PDF) . Проверка собственности, ПКП и хунты (Диссертация). Тель-Авивский университет.
- ^ Кан, Джефф; Калаи, Гил; Линиал, Нати (1988). «Влияние переменных на булевы функции». Учеб. 29-й Симп. по основам информатики . SFCS'88. Уайт-Плейнс: IEEE. стр. 68–80. дои : 10.1109/SFCS.1988.21923 .
- ^ Бен-Ор, Майкл; Линиал, Натан (1985). «Коллективное подбрасывание монеты, надежные схемы голосования и минимальные значения Банцхафа». Учеб. 26-й Симп. по основам информатики . SFCS'85. Портленд, Орегон: IEEE. стр. 408–416. дои : 10.1109/SFCS.1985.15 .
- ^ Фридгут, Эхуд (1998). «Булевы функции с низкой средней чувствительностью зависят от нескольких координат» . Комбинаторика . 18 (1): 474–483. CiteSeerX 10.1.1.7.5597 . дои : 10.1007/PL00009809 . S2CID 15534278 .
- ^ Моссель, Эльханан; О'Доннелл, Райан ; Олешкевич, Кшиштоф (2010). «Помехоустойчивость функций с малыми воздействиями: инвариантность и оптимальность» . Анналы математики . 171 (1): 295–341. arXiv : math/0503503 . дои : 10.4007/анналы.2010.171.295 .
- ^ Блюм, Мануэль; Луби, Майкл; Рубинфельд, Ронитт (1993). «Самотестирование/коррекция с применением численных задач» . Дж. Компьютер. Сист. Наука . 47 (3): 549–595. дои : 10.1016/0022-0000(93)90044-W .
- ^ Белларе, Михир; Копперсмит, Дон; Хостад, Йохан; Киви, Маркос; Судан, Мадху (1995). «Проверка линейности по второй характеристике». Учеб. 36-й симпозиум. по основам информатики . ФОКС'95.
- ^ Калаи, Гил (2002). «Теоретико-фурье-взгляд на парадокс Кондорсе и теорему Эрроу» (PDF) . Достижения прикладной математики . 29 (3): 412–426. дои : 10.1016/S0196-8858(02)00023-4 .
- ^ Фридгут, Эхуд (1999). «Резкие пороги свойств графов и проблема k-SAT» . Журнал Американского математического общества . 12 (4): 1017–1054. дои : 10.1090/S0894-0347-99-00305-7 .
- ^ Фридгут, Эхуд; Калаи, Гил (1996). «Каждое свойство монотонного графа имеет четкий порог» . Труды Американского математического общества . 124 (10): 2993–3002. дои : 10.1090/S0002-9939-96-03732-X .
- ^ Де, Аниндья; Моссель, Эльханан; Ниман, Джо (2016), «Большинство стабильнее всего: дискретное и SoS» (PDF) , Теория вычислений , 12 (4): 1–50, CiteSeerX 10.1.1.757.3048 , doi : 10.4086/toc.2016.v012a004
- ^ Эльдан, Ронен ; Микулинцер, Дэн; Рагхавендра, Прасад (июнь 2023 г.). «Шумоустойчивость на булевом гиперкубе посредством перенормированного броуновского движения» . STOC 2023: Материалы 55-го ежегодного симпозиума ACM по теории вычислений . СТОК. Орландо, Флорида: ACM. стр. 661–671. arXiv : 2208.06508 . дои : 10.1145/3564246.3585118 .
- ^ Хот, Субхаш ; Киндлер, Гай; Моссель, Эльханан; О'Доннелл, Райан (2007), «Оптимальные результаты неаппроксимируемости для MAX-CUT и других CSP с двумя переменными?» (PDF) , SIAM Journal on Computing , 37 (1): 319–357, CiteSeerX 10.1.1.130.8886 , doi : 10.1137/S0097539705447372 , S2CID 2090495