Графон

В теории графов и статистике графон . (также известный как предел графа ) — это симметричная измеримая функция , что важно при изучении плотных графов . Графоны возникают как естественное понятие предела последовательности плотных графов, так и как фундаментальные определяющие объекты моделей сменных случайных графов. Графоны привязаны к плотным графам следующей парой наблюдений: модели случайных графов, определенные графонами, почти наверняка приводят к плотным графам , и, по лемме о регулярности , графоны захватывают структуру произвольных больших плотных графов.
формулировка Статистическая
Графон — симметричная измеримая функция . Обычно под графоном понимают модель сменного случайного графа по следующей схеме:
- Каждая вершина графа присваивается независимая случайная величина
- Край самостоятельно включается в граф с вероятностью .
Модель случайного графа является сменной моделью случайного графа тогда и только тогда, когда ее можно таким образом определить в терминах (возможно, случайного) графона.Модель на основе фиксированного графона иногда обозначается ,по аналогии с Эрдеша–Реньи моделью случайных графов .Граф, созданный из графона таким образом называется -случайный график.
Из этого определения и закона больших чисел следует, что если модели сменных случайных графов почти наверняка плотны. [1]
Примеры [ править ]
Простейший пример графона: для некоторой константы . В этом случае связанной моделью сменных случайных графов является Эрдеша – Реньи. модель который включает каждое ребро независимо с вероятностью .
Если вместо этого мы начнем с графона, который является кусочно-постоянным по формуле:
- деление единичного квадрата на блоки и
- параметр равный на блокировать,
результирующая модель сменного случайного графа представляет собой сообщества стохастическая блочная модель , обобщение модели Эрдеша – Реньи.Мы можем интерпретировать это как модель случайного графа, состоящую из отдельные графы Эрдеша – Реньи с параметрами соответственно, с биграфами между ними, где каждое возможное ребро между блоками и включается независимо с вероятностью .
Многие другие популярные модели случайных графов можно понимать как сменные модели случайных графов, определенные некоторым графоном, подробный обзор включен в книгу Орбанца и Роя. [1]
смежности заменяемые Совместно матрицы
Случайный график размера можно представить как случайное матрица смежности . Чтобы обеспечить согласованность (в смысле проективности ) между случайными графами разных размеров, естественно изучить последовательность матриц смежности, возникающую как верхний левый подматрицы некоторого бесконечного массива случайных величин; это позволяет нам генерировать добавив узел в и выборка краев для . С этой точки зрения случайные графы определяются как случайные бесконечные симметричные массивы. .
Учитывая фундаментальную важность сменных последовательностей в классической теории вероятностей, естественно искать аналогичное понятие в случае случайного графа. Одно из таких понятий дается совместно заменяемыми матрицами; т.е. случайные матрицы, удовлетворяющие
для всех перестановок натуральных чисел, где означает равное распределение . Интуитивно это условие означает, что распределение случайного графа не меняется при перемаркировке его вершин: то есть метки вершин не несут никакой информации.
Существует теорема о представлении совместно заменяемых матриц смежности, аналогичная теореме де Финетти о представлении заменяемых последовательностей. Это частный случай теоремы Олдоса – Гувера для совместно заменяемых массивов, и в этом случае он утверждает, что случайная матрица генерируется:
- Образец независимо
- независимо случайно с вероятностью
где — это (возможно, случайный) графон. То есть модель случайного графа имеет совместно заменяемую матрицу смежности тогда и только тогда, когда она является совместно заменяемой моделью случайного графа, определенной в терминах некоторого графона.
Оценка графона [ править ]
Из-за проблем с идентификацией невозможно оценить ни функцию графона, ни или скрытые позиции узла и существует два основных направления оценки графонов. Одно направление направлено на оценку до класса эквивалентности, [2] [3] или оценить матрицу вероятностей, индуцированную . [4] [5]
формулировка Аналитическая
Любой график на вершины можно отождествить с его матрицей смежности .Эта матрица соответствует ступенчатой функции ,определяется путем разделения на интервалы такой, что имеет интерьер
В общем случае, если у нас есть последовательность графов где количество вершин стремится к бесконечности, мы можем проанализировать предельное поведение последовательности, рассматривая предельное поведение функций . Если эти графики сходятся (согласно некоторому подходящему определению сходимости ), то мы ожидаем, что предел этих графиков будет соответствовать пределу этих связанных функций.
Это мотивирует определение графона (сокращение от «график-функция») как симметричной измеримой функции. который отражает понятие предела последовательности графов. Оказывается, что для последовательностей плотных графов несколько, казалось бы, различных понятий сходимости эквивалентны, и для всех них естественным предельным объектом является графон. [6]
Примеры [ править ]
постоянный editграфик
Возьмите последовательность Случайные графы Эрдеша – Реньи с некоторым фиксированным параметром .Интуитивно, как стремится к бесконечности, предел этой последовательности графов определяется исключительно плотностью ребер этих графов.В пространстве графонов оказывается, что такая последовательность почти наверняка сходится к константе , что отражает вышеизложенную интуицию.
Полуграфон [ править ]
Возьмите последовательность полуграфиков , определяемых взятием быть двудольным графом на вершины и такой, что находится рядом с именно тогда, когда . Если вершины перечислены в представленном порядке, томатрица смежности имеет два угла блочных матриц «полуквадрата», заполненных единицами, а остальные элементы равны нулю. Например, матрица смежности дается
Как становится большим, эти углы «сглаживаются».В соответствии с этой интуицией последовательность сходится к полуграфону определяется когда и в противном случае.
Полный двудольный графон [ править ]
Возьмите последовательность полных двудольных графов с частями одинакового размера.Если мы упорядочим вершины, поместив все вершины в одну часть в началеи поместив вершины другой части в конец, матрица смежности выглядит как блочная недиагональная матрица с двумя блоками единиц и двумя блоками нулей.Например, матрица смежности дается
Как становится больше, эта блочная структура матрицы смежности остается постоянной, так что эта последовательность графов сходится к «полному двудольному» графону определяется в любое время и и настройка в противном случае.
Если вместо этого мы упорядочим вершины чередуя части,Матрица смежности имеет шахматную структуру из нулей и единиц.Например, при таком порядке матрица смежности дается
Как становится больше, матрицы смежности становятся все более тонкой шахматной доской.Несмотря на такое поведение, нам все равно нужен предел быть уникальным и привести к графону из примера 3.Это означает, что когда мы формально определяем сходимость последовательности графов, определение предела не должно зависеть от перемаркировки вершин.
Предел W случайных - графов
Возьмите случайную последовательность из -случайные графики путем рисования для какого-то фиксированного графона .Тогда так же, как и в первом примере из этого раздела, получается, что сходится к почти наверняка.
Восстановление параметров графа из графонов [ править ]
Данный график со связанным графоном , мы можем восстановить теоретико-графовые свойства и параметры путем интеграции преобразований . Например, плотность ребер (т.е. средняя степень, деленная на количество вершин) определяется интегралом
Аналогичные рассуждения показывают, что плотность треугольников в равно
Понятия конвергенции [ править ]
Существует много разных способов измерения расстояния между двумя графиками.Если нас интересуют метрики , «сохраняющие» экстремальные свойства графов,тогда нам следует ограничить наше внимание метриками, которые идентифицируют случайные графы как схожие.Например, если мы случайным образом нарисуем два графика независимо от модели Эрдеша – Реньи. для некоторых фиксированных , расстояние между этими двумя графиками при «разумной» метрике должно быть с высокой вероятностью близко к нулю для больших .
Наивно, учитывая два графа в одном и том же наборе вершин, можно было бы определить их расстояние как количество ребер, которые необходимо добавить или удалить, чтобы перейти от одного графа к другому, то есть их расстояние редактирования . Однако расстояние редактирования не идентифицирует случайные графики как похожие; фактически, два графика, построенные независимо от иметь ожидаемое (нормализованное) расстояние редактирования .
Есть две естественные метрики, которые хорошо ведут себя на плотных случайных графах в том смысле, в котором мы хотим.Первый — это метрика выборки, которая говорит, что два графа близки, если их распределения подграфов близки.Второй — это метрика несоответствия ребер , которая говорит, что два графа близки, когда плотность их ребер близка на всех соответствующих подмножествах вершин.
Чудесным образом последовательность графов сходится относительно одной метрики именно тогда, когда она сходится относительно другой.При этом предельные объекты по обеим метрикам оказываются графонами.Эквивалентность этих двух понятий сходимости отражает различных понятий квазислучайных графов. эквивалентность [7]
Плотности гомоморфизма
Один из способов измерения расстояния между двумя графиками и заключается в сравнении их относительного количества подграфов.То есть для каждого графика мы можем сравнить количество копий в и в .Если эти числа близки для каждого графа , затеминтуитивно и похожие графики.Однако вместо того, чтобы иметь дело непосредственно с подграфами, оказывается, чтопроще работать с гомоморфизмами графов.Это нормально при работе с большими плотными графами, поскольку в этом сценарии количество подграфов и количество гомоморфизмов графов фиксированного графа асимптотически равны.
Учитывая два графика и , плотность гомоморфизма из в определяется как количество гомоморфизмов графов из к .Другими словами, — вероятность случайно выбранной карты из вершин к вершинам отправляет соседние вершины в к соседним вершинам в .
Графоны предлагают простой способ вычисления плотности гомоморфизма.Действительно, учитывая график со связанным графоном и еще один , у нас есть
где интеграл многомерен, взят по единичному гиперкубу .Это следует из определения ассоциированного графона, учитывая, что указанное выше подынтегральное выражение равно .Затем мы можем распространить определение плотности гомоморфизма на произвольные графоны. , используя тот же интеграл и определяя
для любого графика .
Учитывая эту настройку, мы говорим, что последовательность графов сходится слева, если для любого фиксированного графа , последовательность плотностей гомоморфизма сходится.Хотя это и не очевидно из самого определения, если сходится в этом смысле, то всегда существует графон такой, что для каждого графа , у нас есть
Расстояние обрезки [ править ]
Возьмите два графика и на том же множестве вершин.Поскольку эти графы имеют одни и те же вершины,один из способов измерить их расстояние — ограничиться подмножествами множества вершин и для каждой такой пары подмножеств сравниваем количество ребер от к в по количеству ребер между и в . Если эти числа одинаковы для каждой пары подмножеств (относительно общего числа вершин), то это предполагает и похожие графики.
В качестве предварительной формализации понятия расстояния для любой пары графов и на том же наборе вершин размера , определите обозначенное расстояние разреза между и быть
Другими словами, обозначенное расстояние разреза кодирует максимальное несоответствие плотностей краев между и .Мы можем обобщить эту концепцию на графоны, выразив плотность ребер с точки зрения связанного графона , давая равенство
где являются объединениями интервалов, соответствующих вершинам в и . Обратите внимание, что это определение все еще можно использовать, даже если сравниваемые графы не имеют общего набора вершин.Это мотивирует следующее более общее определение.
Определение 1. Для любой симметричной измеримой функции , определим разреза норму быть количеством
взяты все измеримые подмножества единичного интервала. [6]
Это отражает наше более раннее представление о помеченном расстоянии отреза, поскольку мы имеем равенство .
У этой меры расстояния все еще есть одно серьезное ограничение: она может присваивать ненулевое расстояние двум изоморфным графам.Чтобы убедиться, что изоморфные графы имеют нулевое расстояние, мы должны вычислить минимальную норму разреза для всех возможных «перемаркировок» вершин.Это мотивирует следующее определение расстояния отреза.
Определение 2. Для любой пары графонов и , определите расстояние их разреза как
где это состав с картой , а нижняя грань берется по всем сохраняющим меру биекциям из единичного интервала в себя. [8]
Расстояние разреза между двумя графами определяется как расстояние разреза между связанными с ними графонами.
Теперь мы говорим, что последовательность графов сходится под разрезом, если это последовательность Коши под разрезом . Хотя это и не является прямым следствием определения, если такая последовательность графов является Коши, то она всегда сходится к некоторому графону .
Эквивалентность конвергенции [ править ]
Оказывается, для любой последовательности графов , левая сходимость эквивалентна сходимости по разрезному расстоянию, и, кроме того, предельный графон то же самое. Мы также можем рассмотреть конвергенцию самих графонов, используя те же определения, и справедлива та же эквивалентность. Фактически, оба понятия сходимости более тесно связаны через так называемые леммы о подсчете . [6]
Счетная лемма. Для любой пары графонов и , у нас есть
для всех графиков .
Название «лемма о подсчете» происходит от оценок, которые эта лемма дает для плотностей гомоморфизма. , которые аналогичны подсчету подграфов графов. Эта лемма является обобщением леммы о подсчете графов , которая появляется в области регулярности разбиений , и сразу показывает, что сходимость под расстоянием разреза влечет за собой сходимость слева.
Обратная лемма о счете. Для каждого действительного числа , существует действительное число и положительное целое число такая, что для любой пары графонов и с
для всех графиков удовлетворяющий ,мы должны иметь .
Эта лемма показывает, что левая сходимость влечет за собой сходимость на расстоянии разреза.
Пространство графонов [ править ]
Мы можем превратить расстояние разреза в метрику, взяв набор всех графонов и идентифицировав два графона. в любое время .Полученное пространство графонов обозначим , и вместе с образует метрическое пространство .
Это пространство оказывается компактным .Более того, он содержит множество всех конечных графов, представленных связанными с ними графонами, в виде плотного подмножества .Эти наблюдения показывают, что пространство графонов является пополнением пространства графов относительно расстояния разреза. Одним из непосредственных последствий этого является следующее.
Следствие 1. Для любого действительного числа , существует целое число такой, что для каждого графона , есть график с максимум вершины такие, что .
Чтобы понять, почему, позвольте быть множеством графов. Рассмотрим для каждого графа открытый шар содержащий все графоны такой, что . Множество открытых шаров для всех графов покрывает , поэтому из компактности следует, что существует конечное подпокрытие для некоторого конечного подмножества . Теперь мы можем взять быть наибольшим числом вершин среди графов в .
Приложения [ править ]
Лемма о регулярности
Компактность пространства графонов можно рассматривать как аналитическую формулировку леммы Семереди о регулярности ; на самом деле это более сильный результат, чем исходная лемма. [9] Лемму Семереди о регулярности можно перевести на язык графонов следующим образом. Определите ступенчатую функцию как графон то есть кусочно-постоянно, т.е. для некоторого разбиения из , постоянно включен для всех . Утверждение о том, что граф имеет разбиение по регулярности, это эквивалентно утверждению, что связанный с ним графон близка к ступенчатой функции.
Для доказательства компактности требуется только лемма о слабой регулярности :
Лемма о слабой регулярности для графонов. Для каждого графона и , есть ступенчатая функция с максимум шаги такие, что .
но его можно использовать для доказательства более сильных результатов о регулярности, таких как лемма о сильной регулярности :
Лемма о сильной регулярности для графонов. Для каждой последовательности положительных действительных чисел существует целое положительное число такой, что для каждого графона , есть графон и ступенчатая функция с шаги такие, что и
Доказательство леммы о сильной регулярности по своей сути аналогично следствию 1, приведенному выше. Оказывается, каждый графон можно аппроксимировать ступенчатой функцией в норма , показывающая, что набор шаров крышка . Эти наборы не открыты в метрические, но их можно немного увеличить, чтобы они были открытыми. Теперь мы можем взять конечное подпокрытие и показать, что требуемое условие следует.
Гипотеза Сидоренко [ править ]
Аналитическая природа графонов обеспечивает большую гибкость при рассмотрении неравенств, связанных с гомоморфизмами.
Например, гипотеза Сидоренко является основной открытой проблемой экстремальной теории графов , которая утверждает, что для любого графа на вершины средней степени (для некоторых ) и двудольный граф на вершины и ребер, число гомоморфизмов из к по крайней мере . [10] Поскольку эта величина представляет собой ожидаемое количество помеченных подграфов в случайном графике ,гипотезу можно интерпретировать как утверждение что для любого двудольного графа , случайный граф достигает (в ожидании) минимального количества копий по всем графам с некоторой фиксированной плотностью ребер.
Многие подходы к гипотезе Сидоренко формулируют проблему как интегральное неравенство на графонах, что затем позволяет решить проблему, используя другие аналитические подходы. [11]
Обобщения [ править ]
Графоны естественным образом ассоциируются с плотными простыми графами. Существуют расширения этой модели для плотных ориентированных взвешенных графов, часто называемых декорированными графонами. [12] Существуют также недавние расширения режима разреженных графов как с точки зрения моделей случайных графов, так и с точки зрения моделей случайных графов. [13] и теория предела графов. [14] [15]
Ссылки [ править ]
- ↑ Перейти обратно: Перейти обратно: а б Орбанц, П.; Рой, DM (2015). «Байесовские модели графов, массивов и других заменяемых случайных структур». Транзакции IEEE по анализу шаблонов и машинному интеллекту . 37 (2): 437–461. arXiv : 1312.7857 . дои : 10.1109/tpami.2014.2334607 . ПМИД 26353253 . S2CID 566759 .
- ^ Вулф, Патрик Дж.; Ольхеде, София К. (23 сентября 2013 г.). «Непараметрическая оценка графона». arXiv : 1309.5936 [ math.ST ].
- ^ Чой, Дэвид; Вулф, Патрик Дж. (февраль 2014 г.). «Совместная кластеризация отдельно обмениваемых сетевых данных». Анналы статистики . 42 (1): 29–63. arXiv : 1212.4093 . дои : 10.1214/13-AOS1173 . ISSN 0090-5364 . S2CID 16291079 .
- ^ Гао, Чао; Лу, Ю; Чжоу, Харрисон Х. (декабрь 2015 г.). «Оценка оптимального по скорости графона». Анналы статистики . 43 (6): 2624–2652. arXiv : 1410.5837 . дои : 10.1214/15-AOS1354 . ISSN 0090-5364 . S2CID 14267617 .
- ^ Юань, Чжан; Елизавета, Левина; Цзи, Чжу (2017). «Оценка вероятностей границ сети путем сглаживания окрестностей» . Биометрика . 104 (4): 771–783. doi : 10.1093/biomet/asx042 . ISSN 0006-3444 .
- ↑ Перейти обратно: Перейти обратно: а б с Ловас, Л. Большие сети и ограничения графов . Американское математическое общество.
- ^ Чанг, Фан Р.К .; Грэм, Рональд Л .; Уилсон, Р.М. (1989). «Квазислучайные графики» . Комбинаторика . 9 (4): 345–362. дои : 10.1007/BF02125347 .
- ^ Гласскок, Д. (2015). «Что такое графон». Уведомления Американского математического общества . 62 (1): 46–48. arXiv : 1611.00718 .
- ^ Ловас, Ласло ; Сегеди, Балаж (2007). «Лемма Семереди для аналитика». Геометрический и функциональный анализ . 17 : 252–270. дои : 10.1007/s00039-007-0599-6 . S2CID 15201345 .
- ^ Сидоренко, А. (1993). «Корреляционное неравенство для двудольных графов». Графы и комбинаторика . 9 (2–4): 201–204. дои : 10.1007/BF02988307 .
- ^ Хатами, Х. (2010). «Нормы графа и гипотеза Сидоренко». Израильский математический журнал . 175 (1): 125–150. arXiv : 0806.0047 . дои : 10.1007/s11856-010-0005-1 .
- ^ Хаупт, Андреас; Шульц, Томас; Хатами, Мохаммед; Тран, Нгок (17 июля 2020 г.). «Классификация больших сетей: количественная оценка с помощью мотивов и графонов (исследование)». В Аку, Бахар; Даниалли, Донателла; Левицка, Марта; Пати, Арати; Р.В., Сарасвати; Тебо-Юунгкем, Миранда (ред.). Достижения математических наук . Серия «Ассоциация женщин в математике». Том. 21. Спрингер, Чам. стр. 107–126. arXiv : 1710.08878 . дои : 10.1007/978-3-030-42687-3_7 . ISBN 978-3-030-42687-3 .
- ^ Вейч, В.; Рой, DM (2015). «Класс случайных графов, возникающих из взаимозаменяемых случайных мер». arXiv : 1512.03099 [ math.ST ].
- ^ Боргс, К.; Чейес, Дж.Т.; Кон, Х.; Чжао, Ю. (2019). "Ан Л. п теория сходимости разреженных графов I: пределы, модели разреженных случайных графов и степенные распределения». Труды Американского математического общества . 372 (5): 3019–3062. arXiv : 1401.2906 . doi : 10.1090/tran/7543 . S2CID 50704206 .
- ^ Боргс, К.; Чейес, Дж.Т.; Кон, Х.; Чжао, Ю. (2018). "Ан Л. п теория сходимости разреженных графов II: LD-сходимость, частное и правая сходимость». Анналы вероятностей . 46 (2018): 337–396. arXiv : 1408.0744 . doi : 10.1214/17-AOP1187 . S2CID 51786393 .