Лемма Зауэра – Шелы

В комбинаторной математике и экстремальной теории множеств лемма Зауэра -Шела утверждает, что каждое семейство множеств с небольшой размерностью VC состоит из небольшого числа множеств. Он назван в честь Норберта Зауэра и Сахарона Шелаха , которые опубликовали его независимо друг от друга в 1972 году. [ 1 ] [ 2 ] Тот же результат был опубликован немного ранее и снова независимо Владимиром Вапником и Алексеем Червоненкисом , в честь которых названо измерение венчурного капитала. [ 3 ] В своей статье, содержащей лемму, Шела также отдает должное Михе Перлесу , [ 2 ] и по этой причине лемму также назвали леммой Перлеса-Зауэра-Шела и леммой Зауэра-Шела-Перлеса . [ 4 ] [ 5 ]
Бузагло и др. назовите эту лемму «одним из наиболее фундаментальных результатов о VC-размерности», [ 4 ] и он имеет применение во многих областях. Мотивацией Зауэра была комбинаторика систем множеств, Шелаха - теория моделей , а Вапника и Червоненкиса - статистика . Он также применялся в дискретной геометрии. [ 6 ] и теория графов . [ 7 ]
Определения и заявление
[ редактировать ]Если представляет собой семейство множеств и это набор, то говорят, что разбит он если каждое подмножество (включая пустой набор и себя) можно получить как пересечение из с некоторым набором в семье. Размер венчурного капитала — наибольшая мощность множества, разбитого .
В терминах этих определений лемма Зауэра – Шелаха утверждает, что если это семейство множеств, объединение которых имеет элементов, а если количество комплектов в семействе, , подчиняется неравенству затем разрушает набор размеров . Эквивалентно, если размерность VC является затем может состоять максимум из множества, как это выражается с использованием обозначения большого О.
Граница леммы жесткая: пусть семья состоять из всех подмножеств размером менее . Тогда размер это точно но это не разрушает ни один набор размеров . [ 8 ]
Количество разбитых наборов
[ редактировать ]Усиление леммы Зауэра-Шела, предложенное Паджором (1985) , утверждает, что каждое семейство конечных множеств по крайней мере разобьется наборы. [ 9 ] Отсюда немедленно следует лемма Зауэра–Шела, поскольку только подмножеств -вселенная элементов имеет мощность меньше, чем . Таким образом, когда не хватает маленьких множеств, которые можно разбить, поэтому одно из разбитых множеств должно иметь мощность не менее .
Для ограниченного типа разрушенного множества, называемого набором с нарушенным порядком, количество разрушенных множеств всегда равно мощности семейства множеств. [ 10 ]
Доказательство
[ редактировать ]Вариант Пайора леммы Зауэра-Шела можно доказать методом математической индукции ; доказательство по-разному приписывалось Ноге Алону. [ 11 ] или Рону Ахарони и Рону Хольцману. [ 10 ]
- База
- Каждая семья, имеющая только один набор, разбивает пустой набор.
- Шаг
- Предположим, что лемма верна для всех семейств размером менее и пусть быть семьей из двух или более комплектов. Позволять быть элементом, принадлежащим некоторым, но не всем множествам в . Расколоть на два подсемейства множеств, содержащих и множества, не содержащие . По предположению индукции эти два подсемейства разделяют две коллекции множеств, размеры которых составляют как минимум . Ни один из этих разбитых наборов не содержит , поскольку набор, содержащий не может быть разрушена семьей, в которой все множества содержат или все наборы не содержат . Некоторые из разбитых множеств могут быть разбиты обоими подсемействами. Когда набор разбито только одним из двух подсемейств, оно вносит одну единицу как в число разбитых множеств подсемейства, так и в число разбитых множеств подсемейства. . Когда набор раздроблено обоими подсемействами, обоими и разбиты , так вносит две единицы в число разбитых множеств подсемейств и . Таким образом, количество разбитых комплектов по крайней мере равно числу, разбитому двумя подсемействами , что по крайней мере .
Другое доказательство леммы Зауэра-Шела в ее первоначальной форме, предложенное Петером Франклом и Яношем Пахом , основано на линейной алгебре и принципе включения-исключения . [ 6 ] [ 8 ] Это доказательство распространяется и на другие параметры, такие как семейства векторных пространств и, в более общем смысле, на геометрические решетки . [ 5 ]
Приложения
[ редактировать ]Первоначальное применение леммы Вапником и Червоненкисом заключалось в том, чтобы показать, что каждое распределение вероятностей может быть аппроксимировано (относительно семейства событий заданной размерности VC) конечным набором точек выборки, мощность которых зависит только от VC. измерение семейства событий. В этом контексте есть два важных понятия аппроксимации, оба параметризуемые числом : набор выборок и распределение вероятностей по , как говорят, является -аппроксимация исходного распределения, если вероятность каждого события относительно отличается от своей первоначальной вероятности не более чем . Набор (невзвешенных) образцов называется -net, если каждое событие с вероятностью не менее включает в себя хотя бы одну точку . Ан -аппроксимация также должна быть -net, но не обязательно наоборот.
Вапник и Червоненкис использовали лемму, чтобы показать, что системы множеств размерности VC всегда иметь -аппроксимации мощности Более поздние авторы, включая Хаусслера и Вельцля (1987). [ 12 ] и Комлос, Пач и Вегингер (1992) [ 13 ] аналогичным образом показал, что всегда существуют -сети мощности , а точнее мощности не более [ 6 ] Основная идея доказательства существования малых -nets – это выбор случайной выборки мощности и вторая независимая случайная выборка мощности , и ограничить вероятность того, что пропустил какое-то большое событие по вероятности того, что пропущено и одновременно пересечение с больше его медианного значения. Для любого конкретного , вероятность того, что пропущен, пока больше, чем его медиана, очень мала, и лемма Зауэра–Шела (применительно к ) показывает, что лишь небольшое количество различных событий необходимо учитывать, поэтому по объединению с ненулевой вероятностью это -сеть. [ 6 ]
По очереди, -сети и -аппроксимации и вероятность того, что случайная выборка достаточно большой мощности обладает этими свойствами, имеют важные применения в машинном обучении , в области вероятно приблизительно правильного обучения . [ 14 ] В вычислительной геометрии они применялись для поиска диапазона . [ 12 ] дерандомизация , [ 15 ] и алгоритмы аппроксимации . [ 16 ] [ 17 ]
Козма и Моран (2013) используют обобщения леммы Зауэра-Шела для доказательства таких результатов в теории графов , как то, что количество сильных ориентаций данного графа зажато между количеством связных и 2-реберно-связных подграфов. [ 7 ]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Зауэр, Н. (1972), «О плотности семейств множеств», Журнал комбинаторной теории , серия A, 13 : 145–147, doi : 10.1016/0097-3165(72)90019-2 , MR 0307902 .
- ^ Jump up to: а б Шела, Сахарон (1972), «Комбинаторная проблема; стабильность и порядок моделей и теорий в бесконечных языках» , Pacific Journal of Mathematics , 41 : 247–261, doi : 10.2140/pjm.1972.41.247 , MR 0307903 , заархивировано из оригинал на 05.10.2013 .
- ^ Вапник, В.Н. ; Червоненкис, А.Я. (1971), "Равномерная сходимость частот появления событий к их вероятностям", Академия наук СССР , 16 : 264–279, МР 0288823 .
- ^ Jump up to: а б Бузагло, Сарит; Пинчаси, Ром; Роте, Гюнтер (2013), «Топологические гиперграфы», в Пач, Янош (редактор), «Тридцать эссе по геометрической теории графов » , Springer, стр. 71–81, doi : 10.1007/978-1-4614-0110-0_6 .
- ^ Jump up to: а б Камби, Стейн; Черномаз, Богдан; Двир, Зеев; Фильмус, Юваль; Моран, Шей (2020), «Лемма Зауэра-Шела-Перлеса для решеток» , Electronic Journal of Combinatorics , 27 (4): P4.19, arXiv : 1807.04957 , doi : 10.37236/9273 .
- ^ Jump up to: а б с д Пах, Янош ; Агарвал, Панкадж К. (1995), Комбинаторная геометрия , Серия Wiley-Interscience по дискретной математике и оптимизации, Нью-Йорк: John Wiley & Sons Inc., стр. 247 , номер домена : 10.1002/9781118033203 , ISBN 0-471-58890-3 , МР 1354145 .
- ^ Jump up to: а б Козма, Ласло; Моран, Шей (2013), «Разрушение, ориентации графов и связность» , Электронный журнал комбинаторики , 20 (3), P44, arXiv : 1211.1319 , Bibcode : 2012arXiv1211.1319K , MR 3118952 .
- ^ Jump up to: а б Гауэрс, Тимоти (31 июля 2008 г.), «Аргументы размерностей в комбинаторике» , Блог Гауэрса: обсуждения, связанные с математикой , Пример 3 .
- ^ Пажор, Ален (1985), Подпространства банаховых пространств , Travaux en Cours [Работы в процессе], vol. 16, Париж: Герман, ISBN 2-7056-6021-6 , МР 0903247 . Цитируется Ансти, Роньяи и Сали (2002) .
- ^ Jump up to: а б Ансти, РП; Роньяи, Лайош; Сали, Аттила (2002), «Потрясающие новости», Графики и комбинаторика , 18 (1): 59–73, doi : 10.1007/s003730200003 , MR 1892434 .
- ^ Калаи, Гил (28 сентября 2008 г.), «Экстремальная комбинаторика III: некоторые основные теоремы» , Комбинаторика и многое другое .
- ^ Jump up to: а б Хаусслер, Дэвид ; Вельцль, Эмо (1987), " -сети и запросы симплексного диапазона», Discrete and Computational Geometry , 2 (2): 127–151, doi : 10.1007/BF02187876 , MR 0884223 .
- ^ Комлос, Янош ; Пах, Янош ; Воегингер, Герхард (1992), «Почти узкие границы для -сети», Дискретная и вычислительная геометрия , 7 (2): 163–173, doi : 10.1007/BF02187833 , MR 1139078 .
- ^ Блюмер, Ансельм; Эренфойхт, Анджей; Хаусслер, Дэвид ; Вармут, Манфред К. (1989), «Обучаемость и измерение Вапника-Червоненкиса», Журнал ACM , 36 (4): 929–965, doi : 10.1145/76359.76371 , MR 1072253 .
- ^ Шазель, Б. ; Фридман Дж. (1990), «Детерминистический взгляд на случайную выборку и ее использование в геометрии», Combinatorica , 10 (3): 229–249, doi : 10.1007/BF02122778 , MR 1092541 .
- ^ Брённиманн, Х.; Гудрич, М.Т. (1995), «Покрытия почти оптимальных множеств в конечной VC-размерности», Дискретная и вычислительная геометрия , 14 (4): 463–479, doi : 10.1007/BF02570718 , MR 1360948 .
- ^ Хар-Пелед, Сариэль (2011), «О сложности, выборке и -сети и -выборки», Алгоритмы геометрической аппроксимации , Математические обзоры и монографии, т. 173, Провиденс, Род-Айленд: Американское математическое общество, стр. 61–85, ISBN 978-0-8218-4911-8 , МР 2760023 .