Теорема Гливенко – Кантелли.


В теории вероятностей теорема Гливенко –Кантелли (иногда называемая « Основной теоремой статистики »), названная в честь Валерия Ивановича Гливенко и Франческо Паоло Кантелли , описывает асимптотическое поведение эмпирической функции распределения как числа независимых и одинаково распределенных наблюдения растут. [1] В частности, эмпирическая функция распределения сходится равномерно к истинной функции распределения почти наверняка .
Равномерная сходимость более общих эмпирических мер становится важным свойством Гливенко–Кантелли . классов функций или множеств [2] Классы Гливенко–Кантелли возникают в теории Вапника–Червоненкиса с приложениями к машинному обучению . Приложения можно найти в эконометрике с использованием M-оценок .
Заявление
[ редактировать ]Предположим, что являются независимыми и одинаково распределенными случайными величинами в с общей кумулятивной функцией распределения . Эмпирическая функция распределения для определяется
где – индикаторная функция множества За каждый (фиксированный) представляет собой последовательность случайных величин, которые сходятся к почти наверняка по строгому закону больших чисел . Гливенко и Кантелли усилили этот результат, доказав равномерную сходимость к
Теорема
Эта теорема принадлежит Валерию Гливенко. [4] и Франческо Кантелли , [5] в 1933 году.
- Примечания
- Если является стационарным эргодическим процессом , то почти наверняка сходится к Теорема Гливенко – Кантелли дает более сильный способ сходимости, чем в случае iid .
- Еще более сильный результат равномерной сходимости для эмпирической функции распределения доступен в виде закона повторного логарифма расширенного типа . [3] (стр. 268 ) См. асимптотические свойства эмпирической функции распределения для этого и связанных с ним результатов.
Доказательство
[ редактировать ]Для простоты рассмотрим случай непрерывной случайной величины . Исправить такой, что для . Теперь для всех существует такой, что .
Поэтому,
С по строгому закону больших чисел мы можем гарантировать, что для любого положительного и любое целое число такой, что , мы можем найти такой, что для всех , у нас есть . В сочетании с приведенным выше результатом это дополнительно означает, что , что является определением почти наверняка сходимости.
Эмпирические меры
[ редактировать ]можно Обобщить эмпирическую функцию распределения , заменив множество произвольным множеством C из класса множеств чтобы получить эмпирическую меру, индексированную наборами
Где – индикаторная функция каждого набора .
Дальнейшим обобщением является отображение, индуцированное на измеримых вещественных функциях f , что определяется выражением
Тогда важным свойством этих классов становится то, выполняется ли усиленный закон больших чисел равномерно на или .
Класс Гливенко – Кантелли
[ редактировать ]Рассмотрим набор с сигма-алгеброй борелевских подмножеств A и вероятностной мерой Для класса подмножеств
и класс функций
определить случайные величины
где является эмпирической мерой, — соответствующая карта, а
- предполагая, что оно существует.
Определения
- Класс называется классом Гливенко–Кантелли (или классом GC , а иногда и сильным классом GC ) относительно вероятностной меры P, если
- почти наверняка как
- Класс — это является слабым классом Гливенко-Кантелли относительно P , если вместо этого он удовлетворяет более слабому условию
- по вероятности как
- Класс называется универсальным классом Гливенко–Кантелли, если он является классом GC относительно любой вероятностной меры. на .
- Класс называется слабым равномерным классом Гливенко–Кантелли, если сходимость происходит равномерно по всем вероятностным мерам. на : Для каждого ,
- как
- Класс называется (сильным) однородным классом Гливенко-Кантелли, если он удовлетворяет более сильному условию, что для каждого ,
- как
Классы функций Гливенко–Кантелли (а также их равномерные и универсальные формы) определяются аналогично, заменяя все экземпляры с .
Слабая и сильная версии различных свойств Гливенко-Кантелли часто совпадают при определенных условиях регулярности. В таких условиях регулярности обычно появляется следующее определение:
- Класс функций является образно-допустимым по Суслину, если существует пространство Суслина и сюръекция такое, что карта измеримо .
- Класс измеримых множеств является образно-допустимым по Суслину, если класс функций является образно-допустимым Суслина, где обозначает индикаторную функцию для множества .
Теоремы
Следующие две теоремы дают достаточные условия эквивалентности слабой и сильной версий свойства Гливенко-Кантелли.
Теорема ( Талагранд , 1987) [6]
- Позволять быть классом функций, который интегрируем и определить . Тогда следующие условия эквивалентны:
- является слабым классом Гливенко-Кантелли и доминирует интегрируемая функция
- это класс Гливенко-Кантелли
Теорема ( Дадли , Джине и Зинн, 1991) [7]
- Предположим, что класс функций ограничен. Предположим также, что множество является образно-допустимым Суслином. Затем является слабым равномерным классом Гливенко-Кантелли тогда и только тогда, когда он является сильным равномерным классом Гливенко-Кантелли.
Следующая теорема играет центральную роль в статистическом обучении задач двоичной классификации.
Теорема ( Вапник и Червоненкис , 1968) [8]
- При определенных условиях совместности универсально измеримый класс множеств является равномерным классом Гливенко–Кантелли тогда и только тогда, когда он является классом Вапника–Червоненкиса .
Существует множество условий совместности эквивалентности однородных классов Гливенко-Кантелли и Вапника-Червоненкиса. В частности, любое из следующих условий для класса достаточно: [9]
- является образно-допустимым Суслином.
- универсально отделимо : существует счетное подмножество из так, что каждый набор можно записать как поточечный предел множеств в .
Примеры
[ редактировать ]- Позволять и . Классическая теорема Гливенко–Кантелли означает, что этот класс является универсальным классом GC. по теореме Колмогорова Кроме того ,
- , то есть является равномерно классом Гливенко–Кантелли.
- Пусть P — неатомная вероятностная мера на S и быть классом всех конечных подмножеств в S . Потому что , , , у нас это есть и так является не классом GC относительно P .
См. также
[ редактировать ]- Теорема Донскера
- Неравенство Дворецкого – Кифера – Вольфовица – усиливает теорему Гливенко – Кантелли путем количественного определения скорости сходимости.
Ссылки
[ редактировать ]- ^ Говард Г.Такер (1959). «Обобщение теоремы Гливенко – Кантелли» . Анналы математической статистики . 30 (3): 828–830. дои : 10.1214/aoms/1177706212 . JSTOR 2237422 .
- ^ ван дер Ваарт, AW (1998). Асимптотическая статистика . Издательство Кембриджского университета. п. 279 . ISBN 978-0-521-78450-4 .
- ^ Перейти обратно: а б ван дер Ваарт, AW (1998). Асимптотическая статистика . Издательство Кембриджского университета. ISBN 978-0-521-78450-4 .
- ^ Гливенко, В. (1933). «Об эмпирическом определении законов вероятности». Ежедневно Итальянский институт актуариев (на итальянском языке). 4 :92–99.
- ^ Кантелли, Ф. П. (1933). «Об эмпирическом определении законов вероятности». Ежедневно Институт итальянских актуариев . 4 : 421–424.
- ^ Талагранд, М. (1987). «Проблема Гливенко-Кантелли». Анналы вероятности . 15 : 837–870. дои : 10.1214/AOP/1176992069 .
- ^ Дадли, Ричард М .; Джине, Ева; Зинн, Джоэл К. (1991). «Равномерные и универсальные классы Гливенко-Кантелли». Журнал теоретической вероятности . 4 : 485–510. дои : 10.1007/BF01210321 .
- ^ Вапник, В.Н. ; Червоненкис, А.Я. (1971). «О равномерной сходимости относительных частот событий к их вероятностям». Теория вероятностей и ее приложения . 16 (2): 264–280. дои : 10.1137/1116025 .
- ^ Пестов, Владимир (2011). «Обучаемость PAC по сравнению с измерением VC: сноска к основному результату статистического обучения». Международная совместная конференция по нейронным сетям 2011 года . стр. 1141–1145. arXiv : 1104.2097 . дои : 10.1109/IJCNN.2011.6033352 .
Дальнейшее чтение
[ редактировать ]- Дадли, РМ (1999). Равномерные центральные предельные теоремы . Издательство Кембриджского университета. ISBN 0-521-46102-2 .
- Питман, EJG (1979). «Функция распределения выборки». Некоторые базовые теории статистических выводов . Лондон, Великобритания: Чепмен и Холл. п. 79–97. ISBN 0-470-26554-Х .
- Шорак, Греция ; Веллнер, Дж. А. (1986). Эмпирические процессы с приложениями к статистике . Уайли. ISBN 0-471-86725-Х .
- ван дер Ваарт, AW ; Веллнер, Дж. А. (1996). Слабая сходимость и эмпирические процессы . Спрингер. ISBN 0-387-94640-3 .
- ван дер Ваарт, Аад В .; Веллнер, Джон А. (1996). Теоремы Гливенко-Кантелли . Спрингер.
- ван дер Ваарт, Аад В .; Веллнер, Джон А. (2000). Теоремы сохранения для классов Гливенко–Кантелли и равномерных классов Гливенко–Кантелли . Спрингер.