Функция роста
Функция роста , также называемая коэффициентом разрушения или числом разрушения , измеряет богатство семейства множеств или класса функций. Он особенно используется в контексте статистической теории обучения , где он используется для изучения свойств статистических методов обучения.Термин «функция роста» был введен Вапником и Червоненкисом в их статье 1968 года, где они также доказали многие из его свойств. [1] Это базовая концепция машинного обучения . [2] [3]
Определения
[ редактировать ]Определение семейства множеств
[ редактировать ]Позволять быть семейством множеств (набором множеств) и набор. Их пересечение определяется как следующее семейство множеств:
Размер пересечения (также называемый индексом ) относительно является . Если набор имеет элементов, то индекс не превышает . Если индекс равен ровно 2 м тогда набор говорят, что разбит он , потому что содержит все подмножества , то есть:
Функция роста измеряет размер как функция . Формально:
Определение класса гипотез
[ редактировать ]Эквивалентно, пусть быть классом гипотез (набором бинарных функций) и набор с элементы. Ограничение к представляет собой набор бинарных функций на которое может быть получено из : [3] : 45
Функция роста измеряет размер как функция : [3] : 49
Примеры
[ редактировать ]1. Домен — это настоящая линия . Семейство наборов содержит все полупрямые (лучи) от заданного номера до положительной бесконечности, т. е. все множества вида для некоторых . Для любого набора из действительные числа, пересечение содержит наборы: пустой набор, набор, содержащий наибольший элемент , набор, содержащий два крупнейших элемента , и так далее. Поэтому: . [1] : Пример 1 То же самое верно, если содержит открытые полулинии, закрытые полулинии или и то, и другое.
2. Домен – это сегмент . Семейство наборов содержит все открытые множества. Для любого конечного множества из действительные числа, пересечение содержит все возможные подмножества . Есть такие подмножества, поэтому . [1] : Пример 2
3. Областью определения является евклидово пространство. . Семейство наборов содержит все полупространства формы: , где является фиксированным вектором.Затем ,где Comp — число компонент в разбиении n-мерного пространства m гиперплоскостями . [1] : Пример 3
4. Домен — это настоящая линия . Семейство наборов содержит все вещественные интервалы, т. е. все множества вида для некоторых . Для любого набора из действительные числа, пересечение содержит все серии от 0 до последовательные элементы . Число таких запусков , так .
Полиномиальный или экспоненциальный
[ редактировать ]Основное свойство, которое делает функцию роста интересной, заключается в том, что она может быть либо полиномиальной, либо экспоненциальной — ничего промежуточного.
Следующее является свойством размера пересечения: [1] : Лем.1
- Если для некоторого множества размера , и для некоторого числа , -
- тогда существует подмножество размера такой, что .
Отсюда следует следующее свойство функции роста. [1] : Th.1 Для каждой семьи есть два случая:
- Экспоненциальный случай : одинаково.
- Полиномиальный случай : мажорируется , где — наименьшее целое число, для которого .
Другие объекты недвижимости
[ редактировать ]Тривиальная верхняя граница
[ редактировать ]Для любого конечного :
поскольку для каждого , количество элементов в самое большее . Поэтому функция роста представляет наибольший интерес, когда бесконечен.
Экспоненциальная верхняя граница
[ редактировать ]Для любого непустого :
Т.е. функция роста имеет экспоненциальную верхнюю границу.
Мы говорим, что множество-семейство разрушает набор если их пересечение содержит все возможные подмножества , то есть .Если разбивает размера , затем , что является верхней границей.
Декартово пересечение
[ редактировать ]Определим декартово пересечение двух семейств множеств как:
- .
Затем: [2] : 57
Союз
[ редактировать ]Для каждых двух множеств-семейств: [2] : 58
Размер венчурного капитала
[ редактировать ]Размер венчурного капитала определяется в соответствии с этими двумя случаями:
- В случае полиномиальном = наибольшее целое число для чего .
- В экспоненциальном случае .
Так если и только если .
Функцию роста можно рассматривать как уточнение концепции размерности венчурного капитала. Измерение венчурного капитала говорит нам только о том, равно или меньше, чем , а функция роста говорит нам, как именно изменяется в зависимости от .
Еще одну связь между функцией роста и размерностью VC дает лемма Зауэра – Шела : [3] : 49
- Если , затем:
- для всех :
В частности,
- для всех :
- поэтому, когда размерность VC конечна, функция роста растет полиномиально с увеличением .
Эта верхняя граница точная, т.е. для всех существует с размером ВК такой, что: [2] : 56
Энтропия
[ редактировать ]Хотя функция роста связана с максимальным размером пересечения,энтропия средним связана со размером пересечения : [1] : 272–273
Размер пересечения имеет следующее свойство. Для каждого множества-семейства :
Следовательно:
Более того, последовательность сходится к константе когда .
Более того, случайная величина сосредоточен вблизи .
Приложения в теории вероятностей
[ редактировать ]Позволять быть множеством, на котором вероятностная мера определяется. Позволять быть семейством подмножеств (= семейство событий).
Предположим, мы выбрали набор который содержит элементы ,где каждый элемент выбирается случайным образом в соответствии с вероятностной мерой , независимо от остальных (т.е. с заменами). Для каждого события , сравниваем следующие две величины:
- Его относительная частота в , то есть, ;
- Его вероятность .
Нас интересует разница, . Эта разница удовлетворяет следующей верхней границе:
что эквивалентно: [1] : Th.2
Прописью: вероятность того, что для всех событий в , относительная частота близка к вероятности, ограничена снизу выражением, которое зависит от функции роста .
Следствием этого является то, что если функция роста полиномиальна по (т.е. существует некоторый такой, что ), то указанная выше вероятность приближается к 1 как . То есть, семья имеет равномерную сходимость по вероятности .
Ссылки
[ редактировать ]- ^ Перейти обратно: а б с д и ж г час Вапник В.Н.; Червоненкис, А.Я. (1971). «О равномерной сходимости относительных частот событий к их вероятностям». Теория вероятностей и ее приложения . 16 (2): 264. дои : 10.1137/1116025 . Это английский перевод русской статьи Б. Секлера: «О равномерной сходимости относительных частот событий к их вероятностям». Докл. Акад. Наук . 181 (4): 781. 1968. Перевод был воспроизведен как: Вапник В.Н.; Червоненкис, А.Я. (2015). «О равномерной сходимости относительных частот событий к их вероятностям». Меры сложности . п. 11. дои : 10.1007/978-3-319-21852-6_3 . ISBN 978-3-319-21851-9 .
- ^ Перейти обратно: а б с д Мори, Мехриар ; Ростамизаде, Афшин; Талвалкар, Амит (2012). Основы машинного обучения . США, Массачусетс: MIT Press. ISBN 9780262018258 . , особенно раздел 3.2
- ^ Перейти обратно: а б с д Шалев-Шварц, Шай; Бен-Давид, Шай (2014). Понимание машинного обучения – от теории к алгоритмам . Издательство Кембриджского университета. ISBN 9781107057135 .