Jump to content

Функция роста

Функция роста , также называемая коэффициентом разрушения или числом разрушения , измеряет богатство семейства множеств или класса функций. Он особенно используется в контексте статистической теории обучения , где он используется для изучения свойств статистических методов обучения.Термин «функция роста» был введен Вапником и Червоненкисом в их статье 1968 года, где они также доказали многие из его свойств. [1] Это базовая концепция машинного обучения . [2] [3]

Определения

[ редактировать ]

Определение семейства множеств

[ редактировать ]

Позволять быть семейством множеств (набором множеств) и набор. Их пересечение определяется как следующее семейство множеств:

Размер пересечения (также называемый индексом ) относительно является . Если набор имеет элементов, то индекс не превышает . Если индекс равен ровно 2 м тогда набор говорят, что разбит он , потому что содержит все подмножества , то есть:

Функция роста измеряет размер как функция . Формально:

Определение класса гипотез

[ редактировать ]

Эквивалентно, пусть быть классом гипотез (набором бинарных функций) и набор с элементы. Ограничение к представляет собой набор бинарных функций на которое может быть получено из : [3] : 45 

Функция роста измеряет размер как функция : [3] : 49 

1. Домен — это настоящая линия . Семейство наборов содержит все полупрямые (лучи) от заданного номера до положительной бесконечности, т. е. все множества вида для некоторых . Для любого набора из действительные числа, пересечение содержит наборы: пустой набор, набор, содержащий наибольший элемент , набор, содержащий два крупнейших элемента , и так далее. Поэтому: . [1] : Пример 1 То же самое верно, если содержит открытые полулинии, закрытые полулинии или и то, и другое.

2. Домен – это сегмент . Семейство наборов содержит все открытые множества. Для любого конечного множества из действительные числа, пересечение содержит все возможные подмножества . Есть такие подмножества, поэтому . [1] : Пример 2

3. Областью определения является евклидово пространство. . Семейство наборов содержит все полупространства формы: , где является фиксированным вектором.Затем ,где Comp — число компонент в разбиении n-мерного пространства m гиперплоскостями . [1] : Пример 3

4. Домен — это настоящая линия . Семейство наборов содержит все вещественные интервалы, т. е. все множества вида для некоторых . Для любого набора из действительные числа, пересечение содержит все серии от 0 до последовательные элементы . Число таких запусков , так .

Полиномиальный или экспоненциальный

[ редактировать ]

Основное свойство, которое делает функцию роста интересной, заключается в том, что она может быть либо полиномиальной, либо экспоненциальной — ничего промежуточного.

Следующее является свойством размера пересечения: [1] : Лем.1

  • Если для некоторого множества размера , и для некоторого числа , -
  • тогда существует подмножество размера такой, что .

Отсюда следует следующее свойство функции роста. [1] : Th.1 Для каждой семьи есть два случая:

  • Экспоненциальный случай : одинаково.
  • Полиномиальный случай : мажорируется , где — наименьшее целое число, для которого .

Другие объекты недвижимости

[ редактировать ]

Тривиальная верхняя граница

[ редактировать ]

Для любого конечного :

поскольку для каждого , количество элементов в самое большее . Поэтому функция роста представляет наибольший интерес, когда бесконечен.

Экспоненциальная верхняя граница

[ редактировать ]

Для любого непустого :

Т.е. функция роста имеет экспоненциальную верхнюю границу.

Мы говорим, что множество-семейство разрушает набор если их пересечение содержит все возможные подмножества , то есть .Если разбивает размера , затем , что является верхней границей.

Декартово пересечение

[ редактировать ]

Определим декартово пересечение двух семейств множеств как:

.

Затем: [2] : 57 

Для каждых двух множеств-семейств: [2] : 58 

Размер венчурного капитала

[ редактировать ]

Размер венчурного капитала определяется в соответствии с этими двумя случаями:

  • В случае полиномиальном = наибольшее целое число для чего .
  • В экспоненциальном случае .

Так если и только если .

Функцию роста можно рассматривать как уточнение концепции размерности венчурного капитала. Измерение венчурного капитала говорит нам только о том, равно или меньше, чем , а функция роста говорит нам, как именно изменяется в зависимости от .

Еще одну связь между функцией роста и размерностью VC дает лемма Зауэра – Шела : [3] : 49 

Если , затем:
для всех :

В частности,

для всех :
поэтому, когда размерность VC конечна, функция роста растет полиномиально с увеличением .

Эта верхняя граница точная, т.е. для всех существует с размером ВК такой, что: [2] : 56 

Энтропия

[ редактировать ]

Хотя функция роста связана с максимальным размером пересечения,энтропия средним связана со размером пересечения : [1] : 272–273 

Размер пересечения имеет следующее свойство. Для каждого множества-семейства :

Следовательно:

Более того, последовательность сходится к константе когда .

Более того, случайная величина сосредоточен вблизи .

Приложения в теории вероятностей

[ редактировать ]

Позволять быть множеством, на котором вероятностная мера определяется. Позволять быть семейством подмножеств (= семейство событий).

Предположим, мы выбрали набор который содержит элементы ,где каждый элемент выбирается случайным образом в соответствии с вероятностной мерой , независимо от остальных (т.е. с заменами). Для каждого события , сравниваем следующие две величины:

  • Его относительная частота в , то есть, ;
  • Его вероятность .

Нас интересует разница, . Эта разница удовлетворяет следующей верхней границе:

что эквивалентно: [1] : Th.2

Прописью: вероятность того, что для всех событий в , относительная частота близка к вероятности, ограничена снизу выражением, которое зависит от функции роста .

Следствием этого является то, что если функция роста полиномиальна по (т.е. существует некоторый такой, что ), то указанная выше вероятность приближается к 1 как . То есть, семья имеет равномерную сходимость по вероятности .

  1. ^ Перейти обратно: а б с д и ж г час Вапник В.Н.; Червоненкис, А.Я. (1971). «О равномерной сходимости относительных частот событий к их вероятностям». Теория вероятностей и ее приложения . 16 (2): 264. дои : 10.1137/1116025 . Это английский перевод русской статьи Б. Секлера: «О равномерной сходимости относительных частот событий к их вероятностям». Докл. Акад. Наук . 181 (4): 781. 1968. Перевод был воспроизведен как: Вапник В.Н.; Червоненкис, А.Я. (2015). «О равномерной сходимости относительных частот событий к их вероятностям». Меры сложности . п. 11. дои : 10.1007/978-3-319-21852-6_3 . ISBN  978-3-319-21851-9 .
  2. ^ Перейти обратно: а б с д Мори, Мехриар ; Ростамизаде, Афшин; Талвалкар, Амит (2012). Основы машинного обучения . США, Массачусетс: MIT Press. ISBN  9780262018258 . , особенно раздел 3.2
  3. ^ Перейти обратно: а б с д Шалев-Шварц, Шай; Бен-Давид, Шай (2014). Понимание машинного обучения – от теории к алгоритмам . Издательство Кембриджского университета. ISBN  9781107057135 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 8c6f06a3d01e19376ad6bc566a02b6cd__1703018280
URL1:https://arc.ask3.ru/arc/aa/8c/cd/8c6f06a3d01e19376ad6bc566a02b6cd.html
Заголовок, (Title) документа по адресу, URL1:
Growth function - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)