Jump to content

Сложность Радемахера

В теории вычислительного обучения ( машинное обучение и теория вычислений ) сложность Радемахера , названная в честь Ганса Радемахера , измеряет богатство класса множеств относительно распределения вероятностей . Эту концепцию также можно распространить на вещественнозначные функции.

Определения

[ редактировать ]

Радемахеровская сложность множества

[ редактировать ]

Учитывая набор , сложность Радемахера A определяется следующим образом: [1] [2] : 326 

где являются независимыми случайными величинами, полученными из распределения Радемахера , т.е. для , и . Некоторые авторы принимают абсолютное значение суммы перед взятием супремума, но если симметричен , это не имеет значения.

Радемахеровская сложность функционального класса

[ редактировать ]

Позволять быть выборкой точек и рассмотреть класс функции действительных функций над . Тогда Радемахера эмпирическая сложность данный определяется как:

Это также можно записать, используя предыдущее определение: [2] : 326 

где обозначает композицию функции , т.е.:

Позволять быть распределением вероятностей по . функционального Сложность Радемахера класса относительно для размера выборки является:

где вышеуказанное ожидание берется за одинаково независимо распределенную (iid) выборку созданный в соответствии с .

Интуиция

[ редактировать ]

Сложность Радемахера обычно применяется к функциональному классу моделей, которые используются для классификации, с целью измерения их способности классифицировать точки, взятые из вероятностного пространства с произвольными обозначениями. Когда класс функций достаточно богат, он содержит функции, которые могут соответствующим образом адаптироваться к каждому расположению меток, моделируемому случайным отбором меток. под ожиданием, так что это количество в сумме будет максимальным.

1. содержит один вектор, например, . Затем:

То же самое верно для каждого класса одноэлементных гипотез. [3] : 56 

2. содержит два вектора, например, . Затем:

Использование сложности Радемахера

[ редактировать ]

Сложность Радемахера можно использовать для получения зависящих от данных верхних границ обучаемости функциональных классов. Интуитивно понятно, что функциональный класс с меньшей сложностью Радемахера легче изучить.

Ограничение репрезентативности

[ редактировать ]

В машинном обучении желательно иметь обучающий набор , который представляет истинное распределение некоторых выборочных данных. . Это можно оценить количественно, используя понятие репрезентативности . Обозначим через распределение вероятностей, из которого взяты выборки. Обозначим через множество гипотез (потенциальных классификаторов) и обозначим через соответствующий набор функций ошибок, т. е. для каждой гипотезы , есть функция , который сопоставляет каждую обучающую выборку (признаки, метку) с ошибкой классификатора. (обратите внимание, что в этом случае гипотеза и классификатор используются как взаимозаменяемые). Например, в случае, когда представляет собой двоичный классификатор, функция ошибок представляет собой функцию потерь 0–1, т.е. функцию ошибок возвращает 0, если правильно классифицирует образец и еще 1. Опустим индекс и напишем вместо когда основная гипотеза не имеет значения. Определять:

– ожидаемая ошибка некоторой функции ошибок о реальном распределении ;
– предполагаемая ошибка некоторой функции ошибок по образцу .

Репрезентативность выборки , относительно и , определяется как:

Меньшая репрезентативность лучше, поскольку она дает возможность избежать переобучения : это означает, что истинная ошибка классификатора не намного превышает его расчетную ошибку, и поэтому выбор классификатора с низкой расчетной ошибкой гарантирует, что истинная ошибка также будет низкий. Однако обратите внимание, что понятие репрезентативности относительно и, следовательно, не может сравниваться между отдельными выборками.

Ожидаемая репрезентативность выборки может быть ограничена сверху сложностью Радемахера функционального класса: [2] : 326 

Ограничение ошибки обобщения

[ редактировать ]

Когда сложность Радемахера невелика, можно изучить класс гипотез H, используя эмпирическую минимизацию риска .

Например, (с функцией двоичной ошибки), [2] : 328  для каждого , с вероятностью по крайней мере , для каждой гипотезы :

Ограничение сложности Радемахера

[ редактировать ]

Поскольку меньшая сложность Радемахера лучше, полезно иметь верхние границы сложности Радемахера различных наборов функций. Следующие правила можно использовать для верхней границы сложности Радемахера набора. . [2] : 329–330 

1. Если все векторы в переводятся постоянным вектором , то Rad( A ) не изменится.

2. Если все векторы в умножаются на скаляр , то Rad( A ) умножается на .

3. . [3] : 56 

4. (Лемма Какаде и Тевари) Если все векторы в управляются функцией Липшица , то Rad( A ) (не более) умножается на константу Липшица функции. В частности, если все векторы из управляются сжимающим отображением , то Rad( A ) строго уменьшается.

5. Радемахеровская сложность выпуклой оболочки равно Рад( А ).

6. (Лемма Массара) Радемахеровская сложность конечного множества растет логарифмически с размером множества. Формально пусть быть набором векторы в , и пусть быть средним значением векторов в . Затем:

В частности, если представляет собой набор бинарных векторов, норма не более , так:

[ редактировать ]

Позволять быть семейством множеств, которого размерность VC равна . Известно, что роста функция ограничен как:

для всех :

Это означает, что для каждого набора с максимум элементы, . Семейство наборов можно рассматривать как набор двоичных векторов над . Подстановка этого в лемму Массара дает:

С помощью более продвинутых методов ( граница энтропии Дадли и верхняя граница Хаусслера [4] ) можно показать, например, что существует константа , такой, что любой класс -индикаторные функции размерности Вапника–Червоненкиса имеет сложность Радемахера, ограниченную сверху .

[ редактировать ]

Следующие оценки относятся к линейным операциям над – постоянный набор векторы в . [2] : 332–333 

1. Определить набор скалярных произведений векторов в с векторами в единичном шаре . Затем:

2. Определить набор скалярных произведений векторов в с векторами в единичном шаре 1-нормы. Затем:

[ редактировать ]

Следующая оценка связывает сложность Радемахера множества к его внешнему числу покрытия – количеству шаров данного радиуса чей союз содержит . Связка приписывается Дадли. [2] : 338 

Предполагать представляет собой набор векторов, длина (норма) которых не превосходит . Тогда для каждого целого числа :

В частности, если лежит в d -мерном подпространстве , затем:

Подстановка этого значения в предыдущую оценку дает следующую оценку сложности Радемахера:

Гауссова сложность

[ редактировать ]

Гауссова сложность — это аналогичная сложность с аналогичным физическим смыслом, и ее можно получить из сложности Радемахера с использованием случайных величин. вместо , где являются гауссовскими случайными величинами i.id с нулевым средним и дисперсией 1, т.е. . Известно, что сложности Гаусса и Радемахера эквивалентны с точностью до логарифмических множителей.

Эквивалентность Радемахера и Гауссовой сложности.

[ редактировать ]

Учитывая набор тогда это справедливо [5] :

Где — гауссова сложность A. В качестве примера рассмотрим радмахерову и гауссову сложности шара L1. Сложность Радемахера равна ровно 1, тогда как сложность по Гауссу порядка (что можно показать, применив известные свойства супремумов набора субгауссовских случайных величин). [5]

  1. ^ Балкан, Мария-Флорина (15–17 ноября 2011 г.). «Теория машинного обучения – сложность Радемахера» (PDF) . Проверено 10 декабря 2016 г.
  2. ^ Jump up to: а б с д и ж г Глава 26 в Шалев-Шварц, Шай; Бен-Давид, Шай (2014). Понимание машинного обучения – от теории к алгоритмам . Издательство Кембриджского университета. ISBN  9781107057135 .
  3. ^ Jump up to: а б Мори, Мехриар ; Ростамизаде, Афшин; Талвалкар, Амит (2012). Основы машинного обучения . США, Массачусетс: MIT Press. ISBN  9780262018258 .
  4. ^ Буске, О. (2004). Введение в статистическую теорию обучения. Биологическая кибернетика , 3176 (1), 169–207. дои : 10.1007/978-3-540-28650-9_8
  5. ^ Jump up to: а б Уэйнрайт, Мартин (2019). Многомерная статистика: неасимптотическая точка зрения . Кембридж, Великобритания. стр. Упражнение 5.5. ISBN  978-1-108-62777-1 . OCLC   1089254580 . {{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )
  • Питер Л. Бартлетт, Шахар Мендельсон (2002) Радемахер и гауссовы сложности: границы риска и структурные результаты . Журнал исследований машинного обучения 3 463–482
  • Джорджио Ньекко, Марчелло Сангинети (2008) Границы ошибки аппроксимации через сложность Радемахера . Прикладные математические науки, Vol. 2, 2008, вып. 4, 153–176
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 1d9460f4ad9e1ca2c7889811027d4975__1713706860
URL1:https://arc.ask3.ru/arc/aa/1d/75/1d9460f4ad9e1ca2c7889811027d4975.html
Заголовок, (Title) документа по адресу, URL1:
Rademacher complexity - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)