Воспроизведение ядра Гильберта

В функциональном анализе воспроизводительное пространство из гильберта ( RKHS ) - это пространство функций Гильберта , в котором оценка точек является непрерывной линейной функциональной . Грубо говоря, это означает, что если две функции и в RKHS близко по норме, т.е. тогда маленький и также точнее близко, т.е. маленький для всех Полем Конверс не должен быть правдой. Неофициально, это можно показать, глядя на норму Supmum : последовательность функций сходится точечно, но не сходится равномерно, т.е. не сходится по отношению к норме Supmum. (Это не контрпример, потому что норма Supremum не возникает из какого -либо внутреннего продукта из -за не удовлетворяющего законом параллелограмма .)
Не совсем простым построить пространство функций Гильберта, которое не является RKHS. [ 1 ] Некоторые примеры, однако, были найдены. [ 2 ] [ 3 ]
Л 2 Пространства - это не пространства функций (и, следовательно, не RKHSS), а скорее пространства Гильберта классов эквивалентности функций (например, функции и определяется и эквивалентны в L 2 ) Тем не менее, есть RKHSS, в которых норма является L 2 -Norm, такой как пространство функций с ограниченными полосами (см. Пример ниже).
RKHS связан с ядром, которое воспроизводит каждую функцию в пространстве в том смысле, что для каждого В наборе, на котором определены функции », оценка на «Может быть выполнено, взяв внутренний продукт с функцией, определенной ядром. Такое воспроизводящее ядро существует, если и только если каждый функционал оценки непрерывно.
Воспроизведение ядра было впервые введено в 1907 году работы Станислава Зарембы, касающиеся задач граничной ценности для гармонических и бихармонических функций . Джеймс Мерсер одновременно изучил функции , которые удовлетворяют воспроизведению свойства в теории интегральных уравнений . Идея воспроизведения ядра оставалась нетронутой в течение почти двадцати лет, пока оно не появилось в диссертациях Габора Шега , Стефана Бергмана и Саломона Бохнера . Субъект в конечном итоге был систематически разработан в начале 1950 -х годов Нахманом Аронсаджном и Стефаном Бергманом. [ 4 ]
Эти пространства имеют широкие применения, включая сложный анализ , гармонический анализ и квантовую механику . Воспроизведение пространств гильберта ядра особенно важна в области статистического обучения из -за знаменитой теоремы представителя , в которой говорится, что каждая функция в RKHS, которая сводит к минимуму эмпирический функционал риска, может быть написана как линейная комбинация функции ядра, оцениваемой в учебных точках. Полем Это практически полезный результат, поскольку он эффективно упрощает проблему минимизации эмпирической риска от бесконечной размерной проблемы до конечной проблемы оптимизации.
Для простоты понимания мы предоставляем основу для реальных пространств Хилберта. Теория может быть легко распространена на пространства комплексных функций и, следовательно, включает в себя множество важных примеров воспроизводительных пространств Hilbert, которые являются пространствами аналитических функций . [ 5 ]
Определение
[ редактировать ]Позволять быть произвольным набором и Гильбертовое пространство реальных функций на , оснащено точечным добавлением и точечным скалярным умножением. Оценка Гильберта функционала по пространству функций линейный функционал, который оценивает каждую функцию в точке ,
Мы говорим, что H - это пространство для воспроизведения ядра, если, если, для всех в , непрерывно каждом на в или, эквивалентно, если является ограниченным оператором на , т.е. существует некоторые так что
( 1 ) |
Хотя предполагается для всех , это все еще может быть так, что .
В то время как свойство ( 1 ) является самым слабым условием, которое обеспечивает как существование внутреннего продукта, так и оценка каждой функции в В каждой точке домена он не поддается легкому применению на практике. Более интуитивно понятное определение RKHS может быть получено, заметив, что это свойство гарантирует, что функционал оценки может быть представлен путем принятия внутреннего продукта с функцией в Полем Эта функция является так называемым воспроизводительным ядром [ Цитация необходима ] для пространства Гильберта из которого RKHS берет свое название. Более формально, теорема представления RIES подразумевает, что для всех в существует уникальный элемент из с воспроизведением собственности,
( 2 ) |
С Сама функция, определенная на со значениями в поле (или в случае сложных пространств Гильберта) и как находится в У нас это есть
где это элемент в связан с .
Это позволяет нам определить воспроизведение ядра как функция (или в сложном случае)
Из этого определения легко увидеть, что (или в сложном случае) является симметричным (соответствующим конъюгатным симметричным), так и положительным определенным , т.е.
на каждый [ 6 ] Теорема Мур -Ароншаджн (см. Ниже) является своего рода обращением к этому: если функция Удовлетворяет эти условия, тогда есть пространство функций Гильберта для которого это воспроизводящее ядро.
Примеры
[ редактировать ]Самый простой пример размножающегося пространства Hilbert - это пространство - это пространство где это набор и это счетная мера на Полем Для , воспроизводящее ядро индикаторная функция из набора в одну точку .
Пространства нетривиальных размножающих ядра, которые часто включают аналитические функции , как мы теперь иллюстрируем примером. Рассмотрим пространство непрерывных функций Гильберта. Полем Исправить некоторую частоту отсечения и определить пространство Гильберта
где является набором квадратных интегрируемых функций, и это Фурье преобразование Полем Как внутренний продукт, мы используем
Поскольку это закрытый подпространство , это пространство Гильберта. Более того, элементы являются гладкими функциями на Это имеет тенденцию к нулю в бесконечности, по сути, Леммой Римана-Лебесга . На самом деле элементы ограничения на целых голоморфных функций , теорема Пейли -Уинер .
Из теоремы инверсии Фурье у нас
Затем следует неравенство Коши - Шварц и теорему Планировки , что для всех ,
Это неравенство показывает, что функционал оценки ограничен, доказывая, что действительно RKHS.
Функция ядра в этом случае дается
Преобразование Фурье определено выше, дано
что является следствием изменения свойства преобразования Фурье . Следовательно, используя теорему PlanCherel , мы
Таким образом, мы получаем воспроизводящее свойство ядра.
В этом случае является «версия, связанная с группой» функции Dirac Delta , и это сходится к в слабом смысле, как частота отсечения имеет тенденцию к бесконечности.
Мур -Ароншаджн Теорема
[ редактировать ]Мы видели, как воспроизводительное пространство ядра Гильберта определяет функцию воспроизведения ядра, которая является симметричной и положительной определенной . Теорема Мур -Аронзаджн идет в другом направлении; В нем говорится, что каждое симметричное, положительное определенное ядро определяет уникальное воспроизводительное пространство из гильберта. Теорема впервые появилась в теории Аронзаджа о воспроизведении ядра , хотя он приписывает ее Эх Муру .
- Теорема . Предположим, что K является симметричным, положительным определенным ядром на наборе x . есть уникальное пространство функций Гильберта, Тогда на x для которого k является воспроизводительным ядром.
Доказательство . Для всех x в x определите k x = k ( x , ⋅). Пусть H 0 - линейный промежуток { k x : x ∈ X }. внутренний продукт на H 0 Определите
что подразумевает Полем Симметрия этого внутреннего продукта вытекает из симметрии K , а не дегенерация следует из того факта, что K является положительным определенным.
Пусть H будет завершением H . 0 в отношении этого внутреннего продукта Тогда H состоит из функций формы
Теперь мы можем проверить свойство воспроизведения ( 2 ):
Чтобы доказать уникальность, пусть g - еще одно пространство функций Гильберта, для которого k - это воспроизводящее ядро. На каждый x и y в x , ( 2 ) подразумевает, что
Линейностью, на промежутке Полем Затем потому что G завершен и содержит H 0 и, следовательно, содержит его завершение.
Теперь нам нужно доказать, что каждый элемент G находится в h . Позволять быть элементом g . Поскольку H - закрытый подпространство G , мы можем написать где и Полем Теперь если Затем, поскольку K - это ядро G и H :
где мы использовали тот факт, что принадлежит H так, чтобы его внутренний продукт с В G ноль. Это показывает это в G и завершает доказательство.
Интегральные операторы и теорема Мерсера
[ редактировать ]Мы можем охарактеризовать симметричное положительное определенное ядро через интегрального оператора, используя теорему Мерсера и получите дополнительный вид на RKHS. Позволять быть компактным пространством, оснащенным строго положительной конечной мерой бореля и непрерывная, симметричная и положительная определенная функция. Определите интегрального оператора как
где это пространство квадратных интегрируемых функций по отношению к .
Теорема Мерсера утверждает, что спектральное разложение интегрального оператора из дает последовательное представление с точки зрения собственных значений и собственных функций Полем Это тогда подразумевает, что является воспроизводительным ядром, так что соответствующие RKHS можно определить с точки зрения этих собственных значений и собственных функций. Мы предоставляем подробности ниже.
Под этими предположениями является компактным, непрерывным, самостоятельным и позитивным оператором. Спектральная теорема для операторов самостоятельного следования подразумевает, что существует наиболее склонная к снижению последовательность так что и , где сформировать ортонормальную основу Полем Позитивным для всех Можно также показать, что Карты непрерывно в пространство непрерывных функций и поэтому мы можем выбирать непрерывные функции в качестве собственных векторов, то есть для всех Тогда по теореме Мерсера может быть написано с точки зрения собственных значений и непрерывных собственных функций как
для всех так что
Это представление выше серии называется ядром Mercer или Mercer .
Кроме того, можно показать, что RKHS из дано
где внутренний продукт дано по
Это представление RKHS имеет применение в вероятности и статистике, например, к представлению Кархунен-Лоева для стохастических процессов и PCA ядра .
Карты функций
[ редактировать ]Карта функций - это карта , где это пространство Гильберта, которое мы будем называть пространством функций. В первых разделах представлено соединение между ограниченными/непрерывными функциями оценки, положительными определенными функциями и интегральными операторами, и в этом разделе мы предоставляем другое представление RKHS с точки зрения карт признаков.
Каждая карта функций определяет ядро через
( 3 ) |
Четко Симметричная и положительная определенность следует из свойств внутреннего продукта в Полем И наоборот, каждая положительная определенная функция и соответствующее воспроизводящее пространство ядра с ядром имеют бесконечно много связанных карт признаков, так что ( 3 ) удерживается.
Например, мы можем тривиально взять и для всех Полем Тогда ( 3 ) удовлетворяется свойством воспроизведения. Другой классический пример карты функций связан с предыдущим разделом, касающимся интегральных операторов, взяв и .
Эта связь между ядрами и картами функций дает нам новый способ понять положительные определенные функции и, следовательно, воспроизводить ядра как внутренние продукты в Полем Более того, каждая карта функций может естественным образом определять RKHS с помощью определения положительной определенной функции.
Наконец, карты функций позволяют нам построить функциональные пространства, которые раскрывают другую перспективу на RKHS. Рассмотрим линейное пространство
Мы можем определить норму на к
Можно показать, что RKHS с ядром, определенным Полем Это представление подразумевает, что элементы RKHS являются внутренними продуктами элементов в пространстве объектов и, соответственно, могут рассматриваться как гиперплоины. Этот взгляд на RKHS связан с уловкой ядра в машинном обучении. [ 7 ]
Характеристики
[ редактировать ]Полезные свойства RKHSS:
- Позволять быть последовательности наборов и быть набором соответствующих положительных определенных функций на Затем следует, что
- Ядро на
- Позволять тогда ограничение к также воспроизводящий ядро.
- Рассмотрим нормализованное ядро так что для всех Полем Определить псевдометрику на x как
- По неравенству Коши - Шварца ,
- Это неравенство позволяет нам просматривать как мера сходства между входными данными. Если похожи тогда будет ближе к 1, пока если то же самое отличаются будет ближе к 0.
- Закрытие пролета совпадает с . [ 8 ]
Общие примеры
[ редактировать ]Билинейные ядра
[ редактировать ]RKHS соответствует этому ядру двойное пространство, состоящее из функций удовлетворительный .
Полиномиальные ядра
[ редактировать ]Это еще один общий класс ядер, который удовлетворяет Полем Некоторые примеры включают:
- Гауссовая или квадратная экспоненциальная ядра :
- Лапласианское ядро :
Мы также приводим примеры ядер Бергмана . Пусть x конечно и пусть H состоят из всех сложных функций на x . Тогда элемент H может быть представлен как массив сложных чисел. обычный внутренний продукт Если используется , то k x - это функция, значение которой 1 в x и 0 везде везде, и можно рассматривать как матрицу личности, так как
В этом случае h изоморфно .
Случай (где Обозначает единый диск ) более сложный. Здесь пространство Бергмана это пространство квадратных голоморфных функций на Полем Можно показать, что воспроизводительное ядро для является
Наконец, пространство полос ограниченных функций в с пропускной способностью RKHS с воспроизведением ядра
Расширение на векторные функции
[ редактировать ]В этом разделе мы расширяем определение RKHS на пространства векторных функций, так как это расширение особенно важно для многозадачного обучения и регуляризации коллекторов . Основное отличие заключается в том, что воспроизводительное ядро является симметричной функцией, которая теперь является положительной полупрофильной матрицей для каждого в Полем Более формально, мы определяем векторные RKHS (VVRKHS) как пространство функций гильберта так что для всех и
и
Это второе свойство аналогичется воспроизводимому свойству для скалярного дела. Это определение также может быть связано с интегральными операторами, ограниченными функциями оценки и картами функций, как мы видели для скалярных RKHS. Мы можем эквивалентно определить VVRKHS как векторное пространство Гилберта с ограниченным функционалом оценки и показывать, что это подразумевает существование уникального воспроизводительного ядра по теореме представления RIEZ. Теорема Мерсера также может быть расширена для устранения векторных настройки, и поэтому мы можем получить представление карты функций VVRKHS. Наконец, можно также показать, что закрытие пролета совпадает с , другое свойство, аналогичное скалярному делу.
Мы можем получить интуицию для vvrkhs, взяв на себя компонентную перспективу на эти пространства. В частности, мы обнаруживаем, что каждый VVRKHS изометрически изоморфным для скалярных RKHS на определенном входном пространстве. Позволять Полем Рассмотрим пространство и соответствующее воспроизводящее ядро
( 4 ) |
Как отмечалось выше, RKHS, связанные с этим воспроизводным ядром, определяется путем закрытия пролета где Для каждого набора пар .
Подключение к скалярным rkhs может быть создан тем фактом, что каждое ядро ядра, которое можно определить с ядром формы ( 4 ) через
Более того, каждое ядро с формой ( 4 ) определяет ядро с достоинством матрицы с вышеупомянутым выражением. Теперь позволить карте быть определенным как
где является компонент канонической основы для , можно показать, что бидзийтивна и изометрия между и .
Хотя эта точка зрения на VVRKHS может быть полезна при многозадачном обучении, эта изометрия не уменьшает изучение векторного случая, до того, как в случае скалярного случая. Фактически, эта процедура изометрии может сделать как скалярное ядро, так и входное пространство слишком трудным для работы на практике, поскольку свойства исходных ядер часто теряются. [ 11 ] [ 12 ] [ 13 ]
Важным классом ядра размножаемых ядер, на которые можно использовать ядра, которые могут быть факторизированы как продукт скалярного ценного ядра и -Сятная симметричная положительная полуболевая матрица. В свете нашей предыдущей дискуссии эти ядра имеют форму
для всех в и в Полем Поскольку ядро кодирует скалярную стоимость между входами, мы можем заметить, что ядро, на которое матрикс кодирует зависимости как входных и выходов.
В конце концов мы отмечаем, что вышеупомянутая теория может быть дополнительно расширена на пространства функций со значениями в функциональных пространствах, но получение ядра для этих пространств является более сложной задачей. [ 14 ]
Связь между RKHSS и функцией RELU
[ редактировать ]Функция RELU обычно определяется как и является основой в архитектуре нейронных сетей, где она используется в качестве функции активации. Можно построить рельсообразующую нелинейную функцию, используя теорию воспроизведения пространства Hilbert Hilbert. Ниже мы выводим эту конструкцию и показываем, как она подразумевает репрезентативную силу нейронных сетей с активациями RELU.
Мы будем работать с пространством Гильберта абсолютно непрерывных функций с и квадратный интегрируемый (т.е. ) производная. У него внутренний продукт
Для построения ядра воспроизведения достаточно для рассмотрения плотного подпространства, поэтому пусть и Полем Фундаментальная теорема исчисления затем дает
где
и Т.е.
Это подразумевает воспроизводит .
Более того, минимальная функция на имеет следующие представления с функцией RELU:
Используя эту формулировку, мы можем применить теорему представителя к RKHS, позволяя этому доказать оптимальность использования активаций RELU в настройках нейронной сети. [ Цитация необходима ]
Смотрите также
[ редактировать ]- Положительное определенное ядро
- Теорема Мерсера
- Уловки ядра
- Ядро встраивание распределений
- Представляют теорему
Примечания
[ редактировать ]- ^ Alpay, D. и TM Mills. «Семейство пространств Гильберта, которые не воспроизводят пространства Hilbert ядра». J. Anal. Приложение 1.2 (2003): 107–111.
- ^ Z. pasternak-winiarski, «о весах, которые признают воспроизводство ядра типа Бергмана», Международный журнал по математике и математическим наукам , Vol. 15, выпуск 1, 1992.
- ^ T.. Żynda, «о весах, которые признают воспроизведение ядра типа Szegő», журнал современного математического анализа (Армянская академия наук), 55, 2020.
- ^ Окутмуст
- ^ Полсон
- ^ Дурретт
- ^ Розаско
- ^ Розаско
- ^ Берлин, Ален и Томас, Кристина. Воспроизведение пространств Hilbert hilbert в вероятности и статистике , Kluwer Academic Publishers, 2004
- ^ Томас-Агнан c. Вычисление семейства воспроизведения ядра для статистических приложений. Численные алгоритмы, 13, с. 21-32 (1996)
- ^ От Вито
- ^ Чжан
- ^ Альварес
- ^ Розаско
Ссылки
[ редактировать ]- Альварес, Маурисио, Розаско, Лоренцо и Лоуренс, Нил, «Ядра для векторных функций: обзор», https://arxiv.org/abs/1106.6251 , июнь 2011 г.
- Aronszajn, Nachman (1950). «Теория воспроизведения ядра» . Труды Американского математического общества . 68 (3): 337–404. doi : 10.1090/s0002-9947-1950-0051437-7 . JSTOR 1990404 . MR 0051437 .
- Берлинат, Ален и Томас, Кристина. Воспроизведение пространств Hilbert hilbert в вероятности и статистике , Kluwer Academic Publishers, 2004.
- Скассер, Фелипе; Смейл, Стив (2002). «О математических основаниях обучения» . Бюллетень Американского математического общества . 39 (1): 1–49. doi : 10.1090/s0273-0979-01-00923-5 . Мистер 1864085 .
- Де Вито, Эрнест, Уманита, Вероника и Вилла, Сильвия. «Расширение теоремы Mercer на измеримые ядра, а также векторные, Arxiv : 1110.4017 , июнь 2013 года.
- Дюрретт, Грег. 9.520 Примечания к курсу, Массачусетский технологический институт, https://www.mit.edu/~9.520/scribe-notes/class03_gdurett.pdf , февраль 2010 г.
- Кимелдорф, Джордж; Вахба, Грейс (1971). «Некоторые результаты по функциям сплайна chebycheffian» (PDF) . Журнал математического анализа и приложений . 33 (1): 82–95. doi : 10.1016/0022-247x (71) 90184-3 . MR 0290013 .
- Окутмустур, Бейвер. «Воспроизведение пространств Hilbert hilbert», MS Disertation, Bilkent University, http://www.theess.bilkent.edu.tr/0002953.pdf , август 2005 г.
- Поулсен, Верн. «Введение в теорию воспроизводительных пространств Hilbert hilbert», https://citeseerx.ist.psu.edu/document?repid=rep1&type=pdf&doi=440218056738e05b5ab43679f932a9f333 .
- Steinwart, Ingo; Scovel, Clint (2012). «Теорема Мерсера об общих областях: об взаимодействии между показателями, ядрами и RKHSS». Конструкция Примерно 35 (3): 363–417. doi : 10.1007/s00365-012-9153-3 . MR 2914365 . S2CID 253885172 .
- Розаско, Лоренцо и Погио, Томас. «Тур по регуляризации машинного обучения - MIT 9.520 Notes Lecture Notes», Рукопись, декабрь 2014 года.
- Wahba, Grace , Spline Models для данных наблюдений , Siam , 1990.
- Чжан, Хайзханг; Сюй, Юшенг; Чжан, Цинхуи (2012). «Уточнение ядра воспроизводимых операторов» (PDF) . Журнал исследований машинного обучения . 13 : 91–136.