Ядро радиальной базисной функции
В машинном обучении радиальной базисной функции ядро , или ядро RBF , является популярной функцией ядра, используемой в различных кернеризованного алгоритмах обучения. В частности, он широко используется в опорных векторов машинной классификации . [1]
Ядро RBF на двух семплах и , представленный как векторы признаков в некотором входном пространстве , определяется как [2]
может быть распознан как квадрат евклидова расстояния между двумя векторами признаков. является свободным параметром. Эквивалентное определение включает параметр :
Поскольку значение ядра RBF уменьшается с расстоянием и колеблется от нуля (в пределе бесконечных расстояний) до единицы (когда x = x' ), оно имеет готовую интерпретацию как мера подобия . [2] Пространство признаков ядра имеет бесконечное количество измерений; для , его разложение с использованием полиномиальной теоремы : [3]
где ,
Приближения
[ редактировать ]Поскольку машины опорных векторов и другие модели, использующие трюк с ядром, плохо масштабируются для большого количества обучающих выборок или большого количества функций во входном пространстве, было введено несколько аппроксимаций ядра RBF (и подобных ядер). [4] Обычно они принимают форму функции z , которая отображает один вектор в вектор более высокой размерности, аппроксимируя ядро:
где — это неявное отображение, встроенное в ядро RBF.
Случайные функции Фурье
[ редактировать ]Один из способов построить такой z — это случайная выборка из преобразования Фурье ядра. [5] где являются независимыми выборками из нормального распределения .
Теорема:
Доказательство: Достаточно доказать случай . Используйте тригонометрическое тождество , сферическую симметрию гауссова распределения, затем вычислите интеграл
Теорема: . (Приложение А.2 [6] ).
Метод Нистрема
[ редактировать ]Другой подход использует метод Нистрема для аппроксимации собственного разложения матрицы Грама K , используя только случайную выборку обучающего набора. [7]
См. также
[ редактировать ]- Функция Гаусса
- Ядро (статистика)
- Полиномиальное ядро
- Радиальная базисная функция
- Сеть радиальных базисных функций
- Сеть фруктовых ядер
Ссылки
[ редактировать ]- ^ Чанг, Инь-Вэнь; Се, Чо-Джуи; Чанг, Кай-Вэй; Ринггаард, Майкл; Линь, Чи-Джен (2010). «Обучение и тестирование отображений полиномиальных данных низкой степени с помощью линейного SVM» . Журнал исследований машинного обучения . 11 : 1471–1490.
- ^ Jump up to: а б Жан-Филипп Верт, Кодзи Цуда и Бернхард Шёлкопф (2004). «Букварь по методам ядра». Ядерные методы в вычислительной биологии .
- ^ Шашуа, Амнон (2009). «Введение в машинное обучение: классные заметки 67577». arXiv : 0904.3664v1 [ cs.LG ].
- ^ Андреас Мюллер (2012). Приближения ядра для эффективных SVM (и другие методы извлечения признаков) .
- ^ Рахими, Али; Рехт, Бенджамин (2007). «Случайные функции для крупномасштабных машин с ядром» . Достижения в области нейронных систем обработки информации . 20 . Карран Ассошиэйтс, Инк.
- ^ Пэн, Хао; Паппас, Николаос; Йогатама, Дэни; Шварц, Рой; Смит, Ной А.; Конг, Линпэн (19 марта 2021 г.). «Случайное внимание к функциям». arXiv : 2103.02143 [ cs.CL ].
- ^ CKI Уильямс; М. Сигер (2001). «Использование метода Нистрема для ускорения работы машин с ядром» . Достижения в области нейронных систем обработки информации . 13 .