Jump to content

Полиномиальное ядро

Иллюстрация картографии . Слева набор выборок во входном пространстве, справа те же выборки в пространстве признаков, где находится полиномиальное ядро (для некоторых значений параметров и ) — внутренний продукт. Гиперплоскость, изученная SVM в пространстве признаков, представляет собой эллипс во входном пространстве.

В машинном обучении полиномиальное ядро ​​— это функция ядра , обычно используемая с машинами опорных векторов (SVM) и другими моделями с ядром , которая представляет подобие векторов (обучающих выборок) в пространстве признаков по полиномам исходных переменных, позволяя изучать не -линейные модели.

Интуитивно понятно, что полиномиальное ядро ​​рассматривает не только заданные характеристики входных выборок для определения их сходства, но и их комбинации. В контексте регрессионного анализа такие комбинации известны как признаки взаимодействия. (Неявное) пространство признаков полиномиального ядра эквивалентно пространству полиномиальной регрессии , но без комбинаторного увеличения количества изучаемых параметров. Когда входные объекты имеют двоичное значение (логические значения), тогда эти объекты соответствуют логическим соединениям входных объектов. [1]

Определение

[ редактировать ]

Для полиномов степени d ядро ​​полинома определяется как [2]

где x и y — векторы размера n во входном пространстве , т. е. векторы признаков, вычисленные на основе обучающих или тестовых выборок, а c ≥ 0 — свободный параметр, учитывающий влияние членов более высокого и низшего порядка в полиноме. Когда c = 0 , ядро ​​называется однородным. [3] (Еще одно обобщенное полиядро делит x Т y заданным пользователем скалярным параметром a . [4] )

Как ядро ​​K соответствует скалярному произведению в пространстве признаков, основанном на некотором отображении φ :

Природу φ можно увидеть на примере. Пусть d = 2 , и мы получаем частный случай квадратичного ядра. После использования полиномиальной теоремы (дважды — самым внешним применением является биномиальная теорема ) и перегруппировки,

Отсюда следует, что карта признаков имеет вид:

обобщая для , где , и применив полиномиальную теорему :

Последнее суммирование имеет элементы, так что:

где ,

Практическое использование

[ редактировать ]

Хотя ядро ​​RBF более популярно в классификации SVM, чем полиномиальное ядро, последнее довольно популярно в обработке естественного языка (NLP). [1] [5] Наиболее распространенной степенью является d = 2 (квадратичная), поскольку более высокие степени имеют тенденцию к переобучению в задачах НЛП.

В качестве альтернативы обычным нелинейным алгоритмам обучения SVM были разработаны различные способы вычисления полиномиального ядра (как точные, так и приближенные), в том числе:

Одна из проблем с полиномиальным ядром заключается в том, что оно может страдать от числовой нестабильности : когда x Т y + c < 1 , K ( Икс , y ) знак равно ( Икс Т у + с ) д стремится к нулю с увеличением d , тогда как при x Т y + c > 1 , K ( x , y ) стремится к бесконечности. [4]

  1. ^ Jump up to: а б с Йоав Голдберг и Майкл Эльхадад (2008). SplitSVM: быстрые, экономичные, неэвристические полиномиальные вычисления ядра для приложений НЛП. Учеб. ACL-08: HLT.
  2. ^ «Архивная копия» (PDF) . Архивировано из оригинала (PDF) 15 апреля 2013 г. Проверено 12 ноября 2012 г. {{cite web}}: CS1 maint: архивная копия в заголовке ( ссылка )
  3. ^ Шашуа, Амнон (2009). «Введение в машинное обучение: классные заметки 67577». arXiv : 0904.3664v1 [ cs.LG ].
  4. ^ Jump up to: а б Линь, Чи-Джен (2012). Программное обеспечение для машинного обучения: разработка и практическое использование (PDF) . Летняя школа машинного обучения. Киото.
  5. ^ Jump up to: а б Чанг, Инь-Вэнь; Се, Чо-Джуи; Чанг, Кай-Вэй; Ринггаард, Майкл; Линь, Чи-Джен (2010). «Обучение и тестирование отображений полиномиальных данных низкой степени с помощью линейного SVM» . Журнал исследований машинного обучения . 11 : 1471–1490.
  6. ^ Jump up to: а б Кудо, Т.; Мацумото, Ю. (2003). Быстрые методы анализа текста на основе ядра . Учеб. ACL.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 2de3449446191fc306da527cd61a7433__1702638660
URL1:https://arc.ask3.ru/arc/aa/2d/33/2de3449446191fc306da527cd61a7433.html
Заголовок, (Title) документа по адресу, URL1:
Polynomial kernel - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)