Jump to content

Генеративная топографическая карта

Генеративная топографическая карта ( GTM ) — это метод машинного обучения , который является вероятностным аналогом самоорганизующейся карты (SOM), вероятно, является конвергентным и не требует сокращения окрестности или уменьшения размера шага. Это генеративная модель : предполагается, что данные возникают путем сначала вероятностного выбора точки в низкомерном пространстве, сопоставления точки с наблюдаемым многомерным входным пространством (с помощью гладкой функции), а затем добавления шума в это пространство. Параметры низкоразмерного распределения вероятностей, гладкой карты и шума извлекаются из обучающих данных с использованием алгоритма максимизации ожидания (EM) . GTM был представлен в 1996 году в статье Кристофера Бишопа , Маркуса Свенсена и Кристофера К.И. Уильямса.

Подробности алгоритма

[ редактировать ]

Этот подход тесно связан с сетями плотности , которые используют выборку по важности и многослойный персептрон для формирования нелинейной модели скрытых переменных . В GTM скрытое пространство представляет собой дискретную сетку точек, которая предполагается нелинейно проецируемой в пространство данных. Затем в пространстве данных делается предположение о гауссовском шуме , так что модель становится ограниченной смесью гауссиан . Тогда вероятность модели может быть максимизирована с помощью EM.

Теоретически можно использовать произвольную нелинейную параметрическую деформацию. Оптимальные параметры можно найти методом градиентного спуска и т.п.

Предлагаемый подход к нелинейному отображению заключается в использовании радиальной сети базисных функций (RBF) для создания нелинейного отображения между скрытым пространством и пространством данных. Узлы Затем сеть RBF образует пространство признаков , и нелинейное отображение затем можно рассматривать как линейное преобразование этого пространства признаков. Этот подход имеет преимущество перед предлагаемым подходом сети плотности, поскольку его можно оптимизировать аналитически.

Использование

[ редактировать ]

В анализе данных GTM похожи на нелинейную версию анализа главных компонентов , которая позволяет моделировать многомерные данные как результат гауссовского шума, добавленного к источникам в скрытом пространстве более низкой размерности. Например, чтобы найти акции в двумерном пространстве, отображаемом на графике, на основе их форм временных рядов высокого разрешения. Другие приложения могут захотеть иметь меньше источников, чем точек данных, например модели смесей.

В генеративном деформационном моделировании скрытое пространство и пространство данных имеют одинаковые размеры, например, 2D-изображения или 1 звуковая звуковая волна. К источнику добавляются дополнительные «пустые» измерения (известные как «шаблон» в этой форме моделирования), например, размещение одномерной звуковой волны в двухмерном пространстве. Затем добавляются дополнительные нелинейные размеры, полученные путем объединения исходных размеров. Увеличенное скрытое пространство затем проецируется обратно в одномерное пространство данных. Вероятность данной проекции, как и прежде, определяется произведением правдоподобия данных в рамках модели гауссовского шума на априорный параметр деформации. В отличие от традиционного моделирования деформации на основе пружин, это имеет то преимущество, что его можно аналитически оптимизировать. Недостаток заключается в том, что это подход «добычи данных», т.е. форма предшествующей деформации вряд ли будет иметь смысл для объяснения возможных деформаций, поскольку он основан на очень высокой, искусственно и произвольно построенной скрытой нелинейной величине. космос. По этой причине априорное значение извлекается из данных, а не создается человеком-экспертом, как это возможно для моделей на основе пружин.

Сравнение с самоорганизующимися картами Кохонена.

[ редактировать ]

В то время как узлы на самоорганизующейся карте (SOM) могут перемещаться по своему желанию, узлы GTM ограничены допустимыми преобразованиями и их вероятностями. Если деформации ведут себя хорошо, топология скрытого пространства сохраняется.

SOM был создан как биологическая модель нейронов и представляет собой эвристический алгоритм. Напротив, GTM не имеет ничего общего с нейробиологией или познанием и представляет собой модель, основанную на вероятностных принципах. Таким образом, он имеет ряд преимуществ перед СОМ, а именно:

  • он явно формулирует модель плотности данных.
  • он использует функцию стоимости, которая количественно определяет, насколько хорошо обучена карта.
  • он использует надежную процедуру оптимизации ( алгоритм EM ).

GTM был представлен Бишопом, Свенсеном и Уильямсом в их техническом отчете в 1997 году (Технический отчет NCRG/96/015, Астонский университет, Великобритания), опубликованном позже в журнале Neural Computation. Это также было описано в докторской диссертации Маркуса Свенсена (Астон, 1998).

Приложения

[ редактировать ]

См. также

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 1deba9fa01ac35bd839ffa7640f27460__1716837960
URL1:https://arc.ask3.ru/arc/aa/1d/60/1deba9fa01ac35bd839ffa7640f27460.html
Заголовок, (Title) документа по адресу, URL1:
Generative topographic map - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)