Jump to content

Алгоритм EM и модель GMM

В статистике алгоритм EM (максимизация ожиданий) обрабатывает скрытые переменные, а GMM — это модель гауссовой смеси.

На рисунке ниже показаны концентрация гемоглобина в эритроцитах и ​​данные об объеме эритроцитов у двух групп людей: группы с анемией и контрольной группы (т. е. группы людей без анемии ). Как и ожидалось, люди с анемией имеют меньший объем эритроцитов и более низкую концентрацию гемоглобина в эритроцитах , чем люди без анемии.

Модель GMM с этикетками

представляет собой случайный вектор, такой как и от медицинских исследований [ нужна ссылка ] известно, что в обычно распределяются каждой группе, т.е. .

обозначается как группа, где принадлежит, с когда принадлежит к группе Anemia и когда принадлежит контрольной группе. Также где , и . См. Категориальное распределение .

Для оценки можно использовать следующую процедуру .

Оценка максимального правдоподобия может быть применена:

Как для каждого известны, логарифмическую функцию правдоподобия можно упростить, как показано ниже:

Теперь функцию правдоподобия можно максимизировать, сделав частную производную по , получив:

[1]

Если Как известно, оценка параметров оказывается достаточно простой при оценке максимального правдоподобия . Но если неизвестно, все гораздо сложнее. [2]

ГММ без этикеток

Существование ( скрытая переменная т.е. не наблюдаемая), с немаркированным сценарием, алгоритм максимизации ожидания для оценки необходим а также другие параметры. Обычно эта задача задается как GMM, поскольку данные в каждой группе распределены нормально. [3] [ циклическая ссылка ]

В машинном обучении скрытая переменная рассматривается как скрытая закономерность, лежащая под данными, которую наблюдатель не может увидеть непосредственно. это известные данные, а являются параметром модели. В алгоритме EM есть некоторая базовая закономерность. в данных можно найти вместе с оценкой параметров. Широкое применение этого обстоятельства в машинном обучении делает алгоритм EM таким важным.

Алгоритм EM в GMM

[ редактировать ]

Алгоритм EM состоит из двух шагов: E-шага и M-шага. Во-первых, параметры модели и может быть инициализирован случайным образом. На этапе E алгоритм пытается угадать значение на основе параметров, в то время как на M-шаге алгоритм обновляет значение параметров модели на основе предположения шага Е. Эти два шага повторяются до тех пор, пока не будет достигнута сходимость.

Алгоритм в GMM:

Повторяем до схождения:

   1. (E-step) For each , set
   
   2. (M-step) Update the parameters
   
      
      

[1]

С помощью правила Байеса на E-шаге получается следующий результат:

В соответствии с настройкой GMM получаются следующие формулы:

Таким образом, возможно переключение между E-шагом и M-шагом в соответствии со случайно инициализированными параметрами.

  1. ^ Перейти обратно: а б Нг, Эндрю. «Конспекты лекций CS229» (PDF) .
  2. ^ Хуэй, Джонатан (13 октября 2019 г.). «Машинное обучение — алгоритм максимизации ожидания (EM)» . Середина .
  3. ^ Тонг, ЮЛ (2 июля 2020 г.). «Многомерное нормальное распределение» . Arc.Ask3.Ru .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 1b3edd78a5927d45f5216fc3519a9b94__1722853980
URL1:https://arc.ask3.ru/arc/aa/1b/94/1b3edd78a5927d45f5216fc3519a9b94.html
Заголовок, (Title) документа по адресу, URL1:
EM algorithm and GMM model - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)