Многослойная скрытая марковская модель

Многослойная полученная скрытая модель Маркова (LHMM) — это статистическая модель, на основе скрытой модели Маркова (HMM). Многослойная скрытая марковская модель (LHMM) состоит из N уровней HMM, где HMM на уровне i + 1 соответствуют символам наблюдения или генераторам вероятностей на уровне i .Каждый уровень i LHMM состоит из K _i HMM, работающих параллельно. ^[1]

Фон

LHMM иногда полезны в конкретных структурах, поскольку они могут облегчить обучение и обобщение. Например, даже несмотря на то, что полностью подключенный HMM всегда можно было бы использовать, если бы было доступно достаточно обучающих данных, часто бывает полезно ограничить модель, не допуская произвольных переходов между состояниями. Точно так же может быть полезно встроить HMM в многоуровневую структуру, которая теоретически не сможет решить любые проблемы, которые не может решить базовый HMM, но может решить некоторые проблемы более эффективно, поскольку требуется меньше обучающих данных.

Многослойная скрытая марковская модель.

Многослойная скрытая марковская модель (LHMM) состоит из $N$ уровни HMM, где HMM на уровне $N+1$ соответствует символам наблюдения или генераторам вероятностей на уровне $N$ .Каждый уровень $i$ LHMM состоит из $K_{i}$ HMM работают параллельно.

На любом заданном уровне $L$ в LHMM последовательность $T_{L}$ символы наблюдения $\mathbf {o} _{L}=\{o_{1},o_{2},\dots ,o_{T_{L}}\}$ может использоваться для классификации входных данных в один из $K_{L}$ классы, где каждый класс соответствует каждому из $K_{L}$ ХММ на уровне $L$ . Эту классификацию затем можно использовать для создания нового наблюдения для уровня $L-1$ ХМм. На самом нижнем уровне, т.е. уровне $N$ , примитивные символы наблюдения $\mathbf {o} _{p}=\{o_{1},o_{2},\dots ,o_{T_{p}}\}$ будет генерироваться непосредственно из наблюдений за моделируемым процессом. Например, в задаче отслеживания траектории примитивные символы наблюдения будут возникать из квантованных значений датчиков. Таким образом, на каждом уровне LHMM наблюдения происходят из классификации нижележащего слоя, за исключением самого нижнего уровня, где символы наблюдения возникают из измерений наблюдаемого процесса.

Нет необходимости запускать все уровни детализации одновременно. Например, можно использовать оконную обработку на любом уровне структуры, чтобы классификация учитывала среднее значение нескольких классификаций перед передачей результатов на уровни LHMM. ^[2]

Вместо того, чтобы просто использовать победивший HMM на уровне $L+1$ в качестве входного символа для HMM на уровне $L$ его можно использовать в качестве генератора вероятностей , передавая полное распределение вероятностей на уровни LHMM. Таким образом, вместо стратегии «победитель получает все», где в качестве символа наблюдения выбирается наиболее вероятный HMM, вероятность $L(i)$ наблюдения за $i$ HMM можно использовать в рекурсивной формуле уровня $L$ HMM для учета неопределенности в классификации HMM на уровне $L+1$ . Таким образом, если классификация СММ на уровне $n+1$ неопределенно, можно уделить больше внимания априорной информации, закодированной в HMM на уровне $L$ .

На практике LHMM можно преобразовать в одноуровневый HMM, в котором все различные модели объединены вместе. ^[3] Некоторые из преимуществ, которые можно ожидать от использования LHMM по сравнению с большим однослойным HMM, заключаются в том, что LHMM с меньшей вероятностью пострадает от переобучения, поскольку отдельные подкомпоненты обучаются независимо на меньших объемах данных. Следствием этого является то, что для LHMM требуется значительно меньший объем обучающих данных для достижения производительности, сопоставимой с HMM. Еще одним преимуществом является то, что уровни в нижней части LHMM, которые более чувствительны к изменениям в окружающей среде, таким как тип датчиков, частота дискретизации и т. д., можно переобучать отдельно, не изменяя более высокие уровни LHMM.

См. также

Иерархическая скрытая марковская модель

Ссылки

^ Н. Оливер, А. Гарг и Э. Хорвиц, «Многослойные представления для обучения и определения офисной активности по множеству сенсорных каналов», Компьютерное зрение и понимание изображений, том. 96, с. 163–180, 2004.
^ Д. Аарно и Д. Крагич «Оценка многоуровневого HMM для распознавания намерения движения», Международная конференция IEEE по передовой робототехнике, 2007 г.
^ Д. Аарно и Д. Крагич: «Многослойный HMM для распознавания намерения движения», Международная конференция IEEE / RSJ по интеллектуальным роботам и системам, 2006.

[1] Н. Оливер, А. Гарг и Э. Хорвиц, «Многослойные представления для обучения и определения офисной активности по множеству сенсорных каналов», Компьютерное зрение и понимание изображений, том. 96, с. 163–180, 2004.

[2] Д. Аарно и Д. Крагич «Оценка многоуровневого HMM для распознавания намерения движения», Международная конференция IEEE по передовой робототехнике, 2007 г.

[3] Д. Аарно и Д. Крагич: «Многослойный HMM для распознавания намерения движения», Международная конференция IEEE / RSJ по интеллектуальным роботам и системам, 2006.

[1]

[2]

[3]