Jump to content

Сегментация временных рядов

Сегментация временных рядов — это метод анализа временных рядов , при котором входной временной ряд делится на последовательность дискретных сегментов, чтобы выявить основные свойства его источника. Типичным применением сегментации временных рядов является диаризация говорящего , при которой аудиосигнал разделяется на несколько частей в зависимости от того, кто и в какое время говорит. Алгоритмы, основанные на обнаружении точек изменения, включают методы скользящего окна, методы «снизу вверх» и «сверху вниз». [1] Вероятностные методы, основанные на скрытых моделях Маркова, также оказались полезными при решении этой проблемы. [2]

Обзор проблемы сегментации

[ редактировать ]

Часто временной ряд можно представить как последовательность дискретных сегментов конечной длины. Например, траекторию фондового рынка можно было бы разделить на регионы, лежащие между важными мировыми событиями, входные данные для приложения распознавания рукописного текста можно было бы сегментировать на различные слова или буквы, из которых они предположительно состояли, или аудиозапись. Конференцию можно разделить в зависимости от того, кто и когда выступал. В последних двух случаях можно воспользоваться тем фактом, что присвоение меток отдельным сегментам может повторяться (например, если человек выступает несколько раз во время конференции), пытаясь сгруппировать сегменты в соответствии с их отличительными свойствами. (например, спектральный состав голоса каждого говорящего). Существует два общих подхода к этой проблеме. Первый предполагает поиск точек изменения во временном ряду: например, можно назначить границу сегмента всякий раз, когда происходит большой скачок среднего значения сигнала. Второй подход предполагает предположение, что каждый сегмент временного ряда генерируется системой с различными параметрами, а затем выводит наиболее вероятные местоположения сегментов и параметры системы, которые их описывают. [3] В то время как первый подход имеет тенденцию искать изменения только в коротком временном интервале, второй подход обычно учитывает весь временной ряд при принятии решения о том, какую метку присвоить данной точке.

Алгоритмы сегментации

[ редактировать ]

Скрытые марковские модели

[ редактировать ]

В скрытой марковской модели временной ряд предполагается, что он генерируется при переходе системы между набором дискретных скрытых состояний. . В каждый момент времени , образец извлекается из распределения наблюдений (или выбросов), индексированного текущим скрытым состоянием, т. е. . Целью задачи сегментации является определение скрытого состояния в каждый момент времени, а также параметров, описывающих распределение выбросов, связанных с каждым скрытым состоянием. Последовательность скрытых состояний и параметры распределения выбросов можно узнать с помощью алгоритма Баума-Уэлча , который представляет собой вариант максимизации ожидания , применяемый к HMM. Обычно в задаче сегментации вероятности самоперехода между состояниями предполагаются высокими, так что система остается в каждом состоянии в течение немалого времени. Более надежные методы изучения параметров включают размещение иерархических априорных процессов Дирихле над матрицей переходов HMM. [4]

См. также

[ редактировать ]
  1. ^ Кио, Имонн и др. « Сегментация временных рядов: исследование и новый подход ». Интеллектуальный анализ данных в базах данных временных рядов 57 (2004): 1-22.
  2. ^ Фокс, Эмили Б. и др. « HDP-HMM для систем с сохранением состояния ». Материалы 25-й международной конференции по машинному обучению. АКМ, 2008.
  3. ^ Ли, Ян; Чжао, Кайгуан; Ху, Тунси; Чжан, Сюэсун. «BEAST: байесовский ансамблевый алгоритм для обнаружения точек изменения и разложения временных рядов» . Гитхаб .
  4. ^ Тех, Йи Уай и др. « Иерархические процессы Дирихле ». Журнал Американской статистической ассоциации 101.476 (2006).

Дальнейшее чтение

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 955c7d06bcd3fb820d7c0bb389891704__1718214720
URL1:https://arc.ask3.ru/arc/aa/95/04/955c7d06bcd3fb820d7c0bb389891704.html
Заголовок, (Title) документа по адресу, URL1:
Time-series segmentation - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)