Обнаружение шагов
В статистике и обработке сигналов ( обнаружение шага также известное как ступенчатое сглаживание , ступенчатая фильтрация , обнаружение сдвига , обнаружение скачка или обнаружение края ) — это процесс обнаружения резких изменений (шагов, скачков, сдвигов) на среднем уровне временного ряда или сигнал. Обычно его рассматривают как частный случай статистического метода, известного как обнаружение изменений или обнаружение точки изменения. Часто шаг мал, а временной ряд испорчен каким-то шумом , и это усложняет задачу, поскольку шаг может быть скрыт шумом. Поэтому часто требуются алгоритмы статистической обработки и/или обработки сигналов.
Проблема обнаружения шагов возникает во многих научных и инженерных контекстах, например, при статистическом управлении процессами. [1] ( контрольная карта является наиболее близким методом), в геологоразведочной геофизике (где проблема состоит в том, чтобы разбить данные ГИС на стратиграфические зоны [2] ), в генетике (проблема разделения микрочипов данных числа копий на аналогичные режимы [3] ) и в биофизике (обнаружение переходов состояний в молекулярной машине , записанных во временных координатах [4] ). Для 2D-сигналов соответствующая проблема обнаружения границ интенсивно изучалась при обработке изображений . [5]
Алгоритмы
[ редактировать ]Когда обнаружение шагов должно выполняться по мере поступления данных, онлайн-алгоритмы . обычно используются [6] и это становится частным случаем последовательного анализа .Такие алгоритмы включают классический метод CUSUM, применяемый к изменениям среднего значения. [7]
Напротив, автономные алгоритмы применяются к данным потенциально спустя долгое время после их получения. Большинство автономных алгоритмов обнаружения шагов в цифровых данных можно разделить на нисходящие , восходящие , скользящие оконные или глобальные методы.
Сверху вниз
[ редактировать ]Эти алгоритмы начинаются с предположения об отсутствии шагов и по одному вводят возможные шаги-кандидаты, проверяя каждого кандидата, чтобы найти тот, который минимизирует некоторые критерии (например, аппроксимацию оцененного базового кусочно-постоянного сигнала методом наименьших квадратов). Примером может служить алгоритм пошагового размещения прыжков , впервые изученный в геофизических задачах. [2] который нашел недавнее применение в современной биофизике. [8]
Вверх дном
[ редактировать ]Алгоритмы «снизу вверх» используют «противоположный» подход методам «сверху вниз», сначала предполагая, что между каждой выборкой цифрового сигнала есть шаг, а затем последовательно объединяя шаги на основе некоторых критериев, проверенных для каждого кандидата на слияние.
Раздвижное окно
[ редактировать ]Рассматривая небольшое «окно» сигнала, эти алгоритмы ищут признаки шага, происходящего внутри окна. Окно «скользит» по временному ряду, шаг за шагом. Доказательства шага проверяются с помощью статистических процедур, например, с использованием двухвыборочного t-критерия Стьюдента . Альтернативно нелинейный фильтр , такой как медианный фильтр к сигналу применяется . Подобные фильтры пытаются удалить шум, сохраняя при этом резкие скачки.
Глобальный
[ редактировать ]Глобальные алгоритмы рассматривают весь сигнал за один раз и пытаются найти шаги в сигнале с помощью какой-либо процедуры оптимизации. Алгоритмы включают вейвлет -методы, [9] и полное шумоподавление вариаций , в котором используются методы выпуклой оптимизации . Если шаги можно смоделировать как цепь Маркова , то скрытые модели Маркова (популярный подход в биофизическом сообществе). также часто используются [10] ). Когда имеется только несколько уникальных значений среднего, кластеризацию k-средних можно также использовать .
Линейные и нелинейные методы обработки сигналов для обнаружения шагов
[ редактировать ]Поскольку ступени и (независимый) шум теоретически имеют бесконечную полосу пропускания и, таким образом, перекрываются в базисе Фурье , подходы к обработке сигналов для обнаружения ступенек обычно не используют классические методы сглаживания, такие как фильтр нижних частот . Вместо этого большинство алгоритмов являются явно нелинейными или изменяющимися во времени. [11]
Обнаружение шага и кусочно-постоянные сигналы
[ редактировать ]Поскольку целью обнаружения шага является обнаружение серии мгновенных скачков среднего значения сигнала, желаемый, основной, средний сигнал является кусочно-постоянным . По этой причине обнаружение шага можно с успехом рассматривать как задачу восстановления кусочно-постоянного сигнала, искаженного шумом. Существуют две взаимодополняющие модели для кусочно-постоянных сигналов: в виде сплайнов с углом 0 градусов с несколькими узлами или в виде наборов уровней с несколькими уникальными уровнями. Поэтому многие алгоритмы обнаружения ступеней лучше всего понимать как методы аппроксимации сплайном 0 градусов или восстановления набора уровней.
Обнаружение шагов как восстановление набора уровней
[ редактировать ]Когда имеется только несколько уникальных значений среднего значения, такие методы кластеризации, как кластеризация k-средних или сдвиг среднего значения подходят . Эти методы лучше всего понимать как методы поиска описания набора уровней основного кусочно-постоянного сигнала.
Обнаружение ступеньки при подгонке сплайна под углом 0 градусов
[ редактировать ]Многие алгоритмы явно подгоняют сплайны 0 градусов к зашумленному сигналу, чтобы обнаружить шаги (включая методы пошагового размещения переходов). [2] [8] ), но существуют и другие популярные алгоритмы, которые также можно рассматривать как методы подбора сплайнов после некоторого преобразования, например, полное вариационное шумоподавление . [12]
Обобщенное обнаружение шагов путем кусочно-постоянного шумоподавления
[ редактировать ]Все упомянутые выше алгоритмы имеют определенные преимущества и недостатки в конкретных обстоятельствах, однако удивительно большое количество этих алгоритмов обнаружения шагов являются частными случаями более общего алгоритма. [11] Этот алгоритм предполагает минимизацию глобального функционала: [13]
( 1 ) |
Здесь x i для i = 1,...., N — входной сигнал дискретного времени длины N , а m i — выходной сигнал алгоритма. Цель состоит в том, чтобы минимизировать H [ m ] относительно выходного сигнала m . Форма функции определяет конкретный алгоритм. Например, выбрав:
где I ( S ) = 0, если условие S ложно, и другое в противном случае, получает алгоритм общего шумоподавления с параметром регуляризации . Сходным образом:
приводит к алгоритму среднего сдвига при использовании интегратора Эйлера с адаптивным размером шага, инициализируемого входным сигналом x . [13] Здесь W > 0 — параметр, определяющий поддержку ядра среднего сдвига. Другой пример:
ведущий к двустороннему фильтру , где — параметр тонального ядра, а W — поддержка пространственного ядра. Еще один частный случай:
определение группы алгоритмов, которые пытаются жадно подогнать к сигналу сплайны с нулевой степенью. [2] [8] Здесь, определяется как ноль, если x = 0, и единица в противном случае.
Многие из функционалов в уравнении ( 1 ), определяемые конкретным выбором являются выпуклыми : их можно минимизировать, используя методы выпуклой оптимизации . Третьи невыпуклые, но был разработан ряд алгоритмов минимизации этих функционалов. [13]
Обнаружение шагов с использованием модели Поттса
[ редактировать ]Классическим вариационным методом обнаружения шагов является модель Поттса. Это задается задачей невыпуклой оптимизации
Термин наказывается за количество прыжков и срок измеряет верность данным x . Параметр γ > 0 определяет компромисс между регулярностью и точностью данных . Поскольку минимизатор является кусочно-постоянным, шаги задаются ненулевыми положениями градиента .Для и существуют быстрые алгоритмы, дающие точное решение задачи Поттса в . [14] [15] [16] [17]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Э. С. Пейдж (1955). «Проверка изменения параметра, происходящего в неизвестной точке». Биометрика . 42 (3–4): 523–527. дои : 10.1093/biomet/42.3-4.523 . hdl : 10338.dmlcz/103435 .
- ^ Перейти обратно: а б с д Гилл, Д. (1970). «Применение метода статистического районирования для оценки резервуаров и анализа цифровых каротажей». Бюллетень Американской ассоциации геологов-нефтяников . 54 : 719–729. дои : 10.1306/5d25ca35-16c1-11d7-8645000102c1865d .
- ^ Снейдерс, AM; и др. (2001). «Сборка микрочипов для полногеномного измерения количества копий ДНК». Природная генетика . 29 (3): 263–264. дои : 10.1038/ng754 . ПМИД 11687795 . S2CID 19460203 .
- ^ Сова, Ю.; Роу, AD; Лик, MC; Якуши, Т.; Хомма, М.; Исиджима, А.; Берри, РМ (2005). «Прямое наблюдение за этапами вращения бактериального жгутикового мотора». Природа . 437 (7060): 916–919. Бибкод : 2005Natur.437..916S . дои : 10.1038/nature04003 . ПМИД 16208378 . S2CID 262329024 .
- ^ Серра, JP (1982). Анализ изображений и математическая морфология . Лондон; Нью-Йорк: Академическая пресса.
- ^ Басвиль, М.; И.В. Никифоров (1993). Обнаружение резких изменений: теория и применение . Прентис Холл.
- ^ Родионов С.Н., 2005а: Краткий обзор методов обнаружения смены режимов. ссылка на PDF В: Крупномасштабные нарушения (смены режимов) и восстановление водных экосистем: проблемы управления на пути к устойчивому развитию, В. Великова и Н. Чипев (ред.), Семинар ЮНЕСКО-РОСТЕ/БАС по сменам режимов, 14–16 июнь 2005, Варна, Болгария, 17-24.
- ^ Перейти обратно: а б с Керссемакерс, JWJ; Мунтяну, ЭЛ; Лаан, Л.; Ноэцель, ТЛ; Янсон, Мэн; Догтером, М. (2006). «Динамика сборки микротрубочек при молекулярном разрешении». Природа . 442 (7103): 709–712. Бибкод : 2006Natur.442..709K . дои : 10.1038/nature04928 . ПМИД 16799566 . S2CID 4359681 .
- ^ Маллат, С.; Хван, WL (1992). «Обнаружение особенностей и обработка с помощью вейвлетов». Транзакции IEEE по теории информации . 38 (2): 617–643. CiteSeerX 10.1.1.36.5153 . дои : 10.1109/18.119727 .
- ^ МакКинни, ЮАР; Джу, К.; Ха, Т. (2006). «Анализ траекторий FRET одиночных молекул с использованием скрытого марковского моделирования» . Биофизический журнал . 91 (5): 1941–1951. дои : 10.1529/biophysj.106.082487 . ПМК 1544307 . ПМИД 16766620 .
- ^ Перейти обратно: а б Литтл, Массачусетс; Джонс, Н.С. (2011). «Обобщенные методы и решатели удаления шума из кусочно-постоянных сигналов: Часть I. Базовая теория» . Труды Королевского общества А. 467 (2135): 3088–3114. Бибкод : 2011RSPSA.467.3088L . дои : 10.1098/rspa.2010.0671 . ПМК 3191861 . ПМИД 22003312 .
- ^ Чан, Д.; Т. Чан (2003). «Сохраняющие края и зависящие от масштаба свойства полной регуляризации вариаций». Обратная задача . 19 (6): С165–С187. Бибкод : 2003ИнвПр..19С.165С . дои : 10.1088/0266-5611/19/6/059 . S2CID 30704800 .
- ^ Перейти обратно: а б с Мразек, П.; Вайкерт, Дж.; Брюн, А. (2006). «Об устойчивой оценке и сглаживании с помощью пространственных и тональных ядер». Геометрические свойства для неполных данных . Берлин, Германия: Шпрингер.
- ^ Мамфорд Д. и Шах Дж. (1989). Оптимальные приближения кусочно-гладкими функциями и связанные с ними вариационные задачи. Сообщения по чистой и прикладной математике, 42 (5), 577–685.
- ^ Винклер, Г.; Либшер, В. (2002). «Сглаживатели прерывистых сигналов». Журнал непараметрической статистики . 14 (1–2): 203–222. дои : 10.1080/10485250211388 . S2CID 119562495 .
- ^ Фридрих; и др. (2008). «М-оценка с штрафом за сложность: быстрые вычисления». Журнал вычислительной и графической статистики . 17 (1): 201–224. дои : 10.1198/106186008x285591 . S2CID 117951377 .
- ^ А. Вайнманн, М. Сторат, Л. Демаре. " - Функционал Поттса для надежной реконструкции с разреженными переходами».Журнал SIAM по численному анализу, 53(1):644-673 (2015).