Трансформация без запаха
Преобразование без запаха (UT) — это математическая функция, используемая для оценки результата применения данного нелинейного преобразования к распределению вероятностей, которое характеризуется только с точки зрения конечного набора статистических данных. Наиболее распространенное использование преобразования без запаха — нелинейное проецирование оценок среднего и ковариации в контексте нелинейных расширений фильтра Калмана . Его создатель Джеффри Ульманн объяснил, что «без запаха» — это произвольное название, которое он принял, чтобы его не называли «фильтром Ульмана». [1]
Фон
[ редактировать ]Многие методы фильтрации и управления представляют оценки состояния системы в форме среднего вектора и связанной с ним ковариационной матрицы ошибок. Например, предполагаемое двумерное положение интересующего объекта может быть представлено вектором среднего положения: с неопределенностью, заданной в виде ковариационной матрицы 2x2, дающей дисперсию , дисперсия в и перекрестная ковариация между ними. Ковариация, равная нулю, означает, что нет никакой неопределенности или ошибки и что положение объекта соответствует точному значению, заданному средним вектором.
Представление среднего и ковариационного представления дает только первые два момента основного, но в остальном неизвестного распределения вероятностей. В случае движущегося объекта неизвестное распределение вероятностей может отражать неопределенность положения объекта в данный момент времени. Среднее и ковариационное представление неопределенности математически удобно, поскольку любое линейное преобразование можно применить к среднему вектору и ковариационная матрица как и . Это свойство линейности не сохраняется для моментов, выходящих за пределы первого исходного момента (среднего значения) и второго центрального момента (ковариации), поэтому обычно невозможно определить среднее значение и ковариацию, возникающие в результате нелинейного преобразования, поскольку результат зависит от всех моменты, и даны только первые два.
Хотя ковариационная матрица часто рассматривается как ожидаемая квадратичная ошибка, связанная со средним значением, на практике матрица поддерживается как верхняя граница фактической квадратичной ошибки. В частности, среднее значение и ковариационная оценка поддерживается консервативно, так что ковариационная матрица больше или равно фактическому квадрату ошибки, связанному с . Математически это означает, что результат вычитания ожидаемого квадрата ошибки (который обычно неизвестен) из — полуопределенная или положительно определенная матрица . Причина сохранения консервативной оценки ковариации заключается в том, что большинство алгоритмов фильтрации и управления будут иметь тенденцию расходиться (потерпеть неудачу), если ковариация недооценена. Это связано с тем, что ложно малая ковариация подразумевает меньшую неопределенность и заставляет фильтр придавать больший вес (достоверность), чем оправдано точностью среднего значения.
Возвращаясь к приведенному выше примеру, когда ковариация равна нулю, определить местоположение объекта после его перемещения в соответствии с произвольной нелинейной функцией тривиально. : просто примените функцию к среднему вектору. Когда ковариация не равна нулю, преобразованное среднее значение обычно не будет равно и невозможно даже определить среднее значение преобразованного распределения вероятностей только на основе его предварительного среднего и ковариации. Учитывая эту неопределенность, нелинейно преобразованное среднее значение и ковариация могут быть только аппроксимированы. Самое раннее приближение заключалось в линеаризации нелинейной функции и применении полученной матрицы Якобиана к заданному среднему значению и ковариации. Это основа расширенного фильтра Калмана (EKF), и хотя было известно, что во многих случаях он давал плохие результаты, в течение многих десятилетий не было практической альтернативы.
Мотивация для трансформации без запаха
[ редактировать ]В 1994 году Джеффри Ульманн отметил, что EKF берет нелинейную функцию и информацию о частичном распределении (в форме средней и ковариационной оценки) состояния системы, но применяет приближение к известной функции, а не к неточно известному распределению вероятностей. . Он предположил, что лучшим подходом было бы использование точной нелинейной функции, применяемой к аппроксимирующему распределению вероятностей. Мотивация такого подхода изложена в его докторской диссертации, где термин «трансформация без запаха» : впервые был определен [2]
Рассмотрим следующую интуицию: при фиксированном количестве параметров должно быть проще аппроксимировать данное распределение, чем аппроксимировать произвольную нелинейную функцию/преобразование . Следуя этой интуиции, цель состоит в том, чтобы найти параметризацию, которая фиксирует информацию о среднем значении и ковариации, и в то же время позволяет прямое распространение информации через произвольный набор нелинейных уравнений. Этого можно достичь путем создания дискретного распределения, имеющего одинаковые первый и второй (и, возможно, более высокие) моменты, где каждая точка дискретного приближения может быть напрямую преобразована. Затем среднее значение и ковариацию преобразованного ансамбля можно вычислить как оценку нелинейного преобразования исходного распределения. В более общем смысле, применение данного нелинейного преобразования к дискретному распределению точек, рассчитанное таким образом, чтобы получить набор известных статистических данных неизвестного распределения, называется преобразованием без запаха. .
Другими словами, данная информация о среднем и ковариации может быть точно закодирована в наборе точек, называемых сигма-точками , которые, если рассматривать их как элементы дискретного распределения вероятностей, имеют среднее значение и ковариацию, равные заданному среднему значению и ковариации. распространить, Это распределение можно точно применив нелинейную функцию к каждой точке. Среднее значение и ковариация преобразованного набора точек тогда представляют собой желаемую преобразованную оценку. Принципиальное преимущество подхода состоит в том, что нелинейная функция используется в полной мере, в отличие от ЭКФ, заменяющей ее линейной. Устранение необходимости линеаризации также дает преимущества, независимые от какого-либо улучшения качества оценки. Одним из непосредственных преимуществ является то, что UT можно применять к любой заданной функции, тогда как линеаризация может быть невозможна для функций, которые не дифференцируемы. Практическое преимущество состоит в том, что UT может быть проще реализовать, поскольку он позволяет избежать необходимости выводить и реализовывать линеаризующую матрицу Якобиана.
Сигма-очки
[ редактировать ]Чтобы вычислить преобразование без запаха, сначала нужно выбрать набор сигма-точек. Со времени плодотворной работы Ульмана в литературе было предложено множество различных наборов сигма-точек. Подробный обзор этих вариантов можно найти в работе Menegaz et al. [3] В общем, сигма-точки необходимы и достаточны для определения дискретного распределения, имеющего заданное среднее значение и ковариацию в размеры. [2]
Канонический набор сигма-точек — это симметричный набор, первоначально предложенный Ульманом. Рассмотрим вершины равностороннего треугольника с центром в начале координат в двух измерениях:
Можно проверить, что приведенный выше набор точек имеет среднее значение и ковариация (единичная матрица). Учитывая любое двумерное среднее значение и ковариацию, , желаемые сигма-точки можно получить, умножив каждую точку на матричный квадратный корень из и добавление . Подобный канонический набор сигма-точек может быть создан в любом количестве измерений. взяв нулевой вектор и точки, составляющие строки единичной матрицы, вычислив среднее значение набора точек, вычитая среднее значение из каждой точки так, чтобы полученный набор имел среднее значение, равное нулю, а затем вычисляя ковариацию нулевых значений. среднее множество точек и применение его обратного к каждой точке так, чтобы ковариация набора была равна единице.
Ульман показал, что можно удобно генерировать симметричный набор сигма-точки из столбцов и нулевой вектор, где — заданная ковариационная матрица без необходимости вычисления обратной матрицы. Он эффективен в вычислительном отношении и, поскольку точки образуют симметричное распределение, фиксирует третий центральный момент (перекос) всякий раз, когда основное распределение оценки состояния известно или может считаться симметричным. [2] Он также показал, что веса, в том числе отрицательные, можно использовать для воздействия на статистику набора. Жюльер также разработал и исследовал методы создания сигма-точек для учета третьего момента (перекоса) произвольного распределения и четвертого момента (эксцесса) симметричного распределения. [4] [5]
Пример
[ редактировать ]Преобразование без запаха определяется для применения данной функции к любой частичной характеристике неизвестного в противном случае распределения, но его наиболее часто используют в случае, когда заданы только среднее значение и ковариация. Типичным примером является преобразование из одной системы координат в другую, например, из декартовой системы координат в полярные координаты. [4]
Предположим, что двумерное среднее и ковариационная оценка: , задается в декартовых координатах:
и функция преобразования в полярные координаты, , является:
Умножив каждую из сигма-точек канонического симплекса (приведенных выше) на и добавив среднее значение, , дает:
Применение функции преобразования к каждому из вышеперечисленных пунктов дает:
Среднее значение этих трех преобразованных точек, , — UT-оценка среднего значения в полярных координатах:
UT-оценка ковариации:
где каждый квадрат члена суммы представляет собой векторное внешнее произведение. Это дает:
Это можно сравнить с линеаризованным средним значением и ковариацией:
Абсолютная разница между UT и линеаризованными оценками в этом случае относительно невелика, но в фильтрующих приложениях совокупный эффект небольших ошибок может привести к неустранимому расхождению оценки. Влияние ошибок усугубляется, когда ковариация недооценивается, поскольку это приводит к чрезмерной уверенности фильтра в точности среднего значения. В приведенном выше примере можно видеть, что линеаризованная оценка ковариации меньше, чем оценка UT, что позволяет предположить, что линеаризация, вероятно, привела к занижению фактической ошибки среднего значения.
В этом примере невозможно определить абсолютную точность UT и линеаризованных оценок без достоверных данных в форме фактического распределения вероятностей, связанного с исходной оценкой, а также среднего значения и ковариации этого распределения после применения нелинейного преобразования (например, , как определено аналитически или посредством численного интегрирования). Такой анализ был выполнен для преобразований координат в предположении гауссовости основных распределений, и оценки UT имеют тенденцию быть значительно более точными, чем оценки, полученные в результате линеаризации. [6] [7]
Эмпирический анализ показал, что использование минимального симплексного набора сигма-точек значительно менее точны, чем использование симметричного набора точки, когда основное распределение является гауссовым. [7] Это говорит о том, что использование симплексного набора в приведенном выше примере не будет лучшим выбором, если базовое распределение, связанное с является симметричным. Даже если базовое распределение не является симметричным, симплексный набор все равно будет менее точным, чем симметричный набор, поскольку асимметрия симплексного набора не соответствует асимметрии фактического распределения.
Возвращаясь к примеру, минимальный симметричный набор сигма-точек можно получить из ковариационной матрицы просто как средний вектор, плюс и минус столбцы :
Эта конструкция гарантирует, что среднее значение и ковариация вышеупомянутых четырех сигм-точек равны , что можно непосредственно проверить. Применение нелинейной функции каждой из сигм-точек дает:
Среднее значение этих четырех преобразованных сигма-точек, , — UT-оценка среднего значения в полярных координатах:
UT-оценка ковариации:
где каждый квадрат члена суммы представляет собой векторное внешнее произведение. Это дает:
Разница между UT и линеаризованными средними оценками дает меру влияния нелинейности преобразования. Например, когда преобразование линейное, UT и линеаризованные оценки будут идентичны. Это побуждает использовать квадрат этой разницы для добавления к UT-ковариации, чтобы предотвратить недооценку фактической ошибки среднего значения. Этот подход не повышает точность среднего значения, но может со временем значительно повысить точность фильтра за счет уменьшения вероятности недооценки ковариации. [2]
Оптимальность трансформации без запаха
[ редактировать ]Ульманн отметил, что, учитывая только среднее значение и ковариацию неизвестного в противном случае распределения вероятностей, проблема преобразования нечетко определена, поскольку существует бесконечное количество возможных основных распределений с одинаковыми первыми двумя моментами. Без какой-либо априорной информации или предположений о характеристиках основного распределения любой выбор распределения, используемый для вычисления преобразованного среднего значения и ковариации, столь же разумен, как и любой другой. Другими словами, не существует выбора распределения с заданным средним значением и ковариацией, превосходящего тот, который обеспечивается набором сигма-точек, поэтому преобразование без запаха тривиально оптимально.
Это общее утверждение об оптимальности, конечно, бесполезно для каких-либо количественных утверждений о характеристиках UT, например, по сравнению с линеаризацией; следовательно, он, Жюльер и другие провели анализ при различных предположениях о характеристиках распределения и/или форме функции нелинейного преобразования. Например, если функция дифференцируема, что важно для линеаризации, этот анализ подтверждает ожидаемое и эмпирически подтвержденное превосходство преобразования без запаха. [6] [7]
Приложения
[ редактировать ]Преобразование без запаха можно использовать для разработки нелинейного обобщения фильтра Калмана, известного как фильтр Калмана без запаха (UKF) . Этот фильтр в значительной степени заменил EKF во многих приложениях нелинейной фильтрации и управления, в том числе для подводной эксплуатации. [8] наземная и воздушная навигация, [9] и космический корабль. [10] Преобразование без запаха также использовалось в качестве вычислительной основы для оптимального управления Римана-Стилтьеса. [11] Этот вычислительный подход известен как оптимальное управление без запаха . [12] [13]
Фильтр Калмана без запаха
[ редактировать ]Ульманн и Саймон Жюльер опубликовали несколько статей, показывающих, что использование преобразования без запаха в фильтре Калмана , который называется фильтром Калмана без запаха (UKF), обеспечивает значительное улучшение производительности по сравнению с EKF в различных приложениях. [14] [4] [6] Жюльер и Ульманн опубликовали статьи, в которых использовалась определенная параметризованная форма преобразования без запаха в контексте UKF, который использовал отрицательные веса для сбора предполагаемой информации о распределении. [14] [6] Эта форма UT подвержена множеству числовых ошибок, которых не страдают исходные формулировки (симметричный набор, первоначально предложенный Ульманом). Впоследствии Жюльер описал параметризованные формы, которые не используют отрицательные веса и не подвержены этим проблемам. [15]
См. также
[ редактировать ]- Фильтр Калмана
- Ковариационное пересечение
- Ансамбль фильтра Калмана
- Расширенный фильтр Калмана
- Нелинейный фильтр
- Оптимальный контроль без запаха
Ссылки
[ редактировать ]- ^ «Из первых рук: трансформация без запаха — вики по истории техники и технологий» .
- ^ Перейти обратно: а б с д Ульманн, Джеффри (1995). Построение динамических карт и локализация: новые теоретические основы (кандидатская диссертация). Оксфордский университет.
- ^ Менегаз, Энрике М.Т.; Жоао, Ю. Исихара; БОРХЕС, Геовани А.; Варгас, Алессандро Н. (16 февраля 2015 г.). «Систематизация теории фильтра Калмана без запаха». Транзакции IEEE при автоматическом управлении . 60 (10): 2583–2598. дои : 10.1109/TAC.2015.2404511 . hdl : 20.500.11824/251 . S2CID 12606055 .
- ^ Перейти обратно: а б с Жюльер, С.; Дж. Ульманн (1997). «Последовательный несмещенный метод преобразования между полярной и декартовой системами координат». Материалы конференции SPIE 1997 года по обнаружению, отслеживанию и наведению . Том. 3086. ШПИОН.
- ^ Жюльер, Саймон (1998). «Искаженный подход к фильтрации». Материалы 12-го Международного форума. Симп. Об аэрокосмическом и оборонном зондировании, моделировании и управлении . Том. 3373. ШПИОН.
- ^ Перейти обратно: а б с д Жюльер, Саймон; Ульманн, Джеффри (2000). «Новый метод нелинейного преобразования средних и ковариаций в нелинейных фильтрах». Транзакции IEEE при автоматическом управлении . 45 (3): 477–482. дои : 10.1109/9.847726 .
- ^ Перейти обратно: а б с Чжан, В.; М. Лю; З. Чжао (2009). «Анализ точности трансформации без запаха нескольких стратегий отбора проб». Учеб. 10-го Международного Конф. по разработке программного обеспечения, искусственному интеллекту, сетям и параллельным/распределенным вычислениям . АКИС.
- ^ Ву, Л.; Дж. Ма; Дж. Тиан (2010). «Самоадаптивная фильтрация Калмана без запаха для подводной гравитационной навигации». Учеб. планов IEEE/ION .
- ^ Эль-Шейми, Н.; Шин, Э.Х.; Ню, X (2006). «Противодействие фильтру Калмана: расширенные и неароматизированные фильтры Калмана для интегрированного GPS и инерциальной MEMS». Внутри GNSS: инженерные решения для сообщества глобальных навигационных спутниковых систем . 1 (2).
- ^ Крассидис, Дж.; Маркли, Ф. (2003). «Фильтрация без запаха для оценки ориентации космического корабля». Журнал руководства, контроля и динамики . 26 (4): 536–542. Бибкод : 2003JGCD...26..536C . дои : 10.2514/2.5102 .
- ^ Росс, И. Майкл; Пру, Рональд Дж.; Карпенко, Марк; Гун, Ци (июль 2015 г.). «Задачи оптимального управления Римана – Стилтьеса для неопределенных динамических систем» . Журнал руководства, контроля и динамики . 38 (7): 1251–1263. Бибкод : 2015JGCD...38.1251R . дои : 10.2514/1.G000505 . S2CID 121424228 .
- ^ И. М. Росс, Р. Дж. Пру и М. Карпенко, «Оптимальное управление космическим полетом без запаха», Труды 24-го Международного симпозиума по динамике космического полета (ISSFD) , 5–9 мая 2014 г., Лорел, доктор медицины. http://issfd.org/ISSFD_2014/ISSFD24_Paper_S12-5_Karpенко.pdf
- ^ Росс, И. Майкл; Пру, Рональд Дж.; Карпенко, Марк (июль 2015 г.). «Неароматизированное руководство». Американская конференция по контролю (ACC), 2015 г. стр. 5605–5610. дои : 10.1109/ACC.2015.7172217 . ISBN 978-1-4799-8684-2 . S2CID 28136418 .
- ^ Перейти обратно: а б Жюльер, С.; Дж. Ульманн (1997). «Новое расширение фильтра Калмана для нелинейных систем». Материалы конференции SPIE 1997 года по обработке сигналов, слиянию датчиков и распознаванию целей . Том. 3068.
- ^ Жюльер, Саймон (2002). «Масштабная трансформация без запаха». Материалы Американской конференции по контролю . Том. 6. ИИЭР.