Jump to content

Трансформация без запаха

Преобразование без запаха (UT) — это математическая функция, используемая для оценки результата применения данного нелинейного преобразования к распределению вероятностей, которое характеризуется только с точки зрения конечного набора статистических данных. Наиболее распространенное использование преобразования без запаха — нелинейное проецирование оценок среднего и ковариации в контексте нелинейных расширений фильтра Калмана . Его создатель Джеффри Ульманн объяснил, что «без запаха» — это произвольное название, которое он принял, чтобы его не называли «фильтром Ульмана». [1]

Многие методы фильтрации и управления представляют оценки состояния системы в форме среднего вектора и связанной с ним ковариационной матрицы ошибок. Например, предполагаемое двумерное положение интересующего объекта может быть представлено вектором среднего положения: с неопределенностью, заданной в виде ковариационной матрицы 2x2, дающей дисперсию , дисперсия в и перекрестная ковариация между ними. Ковариация, равная нулю, означает, что нет никакой неопределенности или ошибки и что положение объекта соответствует точному значению, заданному средним вектором.

Представление среднего и ковариационного представления дает только первые два момента основного, но в остальном неизвестного распределения вероятностей. В случае движущегося объекта неизвестное распределение вероятностей может отражать неопределенность положения объекта в данный момент времени. Среднее и ковариационное представление неопределенности математически удобно, поскольку любое линейное преобразование можно применить к среднему вектору и ковариационная матрица как и . Это свойство линейности не сохраняется для моментов, выходящих за пределы первого исходного момента (среднего значения) и второго центрального момента (ковариации), поэтому обычно невозможно определить среднее значение и ковариацию, возникающие в результате нелинейного преобразования, поскольку результат зависит от всех моменты, и даны только первые два.

Хотя ковариационная матрица часто рассматривается как ожидаемая квадратичная ошибка, связанная со средним значением, на практике матрица поддерживается как верхняя граница фактической квадратичной ошибки. В частности, среднее значение и ковариационная оценка поддерживается консервативно, так что ковариационная матрица больше или равно фактическому квадрату ошибки, связанному с . Математически это означает, что результат вычитания ожидаемого квадрата ошибки (который обычно неизвестен) из — полуопределенная или положительно определенная матрица . Причина сохранения консервативной оценки ковариации заключается в том, что большинство алгоритмов фильтрации и управления будут иметь тенденцию расходиться (потерпеть неудачу), если ковариация недооценена. Это связано с тем, что ложно малая ковариация подразумевает меньшую неопределенность и заставляет фильтр придавать больший вес (достоверность), чем оправдано точностью среднего значения.

Возвращаясь к приведенному выше примеру, когда ковариация равна нулю, определить местоположение объекта после его перемещения в соответствии с произвольной нелинейной функцией тривиально. : просто примените функцию к среднему вектору. Когда ковариация не равна нулю, преобразованное среднее значение обычно не будет равно и невозможно даже определить среднее значение преобразованного распределения вероятностей только на основе его предварительного среднего и ковариации. Учитывая эту неопределенность, нелинейно преобразованное среднее значение и ковариация могут быть только аппроксимированы. Самое раннее приближение заключалось в линеаризации нелинейной функции и применении полученной матрицы Якобиана к заданному среднему значению и ковариации. Это основа расширенного фильтра Калмана (EKF), и хотя было известно, что во многих случаях он давал плохие результаты, в течение многих десятилетий не было практической альтернативы.

Мотивация для трансформации без запаха

[ редактировать ]

В 1994 году Джеффри Ульманн отметил, что EKF берет нелинейную функцию и информацию о частичном распределении (в форме средней и ковариационной оценки) состояния системы, но применяет приближение к известной функции, а не к неточно известному распределению вероятностей. . Он предположил, что лучшим подходом было бы использование точной нелинейной функции, применяемой к аппроксимирующему распределению вероятностей. Мотивация такого подхода изложена в его докторской диссертации, где термин «трансформация без запаха» : впервые был определен [2]

Рассмотрим следующую интуицию: при фиксированном количестве параметров должно быть проще аппроксимировать данное распределение, чем аппроксимировать произвольную нелинейную функцию/преобразование . Следуя этой интуиции, цель состоит в том, чтобы найти параметризацию, которая фиксирует информацию о среднем значении и ковариации, и в то же время позволяет прямое распространение информации через произвольный набор нелинейных уравнений. Этого можно достичь путем создания дискретного распределения, имеющего одинаковые первый и второй (и, возможно, более высокие) моменты, где каждая точка дискретного приближения может быть напрямую преобразована. Затем среднее значение и ковариацию преобразованного ансамбля можно вычислить как оценку нелинейного преобразования исходного распределения. В более общем смысле, применение данного нелинейного преобразования к дискретному распределению точек, рассчитанное таким образом, чтобы получить набор известных статистических данных неизвестного распределения, называется преобразованием без запаха. .

Другими словами, данная информация о среднем и ковариации может быть точно закодирована в наборе точек, называемых сигма-точками , которые, если рассматривать их как элементы дискретного распределения вероятностей, имеют среднее значение и ковариацию, равные заданному среднему значению и ковариации. распространить, Это распределение можно точно применив нелинейную функцию к каждой точке. Среднее значение и ковариация преобразованного набора точек тогда представляют собой желаемую преобразованную оценку. Принципиальное преимущество подхода состоит в том, что нелинейная функция используется в полной мере, в отличие от ЭКФ, заменяющей ее линейной. Устранение необходимости линеаризации также дает преимущества, независимые от какого-либо улучшения качества оценки. Одним из непосредственных преимуществ является то, что UT можно применять к любой заданной функции, тогда как линеаризация может быть невозможна для функций, которые не дифференцируемы. Практическое преимущество состоит в том, что UT может быть проще реализовать, поскольку он позволяет избежать необходимости выводить и реализовывать линеаризующую матрицу Якобиана.

Сигма-очки

[ редактировать ]

Чтобы вычислить преобразование без запаха, сначала нужно выбрать набор сигма-точек. Со времени плодотворной работы Ульмана в литературе было предложено множество различных наборов сигма-точек. Подробный обзор этих вариантов можно найти в работе Menegaz et al. [3] В общем, сигма-точки необходимы и достаточны для определения дискретного распределения, имеющего заданное среднее значение и ковариацию в размеры. [2]

Канонический набор сигма-точек — это симметричный набор, первоначально предложенный Ульманом. Рассмотрим вершины равностороннего треугольника с центром в начале координат в двух измерениях:

Можно проверить, что приведенный выше набор точек имеет среднее значение и ковариация (единичная матрица). Учитывая любое двумерное среднее значение и ковариацию, , желаемые сигма-точки можно получить, умножив каждую точку на матричный квадратный корень из и добавление . Подобный канонический набор сигма-точек может быть создан в любом количестве измерений. взяв нулевой вектор и точки, составляющие строки единичной матрицы, вычислив среднее значение набора точек, вычитая среднее значение из каждой точки так, чтобы полученный набор имел среднее значение, равное нулю, а затем вычисляя ковариацию нулевых значений. среднее множество точек и применение его обратного к каждой точке так, чтобы ковариация набора была равна единице.

Ульман показал, что можно удобно генерировать симметричный набор сигма-точки из столбцов и нулевой вектор, где — заданная ковариационная матрица без необходимости вычисления обратной матрицы. Он эффективен в вычислительном отношении и, поскольку точки образуют симметричное распределение, фиксирует третий центральный момент (перекос) всякий раз, когда основное распределение оценки состояния известно или может считаться симметричным. [2] Он также показал, что веса, в том числе отрицательные, можно использовать для воздействия на статистику набора. Жюльер также разработал и исследовал методы создания сигма-точек для учета третьего момента (перекоса) произвольного распределения и четвертого момента (эксцесса) симметричного распределения. [4] [5]

Преобразование без запаха определяется для применения данной функции к любой частичной характеристике неизвестного в противном случае распределения, но его наиболее часто используют в случае, когда заданы только среднее значение и ковариация. Типичным примером является преобразование из одной системы координат в другую, например, из декартовой системы координат в полярные координаты. [4]

Предположим, что двумерное среднее и ковариационная оценка: , задается в декартовых координатах:

и функция преобразования в полярные координаты, , является:

Умножив каждую из сигма-точек канонического симплекса (приведенных выше) на и добавив среднее значение, , дает:

Применение функции преобразования к каждому из вышеперечисленных пунктов дает:

Среднее значение этих трех преобразованных точек, , — UT-оценка среднего значения в полярных координатах:

UT-оценка ковариации:

где каждый квадрат члена суммы представляет собой векторное внешнее произведение. Это дает:

Это можно сравнить с линеаризованным средним значением и ковариацией:

Абсолютная разница между UT и линеаризованными оценками в этом случае относительно невелика, но в фильтрующих приложениях совокупный эффект небольших ошибок может привести к неустранимому расхождению оценки. Влияние ошибок усугубляется, когда ковариация недооценивается, поскольку это приводит к чрезмерной уверенности фильтра в точности среднего значения. В приведенном выше примере можно видеть, что линеаризованная оценка ковариации меньше, чем оценка UT, что позволяет предположить, что линеаризация, вероятно, привела к занижению фактической ошибки среднего значения.

В этом примере невозможно определить абсолютную точность UT и линеаризованных оценок без достоверных данных в форме фактического распределения вероятностей, связанного с исходной оценкой, а также среднего значения и ковариации этого распределения после применения нелинейного преобразования (например, , как определено аналитически или посредством численного интегрирования). Такой анализ был выполнен для преобразований координат в предположении гауссовости основных распределений, и оценки UT имеют тенденцию быть значительно более точными, чем оценки, полученные в результате линеаризации. [6] [7]

Эмпирический анализ показал, что использование минимального симплексного набора сигма-точек значительно менее точны, чем использование симметричного набора точки, когда основное распределение является гауссовым. [7] Это говорит о том, что использование симплексного набора в приведенном выше примере не будет лучшим выбором, если базовое распределение, связанное с является симметричным. Даже если базовое распределение не является симметричным, симплексный набор все равно будет менее точным, чем симметричный набор, поскольку асимметрия симплексного набора не соответствует асимметрии фактического распределения.

Возвращаясь к примеру, минимальный симметричный набор сигма-точек можно получить из ковариационной матрицы просто как средний вектор, плюс и минус столбцы :

Эта конструкция гарантирует, что среднее значение и ковариация вышеупомянутых четырех сигм-точек равны , что можно непосредственно проверить. Применение нелинейной функции каждой из сигм-точек дает:

Среднее значение этих четырех преобразованных сигма-точек, , — UT-оценка среднего значения в полярных координатах:

UT-оценка ковариации:

где каждый квадрат члена суммы представляет собой векторное внешнее произведение. Это дает:

Разница между UT и линеаризованными средними оценками дает меру влияния нелинейности преобразования. Например, когда преобразование линейное, UT и линеаризованные оценки будут идентичны. Это побуждает использовать квадрат этой разницы для добавления к UT-ковариации, чтобы предотвратить недооценку фактической ошибки среднего значения. Этот подход не повышает точность среднего значения, но может со временем значительно повысить точность фильтра за счет уменьшения вероятности недооценки ковариации. [2]

Оптимальность трансформации без запаха

[ редактировать ]

Ульманн отметил, что, учитывая только среднее значение и ковариацию неизвестного в противном случае распределения вероятностей, проблема преобразования нечетко определена, поскольку существует бесконечное количество возможных основных распределений с одинаковыми первыми двумя моментами. Без какой-либо априорной информации или предположений о характеристиках основного распределения любой выбор распределения, используемый для вычисления преобразованного среднего значения и ковариации, столь же разумен, как и любой другой. Другими словами, не существует выбора распределения с заданным средним значением и ковариацией, превосходящего тот, который обеспечивается набором сигма-точек, поэтому преобразование без запаха тривиально оптимально.

Это общее утверждение об оптимальности, конечно, бесполезно для каких-либо количественных утверждений о характеристиках UT, например, по сравнению с линеаризацией; следовательно, он, Жюльер и другие провели анализ при различных предположениях о характеристиках распределения и/или форме функции нелинейного преобразования. Например, если функция дифференцируема, что важно для линеаризации, этот анализ подтверждает ожидаемое и эмпирически подтвержденное превосходство преобразования без запаха. [6] [7]

Приложения

[ редактировать ]

Преобразование без запаха можно использовать для разработки нелинейного обобщения фильтра Калмана, известного как фильтр Калмана без запаха (UKF) . Этот фильтр в значительной степени заменил EKF во многих приложениях нелинейной фильтрации и управления, в том числе для подводной эксплуатации. [8] наземная и воздушная навигация, [9] и космический корабль. [10] Преобразование без запаха также использовалось в качестве вычислительной основы для оптимального управления Римана-Стилтьеса. [11] Этот вычислительный подход известен как оптимальное управление без запаха . [12] [13]

Фильтр Калмана без запаха

[ редактировать ]

Ульманн и Саймон Жюльер опубликовали несколько статей, показывающих, что использование преобразования без запаха в фильтре Калмана , который называется фильтром Калмана без запаха (UKF), обеспечивает значительное улучшение производительности по сравнению с EKF в различных приложениях. [14] [4] [6] Жюльер и Ульманн опубликовали статьи, в которых использовалась определенная параметризованная форма преобразования без запаха в контексте UKF, который использовал отрицательные веса для сбора предполагаемой информации о распределении. [14] [6] Эта форма UT подвержена множеству числовых ошибок, которых не страдают исходные формулировки (симметричный набор, первоначально предложенный Ульманом). Впоследствии Жюльер описал параметризованные формы, которые не используют отрицательные веса и не подвержены этим проблемам. [15]

См. также

[ редактировать ]
  1. ^ «Из первых рук: трансформация без запаха — вики по истории техники и технологий» .
  2. ^ Перейти обратно: а б с д Ульманн, Джеффри (1995). Построение динамических карт и локализация: новые теоретические основы (кандидатская диссертация). Оксфордский университет.
  3. ^ Менегаз, Энрике М.Т.; Жоао, Ю. Исихара; БОРХЕС, Геовани А.; Варгас, Алессандро Н. (16 февраля 2015 г.). «Систематизация теории фильтра Калмана без запаха». Транзакции IEEE при автоматическом управлении . 60 (10): 2583–2598. дои : 10.1109/TAC.2015.2404511 . hdl : 20.500.11824/251 . S2CID   12606055 .
  4. ^ Перейти обратно: а б с Жюльер, С.; Дж. Ульманн (1997). «Последовательный несмещенный метод преобразования между полярной и декартовой системами координат». Материалы конференции SPIE 1997 года по обнаружению, отслеживанию и наведению . Том. 3086. ШПИОН.
  5. ^ Жюльер, Саймон (1998). «Искаженный подход к фильтрации». Материалы 12-го Международного форума. Симп. Об аэрокосмическом и оборонном зондировании, моделировании и управлении . Том. 3373. ШПИОН.
  6. ^ Перейти обратно: а б с д Жюльер, Саймон; Ульманн, Джеффри (2000). «Новый метод нелинейного преобразования средних и ковариаций в нелинейных фильтрах». Транзакции IEEE при автоматическом управлении . 45 (3): 477–482. дои : 10.1109/9.847726 .
  7. ^ Перейти обратно: а б с Чжан, В.; М. Лю; З. Чжао (2009). «Анализ точности трансформации без запаха нескольких стратегий отбора проб». Учеб. 10-го Международного Конф. по разработке программного обеспечения, искусственному интеллекту, сетям и параллельным/распределенным вычислениям . АКИС.
  8. ^ Ву, Л.; Дж. Ма; Дж. Тиан (2010). «Самоадаптивная фильтрация Калмана без запаха для подводной гравитационной навигации». Учеб. планов IEEE/ION .
  9. ^ Эль-Шейми, Н.; Шин, Э.Х.; Ню, X (2006). «Противодействие фильтру Калмана: расширенные и неароматизированные фильтры Калмана для интегрированного GPS и инерциальной MEMS». Внутри GNSS: инженерные решения для сообщества глобальных навигационных спутниковых систем . 1 (2).
  10. ^ Крассидис, Дж.; Маркли, Ф. (2003). «Фильтрация без запаха для оценки ориентации космического корабля». Журнал руководства, контроля и динамики . 26 (4): 536–542. Бибкод : 2003JGCD...26..536C . дои : 10.2514/2.5102 .
  11. ^ Росс, И. Майкл; Пру, Рональд Дж.; Карпенко, Марк; Гун, Ци (июль 2015 г.). «Задачи оптимального управления Римана – Стилтьеса для неопределенных динамических систем» . Журнал руководства, контроля и динамики . 38 (7): 1251–1263. Бибкод : 2015JGCD...38.1251R . дои : 10.2514/1.G000505 . S2CID   121424228 .
  12. ^ И. М. Росс, Р. Дж. Пру и М. Карпенко, «Оптимальное управление космическим полетом без запаха», Труды 24-го Международного симпозиума по динамике космического полета (ISSFD) , 5–9 мая 2014 г., Лорел, доктор медицины. http://issfd.org/ISSFD_2014/ISSFD24_Paper_S12-5_Karpенко.pdf
  13. ^ Росс, И. Майкл; Пру, Рональд Дж.; Карпенко, Марк (июль 2015 г.). «Неароматизированное руководство». Американская конференция по контролю (ACC), 2015 г. стр. 5605–5610. дои : 10.1109/ACC.2015.7172217 . ISBN  978-1-4799-8684-2 . S2CID   28136418 .
  14. ^ Перейти обратно: а б Жюльер, С.; Дж. Ульманн (1997). «Новое расширение фильтра Калмана для нелинейных систем». Материалы конференции SPIE 1997 года по обработке сигналов, слиянию датчиков и распознаванию целей . Том. 3068.
  15. ^ Жюльер, Саймон (2002). «Масштабная трансформация без запаха». Материалы Американской конференции по контролю . Том. 6. ИИЭР.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: d0ba2b42bb3443611e9e8e7d1a32b1cd__1716737640
URL1:https://arc.ask3.ru/arc/aa/d0/cd/d0ba2b42bb3443611e9e8e7d1a32b1cd.html
Заголовок, (Title) документа по адресу, URL1:
Unscented transform - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)