Jump to content

Идентификация нелинейной системы

Идентификация системы — это метод идентификации или измерения математической модели на системы основе измерений входных и выходных данных системы. Приложения системной идентификации включают любую систему, в которой входные и выходные данные могут быть измерены, а также промышленные процессы , системы управления , экономические данные , биологию и науки о жизни , медицину , социальные системы и многое другое.

Нелинейная система определяется как любая система, которая не является линейной, то есть любая система, которая не удовлетворяет принципу суперпозиции . Это негативное определение имеет тенденцию скрывать то, что существует очень много различных типов нелинейных систем. Исторически сложилось так, что идентификация нелинейных систем [1] [2] разработан с упором на конкретные классы систем и может быть разделен на пять основных подходов, каждый из которых определяется классом модели:

  1. серии Вольтерра , Модели
  2. Блочные модели,
  3. нейронных сетей , Модели
  4. модели NARMAX и
  5. Модели в пространстве состояний .

Для идентификации системы необходимо выполнить четыре шага: сбор данных, постулат модели, идентификация параметров и проверка модели. Сбор данных считается первой и важной частью терминологии идентификации, используемой в качестве входных данных для модели, которая готовится позже. Он состоит из выбора соответствующего набора данных, предварительной обработки и обработки. Он включает в себя реализацию известных алгоритмов вместе с расшифровкой записей полетов, хранением и управлением данными, калибровкой, обработкой, анализом и представлением. Более того, проверка модели необходима для того, чтобы обрести уверенность в конкретной модели или отвергнуть ее. В частности, оценка параметров и проверка модели являются неотъемлемыми частями идентификации системы. Валидация относится к процессу подтверждения концептуальной модели и демонстрации адекватного соответствия между результатами вычислений модели и фактическими данными. [3]

Методы серии Вольтерра

[ редактировать ]

В ранних работах преобладали методы, основанные на рядах Вольтерра , которые в случае дискретного времени можно выразить как

где и ( к ), у ( к ); k = 1, 2, 3, ... — измеренные входной и выходной параметры соответственно и ядро ​​Вольтерра l -го порядка, или l нелинейная импульсная характеристика -го порядка. Ряд Вольтерра является расширением интеграла линейной свертки . Большинство более ранних алгоритмов идентификации предполагали, что присутствуют только первые два, линейное и квадратичное, ядра Вольтерра, и использовали специальные входные данные, такие как гауссовский белый шум и методы корреляции, для идентификации двух ядер Вольтерра. В большинстве этих методов входные данные должны быть гауссовыми и белыми, что является серьезным ограничением для многих реальных процессов. Позже эти результаты были расширены, включив в них первые три ядра Volterra, чтобы обеспечить возможность использования различных входных данных, а также другие связанные разработки, включая серию Wiener . Очень важный объем работ был разработан Винером, Ли, Бозе и их коллегами из Массачусетского технологического института в период с 1940-х по 1960-е годы, включая знаменитый метод Ли и Шетцена. [4] [5] Хотя эти методы по-прежнему активно изучаются сегодня, существует несколько основных ограничений. К ним относятся необходимость априорного знания количества членов ряда Вольтерра, использование специальных входных данных и большое количество оценок, которые необходимо идентифицировать. Например, для системы, где ядро ​​Вольтерра первого порядка описывается, скажем, 30 выборками, для ядра второго порядка потребуется 30x30 точек, для третьего порядка 30x30x30 и т. д., и, следовательно, объем данных, необходимый для обеспечения хороших оценок, составит чрезмерно большой. [6] Эти числа можно уменьшить, используя определенные симметрии, но требования все равно чрезмерны, независимо от того, какой алгоритм используется для идентификации.

Блочно-структурированные системы

[ редактировать ]

Из-за проблем идентификации моделей Вольтерра были исследованы другие формы моделей в качестве основы для идентификации нелинейных систем. Были введены или повторно введены различные формы нелинейных моделей с блочной структурой. [6] [7] Модель Хаммерштейна состоит из статического однозначного нелинейного элемента, за которым следует линейный динамический элемент. [8] Модель Винера является противоположностью этой комбинации, так что линейный элемент появляется раньше статической нелинейной характеристики. [9] Модель Винера-Хаммерштейна состоит из статического нелинейного элемента, зажатого между двумя динамическими линейными элементами, и доступны несколько других форм модели. Модель Хаммерштейна-Винера состоит из линейного динамического блока, расположенного между двумя статическими нелинейными блоками. [10] Модель Урысона [11] [12] отличается от других блочных моделей тем, что не состоит из последовательных линейных и нелинейных блоков, а описывает как динамические, так и статические нелинейности в выражении ядра оператора. [13] Все эти модели можно представить серией Вольтерра, но в этом случае ядра Вольтерра принимают в каждом случае особую форму. Идентификация состоит из методов корреляции и оценки параметров. Методы корреляции используют определенные свойства этих систем, а это означает, что если используются определенные входные данные, часто белый гауссов шум, отдельные элементы могут быть идентифицированы по одному. Это приводит к управляемым требованиям к данным, а отдельные блоки иногда могут быть связаны с компонентами исследуемой системы.

Более поздние результаты основаны на оценке параметров и решениях на основе нейронных сетей. Было представлено множество результатов, и эти системы продолжают углубленно изучаться. Одна из проблем заключается в том, что эти методы в каждом случае применимы только к очень специфической форме модели, и обычно эта форма модели должна быть известна до идентификации.

Нейронные сети

[ редактировать ]

Искусственные нейронные сети пытаются в общих чертах имитировать сеть нейронов в мозге, где вычисления происходят с помощью большого количества простых элементов обработки. Типичная нейронная сеть состоит из ряда простых процессоров, соединенных между собой в сложную сеть. Слои таких блоков устроены так, что данные вводятся на входной уровень и проходят через один или несколько промежуточных слоев, прежде чем достичь выходного слоя. При обучении с учителем сеть обучается, оперируя разницей между фактическим выходным сигналом и желаемым выходным сигналом сети, ошибкой прогнозирования, чтобы изменить силу соединения между узлами. Путем итерации веса изменяются до тех пор, пока выходная ошибка не достигнет приемлемого уровня. Этот процесс называется машинным обучением, поскольку сеть корректирует веса так, чтобы воспроизводился выходной шаблон.Нейронные сети широко изучены, и этой теме вообще посвящено множество отличных учебников. [1] [14] и более специализированные учебники, в которых особое внимание уделяется применению систем управления и систем. [1] [15] Существует два основных типа проблем, которые можно изучать с помощью нейронных сетей: статические проблемы и динамические проблемы. Статические задачи включают распознавание образов , классификацию и аппроксимацию . Динамические задачи связаны с запаздывающими переменными и больше подходят для идентификации систем и связанных с ними приложений. В зависимости от архитектуры сети задача обучения может быть либо нелинейной по параметрам, что предполагает оптимизацию, либо линейной по параметрам, которую можно решить с использованием классических подходов. Алгоритмы обучения можно разделить на обучение с учителем, без учителя и обучение с подкреплением. Нейронные сети обладают превосходными свойствами аппроксимации, но они обычно основаны на результатах аппроксимации стандартных функций с использованием, например, теоремы Вейерштрасса , которая одинаково хорошо применима к полиномам, рациональным функциям и другим хорошо известным моделям. Нейронные сети широко применяются для решения задач идентификации систем, которые включают нелинейные и динамические отношения. Однако классические нейронные сети представляют собой чисто грубые статические аппроксимирующие машины. Динамики внутри сети нет. Следовательно, при подборе динамических моделей вся динамика возникает за счет распределения входных и выходных данных с запаздыванием на входной уровень сети. Затем процедура обучения создает наилучшую статическую аппроксимацию, которая связывает запаздывающие переменные, назначенные входным узлам, с выходными данными. Существуют более сложные сетевые архитектуры, включая рекуррентные сети, [1] которые создают динамику путем введения возрастающих порядков запаздывающих переменных во входные узлы. Но в этих случаях очень легко переопределить лаги, и это может привести к чрезмерной подгонке и плохим свойствам обобщения. Нейронные сети имеют несколько преимуществ; они концептуально просты, легки в обучении и использовании, имеют отличные свойства аппроксимации, важна концепция локальной и параллельной обработки, что обеспечивает целостность и отказоустойчивость. Самая большая критика классических моделей нейронных сетей заключается в том, что создаваемые модели совершенно непрозрачны и обычно не могут быть записаны или проанализированы. Поэтому очень сложно понять, что и что является причиной, проанализировать модель или вычислить динамические характеристики на основе модели. Некоторые из этих пунктов не будут актуальны для всех приложений, но они предназначены для динамического моделирования.

НАРМАКС-методы

[ редактировать ]

Онлайновая ( модель внешними авторегрессионная модель NARMAX ) может перемещения среднего данными с входными представлять широкий класс нелинейных систем. [2] и определяется как

где y ( k ), u ( k ) и e ( k ) — выходные, входные и шумовые последовательности системы соответственно; , , и — максимальные задержки для вывода, ввода и шума системы; F[•] — некоторая нелинейная функция, d — временная задержка, обычно равная d = 1. Модель, по сути, представляет собой расширение прошлых входных, выходных данных и условий шума. Поскольку шум моделируется явно, несмещенные оценки модели системы могут быть получены в присутствии ненаблюдаемого сильно коррелированного и нелинейного шума.Вольтерру, блочно-структурированные модели и многие архитектуры нейронных сетей можно рассматривать как подмножества модели NARMAX. С момента появления NARMAX путем доказательства того, какой класс нелинейных систем может быть представлен этой моделью, на основе этого описания было получено множество результатов и алгоритмов. Большая часть ранних работ была основана на полиномиальном расширении модели NARMAX. Сегодня это по-прежнему самые популярные методы, но другие, более сложные формы, основанные на вейвлетах для представления сильно нелинейных и очень сложных нелинейных систем были введены и ​​других расширениях. Значительная часть нелинейных систем может быть представлена ​​моделью NARMAX, включая системы с экзотическим поведением, например хаос , бифуркации и субгармоники .Хотя NARMAX начинался как название модели, теперь он превратился в философию идентификации нелинейных систем. [2] Подход NARMAX состоит из нескольких этапов:

  • Обнаружение структуры: какие термины входят в модель
  • Оценка параметров: определение коэффициентов модели
  • Проверка модели: является ли модель объективной и правильной?
  • Прогноз: каков будет результат в будущем
  • Анализ: каковы динамические свойства системы

Обнаружение структуры составляет самую фундаментальную часть NARMAX. Например, модель NARMAX, состоящая из одного входного члена с задержкой и одного выходного члена с запаздыванием, трех членов шума с запаздыванием, расширенных как кубический полином, будет состоять из восьмидесяти двух возможных членов-кандидатов. Такое количество членов-кандидатов возникает потому, что разложение по определению включает в себя все возможные комбинации внутри кубического разложения. Наивный подход к оценке модели, которая включает все эти условия, а затем сокращение приведет к численным и вычислительным проблемам, и этого всегда следует избегать. Однако в модели часто важны лишь несколько членов. Поэтому обнаружение структуры, целью которого является выбор терминов по одному, имеет решающее значение. Этих целей можно легко достичь, используя метод ортогональных наименьших квадратов. [2] алгоритм и его производные для выбора условий модели NARMAX по одному. Эти идеи также можно адаптировать для распознавания образов и выбора признаков и обеспечить альтернативу анализу главных компонентов, но с тем преимуществом, что признаки раскрываются как базисные функции, которые легко связать с исходной задачей.

Методы NARMAX предназначены не только для поиска наилучшей аппроксимирующей модели. Идентификацию системы можно разделить на две цели. Первый предполагает аппроксимацию, где ключевой целью является разработка модели, аппроксимирующей набор данных, позволяющей делать хорошие прогнозы. Существует множество приложений, где этот подход уместен, например, для прогнозирования временных рядов погоды, цен на акции, речи, отслеживания целей, классификации закономерностей и т. д. В таких приложениях форма модели не так важна. Цель состоит в том, чтобы найти схему аппроксимации, которая дает минимальные ошибки прогнозирования. Вторая цель идентификации системы, которая включает в себя первую цель как подмножество, включает в себя гораздо больше, чем просто поиск модели для достижения наилучших среднеквадратических ошибок. Эта вторая цель объясняет, почему была разработана философия NARMAX и связана с идеей поиска простейшей структуры модели. Целью здесь является разработка моделей, которые воспроизводят динамические характеристики базовой системы, найти простейшую возможную модель и, если возможно, связать ее с компонентами и поведением изучаемой системы. Таким образом, основная цель этого второго подхода к идентификации состоит в том, чтобы идентифицировать и выявить правило, которое представляет систему. Эти цели актуальны для моделирования и проектирования систем управления, но все чаще и для приложений в медицине, нейробиологии и науках о жизни. Здесь цель состоит в том, чтобы идентифицировать модели, часто нелинейные, которые можно использовать для понимания основных механизмов того, как эти системы работают и ведут себя, чтобы мы могли ими манипулировать и использовать. Методы NARMAX также были разработаны в частотной и пространственно-временной областях.

Стохастические нелинейные модели

[ редактировать ]

В общей ситуации может случиться так, что какое-то экзогенное неопределенное возмущение проходит через нелинейную динамику и влияет на выходные данные. Класс моделей, достаточно общий, чтобы отразить эту ситуацию, — это класс стохастических нелинейных моделей в пространстве состояний . Модель в пространстве состояний обычно получается с использованием первых принципов законов: [16] такие как механические, электрические или термодинамические физические законы, и определяемые параметры обычно имеют некоторый физический смысл или значение.

Модель в пространстве состояний дискретного времени может быть определена разностными уравнениями:

в котором — положительное целое число, относящееся к времени. Функции и являются общими нелинейными функциями. Первое уравнение известно как уравнение состояния, а второе — как уравнение выхода. Все сигналы моделируются с использованием случайных процессов . Процесс известен как государственный процесс, и обычно предполагаются независимыми и взаимно независимыми, так что . Параметр обычно представляет собой конечномерный (реальный) параметр, который необходимо оценить (с использованием экспериментальных данных). Обратите внимание, что процесс состояния не обязательно должен быть физическим сигналом и обычно не наблюдается (не измеряется). Набор данных представлен как набор пар ввода-вывода. для для некоторого конечного положительного целого значения .

К сожалению, из-за нелинейного преобразования ненаблюдаемых случайных величин функция правдоподобия выходных данных аналитически неразрешима; он дается в виде многомерного интеграла маргинализации. Следовательно, широко используемые методы оценки параметров, такие как метод максимального правдоподобия или метод ошибки прогнозирования, основанные на оптимальном предсказателе на один шаг вперед. [16] аналитически трудноразрешимы. Недавно алгоритмы, основанные на последовательных методах Монте-Карло, использовались для аппроксимации условного среднего выходных данных или, в сочетании с алгоритмом максимизации ожидания , для аппроксимации оценки максимального правдоподобия. [17] Эти методы, хотя и асимптотически оптимальны, требуют больших вычислительных ресурсов, и их использование ограничено конкретными случаями, когда можно избежать фундаментальных ограничений используемых фильтров частиц. Альтернативное решение — применить метод ошибки прогнозирования с использованием неоптимального предиктора. [18] [19] [20] Можно показать, что полученная оценка является строго согласованной и асимптотически нормальной и может быть оценена с использованием относительно простых алгоритмов. [21] [20]

См. также

[ редактировать ]
  1. ^ Jump up to: а б с д Неллес О. «Идентификация нелинейных систем: от классических подходов к нейронным сетям». Спрингер Верлаг, 2001 г.
  2. ^ Jump up to: а б с д Биллингс С.А. «Идентификация нелинейных систем: методы NARMAX во временной, частотной и пространственно-временной областях». Уайли, 2013 г.
  3. ^ Несаи, Сепер; Раисси, Кямран (1 декабря 2011 г.). Дас, Вину В.; Арива, Эзенду; Рахаю, Шарифа Бахия (ред.). Учет обработки данных и проверка модели при идентификации систем летательных аппаратов . Конспекты лекций Института компьютерных наук, социальной информатики и телекоммуникационной техники. Шпрингер Берлин Гейдельберг. стр. 269–274. дои : 10.1007/978-3-642-32573-1_46 . ISBN  978-3-642-32572-4 .
  4. ^ Шетцен М. "Теории Вольтерра и Винера нелинейных систем". Уайли, 1980 г.
  5. ^ Раг В.Дж. «Теория нелинейных систем - подход Вольтерры Винера». Издательство Университета Джонса Хопкинса, 1981 г.
  6. ^ Jump up to: а б Биллингс С.А. « Идентификация нелинейных систем: обзор ». Слушания IEE, часть D 127 (6), 272–285, 1980 г.
  7. ^ Хабер Р., Кевички Л. «Подход к моделированию нелинейной системы идентификации-ввода-вывода». Тома I и II, Клювер, 1980 г.
  8. ^ Хаммерштейн (Acta Math 1930) занимался не системным анализом, а краевыми задачами и собственными значениями нелинейных операторов.
  9. ^ Этот термин широко используется, но он совершенно неточный, поскольку Винер никогда не использовал эту простую модель. Его модель была приведена сразу после стр. 50 в обзоре Биллингса 1980 года, о котором говорится в ссылках ниже.
  10. ^ А.Уиллс, Т.Шен, Л.Люнг, Б.Ниннесс, Идентификация моделей Хаммерштейна-Винера, Автоматика 29 (2013), 70-81.
  11. ^ М.Полуэктов и А.Полярный. Моделирование нелинейных систем управления с помощью дискретного оператора Урысона . 2018. Отправлено arXiv:1802.01700.
  12. ^ А.Полярный. http://ezcodesample.com/urysohn/urysohn.html
  13. ^ М.Полуэктов и А.Полярный. Адаптивный фильтр Урысона . 2019.
  14. ^ Хайкин С. «Нейронные сети: комплексная основа». Макмиллан, 1999 г.
  15. ^ Уорвик К., Ирвин Г.В., Хант К.Дж. «Нейронные сети для управления и систем». Питер Перегринус, 1992 г.
  16. ^ Jump up to: а б Леннарт., Юнг (1999). Системная идентификация: теория для пользователя (2-е изд.). Река Аппер-Сэддл, Нью-Джерси: PTR Prentice Hall. ISBN  978-0136566953 . OCLC   38884169 .
  17. ^ Шен, Томас Б.; Линдстен, Фредрик; Далин, Йохан; Вогберг, Йохан; Нэссет, Кристиан А.; Свенссон, Андреас; Дай, Лян (2015). «Последовательные методы Монте-Карло для идентификации систем** Эта работа выполнена при поддержке проектов «Изучение сложных динамических систем» (номер контракта: 637-2014-466) и «Вероятностное моделирование динамических систем» (номер контракта: 621-2013-5524), оба финансируется Шведским исследовательским советом». IFAC-PapersOnLine . 48 (28): 775–786. arXiv : 1503.06058 . дои : 10.1016/j.ifacol.2015.12.224 . S2CID   11396163 .
  18. ^ М. Абдалмоати, «Изучение стохастических нелинейных динамических систем с использованием нестационарных линейных предсказателей» , Лицензионная диссертация, Стокгольм, Швеция, 2017. Urn:nbn:se:kth:diva-218100
  19. ^ Абдалмоати, Мохамед Рашид; Хьялмарссон, Хокан (2017). «Имитационная идентификация нелинейных моделей с псевдомаксимальным правдоподобием» . IFAC-PapersOnLine . 50 (1): 14058–14063. doi : 10.1016/j.ifacol.2017.08.1841 .
  20. ^ Jump up to: а б Абдалмоати, Мохамед (2019). «Идентификация стохастических нелинейных динамических моделей с использованием оценочных функций» . Дива .
  21. ^ Абдалмоати, Мохамед Рашид-Хилми; Хьялмарссон, Хокан (2019). «Методы линейного прогнозирования ошибок для стохастических нелинейных моделей» . Автоматика . 105 : 49–63. дои : 10.1016/j.automatica.2019.03.006 . S2CID   132768104 .

Дальнейшее чтение

[ редактировать ]
  • Леннарт Люнг: Идентификация системы — теория для пользователя, 2-е изд., PTR Prentice Hall, Аппер-Седл-Ривер, Нью-Джерси, 1999.
  • Р. Пинтелон, Дж. Шукенс, Идентификация системы: подход в частотной области, IEEE Press, Нью-Йорк, 2001. ISBN   978-0-7803-6000-6
  • Т. Сёдерстрем, П. Стойка, Идентификация системы, Прентис-Холл, река Аппер-Седл, Нью-Джерси, 1989. ISBN   0-13-881236-5
  • Р.К. Пирсон: Динамические модели дискретного времени . Издательство Оксфордского университета, 1999.
  • П. Мармарелис, В. Мармарелис, В. Анализ физиологических систем , Пленум, 1978.
  • К. Уорден, Г. Р. Томлинсон, Нелинейность в структурной динамике, Издательство Института физики, 2001.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 8814a1fbfd6e111ab671ffed0e2f5c6c__1705062360
URL1:https://arc.ask3.ru/arc/aa/88/6c/8814a1fbfd6e111ab671ffed0e2f5c6c.html
Заголовок, (Title) документа по адресу, URL1:
Nonlinear system identification - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)