серия Вольтерра
— Ряд Вольтерра это модель нелинейного поведения, аналогичная ряду Тейлора . Он отличается от серии Тейлора способностью улавливать эффекты «памяти». Ряд Тейлора можно использовать для аппроксимации реакции нелинейной системы на заданный входной сигнал, если выходной сигнал системы строго зависит от входного сигнала в данный конкретный момент времени. В серии Вольтерра выходные данные нелинейной системы зависят от входных данных системы в любое другое время. Это обеспечивает возможность улавливать эффект «памяти» таких устройств, как конденсаторы и катушки индуктивности .
Он нашел применение в областях медицины ( биомедицинской инженерии ) и биологии, особенно нейробиологии . [1] Он также используется в электротехнике для моделирования интермодуляционных искажений во многих устройствах, включая усилители мощности и смесители частоты . [ нужна ссылка ] Его главное преимущество заключается в его обобщаемости: он может представлять широкий спектр систем. Таким образом, иногда ее считают непараметрической моделью.
В математике ряд Вольтерра обозначает функциональное разложение динамического, нелинейного , не зависящего от времени функционала . Серия Volterra часто используется для идентификации систем . Ряд Вольтерра, который используется для доказательства теоремы Вольтерра, представляет собой бесконечную сумму многомерных сверточных интегралов.
История
[ редактировать ]Ряд Вольтерра — это модернизированная версия теории аналитических функционалов итальянского математика Вито Вольтерра в его работе, датируемой 1887 годом. [2] [3] Норберт Винер заинтересовался этой теорией в 1920-х годах благодаря контакту с учеником Вольтерры Полем Леви . Винер применил свою теорию броуновского движения для интегрирования аналитических функционалов Вольтерра. Использование серии Вольтерра для системного анализа возникло из ограниченного отчета военного времени 1942 года. [4] Винера, который тогда был профессором математики в Массачусетском технологическом институте . Он использовал эту серию для приблизительного анализа влияния радиолокационного шума в цепи нелинейного приемника. Отчет стал достоянием общественности после войны. [5] В качестве общего метода анализа нелинейных систем серия Вольтерра стала использоваться примерно после 1957 года в результате серии отчетов, сначала распространявшихся в частном порядке из Массачусетского технологического института и других источников. [6] Само название, серия Volterra , вошло в обиход несколько лет спустя.
Математическая теория
[ редактировать ]Теорию серии Вольтерра можно рассматривать с двух разных точек зрения:
- Операторное отображение ( между двумя функциональными пространствами действительными или комплексными)
- Действительное или комплексное функциональное отображение функционального пространства в действительные или комплексные числа.
Последняя перспектива функционального отображения используется чаще из-за предполагаемой неизменности системы во времени.
Непрерывное время
[ редактировать ]Непрерывная нестационарная система с x ( t ) в качестве входных данных и y ( t ) в качестве выходных данных может быть расширена в ряд Вольтерра как
Здесь постоянный член в правой части обычно принимается равным нулю при соответствующем выборе выходного уровня. . Функция называется n -го порядка Вольтерра ядром . Его можно рассматривать как импульсную характеристику системы более высокого порядка. Чтобы представление было уникальным, ядра должны быть симметричны по n переменным. . Если оно не симметрично, его можно заменить симметризованным ядром, которое является средним по n ! перестановки этих n переменных .
Если N конечно, ряд называется усеченным . Если a , b и N конечны, ряд называется дважды конечным .
Иногда член n -го порядка делится на n !, это соглашение удобно, когда выход одной системы Вольтерра принимается за вход другой («каскадирование»).
Условие причинности : поскольку в любой физически реализуемой системе выходной сигнал может зависеть только от предыдущих значений входных данных, ядра будет равна нулю, если какая-либо из переменных являются отрицательными. Затем интегралы можно записать в полудиапазоне от нуля до бесконечности. Итак, если оператор причинный, .
Аппроксимационная теорема Фреше : Использование ряда Вольтерра для представления неизменного во времени функционального отношения часто оправдывается обращением к теореме Фреше . Эта теорема утверждает, что стационарное функциональное соотношение (удовлетворяющее некоторым очень общим условиям) может быть аппроксимировано равномерно и с произвольной степенью точности достаточно высоким рядом Вольтерра конечного порядка. Среди прочих условий множество допустимых входных функций для которого будет выполняться приближение, требуется, чтобы оно было компактным . Обычно под ним понимают равнонепрерывное , равномерно ограниченное множество функций, компактное по теореме Арсела–Асколи . Во многих физических ситуациях это предположение о входном наборе является разумным. Теорема, однако, не дает никаких указаний на то, сколько членов необходимо для хорошего приближения, что является важным вопросом в приложениях.
Дискретное время
[ редактировать ]Случай дискретного времени аналогичен случаю непрерывного времени, за исключением того, что интегралы заменяются суммами:
где Каждая функция называется ядром Вольтерра с дискретным временем . Если P конечно, оператор ряда называется усеченным . Если a , b и P конечны, то последовательный оператор называется двояко конечным рядом Вольтерра . Если оператор называется причинным .
Всегда можно без ограничения общности рассмотреть ядро как симметричный. Действительно, для коммутативности умножения всегда можно его симметризировать, образуя новое ядро, взятое как среднее ядер для всех перестановок переменных .
Для причинной системы -й член можно переписать с симметричными ядрами n приблизительно в треугольном виде
Методы оценки коэффициентов ядра
[ редактировать ]Оценка коэффициентов Вольтерра по отдельности затруднена, поскольку базисные функционалы ряда Вольтерра коррелированы. Это приводит к проблеме одновременного решения системы интегральных уравнений для коэффициентов. Следовательно, оценка коэффициентов Вольтерра обычно выполняется путем оценки коэффициентов ортогонального ряда, например ряда Винера , а затем пересчета коэффициентов исходного ряда Вольтерра. Основная привлекательность ряда Вольтерра по сравнению с ортогональными рядами заключается в его интуитивной канонической структуре, то есть все взаимодействия входных данных имеют одну фиксированную степень. Ортогональные базисные функционалы обычно будут довольно сложными.
Важным аспектом, по которому различаются следующие методы, является то, должна ли ортогонализация базисных функционалов выполняться по идеализированной спецификации входного сигнала (например, гауссову, белому шуму ) или по фактической реализации входного сигнала (т. е. псевдослучайная, ограниченная, почти белая версия гауссовского белого шума или любого другого стимула). Последние методы, несмотря на отсутствие математической элегантности, оказались более гибкими (поскольку можно легко использовать произвольные входные данные) и точными (из-за того, что идеализированная версия входного сигнала не всегда реализуема).
Метод кросскорреляции
[ редактировать ]Этот метод, разработанный Ли и Шетценом, ортогонализируется по отношению к реальному математическому описанию сигнала, т.е. проекция на новые базисные функционалы основана на знании моментов случайного сигнала.
Мы можем записать ряд Вольтерра в терминах однородных операторов, как
где
Чтобы обеспечить ортогонализацию идентификации, ряды Вольтерра необходимо переставить в терминах ортогональных неоднородных G- операторов ( ряд Винера ):
Операторы G могут быть определены следующим образом:
в любое время — произвольный однородный Вольтерра, x ( n некоторый стационарный белый шум (SWN) с нулевым средним и дисперсией A. ) —
Вспоминая, что каждый функционал Вольтерра ортогонален всем функционалам Винера большего порядка, и рассматривая следующий функционал Вольтерра:
мы можем написать
Если x — SWN, и позволяя , у нас есть
Итак, если мы исключим диагональные элементы, , это
Если мы хотим рассмотреть диагональные элементы, решение, предложенное Ли и Шетценом, будет следующим:
Основным недостатком этого метода является то, что ошибки оценки, сделанные для всех элементов ядер более низкого порядка, будут влиять на каждый диагональный элемент порядка p посредством суммирования , задуманный как решение для оценки самих диагональных элементов. Существуют эффективные формулы, позволяющие избежать этого недостатка, и ссылки для оценки элементов диагонального ядра. [7] [8]
После того, как ядра Винера были идентифицированы, ядра Вольтерра можно получить с помощью формул Винера-Вольтерра, которые приведены ниже для ряда Вольтерра пятого порядка:
Многовариантный метод
[ редактировать ]В традиционном ортогональном алгоритме, используя входные данные с высоким имеет то преимущество, что стимулирует нелинейность высокого порядка, чтобы обеспечить более точную идентификацию ядра высокого порядка. Недостатком является использование высоких значения вызывают высокую ошибку идентификации в ядрах более низкого порядка, [9] в основном из-за неидеальности ввода и ошибок усечения.
Напротив, использование более низких в процессе идентификации может привести к лучшей оценке ядра низшего порядка, но может оказаться недостаточным для стимулирования нелинейности высокого порядка.
Это явление, которое можно назвать локальностью усеченного ряда Вольтерра, можно обнаружить, рассчитав ошибку вывода ряда как функцию различных дисперсий входных данных. Этот тест можно повторить с сериями, идентифицированными с разными входными дисперсиями, получая разные кривые, каждая из которых имеет минимум, соответствующий дисперсии, использованной при идентификации.
Чтобы преодолеть это ограничение, используется низкий Значение следует использовать для ядра низшего порядка и постепенно увеличивать для ядер более высокого порядка. Это не теоретическая проблема идентификации ядра Винера, поскольку функционалы Винера ортогональны друг другу, но необходима соответствующая нормализация в формулах преобразования Винера в Вольтерра для учета использования различных дисперсий. Кроме того, необходимы новые формулы преобразования Винера в Вольтерру.
Традиционную идентификацию ядра Винера следует изменить следующим образом: [9]
В приведенных выше формулах введены импульсные функции для идентификации диагональных точек ядра. Если ядра Винера извлекаются с помощью новых формул, потребуются следующие формулы Винера-Вольтерра (выраженные до пятого порядка):
Как видно, недостаток по отношению к предыдущей формуле [8] заключается в том, что для идентификации ядра n -го порядка все ядра более низкого порядка должны быть снова идентифицированы с более высокой дисперсией. Однако значительное улучшение выходного MSE будет получено, если ядра Винера и Вольтерра будут получены с помощью новых формул. [9]
Сеть прямой связи
[ редактировать ]Этот метод был разработан Рэем и Грином (1994) и использует тот факт, что простая двухуровневая полносвязная нейронная сеть (т. е. многослойный персептрон ) вычислительно эквивалентна серии Вольтерра и, следовательно, содержит ядра, скрытые в ее архитектуре. После того, как такая сеть обучена успешно прогнозировать выходные данные на основе текущего состояния и памяти системы, ядра можно вычислить на основе весов и смещений этой сети.
Общие обозначения ядра Вольтерра n -го порядка имеют вид
где это порядок, веса для линейного выходного узла, коэффициенты полиномиального разложения выходной функции скрытых узлов, и — это веса от входного слоя до нелинейного скрытого слоя. Важно отметить, что этот метод позволяет извлекать ядро вплоть до количества входных задержек в архитектуре сети. Более того, очень важно тщательно определить размер входного слоя сети, чтобы он представлял собой эффективную память системы.
Точный ортогональный алгоритм
[ редактировать ]Этот метод и его более эффективная версия (быстрый ортогональный алгоритм) были изобретены Коренбергом. [10] В этом методе ортогонализация выполняется эмпирически над фактическими входными данными. Было показано, что он работает более точно, чем метод кросскорреляции. Еще одним преимуществом является то, что для ортогонализации можно использовать произвольные входные данные и что для достижения желаемого уровня точности достаточно меньшего количества точек данных. Кроме того, оценка может выполняться постепенно, пока не будет выполнен какой-либо критерий.
Линейная регрессия
[ редактировать ]Линейная регрессия — стандартный инструмент линейного анализа. Следовательно, одним из его основных преимуществ является широкое распространение стандартных инструментов для эффективного решения линейных регрессий. Оно имеет некоторую образовательную ценность, поскольку подчеркивает основное свойство рядов Вольтерра: линейную комбинацию нелинейных базисных функционалов. Для оценки порядок оригинала должен быть известен, поскольку базисные функционалы Вольтерра не ортогональны, и, следовательно, оценка не может выполняться постепенно.
Метод ядра
[ редактировать ]Этот метод изобрели Франц и Шёлкопф. [11] и основан на статистической теории обучения . Следовательно, этот подход также основан на минимизации эмпирической ошибки (часто называемой минимизацией эмпирического риска ). Франц и Шёлкопф предположили, что метод ядра может по существу заменить представление ряда Вольтерра, хотя и отметили, что последнее более интуитивно понятно. [12]
Дифференциальная выборка
[ редактировать ]Этот метод был разработан ван Хемменом и его коллегами. [13] и использует дельта-функции Дирака для выборки коэффициентов Вольтерра.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Фристон, Кей Джей; Харрисон, Л.; Пенни, В. (2 апреля 2003 г.). «Динамическое причинно-следственное моделирование» . НейроИмидж . 19 (4): 1273–1302. дои : 10.1016/S1053-8119(03)00202-7 . ПМИД 12948688 . Проверено 24 апреля 2024 г.
- ^ Вольтерра, Вито (1887). Вышеуказанные функции зависят от других функций . Том III. Италия: R. Accademia dei Lincei. стр. 97–105.
- ^ Вито Вольтерра. Теория функционалов и интегралов и интегро-дифференциальных уравнений. Мадрид, 1927 г. (испанский язык), переведенная версия переиздана в Нью-Йорке: Dover Publications, 1959.
- ^ Винер Н: Реакция нелинейного устройства на шум. Радиационная лаборатория Массачусетского технологического института, 1942 г., ограничено. отчет В-16, № 129 (112 стр.). Рассекречено, июль 1946 г., опубликовано как представитель. нет. PB-1-58087, Министерство торговли США. URL: http://www.dtic.mil/dtic/tr/fulltext/u2/a800212.pdf
- ^ Икехара С: Метод Винера в нелинейной схеме. Массачусетский технологический институт, 10 декабря 1951 г., техн. представитель. № 217, Рез. Лаб. Электрон.
- ^ Ранние отчеты MIT Бриллианта, Замеса, Джорджа, Хаузе и Чеслера можно найти на dspace.mit.edu.
- ^ М. Пирани; С. Орсиони; К. Турчетти (сентябрь 2004 г.). «Оценка точки диагонального ядра дискретных систем Вольтерра-Винера n -го порядка». Журнал EURASIP по прикладной обработке сигналов . 2004 (12): 1807–1816.
- ^ Jump up to: а б С. Орсиони; М. Пирани; К. Турчетти (2005). «Достижения в методе Ли – Шетцена для идентификации фильтра Вольтерра». Многомерные системы и обработка сигналов . 16 (3): 265–284. дои : 10.1007/s11045-004-1677-7 . S2CID 57663554 .
- ^ Jump up to: а б с Орсиони, Симона (2014). «Улучшение аппроксимационной способности рядов Вольтерра, идентифицированных методом взаимной корреляции» . Нелинейная динамика . 78 (4): 2861–2869. дои : 10.1007/s11071-014-1631-7 .
- ^ Коренберг, MJ; Брудер, С.Б.; Макилрой, П.Дж. (1988). «Точная оценка ортогонального ядра на основе конечных записей данных: расширение идентификации Винера нелинейных систем». Энн. Биомед. англ . 16 (2): 201–214. дои : 10.1007/BF02364581 . ПМИД 3382067 . S2CID 31320729 .
- ^ Франц, Матиас О.; Бернхард Шёлкопф (2006). «Объединяющий взгляд на теорию Винера и Вольтерра и полиномиальную ядерную регрессию». Нейронные вычисления . 18 (12): 3097–3118. дои : 10.1162/neco.2006.18.12.3097 . ПМИД 17052160 . S2CID 9268156 .
- ^ Сиамак Гадими (12 сентября 2019 г.), Определение ядер Вольтерра для нелинейных радиочастотных усилителей , Микроволны и радиочастоты
- ^ Дж. Л. ван Хеммен; В.М. Кистлер; ЭГФ Томас (2000). «Расчет ядер Вольтерра для решений нелинейных дифференциальных уравнений» . SIAM Journal по прикладной математике . 61 (1): 1–21. дои : 10.1137/S0036139999336037 . hdl : 11370/eda737ae-40d1-4ff3-93d7-6b2434d23d52 .
Дальнейшее чтение
[ редактировать ]- Барретт Дж. Ф.: Библиография серий Вольтерры, функциональных расширений Эрмита и связанных с ними тем . Отдел электр. инженер, технический университет. Эйндховен, Нидерланды, 1977 г., отчет TH 77-E-71. (Хронологический список ранних статей до 1977 г.) URL: http://alexandria.tue.nl/extra1/erap/publichtml/7704263.pdf
- Буссганг, Джей Джей; Эрман, Л.; Грэм, Дж.В.: Анализ нелинейных систем с несколькими входами, Proc. IEEE, том 62, № 8, стр. 1088–1119, август 1974 г.
- Яннакис ГБ и Серпендин Э: Библиография по идентификации нелинейных систем. Обработка сигналов, 81 2001 533–580. (Алфавитный список на 2001 г.) www.elsevier.nl/locate/sigpro
- Коренберг М.Дж. Хантер И.В.: Идентификация нелинейных биологических систем: подходы ядра Вольтерра , Анналы биомедицинской инженерии (1996), том 24, номер 2.
- Куо Ю.Л. Анализ слабонелинейных сетей в частотной области , IEEE Trans. Схемы и системы, том CS-11(4), август 1977 г.; том CS-11(5), октябрь 1977 г., 2–6.
- Раг В.Дж.: Теория нелинейных систем: подход Вольтерры – Винера. Балтимор, 1981 (издательство Университета Джонса Хопкинса) http://rfic.eecs.berkeley.edu/~niknejad/ee242/pdf/volterra_book.pdf
- Шетцен М: Теории Вольтерра и Винера нелинейных систем , Нью-Йорк: Wiley, 1980.