Анализ чувствительности на основе отклонений

Анализ чувствительности на основе дисперсии (часто называемый методом Соболь или индексами Соболь , в честь Ильи М. Соболь ) является формой глобального анализа чувствительности . ^[1]^[2] Работая в рамках вероятностной структуры, он разлагает дисперсию выходных данных модели или системы на дроби, которые можно отнести к входным данным или наборам входных данных. Например, при наличии модели с двумя входными параметрами и одним выходным сигналом можно обнаружить, что 70 % выходной дисперсии вызвано дисперсией первого входного параметра, 20 % — дисперсией второго и 10 % из-за взаимодействия между два. Эти проценты непосредственно интерпретируются как меры чувствительности. Измерения чувствительности, основанные на дисперсии, привлекательны, поскольку они измеряют чувствительность во всем входном пространстве (т. е. это глобальный метод), они могут иметь дело с нелинейными откликами и могут измерять эффект взаимодействий в неаддитивных системах . ^[3]

Разложение дисперсии

С точки зрения черного ящика любую модель можно рассматривать как функцию Y = f ( X ), где X — вектор d неопределенных входных данных модели { X ₁ , X ₂ , ... X _d }, а Y — выбранный выходные данные одномерной модели (обратите внимание, что этот подход исследует выходные данные скалярной модели, но несколько выходных данных можно анализировать с помощью нескольких независимых анализов чувствительности). Кроме того, предполагается, что входные данные независимо и равномерно распределены внутри единичного гиперкуба, т.е. $X_{i}\in [0,1]$ для $i=1,2,...,d$ . Это не приводит к потере общности, поскольку любое входное пространство можно преобразовать в этот единичный гиперкуб. f ( X ) можно разложить следующим образом: ^[4]

Y=f_{0}+\sum _{i=1}^{d}f_{i}(X_{i})+\sum _{i<j}^{d}f_{ij}(X_{i},X_{j})+\cdots +f_{1,2,\dots ,d}(X_{1},X_{2},\dots ,X_{d})

где f ₀ — константа, а f _i — функция от X _i , f _{ij —} функция от X _i и X _j и т. д. Условием этого разложения является то, что

\int _{0}^{1}f_{i_{1}i_{2}\dots i_{s}}(X_{i_{1}},X_{i_{2}},\dots ,X_{i_{s}})dX_{k}=0,{\text{ for }}k=i_{1},...,i_{s}

т.е. все члены функционального разложения ортогональны . Это приводит к определениям членов функциональной декомпозиции в терминах условных ожидаемых значений,

f_{0}=E(Y)

f_{i}(X_{i})=E(Y|X_{i})-f_{0}

f_{ij}(X_{i},X_{j})=E(Y|X_{i},X_{j})-f_{0}-f_{i}-f_{j}

Из чего видно, что f _i — это эффект изменения только X _i (известный как основной эффект X i ₎ , а f _ij — это эффект одновременного изменения X _i и X _j , дополнительный к эффекту их отдельных вариации . второго порядка Это известно как взаимодействие . Термины более высокого порядка имеют аналогичные определения.

Теперь, предполагая, что f ( X ) интегрируемо с квадратом , функциональное разложение можно возвести в квадрат и проинтегрировать, чтобы получить:

\int f^{2}(\mathbf {X} )d\mathbf {X} -f_{0}^{2}=\sum _{s=1}^{d}\sum _{i_{1}<\dots <i_{s}}^{d}\int f_{i_{1}\dots i_{s}}^{2}dX_{i_{1}}\dots dX_{i_{s}}

Обратите внимание, что левая часть равна дисперсии Y , а члены правой части являются членами дисперсии, теперь разложенными по множествам X _i . В конечном итоге это приводит к разложению выражения дисперсии:

\operatorname {Var} (Y)=\sum _{i=1}^{d}V_{i}+\sum _{i<j}^{d}V_{ij}+\cdots +V_{12\dots d}

где

V_{i}=\operatorname {Var} _{X_{i}}\left(E_{{\textbf {X}}_{\sim i}}(Y\mid X_{i})\right)

,

V_{ij}=\operatorname {Var} _{X_{ij}}\left(E_{{\textbf {X}}_{\sim ij}}\left(Y\mid X_{i},X_{j}\right)\right)-V_{i}-V_{j}

и так далее. Обозначение X _{~ i} указывает набор всех переменных, кроме X _i . Приведенное выше разложение дисперсии показывает, как дисперсию выходных данных модели можно разложить на члены, относящиеся к каждому входу, а также на эффекты взаимодействия между ними. Вместе все члены в сумме дают общую дисперсию выходных данных модели.

Индексы первого порядка

Прямая мера чувствительности Si, основанная на дисперсии , _{называемая} «индексом чувствительности первого порядка» или «индексом основного эффекта», формулируется следующим образом: ^[4]

S_{i}={\frac {V_{i}}{\operatorname {Var} (Y)}}

Это вклад в выходное отклонение основного эффекта X _i , поэтому он измеряет эффект изменения X _i только , но усредняется по изменениям других входных параметров. Он стандартизируется по общей дисперсии, чтобы обеспечить дробный вклад. Индексы взаимодействия более высокого порядка Sij _могут , Sijk _{и т. д .} быть сформированы путем деления других членов дисперсионного разложения на Var( Y ). Обратите внимание, что это подразумевает, что

\sum _{i=1}^{d}S_{i}+\sum _{i<j}^{d}S_{ij}+\cdots +S_{12\dots d}=1

Индекс общего эффекта

Используя приведенные выше индексы S _i , S _ij и более высокого порядка, можно построить картину важности каждой переменной в определении дисперсии выпуска. Однако, когда количество переменных велико, для этого требуется оценка 2 ^д-1 индексы, которые могут потребовать слишком больших вычислительных ресурсов. мера, известная как «Индекс общего эффекта» или «Индекс общего порядка», S _{Ti .} По этой причине используется ^[5] Это измеряет вклад в выходную дисперсию X _i , включая всю дисперсию, вызванную его взаимодействиями любого порядка с любыми другими входными переменными. Это дано как,

S_{Ti}={\frac {E_{{\textbf {X}}_{\sim i}}\left(\operatorname {Var} _{X_{i}}(Y\mid \mathbf {X} _{\sim i})\right)}{\operatorname {Var} (Y)}}=1-{\frac {\operatorname {Var} _{{\textbf {X}}_{\sim i}}\left(E_{X_{i}}(Y\mid \mathbf {X} _{\sim i})\right)}{\operatorname {Var} (Y)}}

Обратите внимание, что в отличие от S _i ,

\sum _{i=1}^{d}S_{Ti}\geq 1

из-за того, что эффект взаимодействия между, например, X _i и X _j учитывается как в S _Ti , так и в S _Tj . Фактически, сумма S _Ti будет равна 1 только тогда, когда модель является чисто аддитивной .

Расчет индексов

Для аналитически поддающихся анализу функций приведенные выше индексы можно рассчитать аналитически путем оценки интегралов при разложении. Однако в подавляющем большинстве случаев они оцениваются — обычно это делается методом Монте-Карло .

Последовательность выборки

Подход Монте-Карло предполагает генерацию последовательности случайно распределенных точек внутри единичного гиперкуба (строго говоря, они будут псевдослучайными ). На практике принято заменять случайные последовательности последовательностями с низким расхождением, чтобы повысить эффективность оценщиков. Это тогда известно как метод квази-Монте-Карло . Некоторые последовательности с низким расхождением, обычно используемые в анализе чувствительности, включают последовательность Соболя и дизайн латинского гиперкуба .

Процедура

Для расчета индексов с использованием (квази)метода Монте-Карло используются следующие этапы: ^[1]^[2]

Сгенерируйте выборочную матрицу N × 2 d , т. е. каждая строка представляет собой точку выборки в гиперпространстве 2 d измерений. Это должно быть сделано с учетом вероятностных распределений входных переменных.
Используйте первые d столбцов матрицы как матрицу A оставшиеся d столбцов как матрицу B. , а Это эффективно дает две независимые выборки из N точек в d -мерном единичном гиперкубе.
Построить d далее N × d матрицы A _B^я, для i = 1,2,...,d, такой, что i -й столбец A _B^я равен i- му столбцу B , а остальные столбцы взяты из A .
A , B и d A _B^я Всего матрицы задают N ( d +2) точек во входном пространстве (по одной на каждую строку). Запустите модель в каждой точке проекта в A , B и A _B.^я матрицы, дающие в общей сложности N ( d +2) оценок модели – соответствующие f( A ), f( B ) и f( A _B^я) ценности.
Рассчитайте индексы чувствительности, используя приведенные ниже оценки.

Точность оценок, конечно, зависит N. от Значение N можно выбрать путем последовательного добавления точек и расчета индексов до тех пор, пока оценочные значения не достигнут некоторой приемлемой сходимости. По этой причине при использовании последовательностей с низким расхождением может быть выгодно использовать те, которые допускают последовательное добавление точек (например, последовательность Соболь), по сравнению с теми, которые этого не делают (например, последовательности латинского гиперкуба).

Оценщики

Для обоих индексов существует ряд возможных оценок Монте-Карло. В настоящее время широко используются два: ^[1]^[6]

\operatorname {Var} _{X_{i}}(E_{\mathbf {X} _{\sim i}}(Y|X_{i}))\approx {{\frac {1}{N}}\sum _{j=1}^{N}f\left(\mathbf {B} \right)_{j}\left(f\left(\mathbf {A} _{B}^{i}\right)_{j}-f\left(\mathbf {A} \right)_{j}\right)}

и

E_{\mathbf {X} _{\sim i}}\left(\operatorname {Var} _{X_{i}}\left(Y\mid \mathbf {X} _{\sim i}\right)\right)\approx {{\frac {1}{2N}}\sum _{j=1}^{N}\left(f\left(\mathbf {A} \right)_{j}-f\left(\mathbf {A} _{B}^{i}\right)_{j}\right)^{2}}

оценки Si и _для S Ti _{соответственно} .

Вычислительные затраты

Для оценки Si и _S Ti d _для всех входных переменных N ( +2 ) требуется прогонов модели. Поскольку N часто составляет порядка сотен или тысяч прогонов, вычислительные затраты могут быстро стать проблемой, когда для одного прогона модели требуется значительное количество времени. В таких случаях существует ряд методов, позволяющих снизить вычислительные затраты на оценку индексов чувствительности, таких как эмуляторы , HDMR и FAST .

См. также

Ссылки

^ Jump up to: ^а ^б ^с Соболь, И.М. (2001), Глобальные индексы чувствительности нелинейных математических моделей и их оценки Монте-Карло. МАТЕМАТИЧЕСКОЕ ВЫЧИСЛЕНИЕ ,55(1–3),271-280, дои : 10.1016/S0378-4754(00)00270-6
^ Jump up to: ^а ^б Салтелли А., Ратто М., Андрес Т., Камполонго Ф., Карибони Дж., Гателли Д. Сайсана М. и Тарантола С., 2008 г., Анализ глобальной чувствительности. Букварь , Джон Уайли и сыновья.
^ Салтелли, А., Аннони, П., 2010, Как избежать поверхностного анализа чувствительности, Моделирование окружающей среды и программное обеспечение 25 , 1508–1517.
^ Jump up to: ^а ^б Соболь, И. (1990). Оценки чувствительности нелинейных математических моделей. Математическое моделирование 2 , 112–118. на русском языке, переведено на английский язык в Соболь И. (1993). Анализ чувствительности нелинейных математических моделей. Математическое моделирование и вычислительный эксперимент (англ. пер.) , 1993, 1 , 407–414.
^ Хомма, Т. и А. Салтелли (1996). Меры важности в глобальном анализе чувствительности нелинейных моделей. Техника надежности и системная безопасность , 52 , 1–17.
^ Андреа Сальтелли, Паола Аннони, Ивано Аццини, Франческа Камполонго, Марко Ратто и Стефано Тарантола. Анализ чувствительности результатов модели на основе отклонений. Проектирование и оценка общего индекса чувствительности. Коммуникации по компьютерной физике , 181(2):259{270, 2010 г.

[Sobol2001-1] Jump up to: ^а ^б ^с Соболь, И.М. (2001), Глобальные индексы чувствительности нелинейных математических моделей и их оценки Монте-Карло. МАТЕМАТИЧЕСКОЕ ВЫЧИСЛЕНИЕ ,55(1–3),271-280, дои : 10.1016/S0378-4754(00)00270-6

[Primer-2] Jump up to: ^а ^б Салтелли А., Ратто М., Андрес Т., Камполонго Ф., Карибони Дж., Гателли Д. Сайсана М. и Тарантола С., 2008 г., Анализ глобальной чувствительности. Букварь , Джон Уайли и сыновья.

[OAT-3] Салтелли, А., Аннони, П., 2010, Как избежать поверхностного анализа чувствительности, Моделирование окружающей среды и программное обеспечение 25 , 1508–1517.

[Sob1-4] Jump up to: ^а ^б Соболь, И. (1990). Оценки чувствительности нелинейных математических моделей. Математическое моделирование 2 , 112–118. на русском языке, переведено на английский язык в Соболь И. (1993). Анализ чувствительности нелинейных математических моделей. Математическое моделирование и вычислительный эксперимент (англ. пер.) , 1993, 1 , 407–414.

[5] Хомма, Т. и А. Салтелли (1996). Меры важности в глобальном анализе чувствительности нелинейных моделей. Техника надежности и системная безопасность , 52 , 1–17.

[6] Андреа Сальтелли, Паола Аннони, Ивано Аццини, Франческа Камполонго, Марко Ратто и Стефано Тарантола. Анализ чувствительности результатов модели на основе отклонений. Проектирование и оценка общего индекса чувствительности. Коммуникации по компьютерной физике , 181(2):259{270, 2010 г.

[1]

[2]

[3]

[4]

[5]

[6]