Анализ чувствительности на основе отклонений
Анализ чувствительности на основе дисперсии (часто называемый методом Соболь или индексами Соболь , в честь Ильи М. Соболь ) является формой глобального анализа чувствительности . [1] [2] Работая в рамках вероятностной структуры, он разлагает дисперсию выходных данных модели или системы на дроби, которые можно отнести к входным данным или наборам входных данных. Например, при наличии модели с двумя входными параметрами и одним выходным сигналом можно обнаружить, что 70 % выходной дисперсии вызвано дисперсией первого входного параметра, 20 % — дисперсией второго и 10 % из-за взаимодействия между два. Эти проценты непосредственно интерпретируются как меры чувствительности. Измерения чувствительности, основанные на дисперсии, привлекательны, поскольку они измеряют чувствительность во всем входном пространстве (т. е. это глобальный метод), они могут иметь дело с нелинейными откликами и могут измерять эффект взаимодействий в неаддитивных системах . [3]
Разложение дисперсии
[ редактировать ]С точки зрения черного ящика любую модель можно рассматривать как функцию Y = f ( X ), где X — вектор d неопределенных входных данных модели { X 1 , X 2 , ... X d }, а Y — выбранный выходные данные одномерной модели (обратите внимание, что этот подход исследует выходные данные скалярной модели, но несколько выходных данных можно анализировать с помощью нескольких независимых анализов чувствительности). Кроме того, предполагается, что входные данные независимо и равномерно распределены внутри единичного гиперкуба, т.е. для . Это не приводит к потере общности, поскольку любое входное пространство можно преобразовать в этот единичный гиперкуб. f ( X ) можно разложить следующим образом: [4]
где f 0 — константа, а f i — функция от X i , f ij — функция от X i и X j и т. д. Условием этого разложения является то, что
т.е. все члены функционального разложения ортогональны . Это приводит к определениям членов функциональной декомпозиции в терминах условных ожидаемых значений,
Из чего видно, что f i — это эффект изменения только X i (известный как основной эффект X i ) , а f ij — это эффект одновременного изменения X i и X j , дополнительный к эффекту их отдельных вариации . второго порядка Это известно как взаимодействие . Термины более высокого порядка имеют аналогичные определения.
Теперь, предполагая, что f ( X ) интегрируемо с квадратом , функциональное разложение можно возвести в квадрат и проинтегрировать, чтобы получить:
Обратите внимание, что левая часть равна дисперсии Y , а члены правой части являются членами дисперсии, теперь разложенными по множествам X i . В конечном итоге это приводит к разложению выражения дисперсии:
где
- ,
и так далее. Обозначение X ~ i указывает набор всех переменных, кроме X i . Приведенное выше разложение дисперсии показывает, как дисперсию выходных данных модели можно разложить на члены, относящиеся к каждому входу, а также на эффекты взаимодействия между ними. Вместе все члены в сумме дают общую дисперсию выходных данных модели.
Индексы первого порядка
[ редактировать ]Прямая мера чувствительности Si, основанная на дисперсии , называемая «индексом чувствительности первого порядка» или «индексом основного эффекта», формулируется следующим образом: [4]
Это вклад в выходное отклонение основного эффекта X i , поэтому он измеряет эффект изменения X i только , но усредняется по изменениям других входных параметров. Он стандартизируется по общей дисперсии, чтобы обеспечить дробный вклад. Индексы взаимодействия более высокого порядка Sij могут , Sijk и т. д . быть сформированы путем деления других членов дисперсионного разложения на Var( Y ). Обратите внимание, что это подразумевает, что
Индекс общего эффекта
[ редактировать ]Используя приведенные выше индексы S i , S ij и более высокого порядка, можно построить картину важности каждой переменной в определении дисперсии выпуска. Однако, когда количество переменных велико, для этого требуется оценка 2 д -1 индексы, которые могут потребовать слишком больших вычислительных ресурсов. мера, известная как «Индекс общего эффекта» или «Индекс общего порядка», S Ti . По этой причине используется [5] Это измеряет вклад в выходную дисперсию X i , включая всю дисперсию, вызванную его взаимодействиями любого порядка с любыми другими входными переменными. Это дано как,
Обратите внимание, что в отличие от S i ,
из-за того, что эффект взаимодействия между, например, X i и X j учитывается как в S Ti , так и в S Tj . Фактически, сумма S Ti будет равна 1 только тогда, когда модель является чисто аддитивной .
Расчет индексов
[ редактировать ]Для аналитически поддающихся анализу функций приведенные выше индексы можно рассчитать аналитически путем оценки интегралов при разложении. Однако в подавляющем большинстве случаев они оцениваются — обычно это делается методом Монте-Карло .
Последовательность выборки
[ редактировать ]Подход Монте-Карло предполагает генерацию последовательности случайно распределенных точек внутри единичного гиперкуба (строго говоря, они будут псевдослучайными ). На практике принято заменять случайные последовательности последовательностями с низким расхождением, чтобы повысить эффективность оценщиков. Это тогда известно как метод квази-Монте-Карло . Некоторые последовательности с низким расхождением, обычно используемые в анализе чувствительности, включают последовательность Соболя и дизайн латинского гиперкуба .
Процедура
[ редактировать ]Для расчета индексов с использованием (квази)метода Монте-Карло используются следующие этапы: [1] [2]
- Сгенерируйте выборочную матрицу N × 2 d , т. е. каждая строка представляет собой точку выборки в гиперпространстве 2 d измерений. Это должно быть сделано с учетом вероятностных распределений входных переменных.
- Используйте первые d столбцов матрицы как матрицу A оставшиеся d столбцов как матрицу B. , а Это эффективно дает две независимые выборки из N точек в d -мерном единичном гиперкубе.
- Построить d далее N × d матрицы A B я , для i = 1,2,...,d, такой, что i -й столбец A B я равен i- му столбцу B , а остальные столбцы взяты из A .
- A , B и d A B я Всего матрицы задают N ( d +2) точек во входном пространстве (по одной на каждую строку). Запустите модель в каждой точке проекта в A , B и A B. я матрицы, дающие в общей сложности N ( d +2) оценок модели – соответствующие f( A ), f( B ) и f( A B я ) ценности.
- Рассчитайте индексы чувствительности, используя приведенные ниже оценки.
Точность оценок, конечно, зависит N. от Значение N можно выбрать путем последовательного добавления точек и расчета индексов до тех пор, пока оценочные значения не достигнут некоторой приемлемой сходимости. По этой причине при использовании последовательностей с низким расхождением может быть выгодно использовать те, которые допускают последовательное добавление точек (например, последовательность Соболь), по сравнению с теми, которые этого не делают (например, последовательности латинского гиперкуба).
Оценщики
[ редактировать ]Для обоих индексов существует ряд возможных оценок Монте-Карло. В настоящее время широко используются два: [1] [6]
и
оценки Si и для S Ti соответственно .
Вычислительные затраты
[ редактировать ]Для оценки Si и S Ti d для всех входных переменных N ( +2 ) требуется прогонов модели. Поскольку N часто составляет порядка сотен или тысяч прогонов, вычислительные затраты могут быстро стать проблемой, когда для одного прогона модели требуется значительное количество времени. В таких случаях существует ряд методов, позволяющих снизить вычислительные затраты на оценку индексов чувствительности, таких как эмуляторы , HDMR и FAST .
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б с Соболь, И.М. (2001), Глобальные индексы чувствительности нелинейных математических моделей и их оценки Монте-Карло. МАТЕМАТИЧЕСКОЕ ВЫЧИСЛЕНИЕ ,55(1–3),271-280, дои : 10.1016/S0378-4754(00)00270-6
- ^ Jump up to: а б Салтелли А., Ратто М., Андрес Т., Камполонго Ф., Карибони Дж., Гателли Д. Сайсана М. и Тарантола С., 2008 г., Анализ глобальной чувствительности. Букварь , Джон Уайли и сыновья.
- ^ Салтелли, А., Аннони, П., 2010, Как избежать поверхностного анализа чувствительности, Моделирование окружающей среды и программное обеспечение 25 , 1508–1517.
- ^ Jump up to: а б Соболь, И. (1990). Оценки чувствительности нелинейных математических моделей. Математическое моделирование 2 , 112–118. на русском языке, переведено на английский язык в Соболь И. (1993). Анализ чувствительности нелинейных математических моделей. Математическое моделирование и вычислительный эксперимент (англ. пер.) , 1993, 1 , 407–414.
- ^ Хомма, Т. и А. Салтелли (1996). Меры важности в глобальном анализе чувствительности нелинейных моделей. Техника надежности и системная безопасность , 52 , 1–17.
- ^ Андреа Сальтелли, Паола Аннони, Ивано Аццини, Франческа Камполонго, Марко Ратто и Стефано Тарантола. Анализ чувствительности результатов модели на основе отклонений. Проектирование и оценка общего индекса чувствительности. Коммуникации по компьютерной физике , 181(2):259{270, 2010 г.