Максиминная модель Уолда
В теории принятия решений и теории игр - Уолда максимин модель представляет собой невероятностную модель принятия решений, согласно которой решения ранжируются на основе их наихудших результатов: оптимальным решением является решение с наименее плохим наихудшим результатом. Это одна из наиболее важных моделей для принятия надежных решений в целом и надежной оптимизации в частности.
Оно также известно под множеством других названий, таких как правило максимина Уолда, принцип максимина Уолда, парадигма максимина Уолда и критерий максимина Уолда. Часто « минимакс вместо «максимина» используется ».
Определение
[ редактировать ]Эта модель представляет собой игру для двоих, в которой игрок играет первым. В ответ второй игрок выбирает худшее состояние из , а именно состояние в это минимизирует выигрыш над в . Во многих приложениях второй игрок представляет неопределенность. Однако существуют максиминные модели, которые полностью детерминированы.
Вышеупомянутая модель представляет собой классический формат максимин-модели Вальда. Существует эквивалентный формат математического программирования (МП):
где обозначает реальную линию.
Как и в теории игр , наихудший выигрыш связан с принятием решения. , а именно
называется уровнем безопасности решения .
Минимаксный вариант модели получается путем замены позиций и операции в классическом формате:
Эквивалентный формат MP выглядит следующим образом:
История
[ редактировать ]Вдохновленный теорией игр, Абрахам Вальд разработал эту модель. [ 1 ] [ 2 ] [ 3 ] как подход к сценариям, в которых есть только один игрок (лицо, принимающее решения). Игрок 2 демонстрирует мрачный подход к неопределенности. В максиминной модели Уолда игрок 1 ( игрок) играет первым, а игрок 2 ( игрок) знает решение игрока 1, когда тот выбирает свое решение. Это существенное упрощение классической игры с нулевой суммой для двоих , в которой два игрока выбирают свои стратегии, не зная выбора другого игрока. Игра максимин-модели Вальда также является игрой двух лиц с нулевой суммой , но игроки выбирают последовательно.
С появлением современной теории принятия решений в 1950-х годах эта модель стала ключевым компонентом в формулировке невероятностных моделей принятия решений в условиях серьезной неопределенности. [ 4 ] [ 5 ] Он широко используется в различных областях, таких как теория принятия решений , теория управления , экономика , статистика , робастная оптимизация , исследование операций , философия и т. д. [ 6 ] [ 7 ]
Пример
[ редактировать ]Одним из наиболее известных примеров модели максимин/минимакс является
где обозначает реальную линию. Формально мы можем установить и . Картина вот эта
Оптимальным решением является (красная) седловая точка . .
Таблицы решений
[ редактировать ]Во многих случаях удобно «организовать» модель Максимин/Минимакс в виде «таблицы». По соглашению, строки таблицы представляют решения, а столбцы — состояния.
Пример
[ редактировать ]Анри собирается на прогулку. Может светить солнце, а может идти дождь. Должен ли Анри носить зонтик? Анри не любит носить с собой зонтик, но еще больше он не любит промокать. Его « матрица выигрышей », рассматривающая это как игру Максимина, противопоставляющую Анри природе, выглядит следующим образом.
Солнце | Дождь | |
---|---|---|
Нет зонтика | 5
|
−9
|
Зонтик | 1
|
−5
|
Добавляя столбцы «Худший выигрыш» и « Лучший худший выигрыш» к таблице выигрышей, мы получаем
Солнце | Дождь | Худшая выплата | Лучшая худшая выплата | |
---|---|---|---|---|
Нет зонтика | 5
|
−9
|
−9
|
|
Зонтик | 1
|
−5
|
−5
|
−5
|
Худший случай, если Анри выйдет без зонтика, определенно хуже, чем (лучший) худший случай с зонтиком. Поэтому Анри берет с собой зонтик.
Вариации на тему
[ редактировать ]За прошедшие годы было разработано множество связанных моделей, главным образом для того, чтобы смягчить пессимистический подход, продиктованный ориентацией модели на наихудший случай. [ 4 ] [ 5 ] [ 8 ] [ 9 ] [ 10 ] Например,
Минимаксное сожаление Сэвиджа
[ редактировать ]Сэвиджа Минимаксная модель сожаления [ 11 ] связано с сожалениями о выплате.
Детерминированные модели
[ редактировать ]Наборы состояний не обязательно представляет неопределенность. Они могут представлять (детерминированные) изменения значения параметра.
Пример
[ редактировать ]Позволять быть конечным множеством, представляющим возможные местоположения «нежелательного» общественного объекта (например, свалки мусора), и пусть обозначают конечный набор мест в окрестностях планируемого объекта, представляющих существующие жилища.
Возможно, было бы желательно построить объект таким образом, чтобы его кратчайшее расстояние от существующего жилища было как можно большим. Максиминная формулировка задачи такова:
где обозначает расстояние от . Обратите внимание, что в этой задаче не меняется в зависимости от .
В тех случаях, когда желательно жить рядом с объектом, целью может быть минимизация максимального расстояния от объекта. Это дает следующую минимаксную задачу:
Это общие проблемы с размещением объектов .
Модели Maximin в маскировке
[ редактировать ]Опыт показал, что формулирование максимин-моделей может быть тонким в том смысле, что проблемы, которые «не похожи» на максиминные проблемы, могут быть сформулированы как таковые.
Пример
[ редактировать ]Рассмотрим следующую проблему:
Учитывая конечное множество и вещественнозначная функция на , найдите наибольшее подмножество такой, что для каждого в этом подмножестве.
Максиминная формулировка этой задачи в формате MP выглядит следующим образом:
Общие проблемы этого типа возникают при анализе устойчивости. [ 12 ] [ 13 ]
Было показано, что модель радиуса стабильности и модель устойчивости информационного разрыва являются простыми примерами максимин-модели Вальда. [ 14 ]
Ограниченные максиминные модели
[ редактировать ]Ограничения могут быть явно включены в максиминные модели. Например, ниже приведена задача максимина с ограничениями, сформулированная в классическом формате.
Его эквивалентный формат MP выглядит следующим образом:
Такие модели очень полезны для надежной оптимизации .
Цена надежности
[ редактировать ]Одной из «слабостей» модели Maximin является то, что за обеспечиваемую ею надежность приходится платить . [ 10 ] Действуя осторожно, модель Максимина склонна генерировать консервативные решения, цена которых может быть высокой. Следующий пример иллюстрирует эту важную особенность модели.
Пример
[ редактировать ]Предположим, есть два варианта: x' и . , и где . Тогда модель выглядит следующим образом:
Алгоритмы
[ редактировать ]Универсальных алгоритмов решения максиминных задач не существует. Некоторые проблемы решить очень просто, другие очень сложно. [ 9 ] [ 10 ] [ 15 ] [ 16 ]
Пример
[ редактировать ]Рассмотрим случай, когда переменная состояния является «индексом», например, пусть для всех . Соответствующая максиминная задача тогда выглядит следующим образом:
где .
Если , все функции линейны и задается системой линейных ограничений на , то эта проблема является задачей линейного программирования , которую можно решить с помощью алгоритмов линейного программирования, таких как симплекс-алгоритм .
Ссылки
[ редактировать ]- ^ Уолд, А. (1939). Вклад в теорию статистического оценивания и проверки гипотез. Анналы математики, 10 (4), 299–326.
- ^ Уолд, А. (1945). Статистические функции принятия решений, которые минимизируют максимальный риск. Анналы математики, 46 (2), 265–280.
- ^ Уолд, А. (1950). Статистические функции принятия решений, Джон Уайли, Нью-Йорк.
- ^ Jump up to: а б Резник, доктор медицины (1987). Выбор: введение в теорию принятия решений, Университет Миннесоты, Миннеаполис.
- ^ Jump up to: а б Френч, С. (1986). Теория принятия решений: введение в математику рациональности, Эллис Хорвуд, Чичестер.
- ^ Снедович, М. (2007). Искусство и наука моделирования принятия решений в условиях жесткой неопределенности. Принятие решений в производстве и сфере услуг, 1(1-2), 111-136.
- ^ Снедович, М. (2008). Максимин-модель Уолда: скрытое сокровище! Журнал рискового финансирования, 9 (3), 287–91.
- ^ Кувелис П. и Ю Г. (1997). Робастная дискретная оптимизация и ее приложения, Клювер, Бостон.
- ^ Jump up to: а б Бен-Тал А., Эль Гауи Л., Немировский А. (2009). Надежная оптимизация. Издательство Принстонского университета, Принстон.
- ^ Jump up to: а б с Берцимас Д. и Сим М. (2004). Цена надежности. Исследование операций, 52(1), 35-53.
- ^ Сэвидж, Л. (1951). Теория статистического решения. Журнал Американской статистической ассоциации, 46, 55–67.
- ^ Л. Джо Моффитт, Джон К. Странлунд и Крейг Д. Остин (2008). Надежные протоколы обнаружения сомнительных интродукций инвазивных видов. Журнал экологического менеджмента, 89 (4), 293–299.
- ^ Джонатан Розенхед, Мартин Элтон, Шив К. Гупта. (1972). Надежность и оптимальность как критерии стратегических решений. Ежеквартальный журнал операционных исследований, 23 (4), 413–431.
- ^ Снедович, М. (2010). Взгляд с высоты птичьего полета на теорию принятия решений при информационном дефиците. Журнал рискового финансирования, 11(3), 268-283.
- ^ Римстем, Р. и Р\{укманн, Дж. (1998). Полубесконечное программирование, Клювер, Бостон.
- ^ Рустем Б. и Хоу М. (2002). Алгоритмы проектирования наихудшего случая и приложения к управлению рисками, Princeton University Press, Принстон.