Jump to content

Максиминная модель Уолда

В теории принятия решений и теории игр - Уолда максимин модель представляет собой невероятностную модель принятия решений, согласно которой решения ранжируются на основе их наихудших результатов: оптимальным решением является решение с наименее плохим наихудшим результатом. Это одна из наиболее важных моделей для принятия надежных решений в целом и надежной оптимизации в частности.

Оно также известно под множеством других названий, таких как правило максимина Уолда, принцип максимина Уолда, парадигма максимина Уолда и критерий максимина Уолда. Часто « минимакс вместо «максимина» используется ».

Определение

[ редактировать ]

Эта модель представляет собой игру для двоих, в которой игрок играет первым. В ответ второй игрок выбирает худшее состояние из , а именно состояние в это минимизирует выигрыш над в . Во многих приложениях второй игрок представляет неопределенность. Однако существуют максиминные модели, которые полностью детерминированы.

Вышеупомянутая модель представляет собой классический формат максимин-модели Вальда. Существует эквивалентный формат математического программирования (МП):

где обозначает реальную линию.

Как и в теории игр , наихудший выигрыш связан с принятием решения. , а именно

называется уровнем безопасности решения .

Минимаксный вариант модели получается путем замены позиций и операции в классическом формате:

Эквивалентный формат MP выглядит следующим образом:

Вдохновленный теорией игр, Абрахам Вальд разработал эту модель. [ 1 ] [ 2 ] [ 3 ] как подход к сценариям, в которых есть только один игрок (лицо, принимающее решения). Игрок 2 демонстрирует мрачный подход к неопределенности. В максиминной модели Уолда игрок 1 ( игрок) играет первым, а игрок 2 ( игрок) знает решение игрока 1, когда тот выбирает свое решение. Это существенное упрощение классической игры с нулевой суммой для двоих , в которой два игрока выбирают свои стратегии, не зная выбора другого игрока. Игра максимин-модели Вальда также является игрой двух лиц с нулевой суммой , но игроки выбирают последовательно.

С появлением современной теории принятия решений в 1950-х годах эта модель стала ключевым компонентом в формулировке невероятностных моделей принятия решений в условиях серьезной неопределенности. [ 4 ] [ 5 ] Он широко используется в различных областях, таких как теория принятия решений , теория управления , экономика , статистика , робастная оптимизация , исследование операций , философия и т. д. [ 6 ] [ 7 ]

Одним из наиболее известных примеров модели максимин/минимакс является

где обозначает реальную линию. Формально мы можем установить и . Картина вот эта

Оптимальным решением является (красная) седловая точка . .

Таблицы решений

[ редактировать ]

Во многих случаях удобно «организовать» модель Максимин/Минимакс в виде «таблицы». По соглашению, строки таблицы представляют решения, а столбцы — состояния.

Анри собирается на прогулку. Может светить солнце, а может идти дождь. Должен ли Анри носить зонтик? Анри не любит носить с собой зонтик, но еще больше он не любит промокать. Его « матрица выигрышей », рассматривающая это как игру Максимина, противопоставляющую Анри природе, выглядит следующим образом.

Солнце  Дождь 
Нет зонтика
5
−9
Зонтик
1
−5

Добавляя столбцы «Худший выигрыш» и « Лучший худший выигрыш» к таблице выигрышей, мы получаем

Солнце  Дождь  Худшая выплата Лучшая худшая выплата
Нет зонтика
5
−9
−9
Зонтик
1
−5
−5
−5

Худший случай, если Анри выйдет без зонтика, определенно хуже, чем (лучший) худший случай с зонтиком. Поэтому Анри берет с собой зонтик.

Вариации на тему

[ редактировать ]

За прошедшие годы было разработано множество связанных моделей, главным образом для того, чтобы смягчить пессимистический подход, продиктованный ориентацией модели на наихудший случай. [ 4 ] [ 5 ] [ 8 ] [ 9 ] [ 10 ] Например,

Минимаксное сожаление Сэвиджа

[ редактировать ]

Сэвиджа Минимаксная модель сожаления [ 11 ] связано с сожалениями о выплате.

Детерминированные модели

[ редактировать ]

Наборы состояний не обязательно представляет неопределенность. Они могут представлять (детерминированные) изменения значения параметра.

Позволять быть конечным множеством, представляющим возможные местоположения «нежелательного» общественного объекта (например, свалки мусора), и пусть обозначают конечный набор мест в окрестностях планируемого объекта, представляющих существующие жилища.

Возможно, было бы желательно построить объект таким образом, чтобы его кратчайшее расстояние от существующего жилища было как можно большим. Максиминная формулировка задачи такова:

где обозначает расстояние от . Обратите внимание, что в этой задаче не меняется в зависимости от .

В тех случаях, когда желательно жить рядом с объектом, целью может быть минимизация максимального расстояния от объекта. Это дает следующую минимаксную задачу:

Это общие проблемы с размещением объектов .

Модели Maximin в маскировке

[ редактировать ]

Опыт показал, что формулирование максимин-моделей может быть тонким в том смысле, что проблемы, которые «не похожи» на максиминные проблемы, могут быть сформулированы как таковые.

Рассмотрим следующую проблему:

Учитывая конечное множество и вещественнозначная функция на , найдите наибольшее подмножество такой, что для каждого в этом подмножестве.

Максиминная формулировка этой задачи в формате MP выглядит следующим образом:

Общие проблемы этого типа возникают при анализе устойчивости. [ 12 ] [ 13 ]

Было показано, что модель радиуса стабильности и модель устойчивости информационного разрыва являются простыми примерами максимин-модели Вальда. [ 14 ]

Ограниченные максиминные модели

[ редактировать ]

Ограничения могут быть явно включены в максиминные модели. Например, ниже приведена задача максимина с ограничениями, сформулированная в классическом формате.

Его эквивалентный формат MP выглядит следующим образом:

Такие модели очень полезны для надежной оптимизации .

Цена надежности

[ редактировать ]

Одной из «слабостей» модели Maximin является то, что за обеспечиваемую ею надежность приходится платить . [ 10 ] Действуя осторожно, модель Максимина склонна генерировать консервативные решения, цена которых может быть высокой. Следующий пример иллюстрирует эту важную особенность модели.

Предположим, есть два варианта: x' и ⁠. , и где . Тогда модель выглядит следующим образом:

Алгоритмы

[ редактировать ]

Универсальных алгоритмов решения максиминных задач не существует. Некоторые проблемы решить очень просто, другие очень сложно. [ 9 ] [ 10 ] [ 15 ] [ 16 ]

Рассмотрим случай, когда переменная состояния является «индексом», например, пусть для всех . Соответствующая максиминная задача тогда выглядит следующим образом:

где .

Если , все функции линейны и задается системой линейных ограничений на , то эта проблема является задачей линейного программирования , которую можно решить с помощью алгоритмов линейного программирования, таких как симплекс-алгоритм .

  1. ^ Уолд, А. (1939). Вклад в теорию статистического оценивания и проверки гипотез. Анналы математики, 10 (4), 299–326.
  2. ^ Уолд, А. (1945). Статистические функции принятия решений, которые минимизируют максимальный риск. Анналы математики, 46 (2), 265–280.
  3. ^ Уолд, А. (1950). Статистические функции принятия решений, Джон Уайли, Нью-Йорк.
  4. ^ Jump up to: а б Резник, доктор медицины (1987). Выбор: введение в теорию принятия решений, Университет Миннесоты, Миннеаполис.
  5. ^ Jump up to: а б Френч, С. (1986). Теория принятия решений: введение в математику рациональности, Эллис Хорвуд, Чичестер.
  6. ^ Снедович, М. (2007). Искусство и наука моделирования принятия решений в условиях жесткой неопределенности. Принятие решений в производстве и сфере услуг, 1(1-2), 111-136.
  7. ^ Снедович, М. (2008). Максимин-модель Уолда: скрытое сокровище! Журнал рискового финансирования, 9 (3), 287–91.
  8. ^ Кувелис П. и Ю Г. (1997). Робастная дискретная оптимизация и ее приложения, Клювер, Бостон.
  9. ^ Jump up to: а б Бен-Тал А., Эль Гауи Л., Немировский А. (2009). Надежная оптимизация. Издательство Принстонского университета, Принстон.
  10. ^ Jump up to: а б с Берцимас Д. и Сим М. (2004). Цена надежности. Исследование операций, 52(1), 35-53.
  11. ^ Сэвидж, Л. (1951). Теория статистического решения. Журнал Американской статистической ассоциации, 46, 55–67.
  12. ^ Л. Джо Моффитт, Джон К. Странлунд и Крейг Д. Остин (2008). Надежные протоколы обнаружения сомнительных интродукций инвазивных видов. Журнал экологического менеджмента, 89 (4), 293–299.
  13. ^ Джонатан Розенхед, Мартин Элтон, Шив К. Гупта. (1972). Надежность и оптимальность как критерии стратегических решений. Ежеквартальный журнал операционных исследований, 23 (4), 413–431.
  14. ^ Снедович, М. (2010). Взгляд с высоты птичьего полета на теорию принятия решений при информационном дефиците. Журнал рискового финансирования, 11(3), 268-283.
  15. ^ Римстем, Р. и Р\{укманн, Дж. (1998). Полубесконечное программирование, Клювер, Бостон.
  16. ^ Рустем Б. и Хоу М. (2002). Алгоритмы проектирования наихудшего случая и приложения к управлению рисками, Princeton University Press, Принстон.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 35900d3af810b3448bfb9b72ff2a7bd1__1703141460
URL1:https://arc.ask3.ru/arc/aa/35/d1/35900d3af810b3448bfb9b72ff2a7bd1.html
Заголовок, (Title) документа по адресу, URL1:
Wald's maximin model - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)