Jump to content

Мрачный триггер

В теории игр мрачный триггер (также называемый мрачной стратегией или просто мрачным ) — это триггерная стратегия для повторяющейся игры.

Первоначально игрок, использующий мрачный триггер, будет сотрудничать, но как только противник откажется (таким образом удовлетворяя условию триггера), игрок, использующий мрачный триггер, откажется до конца повторяемой игры. Поскольку один-единственный дефект противника приводит к его отказу навсегда, «мрачный триггер» является самой неумолимой из стратегий в повторяющейся игре.

В Роберта Аксельрода книге «Эволюция сотрудничества » мрачный триггер назван «Фридман». [1] для статьи Джеймса Фридмана 1971 года , в которой используется эта концепция. [2] [3]

Бесконечно дилемма повторяющаяся заключенных

Бесконечно повторяющаяся дилемма заключенных является хорошо известным примером стратегии мрачного триггера. Обычная игра для двоих заключенных выглядит следующим образом:

Заключенный Б
Заключенный А
Молчит (сотрудничать) Предательство (Дефект)
Молчит (сотрудничать) 1, 1 -1, 2
Предательство (Дефект) 2, -1 0, 0

В дилемме заключенных у каждого игрока на каждом этапе есть два варианта выбора:

  1. Сотрудничать
  2. Дефект ради немедленной выгоды

Если игрок выходит из игры, он будет наказан до конца игры. Фактически, обоим игрокам лучше хранить молчание (сотрудничать), чем предать другого, поэтому игра (C, C) является кооперативным профилем, а игра (D, D), а также уникальным равновесием Нэша в этой игре, является профиль наказания.

В стратегии «мрачного триггера» игрок сотрудничает в первом раунде и в последующих раундах до тех пор, пока его противник не откажется от соглашения. Как только игрок обнаружит, что противник предал в предыдущей игре, он навсегда дезертирует.

Чтобы оценить идеальное равновесие подигры (SPE) для следующей мрачной триггерной стратегии игры, стратегия S * для игроков i и j выглядит следующим образом:

  • Играйте C в каждом периоде, если только кто-то раньше не играл D.
  • Играйте в D навсегда, если кто-то играл в D в прошлом. [4]

Тогда стратегия является SPE, только если коэффициент дисконтирования равен . Другими словами, ни у Игрока 1, ни у Игрока 2 нет стимула отказываться от профиля сотрудничества, если коэффициент дисконтирования превышает половину. [5]

Чтобы доказать, что стратегия является SPE, сотрудничество должно быть лучшим ответом на сотрудничество другого игрока, а бегство должно быть лучшим ответом на бегство другого игрока. [4]

Шаг 1: Предположим, что D до сих пор ни разу не игралась.

  • Выигрыш игрока i от C:
  • Выигрыш игрока i от D:

Тогда C лучше, чем D, если .

Шаг 2: Предположим, что кто-то ранее играл в D, тогда игрок j будет играть в D, несмотря ни на что.

  • Выигрыш игрока i от C:
  • Выигрыш игрока i от D:

С , игра D оптимальна.

Предыдущий аргумент подчеркивает, что нет стимула отклоняться (нет прибыльного отклонения) от профиля сотрудничества, если , и это верно для каждой подигры. Следовательно, стратегией бесконечно повторяющейся игры «Дилемма заключенных» является идеальное равновесие Нэша в подигре.

В повторяющихся соревнованиях по стратегии «Дилемма заключенного» мрачный триггер работает плохо даже без шума , а добавление ошибок сигнала делает его еще хуже. Его способность угрожать постоянным дезертирством дает ему теоретически эффективный способ поддерживать доверие, но из-за его неумолимого характера и неспособности заранее сообщить об этой угрозе он работает плохо. [6]

триггер в международных отношениях Мрачный

В условиях мрачного триггера с точки зрения международных отношений нация сотрудничает только в том случае, если ее партнер никогда не эксплуатировал ее в прошлом. Поскольку нация будет отказываться от сотрудничества во всех будущих периодах, как только ее партнер однажды откажется, бессрочное прекращение сотрудничества становится угрозой, которая делает такую ​​стратегию ограничительным случаем. [7]

Мрачный триггер во взаимодействии пользователя с сетью [ править ]

Теория игр недавно использовалась при разработке будущих систем связи , и пользователь в игре взаимодействия пользователя с сетью, использующей стратегию мрачного триггера, является одним из таких примеров. [8] Если мрачный триггер решено использовать в игре взаимодействия пользователя и сети, пользователь остается в сети (сотрудничает), если сеть поддерживает определенное качество, но наказывает сеть, прекращая взаимодействие и покидая сеть, как только пользователь узнает дефекты противника. [9] Антониу и др. объясняет, что «при такой стратегии у сети появляется более сильный стимул выполнять данное обещание в отношении определенного качества, поскольку она сталкивается с угрозой навсегда потерять своего клиента». [8]

Сравнение с другими стратегиями [ править ]

Стратегии «око за око» и мрачные триггерные стратегии схожи по своей природе в том, что обе являются триггерной стратегией, при которой игрок отказывается отступать первым, если у него есть возможность наказать противника за дезертирство. Разница, однако, в том, что «мрачный триггер» предполагает максимальное наказание за одно дезертирство, в то время как «око за око» более снисходительно, предлагая одно наказание за каждое дезертирство. [10]

См. также [ править ]

Ссылки [ править ]

  1. ^ Аксельрод, Роберт (2006). Эволюция сотрудничества (пересмотренная ред.). Основные книги. п. 36. ISBN  0-465-00564-0 .
  2. ^ Фридман, Джеймс В. (1971). «Некооперативное равновесие для суперигр». Обзор экономических исследований . 38 (1): 1–12. дои : 10.2307/2296617 . JSTOR   2296617 .
  3. ^ Статья о JSTOR
  4. ^ Jump up to: Перейти обратно: а б Аджемоглу, Дарон (2 ноября 2009 г.). «Повторные игры и сотрудничество» .
  5. ^ Левин, Джонатан (май 2006 г.). «Повторяющиеся игры I: идеальный мониторинг» (PDF) .
  6. ^ Аксельрод, Роберт (2000). «О шести достижениях в теории сотрудничества» (PDF) . Проверено 2 ноября 2007 г. (стр. 13)
  7. ^ Макгилливра, Фиона; Смит, Аластер (2000). «Доверие и сотрудничество посредством наказаний, специфичных для агентов». Международная организация . 54 (4): 809–824. дои : 10.1162/002081800551370 . S2CID   22744046 .
  8. ^ Jump up to: Перейти обратно: а б Антониу, Жозефина; Пападопулу, Вики (ноябрь 2009 г.). «Совместное взаимодействие пользователя и сети в сетях связи следующего поколения». Компьютерные сети . 54 (13): 2239–2255. дои : 10.1016/j.comnet.2010.03.013 .
  9. ^ Антониу, Жозефина; Петрос А, Иоанну (2016). Теория игр в коммуникационных сетях: совместное разрешение сценариев интерактивных сетей . ЦРК Пресс. ISBN  9781138199385 .
  10. ^ Баурманн, Майкл; Лейст, Антон (май 2016 г.). «О шести достижениях теории сотрудничества». Журнал философии и социальной теории . 22 (1): 130–151.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: dd9ba7e02565581364fe7188c2e3122a__1718755200
URL1:https://arc.ask3.ru/arc/aa/dd/2a/dd9ba7e02565581364fe7188c2e3122a.html
Заголовок, (Title) документа по адресу, URL1:
Grim trigger - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)