Мрачный триггер
В теории игр мрачный триггер (также называемый мрачной стратегией или просто мрачным ) — это триггерная стратегия для повторяющейся игры.
Первоначально игрок, использующий мрачный триггер, будет сотрудничать, но как только противник откажется (таким образом удовлетворяя условию триггера), игрок, использующий мрачный триггер, откажется до конца повторяемой игры. Поскольку один-единственный дефект противника приводит к его отказу навсегда, «мрачный триггер» является самой неумолимой из стратегий в повторяющейся игре.
В Роберта Аксельрода книге «Эволюция сотрудничества » мрачный триггер назван «Фридман». [1] для статьи Джеймса Фридмана 1971 года , в которой используется эта концепция. [2] [3]
Бесконечно дилемма повторяющаяся заключенных
Бесконечно повторяющаяся дилемма заключенных является хорошо известным примером стратегии мрачного триггера. Обычная игра для двоих заключенных выглядит следующим образом:
Заключенный Б Заключенный А | Молчит (сотрудничать) | Предательство (Дефект) |
Молчит (сотрудничать) | 1, 1 | -1, 2 |
Предательство (Дефект) | 2, -1 | 0, 0 |
В дилемме заключенных у каждого игрока на каждом этапе есть два варианта выбора:
- Сотрудничать
- Дефект ради немедленной выгоды
Если игрок выходит из игры, он будет наказан до конца игры. Фактически, обоим игрокам лучше хранить молчание (сотрудничать), чем предать другого, поэтому игра (C, C) является кооперативным профилем, а игра (D, D), а также уникальным равновесием Нэша в этой игре, является профиль наказания.
В стратегии «мрачного триггера» игрок сотрудничает в первом раунде и в последующих раундах до тех пор, пока его противник не откажется от соглашения. Как только игрок обнаружит, что противник предал в предыдущей игре, он навсегда дезертирует.
Чтобы оценить идеальное равновесие подигры (SPE) для следующей мрачной триггерной стратегии игры, стратегия S * для игроков i и j выглядит следующим образом:
- Играйте C в каждом периоде, если только кто-то раньше не играл D.
- Играйте в D навсегда, если кто-то играл в D в прошлом. [4]
Тогда стратегия является SPE, только если коэффициент дисконтирования равен . Другими словами, ни у Игрока 1, ни у Игрока 2 нет стимула отказываться от профиля сотрудничества, если коэффициент дисконтирования превышает половину. [5]
Чтобы доказать, что стратегия является SPE, сотрудничество должно быть лучшим ответом на сотрудничество другого игрока, а бегство должно быть лучшим ответом на бегство другого игрока. [4]
Шаг 1: Предположим, что D до сих пор ни разу не игралась.
- Выигрыш игрока i от C:
- Выигрыш игрока i от D:
Тогда C лучше, чем D, если .
Шаг 2: Предположим, что кто-то ранее играл в D, тогда игрок j будет играть в D, несмотря ни на что.
- Выигрыш игрока i от C:
- Выигрыш игрока i от D:
С , игра D оптимальна.
Предыдущий аргумент подчеркивает, что нет стимула отклоняться (нет прибыльного отклонения) от профиля сотрудничества, если , и это верно для каждой подигры. Следовательно, стратегией бесконечно повторяющейся игры «Дилемма заключенных» является идеальное равновесие Нэша в подигре.
В повторяющихся соревнованиях по стратегии «Дилемма заключенного» мрачный триггер работает плохо даже без шума , а добавление ошибок сигнала делает его еще хуже. Его способность угрожать постоянным дезертирством дает ему теоретически эффективный способ поддерживать доверие, но из-за его неумолимого характера и неспособности заранее сообщить об этой угрозе он работает плохо. [6]
триггер в международных отношениях Мрачный
В условиях мрачного триггера с точки зрения международных отношений нация сотрудничает только в том случае, если ее партнер никогда не эксплуатировал ее в прошлом. Поскольку нация будет отказываться от сотрудничества во всех будущих периодах, как только ее партнер однажды откажется, бессрочное прекращение сотрудничества становится угрозой, которая делает такую стратегию ограничительным случаем. [7]
Мрачный триггер во взаимодействии пользователя с сетью [ править ]
Теория игр недавно использовалась при разработке будущих систем связи , и пользователь в игре взаимодействия пользователя с сетью, использующей стратегию мрачного триггера, является одним из таких примеров. [8] Если мрачный триггер решено использовать в игре взаимодействия пользователя и сети, пользователь остается в сети (сотрудничает), если сеть поддерживает определенное качество, но наказывает сеть, прекращая взаимодействие и покидая сеть, как только пользователь узнает дефекты противника. [9] Антониу и др. объясняет, что «при такой стратегии у сети появляется более сильный стимул выполнять данное обещание в отношении определенного качества, поскольку она сталкивается с угрозой навсегда потерять своего клиента». [8]
Сравнение с другими стратегиями [ править ]
Стратегии «око за око» и мрачные триггерные стратегии схожи по своей природе в том, что обе являются триггерной стратегией, при которой игрок отказывается отступать первым, если у него есть возможность наказать противника за дезертирство. Разница, однако, в том, что «мрачный триггер» предполагает максимальное наказание за одно дезертирство, в то время как «око за око» более снисходительно, предлагая одно наказание за каждое дезертирство. [10]
См. также [ править ]
- Балансирование на грани – Политическая и военная тактика.
- Народная теорема (теория игр) - класс теорем о равновесных профилях выигрышей Нэша в повторяющихся играх.
- Гарантированное взаимное уничтожение - Доктрина военной стратегии.
- Повторная игра - игра, повторяющая основную игру.
- Триггерная стратегия - класс стратегий, используемых в повторяющейся некооперативной игре.
- Око за око - английская поговорка, означающая «эквивалентное возмездие».
Ссылки [ править ]
- ^ Аксельрод, Роберт (2006). Эволюция сотрудничества (пересмотренная ред.). Основные книги. п. 36. ISBN 0-465-00564-0 .
- ^ Фридман, Джеймс В. (1971). «Некооперативное равновесие для суперигр». Обзор экономических исследований . 38 (1): 1–12. дои : 10.2307/2296617 . JSTOR 2296617 .
- ^ Статья о JSTOR
- ^ Jump up to: Перейти обратно: а б Аджемоглу, Дарон (2 ноября 2009 г.). «Повторные игры и сотрудничество» .
- ^ Левин, Джонатан (май 2006 г.). «Повторяющиеся игры I: идеальный мониторинг» (PDF) .
- ^ Аксельрод, Роберт (2000). «О шести достижениях в теории сотрудничества» (PDF) . Проверено 2 ноября 2007 г. (стр. 13)
- ^ Макгилливра, Фиона; Смит, Аластер (2000). «Доверие и сотрудничество посредством наказаний, специфичных для агентов». Международная организация . 54 (4): 809–824. дои : 10.1162/002081800551370 . S2CID 22744046 .
- ^ Jump up to: Перейти обратно: а б Антониу, Жозефина; Пападопулу, Вики (ноябрь 2009 г.). «Совместное взаимодействие пользователя и сети в сетях связи следующего поколения». Компьютерные сети . 54 (13): 2239–2255. дои : 10.1016/j.comnet.2010.03.013 .
- ^ Антониу, Жозефина; Петрос А, Иоанну (2016). Теория игр в коммуникационных сетях: совместное разрешение сценариев интерактивных сетей . ЦРК Пресс. ISBN 9781138199385 .
- ^ Баурманн, Майкл; Лейст, Антон (май 2016 г.). «О шести достижениях теории сотрудничества». Журнал философии и социальной теории . 22 (1): 130–151.