Мрачный триггер

В теории игр мрачный триггер (также называемый мрачной стратегией или просто мрачным ) — это триггерная стратегия для повторяющейся игры.

Первоначально игрок, использующий мрачный триггер, будет сотрудничать, но как только противник откажется (таким образом удовлетворяя условию триггера), игрок, использующий мрачный триггер, откажется до конца повторяемой игры. Поскольку один-единственный дефект противника приводит к его отказу навсегда, «мрачный триггер» является самой неумолимой из стратегий в повторяющейся игре.

В Роберта Аксельрода книге «Эволюция сотрудничества » мрачный триггер назван «Фридман». ^[1] для статьи Джеймса Фридмана 1971 года , в которой используется эта концепция. ^[2]^[3]

Бесконечно дилемма повторяющаяся заключенных

Бесконечно повторяющаяся дилемма заключенных является хорошо известным примером стратегии мрачного триггера. Обычная игра для двоих заключенных выглядит следующим образом:

Заключенный Б Заключенный А	Молчит (сотрудничать)	Предательство (Дефект)
Молчит (сотрудничать)	1, 1	-1, 2
Предательство (Дефект)	2, -1	0, 0

В дилемме заключенных у каждого игрока на каждом этапе есть два варианта выбора:

Сотрудничать
Дефект ради немедленной выгоды

Если игрок выходит из игры, он будет наказан до конца игры. Фактически, обоим игрокам лучше хранить молчание (сотрудничать), чем предать другого, поэтому игра (C, C) является кооперативным профилем, а игра (D, D), а также уникальным равновесием Нэша в этой игре, является профиль наказания.

В стратегии «мрачного триггера» игрок сотрудничает в первом раунде и в последующих раундах до тех пор, пока его противник не откажется от соглашения. Как только игрок обнаружит, что противник предал в предыдущей игре, он навсегда дезертирует.

Чтобы оценить идеальное равновесие подигры (SPE) для следующей мрачной триггерной стратегии игры, стратегия S * для игроков i и j выглядит следующим образом:

Играйте C в каждом периоде, если только кто-то раньше не играл D.
Играйте в D навсегда, если кто-то играл в D в прошлом. ^[4]

Тогда стратегия является SPE, только если коэффициент дисконтирования равен ${\textstyle \delta \geq {\frac {1}{2}}}$ . Другими словами, ни у Игрока 1, ни у Игрока 2 нет стимула отказываться от профиля сотрудничества, если коэффициент дисконтирования превышает половину. ^[5]

Чтобы доказать, что стратегия является SPE, сотрудничество должно быть лучшим ответом на сотрудничество другого игрока, а бегство должно быть лучшим ответом на бегство другого игрока. ^[4]

Шаг 1: Предположим, что D до сих пор ни разу не игралась.

Выигрыш игрока i от C: $(1-\delta )[1+\delta +\delta ^{2}+...]=(1-\delta )\times {\frac {1}{1-\delta }}=1$
Выигрыш игрока i от D: $(1-\delta )[2+0+0+...]=2(1-\delta )$

Тогда C лучше, чем D, если $1\geq 2(1-\delta )$ .

Шаг 2: Предположим, что кто-то ранее играл в D, тогда игрок j будет играть в D, несмотря ни на что.

Выигрыш игрока i от C: $(1-\delta )[-1+\delta \times 0+\delta ^{2}\times 0+...]=(1-\delta )\times -1=\delta -1$
Выигрыш игрока i от D: $(1-\delta )[0+\delta \times 0+\delta ^{2}\times 0+...]=0$

С $0\leq \delta \leq 1$ , игра D оптимальна.

Предыдущий аргумент подчеркивает, что нет стимула отклоняться (нет прибыльного отклонения) от профиля сотрудничества, если $\delta \geq {\frac {1}{2}}$ , и это верно для каждой подигры. Следовательно, стратегией бесконечно повторяющейся игры «Дилемма заключенных» является идеальное равновесие Нэша в подигре.

В повторяющихся соревнованиях по стратегии «Дилемма заключенного» мрачный триггер работает плохо даже без шума , а добавление ошибок сигнала делает его еще хуже. Его способность угрожать постоянным дезертирством дает ему теоретически эффективный способ поддерживать доверие, но из-за его неумолимого характера и неспособности заранее сообщить об этой угрозе он работает плохо. ^[6]

триггер в международных отношениях Мрачный

В условиях мрачного триггера с точки зрения международных отношений нация сотрудничает только в том случае, если ее партнер никогда не эксплуатировал ее в прошлом. Поскольку нация будет отказываться от сотрудничества во всех будущих периодах, как только ее партнер однажды откажется, бессрочное прекращение сотрудничества становится угрозой, которая делает такую стратегию ограничительным случаем. ^[7]

Мрачный триггер во взаимодействии пользователя с сетью [ править ]

Теория игр недавно использовалась при разработке будущих систем связи , и пользователь в игре взаимодействия пользователя с сетью, использующей стратегию мрачного триггера, является одним из таких примеров. ^[8] Если мрачный триггер решено использовать в игре взаимодействия пользователя и сети, пользователь остается в сети (сотрудничает), если сеть поддерживает определенное качество, но наказывает сеть, прекращая взаимодействие и покидая сеть, как только пользователь узнает дефекты противника. ^[9] Антониу и др. объясняет, что «при такой стратегии у сети появляется более сильный стимул выполнять данное обещание в отношении определенного качества, поскольку она сталкивается с угрозой навсегда потерять своего клиента». ^[8]

Сравнение с другими стратегиями [ править ]

Стратегии «око за око» и мрачные триггерные стратегии схожи по своей природе в том, что обе являются триггерной стратегией, при которой игрок отказывается отступать первым, если у него есть возможность наказать противника за дезертирство. Разница, однако, в том, что «мрачный триггер» предполагает максимальное наказание за одно дезертирство, в то время как «око за око» более снисходительно, предлагая одно наказание за каждое дезертирство. ^[10]

См. также [ править ]

Балансирование на грани – Политическая и военная тактика.
Народная теорема (теория игр) - класс теорем о равновесных профилях выигрышей Нэша в повторяющихся играх.
Гарантированное взаимное уничтожение - Доктрина военной стратегии.
Повторная игра - игра, повторяющая основную игру.
Триггерная стратегия - класс стратегий, используемых в повторяющейся некооперативной игре.
Око за око - английская поговорка, означающая «эквивалентное возмездие».

Ссылки [ править ]

^ Аксельрод, Роберт (2006). Эволюция сотрудничества (пересмотренная ред.). Основные книги. п. 36. ISBN 0-465-00564-0 .
^ Фридман, Джеймс В. (1971). «Некооперативное равновесие для суперигр». Обзор экономических исследований . 38 (1): 1–12. дои : 10.2307/2296617 . JSTOR 2296617 .
^ Статья о JSTOR
^ Jump up to: Перейти обратно: ^а ^б Аджемоглу, Дарон (2 ноября 2009 г.). «Повторные игры и сотрудничество» .
^ Левин, Джонатан (май 2006 г.). «Повторяющиеся игры I: идеальный мониторинг» (PDF) .
^ Аксельрод, Роберт (2000). «О шести достижениях в теории сотрудничества» (PDF) . Проверено 2 ноября 2007 г. (стр. 13)
^ Макгилливра, Фиона; Смит, Аластер (2000). «Доверие и сотрудничество посредством наказаний, специфичных для агентов». Международная организация . 54 (4): 809–824. дои : 10.1162/002081800551370 . S2CID 22744046 .
^ Jump up to: Перейти обратно: ^а ^б Антониу, Жозефина; Пападопулу, Вики (ноябрь 2009 г.). «Совместное взаимодействие пользователя и сети в сетях связи следующего поколения». Компьютерные сети . 54 (13): 2239–2255. дои : 10.1016/j.comnet.2010.03.013 .
^ Антониу, Жозефина; Петрос А, Иоанну (2016). Теория игр в коммуникационных сетях: совместное разрешение сценариев интерактивных сетей . ЦРК Пресс. ISBN 9781138199385 .
^ Баурманн, Майкл; Лейст, Антон (май 2016 г.). «О шести достижениях теории сотрудничества». Журнал философии и социальной теории . 22 (1): 130–151.

[1] Аксельрод, Роберт (2006). Эволюция сотрудничества (пересмотренная ред.). Основные книги. п. 36. ISBN 0-465-00564-0 .

[2] Фридман, Джеймс В. (1971). «Некооперативное равновесие для суперигр». Обзор экономических исследований . 38 (1): 1–12. дои : 10.2307/2296617 . JSTOR 2296617 .

[3] Статья о JSTOR

[:0-4] Jump up to: Перейти обратно: ^а ^б Аджемоглу, Дарон (2 ноября 2009 г.). «Повторные игры и сотрудничество» .

[5] Левин, Джонатан (май 2006 г.). «Повторяющиеся игры I: идеальный мониторинг» (PDF) .

[6] Аксельрод, Роберт (2000). «О шести достижениях в теории сотрудничества» (PDF) . Проверено 2 ноября 2007 г. (стр. 13)

[7] Макгилливра, Фиона; Смит, Аластер (2000). «Доверие и сотрудничество посредством наказаний, специфичных для агентов». Международная организация . 54 (4): 809–824. дои : 10.1162/002081800551370 . S2CID 22744046 .

[:1-8] Jump up to: Перейти обратно: ^а ^б Антониу, Жозефина; Пападопулу, Вики (ноябрь 2009 г.). «Совместное взаимодействие пользователя и сети в сетях связи следующего поколения». Компьютерные сети . 54 (13): 2239–2255. дои : 10.1016/j.comnet.2010.03.013 .

[9] Антониу, Жозефина; Петрос А, Иоанну (2016). Теория игр в коммуникационных сетях: совместное разрешение сценариев интерактивных сетей . ЦРК Пресс. ISBN 9781138199385 .

[10] Баурманн, Майкл; Лейст, Антон (май 2016 г.). «О шести достижениях теории сотрудничества». Журнал философии и социальной теории . 22 (1): 130–151.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

v т и Темы теории игр
Определения	Игра с пробками Кооперативная игра Определенность Эскалация обязательств Игра развернутой формы Победа первого и второго игрока Сложность игры Графическая игра Иерархия убеждений Информационный набор Игра в нормальной форме Предпочтение Последовательная игра Одновременная игра Выбор одновременного действия Решенная игра Краткая игра Конструкция механизма
Равновесие концепции	Байесовское коррелированное равновесие Байесовское равновесие Нэша Равновесие Бержа Основной Коррелированное равновесие Коалиционно-устойчивое равновесие Нэша Эпсилон-равновесие Эволюционно стабильная стратегия Равновесие Гиббса Устойчивое равновесие Мертенса Марковское совершенное равновесие Равновесие Нэша Парето-эффективность Идеальное байесовское равновесие Правильное равновесие Равновесие квантового ответа Практически идеальный баланс Доминирование риска Равновесие удовлетворенности Самоподтверждающееся равновесие Последовательное равновесие Значение Шепли Сильное равновесие Нэша Совершенство подигры Дрожащая рука, равновесие
Стратегии	Умиротворение Обратная индукция Затенение ставок Сговор Дешевый разговор Деэскалация Сдерживание Эскалация Прямая индукция Мрачный триггер Марковская стратегия Доминирующие стратегии Чистая стратегия Смешанная стратегия Аргумент о краже стратегии Око за око
Классы игр	Аукцион Проблема с переговорами Глобальная игра Непереходная игра Среднее поле игры n игроков игра для Идеальная информация Большая игра Пуассона Потенциальная игра Повторная игра Скрининговая игра Сигнальная игра Строго определенная игра Стохастическая игра Симметричная игра Игра с нулевой суммой
Игры	Идти шахматы Бесконечные шахматы Шашки Аукцион с полной оплатой Дилемма заключенного Игра по обмену подарками Необязательная дилемма заключенного Дилемма путешественника Координационная игра Курица игра многоножка Сигнальная игра Льюиса Дилемма волонтера Долларовый аукцион Битва полов Охота на оленя Соответствующие пенни Ультиматум игра Камень-ножницы-бумага Пиратская игра Диктатор игра Игра «Общественные блага» Блото игра Война на истощение Проблема с баром Эль-Фарол Ярмарочный отдел Ярмарка разрезания торта Бертран конкурс Конкурс Курно конкурс Штакельберга Тупик Дилемма закусочной Угадайте 2/3 от среднего Кун покер Торговая игра Нэша Индукционные головоломки Доверительная игра Игра Принцесса и монстр Проблема встречи
Теоремы	Теорема согласия Ауманна Народная теорема Теорема о минимаксе Nash's theorem Теорема Негамакса Теорема очистки Принцип откровения Теорема Спрэга – Гранди Теорема Цермело
Ключ цифры	Альберт В. Такер Амос Тверски Антуан Огюстен Курно Ариэль Рубинштейн Клод Шеннон Дэниел Канеман Дэвид К. Левин Дэвид М. Крепс Дональд Б. Гиллис Дрю Фуденберг Эрик Маскин Гарольд В. Кун Герберт Саймон Эрве Мулен Джон Конвей Жан Тироль Жан-Франсуа Мертенс Дженнифер Тур Чейес Джон Харсаньи Джон Мейнард Смит Джон Нэш Джон фон Нейман Кеннет Эрроу Кеннет Бинмор Леонид Гурвич Ллойд Шепли Мелвин Дрешер Меррилл М. Флуд Ольга Бондарева Оскар Моргенштерн Пол Милгром Пейтон Янг Райнхард Зельтен Роберт Аксельрод Роберт Ауманн Роберт Б. Уилсон Роджер Майерсон Сэмюэл Боулз Сюзанна Скотчмер Томас Шеллинг Уильям Викри
Разнообразный	Альфа-бета-обрезка Ограниченная рациональность Комбинаторная теория игр Анализ конфронтации сотрудничество Эволюционная теория игр Глоссарий теории игр Список теоретиков игр Список игр по теории игр Безвыходная ситуация Топологическая игра Трагедия общего пользования