Дилемма путешественника

В теории игр ( дилемма путешественника иногда сокращенно TD ) — это игра с ненулевой суммой , в которой каждый игрок предлагает выигрыш. Побеждает меньшее из двух предложений; игрок лоуболла получает выигрыш лоуболла плюс небольшой бонус, а игрок хайболла получает такой же выигрыш лоуболла, за вычетом небольшого штрафа. Удивительно, но равновесие Нэша заключается в том, что оба игрока агрессивно занижают ставки. Дилемма путешественника примечательна тем, что наивная игра, кажется, превосходит равновесие Нэша; этот очевидный парадокс также проявляется в игре с многоножкой и в конечно повторяющейся дилемме заключенного .

Формулировка

Оригинальный сценарий игры был сформулирован в 1994 году Каушиком Басу и выглядит следующим образом: ^{[ 1 ]}^{[ 2 ]}

«Авиакомпания теряет два чемодана, принадлежащих двум разным путешественникам. Оба чемодана оказались идентичными и содержат идентичный антиквариат. Менеджер авиакомпании, которому поручено урегулировать претензии обоих путешественников, объясняет, что авиакомпания несет ответственность за максимум 100 долларов за чемодан — он не могу напрямую узнать цену антиквариата».

«Чтобы определить честную оценочную стоимость антиквариата, менеджер разделяет обоих путешественников, чтобы они не могли совещаться, и просит их записать сумму их стоимости не менее 2 и не более 100 долларов. Он также сообщает им, что если оба запишут одно и то же число, он будет рассматривать это число как истинную долларовую стоимость обоих чемоданов и возместит эту сумму обоим путешественникам. Однако, если один запишет меньшее число, чем другой, это меньшее число будет считаться истинным. долларовая стоимость и оба путешественника получат эту сумму вместе с бонусом/малусом: 2 доллара дополнительно будут выплачены путешественнику, записавшему меньшую сумму, а вычет 2 доллара будет взят с человека, записавшего более высокую сумму. Задача состоит в том, какая стратегия. должны ли оба путешественника следовать за ним, чтобы решить, какую сумму им следует записать?»

Два игрока пытаются максимизировать свой выигрыш, не заботясь о выигрыше другого игрока.

Анализ

Обратная индукция применима только там, где имеется точная информация. Если его использовать там, где существует информационная асимметрия (менеджер авиакомпании не знает ценности антиквариата), результатом будет иррациональное поведение. Вот что происходит в следующем анализе:

Можно было бы ожидать, что оптимальный выбор путешественника составит 100 долларов; то есть путешественник оценивает антиквариат по максимально разрешенной цене, установленной менеджером авиакомпании. Примечательно и для многих это противоречит здравому смыслу, что равновесное решение по Нэшу на самом деле составляет всего 2 доллара; то есть путешественник оценивает антиквариат по минимально допустимой цене, установленной менеджером авиакомпании.

Чтобы понять, почему 2 доллара являются равновесием Нэша, рассмотрим следующее доказательство:

Алису, потерявшую антиквариат, спрашивают, сколько они стоят. Первая мысль Алисы — назвать 100 долларов, максимально допустимую сумму.
Однако, поразмыслив, она понимает, что ее попутчик Боб тоже может предложить 100 долларов. И поэтому Алиса меняет свое мнение и решает указать 99 долларов, что, если Боб назовет 100 долларов, принесет 101 доллар. Но «занижение балла» приводит к наихудшему возможному результату. Рациональные люди будут использовать рациональные ожидания Muth, то есть оба выберут 100, поскольку это максимизирует их индивидуальную и коллективную выгоду.
Но Боб, находясь в том же положении, что и Алиса, мог бы также подумать о котировке 99 долларов. Итак, Алиса меняет свое мнение и решает указать 98 долларов, что, если Боб назовет 99 долларов, принесет 100 долларов. Это больше, чем 99 долларов, которые получила бы Алиса, если бы и она, и Боб предложили 99 долларов.
Этот цикл мыслей продолжается до тех пор, пока Алиса, наконец, не решает указать всего лишь 2 доллара — минимально допустимую цену.

Приведенный выше анализ в решающей степени зависит от (1) несовершенства информации (менеджер авиакомпании не знает истинной ценности) и (2) иррациональности, в частности, от неспособности использовать стратегию Muth Rational.

Другое доказательство звучит следующим образом:

Если Алиса хочет только максимизировать свой выигрыш, выбор 99 долларов важнее выбора 100 долларов. Если Боб выберет любое долларовое значение от 2 до 98 включительно, 99 и 100 долларов принесут равные выплаты; Если Боб выберет 99 или 100 долларов, выбор 99 долларов принесет Алисе дополнительный доллар.
Аналогичные рассуждения показывают, что выбор 98 долларов для Алисы всегда лучше, чем выбор 99 долларов. Единственная ситуация, в которой выбор 99 долларов принесет более высокий выигрыш, чем выбор 98 долларов, — это если Боб выберет 100 долларов, но если Боб стремится только максимизировать свою собственную прибыль, он всегда выберет 99 долларов вместо 100 долларов.
Эту линию рассуждений можно применить ко всем опционам Алисы на целые доллары, пока она, наконец, не достигнет 2 долларов, самой низкой цены.

Результаты экспериментов

Результат (2 доллара, 2 доллара) в этом случае является равновесием Нэша в игре. По определению это означает, что если ваш оппонент выберет это равновесное значение Нэша, то вашим лучшим выбором будет равновесное значение Нэша, равное 2 долларам. Это не будет оптимальным выбором, если есть вероятность, что ваш оппонент выберет более высокое значение, чем 2 доллара. ^{[ 3 ]} Когда игра ведется экспериментально, большинство участников выбирают значение выше равновесия Нэша и ближе к 100 долларам (что соответствует оптимальному решению по Парето). Точнее, решение равновесной стратегии Нэша оказалось плохим предсказателем поведения людей в дилемме путешественника с небольшим бонусом/малусом и довольно хорошим предсказателем, если параметр бонус/малус был большим. ^{[ 4 ]}

Более того, путешественники получают вознаграждение за сильное отклонение от равновесия Нэша в игре и получают гораздо более высокие награды, чем можно было бы получить при использовании чисто рациональной стратегии. Эти эксперименты (и другие, такие как фокусные точки ) показывают, что большинство людей не используют чисто рациональные стратегии, но стратегии, которые они используют, явно оптимальны. Этот парадокс может снизить ценность анализа чистой теории игр, но может также указать на пользу расширенного рассуждения, которое поймет, как может быть вполне рациональным делать нерациональный выбор, по крайней мере, в контексте игр, в которых есть игроки, которые могут можно рассчитывать на то, что он не будет играть «рационально». Например, Капраро предложил модель, в которой люди априори не действуют как отдельные агенты, а прогнозируют, как будет вестись игра, если они образуют коалиции, а затем действуют так, чтобы максимизировать прогноз. Его модель вполне соответствует экспериментальным данным по дилемме путешественника и подобным играм. ^{[ 5 ]} Недавно дилемма путешественника была проверена с помощью решения, принимаемого группами, а не индивидуально, чтобы проверить предположение о том, что групповые решения более рациональны, донося идею о том, что обычно две головы лучше, чем одна. ^{[ 6 ]} Экспериментальные данные показывают, что группы всегда более рациональны (т.е. их требования ближе к равновесию Нэша) и более чувствительны к размеру бонуса/малюса. ^{[ 7 ]}

Некоторые игроки, похоже, стремятся к байесовскому равновесию Нэша . ^{[ 8 ]}^{[ 9 ]}

Матрица выплат

Каноническая матрица выигрышей показана ниже (если учитываются только целочисленные входные данные):

Выигрышная матрица Canonical TD
	100	99	98	97	⋯	3	2
100	100 , 100	97 , 101	96 , 100	95 , 99	⋯	1 , 5	0 , 4
99	101 , 97	99 , 99	96 , 100	95 , 99	⋯	1 , 5	0 , 4
98	100 , 96	100 , 96	98 , 98	95 , 99	⋯	1 , 5	0 , 4
97	99 , 95	99 , 95	99 , 95	97 , 97	⋯	1 , 5	0 , 4
⋮	⋮	⋮	⋮	⋮	⋱	⋮	⋮
3	5 , 1	5 , 1	5 , 1	5 , 1	⋯	3 , 3	0 , 4
2	4 , 0	4 , 0	4 , 0	4 , 0	⋯	4 , 0	2 , 2

Обозначая $S=\{2,...,100\}$ набор стратегий, доступных как игрокам, так и $F:S\times S\rightarrow \mathbb {R}$ функцию выигрыша одного из них мы можем записать

F(x,y)=\min(x,y)+2\cdot \operatorname {sgn}(y-x)

(Обратите внимание, что другой игрок получает $F(y,x)$ поскольку игра количественно симметрична ).

Ссылки

^ Каушик Басу , «Дилемма путешественника: парадоксы рациональности в теории игр»; Американский экономический обзор , Vol. 84, № 2, стр. 391–395; Май 1994 года.
^ Каушик Басу, «Дилемма путешественника» ; Scientific American , июнь 2007 г.
^ Вулперт, Д. (2009). «Формализация Шеллинга: стратегический выбор нерациональных личностей». ССНР 1172602 . {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )
^ Капра, К. Моника; Гури, Джейкоб К.; Гомес, Росарио; Холт, Чарльз А. (1 января 1999 г.). «Аномальное поведение в дилемме путешественника?». Американский экономический обзор . 89 (3): 678–690. дои : 10.1257/aer.89.3.678 . JSTOR 117040 .
^ Капраро, В. (2013). «Модель человеческого сотрудничества в социальных дилеммах» . ПЛОС ОДИН . 8 (8): е72427. arXiv : 1307.4228 . дои : 10.1371/journal.pone.0072427 . ПМЦ 3756993 . ПМИД 24009679 .
^ Купер, Дэвид Дж; Кагель, Джон Х (1 июня 2005 г.). «Две головы лучше, чем одна? Командная или индивидуальная игра в сигнальных играх» (PDF) . Американский экономический обзор . 95 (3): 477–509. дои : 10.1257/0002828054201431 . ISSN 0002-8282 .
^ Перейти обратно: ^а ^б Морон, А.; Морон, П.; Германи, Арканзас (1 апреля 2014 г.). «Индивидуальное и групповое поведение в дилемме путешественника: экспериментальное исследование». Журнал поведенческой и экспериментальной экономики . 49 : 1–7. doi : 10.1016/j.socec.2014.02.001 .
^ Перейти обратно: ^а ^б Беккер Т., Картер М. и Наив Дж. (2005). Эксперты, решающие дилемму путешественника (№ 252/2005). Факультет экономики, Университет Хоэнхайма, Германия.
^ Перейти обратно: ^а ^б Баадер, Мальте; Вострокнутов, Александр (октябрь 2017 г.). «Взаимодействие способности к рассуждению и предпочтений в распределении в социальной дилемме». Журнал экономического поведения и организации . 142 : 79–91. дои : 10.1016/j.jebo.2017.07.025 . hdl : 11572/220494 .

[1] Каушик Басу , «Дилемма путешественника: парадоксы рациональности в теории игр»; Американский экономический обзор , Vol. 84, № 2, стр. 391–395; Май 1994 года.

[2] Каушик Басу, «Дилемма путешественника» ; Scientific American , июнь 2007 г.

[3] Вулперт, Д. (2009). «Формализация Шеллинга: стратегический выбор нерациональных личностей». ССНР 1172602 . {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )

[4] Капра, К. Моника; Гури, Джейкоб К.; Гомес, Росарио; Холт, Чарльз А. (1 января 1999 г.). «Аномальное поведение в дилемме путешественника?». Американский экономический обзор . 89 (3): 678–690. дои : 10.1257/aer.89.3.678 . JSTOR 117040 .

[Capraro-5] Капраро, В. (2013). «Модель человеческого сотрудничества в социальных дилеммах» . ПЛОС ОДИН . 8 (8): е72427. arXiv : 1307.4228 . дои : 10.1371/journal.pone.0072427 . ПМЦ 3756993 . ПМИД 24009679 .

[6] Купер, Дэвид Дж; Кагель, Джон Х (1 июня 2005 г.). «Две головы лучше, чем одна? Командная или индивидуальная игра в сигнальных играх» (PDF) . Американский экономический обзор . 95 (3): 477–509. дои : 10.1257/0002828054201431 . ISSN 0002-8282 .

[morone-7] Перейти обратно: ^а ^б Морон, А.; Морон, П.; Германи, Арканзас (1 апреля 2014 г.). «Индивидуальное и групповое поведение в дилемме путешественника: экспериментальное исследование». Журнал поведенческой и экспериментальной экономики . 49 : 1–7. doi : 10.1016/j.socec.2014.02.001 .

[becker-8] Перейти обратно: ^а ^б Беккер Т., Картер М. и Наив Дж. (2005). Эксперты, решающие дилемму путешественника (№ 252/2005). Факультет экономики, Университет Хоэнхайма, Германия.

[baader-9] Перейти обратно: ^а ^б Баадер, Мальте; Вострокнутов, Александр (октябрь 2017 г.). «Взаимодействие способности к рассуждению и предпочтений в распределении в социальной дилемме». Журнал экономического поведения и организации . 142 : 79–91. дои : 10.1016/j.jebo.2017.07.025 . hdl : 11572/220494 .

[ 1 ]

[ 2 ]

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]

[ 9 ]

v т и Темы теории игр
Определения	Игра с пробками Кооперативная игра Определенность Эскалация обязательств Игра развернутой формы Победа первого и второго игрока Сложность игры Графическая игра Иерархия убеждений Информационный набор Игра в нормальной форме Предпочтение Последовательная игра Одновременная игра Выбор одновременного действия Решенная игра Краткая игра Конструкция механизма
Равновесие концепции	Байесовское коррелированное равновесие Байесовское равновесие Нэша Равновесие Бержа Основной Коррелированное равновесие Коалиционно-устойчивое равновесие Нэша Эпсилон-равновесие Эволюционно стабильная стратегия Равновесие Гиббса Устойчивое равновесие Мертенса Марковское совершенное равновесие Равновесие Нэша Парето-эффективность Идеальное байесовское равновесие Правильное равновесие Равновесие квантового ответа Практически идеальный баланс Доминирование риска Равновесие удовлетворенности Самоподтверждающееся равновесие Последовательное равновесие Значение Шепли Сильное равновесие Нэша Совершенство подигры Дрожащая рука, равновесие
Стратегии	Умиротворение Обратная индукция Затенение ставок Сговор Дешевый разговор Деэскалация Сдерживание Эскалация Прямая индукция Мрачный триггер Марковская стратегия Доминирующие стратегии Чистая стратегия Смешанная стратегия Аргумент о краже стратегии Око за око
Классы игр	Аукцион Проблема с переговорами Глобальная игра Непереходная игра Среднее поле игры n игроков игра для Идеальная информация Большая игра Пуассона Потенциальная игра Повторная игра Скрининговая игра Сигнальная игра Строго определенная игра Стохастическая игра Симметричная игра Игра с нулевой суммой
Игры	Идти шахматы Бесконечные шахматы Шашки Аукцион с полной оплатой Дилемма заключенного Игра-обмен подарками Необязательная дилемма заключенного Дилемма путешественника Координационная игра Курица игра многоножка Сигнальная игра Льюиса Дилемма волонтера Долларовый аукцион Битва полов Охота на оленя Соответствующие пенни Ультиматум игра Электронная почтовая игра Камень-ножницы-бумага Пиратская игра Диктатор игра Игра «Общественные блага» Блото игра Война на истощение Проблема с баром Эль-Фарол Ярмарочный отдел Ярмарка разрезания торта Бертран конкурс Конкурс Курно конкурс Штакельберга Тупик Дилемма закусочной Угадайте 2/3 от среднего Кун покер Торговая игра Нэша Индукционные головоломки Доверительная игра Игра Принцесса и монстр Проблема встречи
Теоремы	Теорема согласия Ауманна Народная теория Теорема о минимаксе Nash's theorem Теорема Негамакса Теорема очистки Принцип откровения Теорема Спрэга – Гранди Теорема Цермело
Ключ цифры	Альберт В. Такер Амос Тверски Антуан Огюстен Курно Ариэль Рубинштейн Клод Шеннон Дэниел Канеман Дэвид К. Левин Дэвид М. Крепс Дональд Б. Гиллис Дрю Фуденберг Эрик Маскин Гарольд В. Кун Герберт Саймон Эрве Мулен Джон Конвей Жан Тироль Жан-Франсуа Мертенс Дженнифер Тур Чейес Джон Харсаньи Джон Мейнард Смит Джон Нэш Джон фон Нейман Кеннет Эрроу Кеннет Бинмор Леонид Гурвич Ллойд Шепли Мелвин Дрешер Меррилл М. Флуд Ольга Бондарева Оскар Моргенштерн Пол Милгром Пейтон Янг Райнхард Зельтен Роберт Аксельрод Роберт Ауманн Роберт Б. Уилсон Роджер Майерсон Сэмюэл Боулз Сюзанна Скотчмер Томас Шеллинг Уильям Викри
Поисковая оптимизация	Альфа-бета-обрезка Окно стремления Поиск основных вариантов алгоритм max^n Параноидальный алгоритм Ленивый СМП
Разнообразный	Ограниченная рациональность Комбинаторная теория игр Анализ конфронтации сотрудничество Эволюционная теория игр Глоссарий теории игр Список теоретиков игр Список игр по теории игр Безвыходная ситуация Топологическая игра Трагедия общего пользования

Формулировка

Анализ

Результаты экспериментов

Похожие игры

Матрица выплат

Ссылки