Дилемма путешественника
В теории игр ( дилемма путешественника иногда сокращенно TD ) — это игра с ненулевой суммой , в которой каждый игрок предлагает выигрыш. Побеждает меньшее из двух предложений; игрок лоуболла получает выигрыш лоуболла плюс небольшой бонус, а игрок хайболла получает такой же выигрыш лоуболла, за вычетом небольшого штрафа. Удивительно, но равновесие Нэша заключается в том, что оба игрока агрессивно занижают ставки. Дилемма путешественника примечательна тем, что наивная игра, кажется, превосходит равновесие Нэша; этот очевидный парадокс также проявляется в игре с многоножкой и в конечно повторяющейся дилемме заключенного .
Формулировка
[ редактировать ]Оригинальный сценарий игры был сформулирован в 1994 году Каушиком Басу и выглядит следующим образом: [ 1 ] [ 2 ]
«Авиакомпания теряет два чемодана, принадлежащих двум разным путешественникам. Оба чемодана оказались идентичными и содержат идентичный антиквариат. Менеджер авиакомпании, которому поручено урегулировать претензии обоих путешественников, объясняет, что авиакомпания несет ответственность за максимум 100 долларов за чемодан — он не могу напрямую узнать цену антиквариата».
«Чтобы определить честную оценочную стоимость антиквариата, менеджер разделяет обоих путешественников, чтобы они не могли совещаться, и просит их записать сумму их стоимости не менее 2 и не более 100 долларов. Он также сообщает им, что если оба запишут одно и то же число, он будет рассматривать это число как истинную долларовую стоимость обоих чемоданов и возместит эту сумму обоим путешественникам. Однако, если один запишет меньшее число, чем другой, это меньшее число будет считаться истинным. долларовая стоимость и оба путешественника получат эту сумму вместе с бонусом/малусом: 2 доллара дополнительно будут выплачены путешественнику, записавшему меньшую сумму, а вычет 2 доллара будет взят с человека, записавшего более высокую сумму. Задача состоит в том, какая стратегия. должны ли оба путешественника следовать за ним, чтобы решить, какую сумму им следует записать?»
Два игрока пытаются максимизировать свой выигрыш, не заботясь о выигрыше другого игрока.
Анализ
[ редактировать ]Обратная индукция применима только там, где имеется точная информация. Если его использовать там, где существует информационная асимметрия (менеджер авиакомпании не знает ценности антиквариата), результатом будет иррациональное поведение. Вот что происходит в следующем анализе:
Можно было бы ожидать, что оптимальный выбор путешественника составит 100 долларов; то есть путешественник оценивает антиквариат по максимально разрешенной цене, установленной менеджером авиакомпании. Примечательно и для многих это противоречит здравому смыслу, что равновесное решение по Нэшу на самом деле составляет всего 2 доллара; то есть путешественник оценивает антиквариат по минимально допустимой цене, установленной менеджером авиакомпании.
Чтобы понять, почему 2 доллара являются равновесием Нэша, рассмотрим следующее доказательство:
- Алису, потерявшую антиквариат, спрашивают, сколько они стоят. Первая мысль Алисы — назвать 100 долларов, максимально допустимую сумму.
- Однако, поразмыслив, она понимает, что ее попутчик Боб тоже может предложить 100 долларов. И поэтому Алиса меняет свое мнение и решает указать 99 долларов, что, если Боб назовет 100 долларов, принесет 101 доллар. Но «занижение балла» приводит к наихудшему возможному результату. Рациональные люди будут использовать рациональные ожидания Muth, то есть оба выберут 100, поскольку это максимизирует их индивидуальную и коллективную выгоду.
- Но Боб, находясь в том же положении, что и Алиса, мог бы также подумать о котировке 99 долларов. Итак, Алиса меняет свое мнение и решает указать 98 долларов, что, если Боб назовет 99 долларов, принесет 100 долларов. Это больше, чем 99 долларов, которые получила бы Алиса, если бы и она, и Боб предложили 99 долларов.
- Этот цикл мыслей продолжается до тех пор, пока Алиса, наконец, не решает указать всего лишь 2 доллара — минимально допустимую цену.
Приведенный выше анализ в решающей степени зависит от (1) несовершенства информации (менеджер авиакомпании не знает истинной ценности) и (2) иррациональности, в частности, от неспособности использовать стратегию Muth Rational.
Другое доказательство звучит следующим образом:
- Если Алиса хочет только максимизировать свой выигрыш, выбор 99 долларов важнее выбора 100 долларов. Если Боб выберет любое долларовое значение от 2 до 98 включительно, 99 и 100 долларов принесут равные выплаты; Если Боб выберет 99 или 100 долларов, выбор 99 долларов принесет Алисе дополнительный доллар.
- Аналогичные рассуждения показывают, что выбор 98 долларов для Алисы всегда лучше, чем выбор 99 долларов. Единственная ситуация, в которой выбор 99 долларов принесет более высокий выигрыш, чем выбор 98 долларов, — это если Боб выберет 100 долларов, но если Боб стремится только максимизировать свою собственную прибыль, он всегда выберет 99 долларов вместо 100 долларов.
- Эту линию рассуждений можно применить ко всем опционам Алисы на целые доллары, пока она, наконец, не достигнет 2 долларов, самой низкой цены.
Результаты экспериментов
[ редактировать ]Результат (2 доллара, 2 доллара) в этом случае является равновесием Нэша в игре. По определению это означает, что если ваш оппонент выберет это равновесное значение Нэша, то вашим лучшим выбором будет равновесное значение Нэша, равное 2 долларам. Это не будет оптимальным выбором, если есть вероятность, что ваш оппонент выберет более высокое значение, чем 2 доллара. [ 3 ] Когда игра ведется экспериментально, большинство участников выбирают значение выше равновесия Нэша и ближе к 100 долларам (что соответствует оптимальному решению по Парето). Точнее, решение равновесной стратегии Нэша оказалось плохим предсказателем поведения людей в дилемме путешественника с небольшим бонусом/малусом и довольно хорошим предсказателем, если параметр бонус/малус был большим. [ 4 ]
Более того, путешественники получают вознаграждение за сильное отклонение от равновесия Нэша в игре и получают гораздо более высокие награды, чем можно было бы получить при использовании чисто рациональной стратегии. Эти эксперименты (и другие, такие как фокусные точки ) показывают, что большинство людей не используют чисто рациональные стратегии, но стратегии, которые они используют, явно оптимальны. Этот парадокс может снизить ценность анализа чистой теории игр, но может также указать на пользу расширенного рассуждения, которое поймет, как может быть вполне рациональным делать нерациональный выбор, по крайней мере, в контексте игр, в которых есть игроки, которые могут можно рассчитывать на то, что он не будет играть «рационально». Например, Капраро предложил модель, в которой люди априори не действуют как отдельные агенты, а прогнозируют, как будет вестись игра, если они образуют коалиции, а затем действуют так, чтобы максимизировать прогноз. Его модель вполне соответствует экспериментальным данным по дилемме путешественника и подобным играм. [ 5 ] Недавно дилемма путешественника была проверена с помощью решения, принимаемого группами, а не индивидуально, чтобы проверить предположение о том, что групповые решения более рациональны, донося идею о том, что обычно две головы лучше, чем одна. [ 6 ] Экспериментальные данные показывают, что группы всегда более рациональны (т.е. их требования ближе к равновесию Нэша) и более чувствительны к размеру бонуса/малюса. [ 7 ]
Некоторые игроки, похоже, стремятся к байесовскому равновесию Нэша . [ 8 ] [ 9 ]
Похожие игры
[ редактировать ]Дилемму путешественника можно сформулировать как конечно повторяющуюся дилемму заключенного. [ 8 ] [ 9 ] Подобные парадоксы приписывают игре «Сороконожка» и игре «Конкурс красоты». [ 7 ] (или, точнее, « Угадай 2/3 среднего »). Один вариант исходной дилеммы путешественника, в котором обоим путешественникам предлагается только два целочисленных варианта выбора, 2 или 3 доллара, математически идентичен стандартной неповторяемой дилемме узника, и, таким образом, дилемму путешественника можно рассматривать как расширение дилеммы заключенного. (Минимальная гарантированная выплата составляет 1 доллар, и каждый доллар сверх этой суммы может считаться эквивалентом года, исключаемого из трехлетнего тюремного заключения.) Эти игры, как правило, включают в себя глубокое итеративное удаление доминирующих стратегий , чтобы продемонстрировать равновесие Нэша, и имеют тенденцию приводить к экспериментальным результатам, которые заметно отклоняются от классических предсказаний теории игр .
Матрица выплат
[ редактировать ]Каноническая матрица выигрышей показана ниже (если учитываются только целочисленные входные данные):
100 | 99 | 98 | 97 | ⋯ | 3 | 2 | |
---|---|---|---|---|---|---|---|
100 | 100 , 100 | 97 , 101 | 96 , 100 | 95 , 99 | ⋯ | 1 , 5 | 0 , 4 |
99 | 101 , 97 | 99 , 99 | 96 , 100 | 95 , 99 | ⋯ | 1 , 5 | 0 , 4 |
98 | 100 , 96 | 100 , 96 | 98 , 98 | 95 , 99 | ⋯ | 1 , 5 | 0 , 4 |
97 | 99 , 95 | 99 , 95 | 99 , 95 | 97 , 97 | ⋯ | 1 , 5 | 0 , 4 |
⋮ | ⋮ | ⋮ | ⋮ | ⋮ | ⋱ | ⋮ | ⋮ |
3 | 5 , 1 | 5 , 1 | 5 , 1 | 5 , 1 | ⋯ | 3 , 3 | 0 , 4 |
2 | 4 , 0 | 4 , 0 | 4 , 0 | 4 , 0 | ⋯ | 4 , 0 | 2 , 2 |
Обозначая набор стратегий, доступных как игрокам, так и функцию выигрыша одного из них мы можем записать
(Обратите внимание, что другой игрок получает поскольку игра количественно симметрична ).
Ссылки
[ редактировать ]- ^ Каушик Басу , «Дилемма путешественника: парадоксы рациональности в теории игр»; Американский экономический обзор , Vol. 84, № 2, стр. 391–395; Май 1994 года.
- ^ Каушик Басу, «Дилемма путешественника» ; Scientific American , июнь 2007 г.
- ^ Вулперт, Д. (2009). «Формализация Шеллинга: стратегический выбор нерациональных личностей». ССНР 1172602 .
{{cite journal}}
: Для цитирования журнала требуется|journal=
( помощь ) - ^ Капра, К. Моника; Гури, Джейкоб К.; Гомес, Росарио; Холт, Чарльз А. (1 января 1999 г.). «Аномальное поведение в дилемме путешественника?». Американский экономический обзор . 89 (3): 678–690. дои : 10.1257/aer.89.3.678 . JSTOR 117040 .
- ^ Капраро, В. (2013). «Модель человеческого сотрудничества в социальных дилеммах» . ПЛОС ОДИН . 8 (8): е72427. arXiv : 1307.4228 . дои : 10.1371/journal.pone.0072427 . ПМЦ 3756993 . ПМИД 24009679 .
- ^ Купер, Дэвид Дж; Кагель, Джон Х (1 июня 2005 г.). «Две головы лучше, чем одна? Командная или индивидуальная игра в сигнальных играх» (PDF) . Американский экономический обзор . 95 (3): 477–509. дои : 10.1257/0002828054201431 . ISSN 0002-8282 .
- ^ Перейти обратно: а б Морон, А.; Морон, П.; Германи, Арканзас (1 апреля 2014 г.). «Индивидуальное и групповое поведение в дилемме путешественника: экспериментальное исследование». Журнал поведенческой и экспериментальной экономики . 49 : 1–7. doi : 10.1016/j.socec.2014.02.001 .
- ^ Перейти обратно: а б Беккер Т., Картер М. и Наив Дж. (2005). Эксперты, решающие дилемму путешественника (№ 252/2005). Факультет экономики, Университет Хоэнхайма, Германия.
- ^ Перейти обратно: а б Баадер, Мальте; Вострокнутов, Александр (октябрь 2017 г.). «Взаимодействие способности к рассуждению и предпочтений в распределении в социальной дилемме». Журнал экономического поведения и организации . 142 : 79–91. дои : 10.1016/j.jebo.2017.07.025 . hdl : 11572/220494 .