Дешевый разговор

В теории игр дешевая болтовня — это общение между игроками, которое напрямую не влияет на выигрыши в игре. Предоставление и получение информации бесплатно. В этом отличие от сигнализации , при которой отправка определенных сообщений может быть дорогостоящей для отправителя в зависимости от состояния мира.

Эта базовая настройка, заданная Винсентом Кроуфордом и Джоэлом Собелом. ^[1] породило множество вариантов.

Если дать формальное определение, дешевый разговор – это общение, которое: ^[2]

без затрат на передачу и получение
необязательный (т.е. не ограничивает стратегический выбор любой из сторон)
не поддается проверке (т. е. не может быть проверен третьей стороной, например судом)

Следовательно, агент, занимающийся дешевыми разговорами, может безнаказанно лгать, но в состоянии равновесия может решить не делать этого.

Приложения [ править ]

Теория игр [ править ]

Дешевую болтовню можно, как правило, добавить в любую игру, и она потенциально может расширить набор возможных равновесных результатов. можно добавить порцию дешевых разговоров Например, в начало « Битвы полов» . Каждый игрок объявляет, собирается ли он пойти на футбольный матч или в оперу. Поскольку «Битва полов» — это координационная игра , этот начальный раунд общения может позволить игрокам выбирать среди нескольких равновесий, тем самым достигая более высоких выигрышей, чем в некоординированном случае. Сообщения и стратегии, которые приводят к такому результату, симметричны для каждого игрока. Это: 1) с четной вероятностью объявляют оперу или футбол 2) если человек объявляет оперу (или футбол), то, услышав это сообщение, другой человек тоже скажет оперу (или футбол) (Фаррелл и Рабин , 1996). Если они оба объявят разные варианты, то никакой координации не будет. В случае обмена сообщениями только одного игрока это также может дать этому игроку преимущество первопроходца.

Однако не гарантировано, что дешевые разговоры повлияют на равновесные выплаты. Другая игра, «Дилемма узника» , представляет собой игру, единственное равновесие которой находится в доминирующих стратегиях. Любые дешёвые разговоры перед игрой будут игнорироваться, и игроки будут использовать свои доминирующие стратегии («Дефект, Дефект») независимо от отправленных сообщений.

применения Биологические

Обычно утверждается, что дешевые разговоры не окажут никакого влияния на основную структуру игры. В биологии авторы часто утверждают, что дорогостоящая передача сигналов лучше всего объясняет передачу сигналов между животными (см. Принцип гандикапа , Теория передачи сигналов ). Это общее убеждение сталкивается с некоторыми проблемами (см. работу Карла Бергстрома). ^[3] и Брайан Скирмс 2002, 2004). В частности, несколько моделей, использующих эволюционную теорию игр, показывают, что дешёвые разговоры могут влиять на эволюционную динамику отдельных игр.

Собела Определение и Кроуфорда

Настройка [ править ]

В базовой форме игры общаются два игрока: отправитель и получатель R. S

Введите [ изменить ]

Отправитель S получает информацию о состоянии мира или о своем «типе» t . Получатель R не знает t ; у него есть только предварительные убеждения по этому поводу, и он полагается на сообщение от S, чтобы, возможно, повысить точность своих убеждений.

Сообщение [ править ]

S решает отправить сообщение m . Сообщение m может раскрывать полную информацию, но оно также может давать ограниченную, размытую информацию: обычно в нем говорится: «Состояние мира находится между t ₁ и t ₂ ». Он может вообще не давать никакой информации.

Форма сообщения не имеет значения, главное, чтобы было взаимопонимание, общее толкование. Это может быть общее заявление председателя центрального банка, политическая речь на любом языке и т. д. Какова бы ни была форма, в конечном итоге это означает: «Состояние мира находится между t ₁ и t ₂ ».

Действие [ править ]

Получатель R получает сообщение m . R обновляет свои представления о состоянии мира с учетом новой информации, которую он может получить, используя правило Байеса . R решает предпринять действия a . Это действие влияет как на его собственную полезность, так и на полезность отправителя.

Утилита [ править ]

Решение S относительно содержания m основано на максимизации его полезности с учетом того, чего он ожидает R. от Полезность – это способ количественной оценки удовлетворения или желаний. Это может быть финансовая прибыль или нефинансовое удовлетворение — например, степень защиты окружающей среды. → Квадратичные полезности: Соответствующие полезности S и R можно определить следующим образом:

U^{S}(a,t)=-(a-t-b)^{2}

U^{R}(a,t)=-(a-t)^{2}

Теория применима к более общим формам полезности, но квадратичные предпочтения облегчают изложение. Таким образом, S и R преследуют разные цели, если b ≠ 0 . Параметр b интерпретируется как конфликт интересов между двумя игроками или, альтернативно, как предвзятость. ты ^Р максимизируется, когда a = t , а это означает, что получатель хочет предпринять действие, соответствующее состоянию мира, о котором он вообще не знает. ты ^С максимизируется, когда a = t + b , а это означает, что S хочет, чтобы было предпринято немного более серьезное действие, если b > 0 . Поскольку S не контролирует действие, S должен добиться желаемого действия, выбрав, какую информацию раскрыть. Полезность каждого игрока зависит от состояния мира и от решений обоих игроков, которые в конечном итоге приводят к . действию

Равновесие Нэша [ править ]

Мы ищем равновесие, при котором каждый игрок принимает оптимальное решение, предполагая, что другой игрок также принимает оптимальное решение. Игроки рациональны, хотя R располагает лишь ограниченной информацией. Ожидания оправдываются, и нет стимула отклоняться от этой ситуации.

Теорема [ править ]

Кроуфорд и Собел характеризуют возможные равновесия Нэша .

Обычно существует несколько состояний равновесия , но в конечном количестве.
Разделение , что означает полное раскрытие информации, не является равновесием Нэша.
Бормотание , то есть отсутствие передачи информации, всегда является равновесным результатом.

Когда интересы совпадают, тогда информация раскрывается полностью. Когда конфликт интересов очень велик, вся информация остается скрытой. Это крайние случаи. Модель учитывает более тонкий случай, когда интересы близки, но различны, и в этих случаях оптимальное поведение приводит к раскрытию некоторой, но не всей информации, что приводит к различным видам тщательно сформулированных предложений, которые мы можем наблюдать.

В более общем плане:

Существует N ^* > 0 такое, что для всех N , 1 ≤ N ≤ N ^*,
существует по крайней мере равновесие, в котором множество индуцированных действий имеет мощность N ; и более того
не существует равновесия, которое индуцирует более N ^* действия.

Сообщения [ править ]

Хотя сообщения могут заранее принимать бесконечное число возможных значений µ(t) для бесконечного числа возможных состояний мира t , на самом деле они могут принимать только конечное число значений (m ₁ , m ₂ ,..., м _Н ) .

Таким образом, равновесие можно охарактеризовать разбиением (t ₀ (N), t ₁ (N)... t _N (N)) множества типов [0, 1],где 0 = t ₀ (N) < t ₁ (N) < . . . < т _N (N) знак равно 1 . Этот раздел показан в верхнем правом сегменте рисунка 1.

t i ₍ (N) - границы интервалов, в которых сообщения постоянны: для t _i-1 (N) < t < t _i N), µ(t) = m _i .

Действия [ править ]

Поскольку действия являются функциями сообщений, действия также постоянны в течение этих интервалов:для t _i-1 (N) < t < t _i (N) , α(t) = α(m _i ) = a _i .

Функция действия теперь косвенно характеризуется тем фактом, что каждое значение a _i оптимизирует доходность R , зная, что t находится между t ₁ и t ₂ . Математически (предполагая, что t равномерно распределено по [0, 1]),

$a_{i}={\bar {a}}(t_{i-1},t_{i})=\mathrm {arg} \max _{a}\int _{t_{i-1}}^{t_{i}}U^{R}(a,t)dt$

→ Квадратичные полезности:

Учитывая, что R знает, что t находится между t _i-1 и t _i , и в особом случае квадратичной полезности, когда R хочет, чтобы действие a было как можно ближе к t , мы можем показать, что совершенно интуитивно оптимальное действие — это середина интервал:

a_{i}={\frac {t_{i-1}+t_{i}}{2}}

Состояние безразличия [ править ]

В момент $t = t i$ отправителю должно быть безразлично, отправлять ли сообщение $m i-1$ или $m i$ . $U^{S}(a_{i},t_{i})=U^{S}(a_{i+1},t_{i})$ 1 ≤ i≤ N-1

Это дает информацию о N и t _i .

→ Практически: рассматриваем раздел размера N. Мы Можно показать, что

t_{i}=t_{1}i+2bi(i-1)\qquad t_{1}={\frac {1-2bN(N-1)}{N}}

N должно быть достаточно малым, чтобы числитель был положительным. Это определяет максимально допустимое значение

N^{*}=\langle -{\frac {1}{2}}+{\frac {1}{2}}{\sqrt {1+{\frac {2}{b}}}}\rangle

где

\langle Z\rangle

это потолок

Z

, т.е. наименьшее целое положительное число, большее или равное

Z

. Пример: Мы предполагаем, что b = 1/20 . Тогда Н ^* = 3 . Теперь мы опишем все состояния равновесия для N=1 , 2 или 3 (см. рисунок 2).

N = 1: это болтающееся равновесие. т ₀ = 0, т ₁ = 1 ; а ₁ = 1/2 = 0,5 .

N = 2: t ₀ = 0, t ₁ = 2/5 = 0,4, t ₂ = 1 ; а ₁ = 1/5 = 0,2, а ₂ = 7/10 = 0,7 .

Н = Н ^* = 3: t ₀ = 0, t ₁ = 2/15, t ₂ = 7/15, t ₃ = 1 ; а ₁ = 1/15, а ₂ = 3/10 = 0,3, а ₃ = 11/15 .

При N = 1 мы получаем максимально грубое сообщение, не дающее никакой информации. Итак, на верхней левой панели все красное. При N = 3 сообщение становится более точным . Однако она остается довольно грубой по сравнению с полным раскрытием, которым была бы линия 45°, но которая не является равновесием Нэша.

При более высоком N и более четком сообщении синяя область более важна. Это подразумевает более высокую полезность. Раскрытие дополнительной информации выгодно обеим сторонам.

См. также [ править ]

Примечания [ править ]

^ Кроуфорд, Винсент П.; Собел, Джоэл (ноябрь 1982 г.). «Передача стратегической информации». Эконометрика . 50 (6): 1431–1451. CiteSeerX 10.1.1.295.3462 . дои : 10.2307/1913390 . JSTOR 1913390 .
^ Фаррелл, Джозеф (1987). «Дешевый разговор, координация и вход». Экономический журнал RAND . 18 (1): 34–39. дои : 10.2307/2555533 . JSTOR 2555533 .
^ « Биология информации » . Архивировано из оригинала 4 марта 2005 г. Проверено 17 марта 2005 г.

Ссылки [ править ]

Кроуфорд, вице-президент; Собел, Дж. (1982). «Передача стратегической информации». Эконометрика . 50 (6): 1431–1451. CiteSeerX 10.1.1.461.9770 . дои : 10.2307/1913390 . JSTOR 1913390 .
Фаррелл, Дж.; Рабин, М. (1996). «Дешевый разговор» . Журнал экономических перспектив . 10 (3): 103–118. дои : 10.1257/jep.10.3.103 . JSTOR 2138522 .
Робсон, Эй Джей (1990). «Эффективность в эволюционных играх: Дарвин, Нэш и секретное рукопожатие» (PDF) . Журнал теоретической биологии . 144 (3): 379–396. Бибкод : 1990JThBi.144..379R . дои : 10.1016/S0022-5193(05)80082-7 . ПМИД 2395377 .
Скирмс, Б. (2002). «Сигналы, эволюция и объяснительная сила временной информации» (PDF) . Философия науки . 69 (3): 407–428. дои : 10.1086/342451 . S2CID 15843361 .
Скирмс, Б. (2004). Охота на оленя и эволюция социальной структуры . Нью-Йорк: Издательство Кембриджского университета. ISBN 0-521-82651-9 .

[CS-1] Кроуфорд, Винсент П.; Собел, Джоэл (ноябрь 1982 г.). «Передача стратегической информации». Эконометрика . 50 (6): 1431–1451. CiteSeerX 10.1.1.295.3462 . дои : 10.2307/1913390 . JSTOR 1913390 .

[2] Фаррелл, Джозеф (1987). «Дешевый разговор, координация и вход». Экономический журнал RAND . 18 (1): 34–39. дои : 10.2307/2555533 . JSTOR 2555533 .

[3] « Биология информации » . Архивировано из оригинала 4 марта 2005 г. Проверено 17 марта 2005 г.

[1]

[2]

[3]

v т и Темы теории игр
Определения	Игра с пробками Кооперативная игра Определенность Эскалация обязательств Игра развернутой формы Победа первого и второго игрока Сложность игры Графическая игра Иерархия убеждений Информационный набор Игра в нормальной форме Предпочтение Последовательная игра Одновременная игра Выбор одновременного действия Решенная игра Краткая игра Конструкция механизма
Равновесие концепции	Байесовское коррелированное равновесие Байесовское равновесие Нэша Равновесие Бержа Основной Коррелированное равновесие Коалиционно-устойчивое равновесие Нэша Эпсилон-равновесие Эволюционно стабильная стратегия Равновесие Гиббса Устойчивое равновесие Мертенса Марковское совершенное равновесие Равновесие Нэша Парето-эффективность Идеальное байесовское равновесие Правильное равновесие Равновесие квантового ответа Практически идеальный баланс Доминирование риска Равновесие удовлетворенности Самоподтверждающееся равновесие Последовательное равновесие Значение Шепли Сильное равновесие Нэша Совершенство подигры Дрожащая рука, равновесие
Стратегии	Умиротворение Обратная индукция Затенение ставок Сговор Дешевый разговор Деэскалация Сдерживание Эскалация Прямая индукция Мрачный триггер Марковская стратегия Доминирующие стратегии Чистая стратегия Смешанная стратегия Аргумент о краже стратегии Око за око
Классы игр	Аукцион Проблема с переговорами Глобальная игра Непереходная игра Среднее поле игры n игроков игра для Идеальная информация Большая игра Пуассона Потенциальная игра Повторная игра Скрининговая игра Сигнальная игра Строго определенная игра Стохастическая игра Симметричная игра Игра с нулевой суммой
Игры	Идти шахматы Бесконечные шахматы Шашки Аукцион с полной оплатой Дилемма заключенного Игра-обмен подарками Необязательная дилемма заключенного Дилемма путешественника Координационная игра Курица игра многоножка Сигнальная игра Льюиса Дилемма волонтера Долларовый аукцион Битва полов Охота на оленя Соответствующие пенни Ультиматум игра Камень-ножницы-бумага Пиратская игра Диктатор игра Игра «Общественные блага» Блото игра Война на истощение Проблема с баром Эль-Фарол Ярмарочный отдел Ярмарка разрезания торта Бертран конкурс Конкурс Курно конкурс Штакельберга Тупик Дилемма закусочной Угадайте 2/3 от среднего Кун покер Торговая игра Нэша Индукционные головоломки Доверительная игра Игра Принцесса и монстр Проблема встречи
Теоремы	Теорема согласия Ауманна Народная теорема Теорема о минимаксе Nash's theorem Теорема Негамакса Теорема очистки Принцип откровения Теорема Спрэга – Гранди Теорема Цермело
Ключ цифры	Альберт В. Такер Амос Тверски Антуан Огюстен Курно Ариэль Рубинштейн Клод Шеннон Дэниел Канеман Дэвид К. Левин Дэвид М. Крепс Дональд Б. Гиллис Дрю Фуденберг Эрик Маскин Гарольд В. Кун Герберт Саймон Эрве Мулен Джон Конвей Жан Тироль Жан-Франсуа Мертенс Дженнифер Тур Чейес Джон Харсаньи Джон Мейнард Смит Джон Нэш Джон фон Нейман Кеннет Эрроу Кеннет Бинмор Леонид Гурвич Ллойд Шепли Мелвин Дрешер Меррилл М. Флуд Ольга Бондарева Оскар Моргенштерн Пол Милгром Пейтон Янг Райнхард Зельтен Роберт Аксельрод Роберт Ауманн Роберт Б. Уилсон Роджер Майерсон Сэмюэл Боулз Сюзанна Скотчмер Томас Шеллинг Уильям Викри
Разнообразный	Альфа-бета-обрезка Ограниченная рациональность Комбинаторная теория игр Анализ конфронтации сотрудничество Эволюционная теория игр Глоссарий теории игр Список теоретиков игр Список игр по теории игр Безвыходная ситуация Топологическая игра Трагедия общего пользования