Jump to content

Дешевый разговор

В теории игр дешевая болтовня — это общение между игроками, которое напрямую не влияет на выигрыши в игре. Предоставление и получение информации бесплатно. В этом отличие от сигнализации , при которой отправка определенных сообщений может быть дорогостоящей для отправителя в зависимости от состояния мира.

Эта базовая настройка, заданная Винсентом Кроуфордом и Джоэлом Собелом. [1] породило множество вариантов.

Если дать формальное определение, дешевый разговор – это общение, которое: [2]

  1. без затрат на передачу и получение
  2. необязательный (т.е. не ограничивает стратегический выбор любой из сторон)
  3. не поддается проверке (т. е. не может быть проверен третьей стороной, например судом)

Следовательно, агент, занимающийся дешевыми разговорами, может безнаказанно лгать, но в состоянии равновесия может решить не делать этого.

Приложения [ править ]

Теория игр [ править ]

Дешевую болтовню можно, как правило, добавить в любую игру, и она потенциально может расширить набор возможных равновесных результатов. можно добавить порцию дешевых разговоров Например, в начало « Битвы полов» . Каждый игрок объявляет, собирается ли он пойти на футбольный матч или в оперу. Поскольку «Битва полов» — это координационная игра , этот начальный раунд общения может позволить игрокам выбирать среди нескольких равновесий, тем самым достигая более высоких выигрышей, чем в некоординированном случае. Сообщения и стратегии, которые приводят к такому результату, симметричны для каждого игрока. Это: 1) с четной вероятностью объявляют оперу или футбол 2) если человек объявляет оперу (или футбол), то, услышав это сообщение, другой человек тоже скажет оперу (или футбол) (Фаррелл и Рабин , 1996). Если они оба объявят разные варианты, то никакой координации не будет. В случае обмена сообщениями только одного игрока это также может дать этому игроку преимущество первопроходца.

Однако не гарантировано, что дешевые разговоры повлияют на равновесные выплаты. Другая игра, «Дилемма узника» , представляет собой игру, единственное равновесие которой находится в доминирующих стратегиях. Любые дешёвые разговоры перед игрой будут игнорироваться, и игроки будут использовать свои доминирующие стратегии («Дефект, Дефект») независимо от отправленных сообщений.

применения Биологические

Обычно утверждается, что дешевые разговоры не окажут никакого влияния на основную структуру игры. В биологии авторы часто утверждают, что дорогостоящая передача сигналов лучше всего объясняет передачу сигналов между животными (см. Принцип гандикапа , Теория передачи сигналов ). Это общее убеждение сталкивается с некоторыми проблемами (см. работу Карла Бергстрома). [3] и Брайан Скирмс 2002, 2004). В частности, несколько моделей, использующих эволюционную теорию игр, показывают, что дешёвые разговоры могут влиять на эволюционную динамику отдельных игр.

Собела Определение и Кроуфорда

Настройка [ править ]

В базовой форме игры общаются два игрока: отправитель и получатель R. S

Введите [ изменить ]

Отправитель S получает информацию о состоянии мира или о своем «типе» t . Получатель R не знает t ; у него есть только предварительные убеждения по этому поводу, и он полагается на сообщение от S, чтобы, возможно, повысить точность своих убеждений.

Сообщение [ править ]

S решает отправить сообщение m . Сообщение m может раскрывать полную информацию, но оно также может давать ограниченную, размытую информацию: обычно в нем говорится: «Состояние мира находится между t 1 и t 2 ». Он может вообще не давать никакой информации.

Форма сообщения не имеет значения, главное, чтобы было взаимопонимание, общее толкование. Это может быть общее заявление председателя центрального банка, политическая речь на любом языке и т. д. Какова бы ни была форма, в конечном итоге это означает: «Состояние мира находится между t 1 и t 2 ».

Действие [ править ]

Получатель R получает сообщение m . R обновляет свои представления о состоянии мира с учетом новой информации, которую он может получить, используя правило Байеса . R решает предпринять действия a . Это действие влияет как на его собственную полезность, так и на полезность отправителя.

Утилита [ править ]

Решение S относительно содержания m основано на максимизации его полезности с учетом того, чего он ожидает R. от Полезность – это способ количественной оценки удовлетворения или желаний. Это может быть финансовая прибыль или нефинансовое удовлетворение — например, степень защиты окружающей среды. → Квадратичные полезности: Соответствующие полезности S и R можно определить следующим образом:

Теория применима к более общим формам полезности, но квадратичные предпочтения облегчают изложение. Таким образом, S и R преследуют разные цели, если b ≠ 0 . Параметр b интерпретируется как конфликт интересов между двумя игроками или, альтернативно, как предвзятость. ты Р максимизируется, когда a = t , а это означает, что получатель хочет предпринять действие, соответствующее состоянию мира, о котором он вообще не знает. ты С максимизируется, когда a = t + b , а это означает, что S хочет, чтобы было предпринято немного более серьезное действие, если b > 0 . Поскольку S не контролирует действие, S должен добиться желаемого действия, выбрав, какую информацию раскрыть. Полезность каждого игрока зависит от состояния мира и от решений обоих игроков, которые в конечном итоге приводят к . действию

Равновесие Нэша [ править ]

Мы ищем равновесие, при котором каждый игрок принимает оптимальное решение, предполагая, что другой игрок также принимает оптимальное решение. Игроки рациональны, хотя R располагает лишь ограниченной информацией. Ожидания оправдываются, и нет стимула отклоняться от этой ситуации.

Теорема [ править ]

Рисунок 1: Настройка дешевой разговорной связи

Кроуфорд и Собел характеризуют возможные равновесия Нэша .

  • Обычно существует несколько состояний равновесия , но в конечном количестве.
  • Разделение , что означает полное раскрытие информации, не является равновесием Нэша.
  • Бормотание , то есть отсутствие передачи информации, всегда является равновесным результатом.

Когда интересы совпадают, тогда информация раскрывается полностью. Когда конфликт интересов очень велик, вся информация остается скрытой. Это крайние случаи. Модель учитывает более тонкий случай, когда интересы близки, но различны, и в этих случаях оптимальное поведение приводит к раскрытию некоторой, но не всей информации, что приводит к различным видам тщательно сформулированных предложений, которые мы можем наблюдать.

В более общем плане:

  • Существует N * > 0 такое, что для всех N , 1 ≤ N ≤ N * ,
  • существует по крайней мере равновесие, в котором множество индуцированных действий имеет мощность N ; и более того
  • не существует равновесия, которое индуцирует более N * действия.

Сообщения [ править ]

Хотя сообщения могут заранее принимать бесконечное число возможных значений µ(t) для бесконечного числа возможных состояний мира t , на самом деле они могут принимать только конечное число значений (m 1 , m 2 ,..., м Н ) .

Таким образом, равновесие можно охарактеризовать разбиением (t 0 (N), t 1 (N)... t N (N)) множества типов [0, 1],где 0 = t 0 (N) < t 1 (N) < . . . < т N (N) знак равно 1 . Этот раздел показан в верхнем правом сегменте рисунка 1.

t i ( (N) - границы интервалов, в которых сообщения постоянны: для t i-1 (N) < t < t i N), µ(t) = m i .

Действия [ править ]

Поскольку действия являются функциями сообщений, действия также постоянны в течение этих интервалов:для t i-1 (N) < t < t i (N) , α(t) = α(m i ) = a i .

Функция действия теперь косвенно характеризуется тем фактом, что каждое значение a i оптимизирует доходность R , зная, что t находится между t 1 и t 2 . Математически (предполагая, что t равномерно распределено по [0, 1]),

Квадратичные полезности:

Учитывая, что R знает, что t находится между t i-1 и t i , и в особом случае квадратичной полезности, когда R хочет, чтобы действие a было как можно ближе к t , мы можем показать, что совершенно интуитивно оптимальное действие — это середина интервал:

Состояние безразличия [ править ]

В момент t = t i отправителю должно быть безразлично, отправлять ли сообщение m i-1 или m i .       1 ≤ i≤ N-1

Это дает информацию о N и t i .

→ Практически: рассматриваем раздел размера N. Мы Можно показать, что

N должно быть достаточно малым, чтобы числитель был положительным. Это определяет максимально допустимое значение

где это потолок , т.е. наименьшее целое положительное число, большее или равное . Пример: Мы предполагаем, что b = 1/20 . Тогда Н * = 3 . Теперь мы опишем все состояния равновесия для N=1 , 2 или 3 (см. рисунок 2).

Рисунок 2. Сообщение и утилиты при конфликте интересов b = 1/20 , для N=1 , 2 и 3.

N = 1: это болтающееся равновесие. т 0 = 0, т 1 = 1 ; а 1 = 1/2 = 0,5 .

N = 2: t 0 = 0, t 1 = 2/5 = 0,4, t 2 = 1 ; а 1 = 1/5 = 0,2, а 2 = 7/10 = 0,7 .

Н = Н * = 3: t 0 = 0, t 1 = 2/15, t 2 = 7/15, t 3 = 1 ; а 1 = 1/15, а 2 = 3/10 = 0,3, а 3 = 11/15 .

При N = 1 мы получаем максимально грубое сообщение, не дающее никакой информации. Итак, на верхней левой панели все красное. При N = 3 сообщение становится более точным . Однако она остается довольно грубой по сравнению с полным раскрытием, которым была бы линия 45°, но которая не является равновесием Нэша.

При более высоком N и более четком сообщении синяя область более важна. Это подразумевает более высокую полезность. Раскрытие дополнительной информации выгодно обеим сторонам.

См. также [ править ]

Примечания [ править ]

  1. ^ Кроуфорд, Винсент П.; Собел, Джоэл (ноябрь 1982 г.). «Передача стратегической информации». Эконометрика . 50 (6): 1431–1451. CiteSeerX   10.1.1.295.3462 . дои : 10.2307/1913390 . JSTOR   1913390 .
  2. ^ Фаррелл, Джозеф (1987). «Дешевый разговор, координация и вход». Экономический журнал RAND . 18 (1): 34–39. дои : 10.2307/2555533 . JSTOR   2555533 .
  3. ^ « Биология информации » . Архивировано из оригинала 4 марта 2005 г. Проверено 17 марта 2005 г.

Ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 8becb8dfac05bc924d90bc4dee35d89a__1715400180
URL1:https://arc.ask3.ru/arc/aa/8b/9a/8becb8dfac05bc924d90bc4dee35d89a.html
Заголовок, (Title) документа по адресу, URL1:
Cheap talk - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)