Jump to content

Стратегическая устойчивость

(Перенаправлено с Strategyproof )

В проектировании механизмов механизм , устойчивый к стратегии (SP), представляет собой форму игры , в которой каждый игрок имеет слабо доминирующую стратегию , так что ни один игрок не может получить выгоду, «шпионя» за другими игроками, чтобы узнать, во что они собираются играть. Когда игроки имеют личную информацию (например, их тип или значение какого-либо предмета), а стратегическое пространство каждого игрока состоит из возможных информационных значений (например, возможных типов или значений), правдивый механизм — это игра, в которой выявляются истинные значения. информация является слабо доминантной стратегией для каждого игрока. [1] : 244  Механизм SP также называется совместимым со стимулами доминирующей стратегии (DSIC) . [1] : 415  чтобы отличить его от других видов совместимости стимулов .

Механизм SP невосприимчив к манипуляциям со стороны отдельных игроков (но не коалиций). Напротив, в механизме, защищенном от групповой стратегии , ни одна группа людей не может вступить в сговор, чтобы исказить свои предпочтения таким образом, чтобы улучшить положение каждого члена. В сильном механизме защиты от групповой стратегии ни одна группа людей не может вступить в сговор, чтобы исказить свои предпочтения таким образом, чтобы улучшить благосостояние хотя бы одного члена группы, не ухудшив при этом положение остальных членов. [2]

Типичными примерами механизмов SP являются:

Типичными примерами механизмов, не являющихся SP, являются:

SP в сетевой маршрутизации

[ редактировать ]

SP также применим в сетевой маршрутизации . [ нужна ссылка ] Рассмотрим сеть как граф , где каждое ребро (т. е. ссылка) имеет связанную с ней , известную стоимость передачи в частном порядке владельцу ссылки. Владелец ссылки желает получать вознаграждение за ретрансляцию сообщений. Отправитель сообщения в сети хочет найти путь с наименьшей стоимостью. Для этого существуют эффективные методы даже в больших сетях. Однако есть одна проблема: стоимость каждой ссылки неизвестна. Наивный подход заключался бы в том, чтобы спросить владельца каждой ссылки о стоимости, использовать эти заявленные затраты, чтобы найти путь с наименьшей стоимостью, и оплатить всем ссылкам на пути их заявленную стоимость. Однако можно показать, что данная схема оплаты не является SP, то есть владельцы некоторых ссылок могут получить выгоду, солгав о стоимости. В конечном итоге мы можем заплатить гораздо больше, чем фактическая стоимость. Можно показать, что при определенных предположениях о сети и игроках (владельцах ссылок) вариантом механизма VCG является SP. [ нужна ссылка ]

Формальные определения

[ редактировать ]

Есть набор возможных результатов.

Есть агенты, которые имеют разные оценки для каждого результата. Оценка агента представляется в виде функции:

который выражает ценность каждой альтернативы в денежном выражении.

Предполагается, что агенты имеют полезности квазилинейные функции ; это означает, что если результат и дополнительно агент получает оплату (положительная или отрицательная), то общая полезность агента является:

Вектор всех функций цены обозначается .

Для каждого агента вектор всех функций ценности других агентов обозначается через . Так .

Механизм это пара функций:

  • Ан функция, которая принимает на вход вектор значений и возвращает результат (ее еще называют функцией социального выбора );
  • А функция, которая принимает на вход вектор значений и возвращает вектор платежей, , определяя, какую сумму должен получить каждый игрок (отрицательный платеж означает, что игрок должен заплатить положительную сумму).

Механизм называется стратегически устойчивым , если для каждого игрока и для каждого вектора ценностей других игроков :

Характеристика

[ редактировать ]

Полезно иметь простые условия для проверки того, является ли данный механизм SP или нет. В этом подразделе показаны два простых условия, которые являются одновременно необходимыми и достаточными.

Если механизм денежных переводов является SP, то он должен удовлетворять следующим двум условиям: для каждого агента : [1] : 226 

1. Оплата агенту является функцией выбранного результата и оценок других агентов. - но не является прямой функцией собственной оценки агента . Формально существует функция цены , который принимает в качестве входных данных результат и вектор оценки для других агентов , и возвращает оплату агенту , такой, что для каждого , если:

затем:

ДОКАЗАТЕЛЬСТВО: Если затем агент с оценкой предпочитает сообщать , поскольку это дает ему тот же результат и более крупную оплату; аналогично, если затем агент с оценкой предпочитает сообщать .

Как следствие, существует функция «ценника», , который принимает в качестве входных данных результат и вектор оценки для других агентов , и возвращает оплату агенту Для каждого , если:

затем:

2. Выбранный исход оптимален для агента. , учитывая оценки других агентов. Формально:

где максимизация ведется по всем результатам в диапазоне .

ДОКАЗАТЕЛЬСТВО: Если есть другой результат такой, что , то агент с оценкой предпочитает сообщать , поскольку это дает ему большую общую полезность.

Условия 1 и 2 не только необходимы, но и достаточны: любой механизм, удовлетворяющий условиям 1 и 2, является SP.

ДОКАЗАТЕЛЬСТВО: исправить агента и оценки . Обозначим:

- результат, когда агент действует правдиво.
- результат, когда агент действует неправдиво.

По свойству 1 полезность агента при честной игре равна:

а полезность агента при игре неправдой равна:

По свойству 2:

поэтому доминирующей стратегией агента является действовать правдиво.

Характеристика функции результата

[ редактировать ]

Фактическая цель механизма – это его функция; функция оплаты — это всего лишь инструмент, побуждающий игроков быть правдивыми. Следовательно, полезно знать для определенной выходной функции, может ли она быть реализована с использованием механизма SP или нет (это свойство также называется реализуемостью ). [ нужна ссылка ]

Свойство монотонности необходимо для устойчивости стратегии. [ нужна ссылка ]

Истинные механизмы в однопараметрических областях

[ редактировать ]

Однопараметрическая область — это игра, в которой каждый игрок получает определенное положительное значение для «выигрыша» и значение 0 для «проигрыша». Простым примером является аукцион одного предмета, на котором ценность, которую игрок присваивается элементу.

В этой ситуации легко охарактеризовать правдивые механизмы. Начнем с некоторых определений.

Механизм называется нормализованным, если за каждую проигрышную ставку выплачивается 0.

Механизм называется монотонным , если при повышении ставки игроком его шансы на выигрыш (слабо) увеличиваются.

Для монотонного механизма для каждого игрока i и каждой комбинации ставок других игроков существует критическое значение , при котором игрок переходит от проигрыша к выигрышу.

Нормализованный механизм в однопараметрической области правдив, если выполняются следующие два условия: [1] : 229–230 

  1. Функция назначения монотонна в каждой из заявок и:
  2. Каждая выигрышная ставка приносит критическую ценность.

Правдивость рандомизированных механизмов

[ редактировать ]

Существуют различные способы распространить понятие правдивости на рандомизированные механизмы. Они от самого сильного к самому слабому: [3] : 6–8 

  • Универсальная правдивость : для каждой рандомизации алгоритма результирующий механизм правдив. Другими словами: универсально-истинный механизм — это рандомизация детерминированных истинных механизмов, где веса могут зависеть от входных данных.
  • Правдивость с сильным стохастическим доминированием (сильная SD-правдивость) : вектор вероятностей, которые агент получает, будучи правдивым, имеет стохастическое доминирование первого порядка над вектором вероятностей, которые он получает, сообщая ложные сведения. То есть: вероятность получения высшего приоритета как минимум столь же высока И вероятность получения одного из двух высших приоритетов как минимум столь же высока И ... вероятность получения одного из m высших приоритетов как минимум столь же высока. .
  • Лексикографическая правдивость (lex-truthfulness) : вектор вероятностей, которые агент получает, будучи правдивым, имеет лексикографическое доминирование над вектором вероятностей, которые он получает, сообщая ложные сведения. То есть: вероятность получения высшего приоритета выше ИЛИ (вероятность получения высшего приоритета равна и вероятность получения одного из двух высших приоритетов выше) ИЛИ... (вероятность получения первого m - Приоритет 1 приоритета равен и вероятность получения одного из m высших приоритетов выше) ИЛИ (все вероятности равны).
  • Правдивость со слабым стохастическим доминированием (слабая правдивость со стохастическим доминированием) : вектор вероятностей, который агент получает, будучи правдивым, не находится под стохастическим доминированием первого порядка вектором вероятностей, который он получает, сообщая ложные сведения.

Из универсального следует сильное SD, из Lex следует слабое SD, и все импликации строгие. [3] : Thm.3.4

Правдивость с высокой вероятностью

[ редактировать ]

Для каждой константы , рандомизированный механизм называется правдивым с вероятностью если для каждого агента и для каждого вектора ставок вероятность того, что агент выиграет от неправдивых ставок, не превышает , где за вероятность берется случайность механизма. [1] : 349 

Если константа переходит в 0, когда число участников растет, тогда механизм с высокой вероятностью называется правдивым . Это понятие слабее полной правдивости, но в некоторых случаях оно все же полезно; см., например, консенсус-оценка .

Защита от ложного имени

[ редактировать ]

Новый тип мошенничества, который стал обычным явлением в связи с обилием интернет-аукционов, — это ставки от вымышленного имени — заявки, подаваемые одним участником торгов с использованием нескольких идентификаторов, таких как несколько адресов электронной почты.

Защита от вымышленного имени означает, что ни у одного из игроков нет стимула делать ставки под вымышленным именем. Это более сильное понятие, чем устойчивость стратегии. В частности, аукцион Викри-Кларка-Гроувса (VCG) не является защитой от ложных имен. [4]

Защита от ложного имени существенно отличается от защиты от групповой стратегии, поскольку предполагает, что отдельный человек в одиночку может имитировать определенное поведение, которое обычно требует совместной координации нескольких людей. [ нужна ссылка ] [ нужны дальнейшие объяснения ]

См. также

[ редактировать ]

Дальнейшее чтение

[ редактировать ]
  1. ^ Перейти обратно: а б с д и Вазирани, Виджай В .; Нисан, Ноам ; Рафгарден, Тим ; Тардос, Ева (2007). Алгоритмическая теория игр (PDF) . Кембридж, Великобритания: Издательство Кембриджского университета. ISBN  0-521-87282-0 .
  2. ^ «Защита от групповой стратегии и социальный выбор между двумя альтернативами» (PDF) . Архивировано из оригинала (PDF) 12 февраля 2020 г.
  3. ^ Перейти обратно: а б Чакрабарти, Дипарнаб; Свами, Чайтанья (12 января 2014 г.). «Максимализация благосостояния и правдивость в конструкции механизмов с порядковыми предпочтениями» . Материалы 5-й конференции «Инновации в теоретической информатике» . ИТКС '14. Нью-Йорк, штат Нью-Йорк, США: Ассоциация вычислительной техники. стр. 105–120. дои : 10.1145/2554797.2554810 . ISBN  978-1-4503-2698-8 . S2CID   2428592 .
  4. ^ Йоко, М.; Сакурай, Ю.; Мацубара, С. (2004). «Эффект ставок от вымышленных имен на комбинаторных аукционах: новое мошенничество на интернет-аукционах». Игры и экономическое поведение . 46 : 174–188. CiteSeerX   10.1.1.18.6796 . дои : 10.1016/S0899-8256(03)00045-9 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: e7578d1b426f62c310166af9645986bd__1719951540
URL1:https://arc.ask3.ru/arc/aa/e7/bd/e7578d1b426f62c310166af9645986bd.html
Заголовок, (Title) документа по адресу, URL1:
Strategyproofness - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)