Jump to content

Цена анархии

(Перенаправлено с «Цена анархии »)

Цена анархии ( PoA ) [1] — это концепция в экономике и теории игр , которая измеряет, насколько снижается эффективность системы из-за эгоистичного поведения ее агентов. Это общее понятие, которое можно распространить на различные системы и понятия эффективности. Например, рассмотрим транспортную систему города и множество агентов, пытающихся добраться из некоторого исходного места в пункт назначения. Здесь эффективность означает среднее время, за которое агент доберется до места назначения. В «централизованном» решении центральный орган может указать каждому агенту, какой путь выбрать, чтобы минимизировать среднее время в пути. В «децентрализованной» версии каждый агент выбирает свой путь. Цена анархии измеряет соотношение среднего времени в пути в обоих случаях.

Обычно система моделируется как игра , и эффективность является некоторой функцией результатов (например, максимальная задержка в сети, перегруженность транспортной системы, социальное обеспечение на аукционе и т. д.). Для моделирования эгоистичного поведения агентов можно использовать различные концепции равновесия, среди которых наиболее распространенным является равновесие Нэша . Различные варианты равновесия Нэша приводят к вариациям понятия «Цена анархии» как « Чистая цена анархии» (для детерминированных равновесий), «Смешанная цена анархии» (для рандомизированных равновесий) и «Цена анархии Байеса – Нэша» (для игр с неполной информацией). . Концепции решения, отличные от равновесия Нэша, приводят к таким вариациям, как цена погружения . [2]

Термин «Цена анархии» впервые был использован Элиасом Куцупиасом и Христосом Пападимитриу . [1] [3] но идея измерения неэффективности равновесия старше. [4] Концепция в ее нынешней форме была разработана как аналог «коэффициента аппроксимации» в алгоритме аппроксимации или «коэффициента конкуренции» в онлайн-алгоритме . Это в контексте современной тенденции анализа игр с использованием алгоритмических линз ( алгоритмическая теория игр ).

Математическое определение

[ редактировать ]

Рассмотрим игру , определяемый набором игроков , наборы стратегий за каждого игрока и утилиты (где также называемый набором результатов). Мы можем определить меру эффективности каждого результата, которую мы называем функцией благосостояния. . Естественные кандидаты включают сумму полезностей игроков (утилитарная цель). минимальная полезность (справедливость или эгалитарная цель) ... или любую функцию, которая имеет значение для конкретной анализируемой игры и которую желательно максимизировать.

Мы можем определить подмножество быть множеством стратегий, находящихся в равновесии (например, множеством равновесий Нэша ). Цена анархии тогда определяется как соотношение между оптимальным «централизованным» решением и «худшим равновесием»:

Если вместо «благосостояния», которое мы хотим «максимизировать», функция, измеряющая эффективность, является «функцией затрат». который мы хотим «минимизировать» (например, задержку в сети), мы используем (следуя соглашению в алгоритмах аппроксимации):

С этим связано понятие « Цена стабильности» ( PoS ), которая измеряет соотношение между оптимальным «централизованным» решением и «наилучшим равновесием»:

или в случае функций стоимости:

Мы знаем, что по определению. Ожидается, что потеря эффективности из-за ограничений теории игр находится где-то между «PoS» и «PoA».

Дилемма заключенного

[ редактировать ]

Рассмотрим игру 2х2, называемую «дилеммой заключенного» , заданную следующей матрицей затрат:

Сотрудничать Дефект
Сотрудничать 1 , 1 7 , 0
Дефект 0 , 7 5 , 5

и пусть функция стоимости будет Наихудшее (и единственное) равновесие Нэша будет тогда, когда оба игрока откажутся от участия, а результирующая цена будет равна . Однако наивысшее социальное благосостояние достигается тогда, когда оба сотрудничают, и в этом случае затраты равны. . Таким образом, PoA этой игры будет .

Поскольку в игре существует уникальное равновесие Нэша, PoS равно PoA и тоже равно 5.

Планирование работы

[ редактировать ]

Более естественный пример – планирование работы . Есть игроков, и у каждого из них есть задание, которое нужно выполнить. Они могут выбрать один из машины для выполнения работы. «Цена анархии» сравнивает ситуацию, когда выбор машин осуществляется централизованно, с ситуацией, когда каждый игрок выбирает машину, которая будет выполнять его работу быстрее всего.

Каждая машина имеет скорость Каждая работа имеет вес Игрок выбирает машину, на которой будет выполнять свою работу. Итак, стратегии каждого игрока Определить нагрузку на машину быть:

Стоимость для игрока является т.е. нагрузку машины они выбрали. Мы рассматриваем эгалитарную функцию издержек , здесь называется makepan .

Мы рассматриваем две концепции равновесия: чистый Нэш и смешанный Нэш . Должно быть ясно, что смешанное PoA ≥ чистое PoA, поскольку любое чистое равновесие Нэша также является смешанным равновесием Нэша (это неравенство может быть строгим: например, когда , , , и , смешанные стратегии достичь среднего времени выполнения 1,5, в то время как любой чисто стратегический PoA в этих условиях ). Сначала нам нужно доказать, что существуют чистые равновесия по Нэшу.

Требовать . Для каждой игры по планированию работ существует по крайней мере одно равновесие Нэша в чистой стратегии.

Доказательство . Мы хотели бы принять социально оптимальный профиль действий. . Это будет означать просто профиль действия с минимальным периодом выполнения. Однако этого будет недостаточно. Таких профилей действий может быть несколько, что приводит к множеству различных распределений нагрузок (все они имеют одинаковую максимальную нагрузку). Среди них мы далее ограничимся тем, который имеет минимальную вторую по величине нагрузку. Опять же, это приводит к набору возможных распределений нагрузки, и мы повторяем до тех пор, пока th-наибольшая (т.е. наименьшая) нагрузка, при которой может быть только одно распределение нагрузок (уникальное с точностью до перестановки). Его также можно было бы назвать лексикографическим наименьшим отсортированным вектором нагрузки.

Мы утверждаем, что это чисто стратегическое равновесие Нэша. Рассуждая от противного, предположим, что некоторый игрок можно было бы улучшить, перейдя с машины обрабатывать . Это означает, что повышенная нагрузка на машину после переезда все еще меньше, чем загрузка машины перед переездом. По мере загрузки машины должно уменьшиться в результате перемещения и никакая другая машина не будет затронута, это означает, что новая конфигурация гарантированно уменьшит th-наибольшая (или более высокая) нагрузка в распределении. Однако это нарушает предполагаемую лексикографическую минимальность . КЭД

Требовать . Для каждой игры по планированию заданий чистый PoA не превышает .

Доказательство . Легко оценить сверху благосостояние, полученное при любом равновесии Нэша смешанной стратегии. к

Для ясности изложения рассмотрим любой чисто стратегический профиль действий. : четко

Поскольку сказанное справедливо и для социального оптимума, сравнивая соотношения и доказывает утверждение. КЭД

Эгоистичная маршрутизация

[ редактировать ]

Парадокс Брасса

[ редактировать ]

Рассмотрим дорожную сеть, показанную на диаграмме рядом, по которой 4000 водителей желают проехать от точки начала до конца. Время в пути в минутах на дороге Старт-А представляет собой число пассажиров (Т), деленное на 100, а на дороге Старт-Б - постоянные 45 минут (аналогично и с дорогами напротив них). Если пунктирная дорога не существует (всего в дорожной сети 4 дороги), время, необходимое для проезда по маршруту Начало–А–Конец с водители были бы . Время, необходимое для проезда по маршруту Начало–Б–Конец с водители были бы . Поскольку имеется 4000 водителей, тот факт, что можно использовать для вывода того факта, что когда система находится в равновесии. Таким образом, каждый маршрут занимает минут. Если бы любой маршрут занимал меньше времени, это не было бы равновесием Нэша: рациональный водитель переключился бы с более длинного маршрута на более короткий.

Теперь предположим, что пунктирная линия A–B представляет собой дорогу с чрезвычайно коротким временем в пути, примерно 0 минут. Предположим, что дорога открыта и один водитель пытается начать-А-Б-Конец. К своему удивлению, он обнаруживает, что его время истекло. минут, экономия почти 25 минут. Вскоре еще больше из 4000 водителей опробуют этот новый маршрут. Затраченное время увеличивается с 40.01 и продолжает расти. Когда количество водителей, пробующих новый маршрут, достигнет 2500, а 1500 все еще будут на маршруте Начало-Б-Конец, их время будет равно минут, что не является улучшением по сравнению с исходным маршрутом. Между тем, эти 1500 водителей замедлились до минут, увеличение на 20 минут. Они также вынуждены перейти на новый маршрут через А, поэтому теперь требуется минут. Ни у кого нет стимула ехать А-Конец или Старт-Б, потому что любому водителю потребуется 85 минут. Таким образом, открытие перекрестного маршрута вызывает необратимое изменение его всеми, что обходится каждому в 80 минут вместо первоначальных 65. Если бы каждый водитель согласился не использовать путь A–B или если бы этот маршрут был закрыт, каждый водитель выиграет от сокращения времени в пути на 15 минут.

Обобщенная проблема маршрутизации

[ редактировать ]

Проблема маршрутизации, представленная в парадоксе Брасса, может быть обобщена на множество различных потоков, пересекающих один и тот же граф одновременно.

Определение (Обобщенный поток) . Позволять , и быть таким, как определено выше, и предположим, что мы хотим направить количества через каждую отдельную пару узлов в . Поток определяется как задание действительного неотрицательного числа для каждого пути иду от к , с ограничением, что

Поток, пересекающий определенный край определяется как

Для краткости напишем когда ясны из контекста.

Определение (равновесное по Нэшу течение) . Поток представляет собой равновесный по Нэшу поток тогда и только тогда, когда и от к

Это определение тесно связано с тем, что мы говорили о поддержке равновесий Нэша смешанной стратегии в играх нормальной формы.

Определение (Условное благополучие потока) . Позволять и быть два потока в связанные с одними и теми же наборами и . В дальнейшем мы будем опускать индекс, чтобы сделать обозначения более понятными. Предположим, что мы исправили задержки, вызванные на графике: благосостояние условное относительно определяется как

Факт 1 . Учитывая равновесный по Нэшу поток и любой другой поток , .

Доказательство (от противного) . Предположим, что . По определению,

.

С и связаны с одними и теми же множествами , мы это знаем

Следовательно, должна быть пара и два пути от к такой, что , , и

Другими словами, поток может достичь более низкого благосостояния, чем только если есть два пути из к имеющие разные затраты, и если перенаправляет некоторый поток от пути с более высокими затратами к пути с более низкими затратами. Эта ситуация явно несовместима с предположением, что представляет собой равновесный по Нэшу поток. КЭД

Обратите внимание, что факт 1 не предполагает какой-либо конкретной структуры на множестве .

Факт 2 . Даны любые два действительных числа и , .

Доказательство . Это еще один способ выразить истинное неравенство . КЭД

Теорема . Чистый PoA любой обобщенной задачи маршрутизации с линейными задержками .

Доказательство . Заметим, что эта теорема эквивалентна утверждению, что для каждого равновесного по Нэшу потока , , где это любой другой поток. По определению,

Используя факт 2, мы имеем, что

с

Мы можем заключить, что , и докажем утверждение, используя факт 1. КЭД

Заметим, что в доказательстве мы широко использовали предположение о том, что функции из линейны. На самом деле имеет место более общий факт.

Теорема . Учитывая обобщенную задачу маршрутизации с графом и полиномиальные латентные функции степени с неотрицательными коэффициентами чистый PoA равен .

Обратите внимание, что PoA может расти с . Рассмотрим пример, показанный на следующем рисунке, где мы предполагаем единичный поток: равновесные по Нэшу потоки имеют социальное благосостояние 1; однако наилучшее благополучие достигается тогда, когда , в этом случае

Эта величина стремится к нулю, когда стремится к бесконечности.

Дальнейшие результаты

[ редактировать ]

Верхние границы PoA можно получить, если показать, что игра удовлетворяет так называемому неравенству гладкости . Точнее, игра по минимизации затрат является ( λ , µ )-гладкой (с λ ≥ 0 и µ < 1), если выполнено неравенство

справедливо для любого исхода a и a *. В этом случае PoA ограничено сверху величиной λ /(1 − µ ). [5]

Для игр с разделением затрат с вогнутыми функциями затрат оптимальным правилом распределения затрат, которое оптимизирует цену анархии , за которой следует цена стабильности , является именно правило распределения затрат по ценности Шепли. [6] (Утверждение о симметрии аналогично справедливо и для игр с разделением полезности с выпуклыми функциями полезности.) При проектировании механизмов это означает, что концепция решения ценности Шепли оптимальна для этих наборов игр.

Более того, для этих (конечных) игр было доказано, что любое равновесие, достигающее границы РоА, является хрупким в том смысле, что агенты демонстрируют состояние безразличия между своим равновесным действием и действием, которое они будут осуществлять с оптимальным для системы результатом. [7]

См. также

[ редактировать ]
  1. ^ Jump up to: а б Куцупиас, Элиас; Пападимитриу, Христос (май 2009 г.). «Наихудшее равновесие» . Обзор компьютерных наук . 3 (2): 65–69. дои : 10.1016/j.cosrev.2009.04.003 . Архивировано из оригинала 13 марта 2016 г. Проверено 12 сентября 2010 г.
  2. ^ М. Гоеманс, В. Миррокни, А. Ветта, Равновесия и конвергенция стока , FOCS 05
  3. ^ Чанг, Кристина; Лигетт, Катрина; Прус, Кирк; Рот, Аарон (2008), Моньен, Буркхард; Шредер, Ульф-Петер (ред.), «Цена стохастической анархии» , Алгоритмическая теория игр , том. 4997, Берлин, Гейдельберг: Springer Berlin Heidelberg, стр. 303–314, doi : 10.1007/978-3-540-79309-0_27 , ISBN  978-3-540-79308-3 , получено 29 декабря 2023 г.
  4. ^ П. Дубей. Неэффективность равновесий Нэша. Математика. Оперировать. Рез., 11(1):1–8, 1986 г.
  5. ^ Рафгарден, Тим (2 ноября 2015 г.). «Внутренняя устойчивость цены анархии» . Журнал АКМ . 62 (5): 1–42. дои : 10.1145/2806883 . ISSN   0004-5411 .
  6. ^ Филлипс, Мэтью; Марден, Джейсон Р. (июль 2018 г.). «Компромиссы в проектировании в вогнутых играх с разделением затрат». Транзакции IEEE при автоматическом управлении . 63 (7): 2242–2247. дои : 10.1109/tac.2017.2765299 . ISSN   0018-9286 . S2CID   45923961 .
  7. ^ Ситон, Джошуа Х.; Браун, Филип Н. (2023). «О внутренней хрупкости цены анархии» . Письма о системах управления IEEE . 7 : 3573–3578. дои : 10.1109/LCSYS.2023.3335315 . ISSN   2475-1456 .

Дальнейшее чтение

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 9c8e2bf44ac5b089c2f82ff4d7aea095__1718823840
URL1:https://arc.ask3.ru/arc/aa/9c/95/9c8e2bf44ac5b089c2f82ff4d7aea095.html
Заголовок, (Title) документа по адресу, URL1:
Price of anarchy - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)