Значение Шепли

Значение Шепли — это концепция решения в теории кооперативных игр . Он был назван в честь Ллойда Шепли , который представил его в 1951 году и получил за него Нобелевскую премию по экономике в 2012 году. [1] [2] Каждой кооперативной игре присваивается уникальное распределение (среди игроков) общего излишка, созданного коалицией всех игроков. Ценность Шепли характеризуется набором желательных свойств. Харт (1989) дает обзор этой темы. [3] [4]
Формальное определение [ править ]
Формально коалиционная игра определяется как:Существует набор N (из n игроков) и функция который сопоставляет подмножества игроков с реальными числами: , с , где обозначает пустое множество. Функция называется характеристической функцией.
Функция имеет следующий смысл: если S — коалиция игроков, то ( S ), называемая ценностью коалиции S , описывает общую ожидаемую сумму выигрышей членов коалиции. можно получить путем сотрудничества.
Значение Шепли — это один из способов распределения общего выигрыша между игроками при условии, что все они сотрудничают. Это «справедливый» дистрибутив в том смысле, что это единственный дистрибутив с определенными желательными свойствами, перечисленными ниже. Согласно значению Шепли, [5] сумма, которую игрок i в коалиционной игре получает является
где n — общее количество игроков, а сумма распространяется на все подмножества S из N, не содержащие игрока i , включая пустой набор. Также обратите внимание, что – биномиальный коэффициент . Формулу можно интерпретировать следующим образом: представьте себе, что коалиция формируется по одному актору за раз, причем каждый актор требует своего вклада. в качестве справедливой компенсации, а затем для каждого участника взять среднее значение этого вклада по возможным различным перестановкам , в которых может быть сформирована коалиция.
Альтернативная эквивалентная формула для значения Шепли:
где сумма колеблется по всем заказы игроков и это набор игроков в которые предшествуют в порядке . Наконец, это также можно выразить как
который можно интерпретировать как
С точки зрения синергии [ править ]
Из характеристической функции можно подсчитать синергию , которую обеспечивает каждая группа игроков. Синергия – уникальная функция , такой, что
для любого подмножества игроков. Другими словами, «общая ценность» коалиции происходит в результате суммирования синергии каждого возможного подмножества .
Дана характеристическая функция , функция синергии рассчитывается через
используя принцип исключения включения . Другими словами, синергия коалиции это ценность , что еще не учтено его подмножествами.
Значения Шепли выражаются через функцию синергии следующим образом: [6] [7]
где сумма ведется по всем подмножествам из включая игрока .
Это можно интерпретировать как
Другими словами, синергия каждой коалиции делится поровну между всеми ее членами.
Примеры [ править ]
Бизнес-пример [ править ]
Рассмотрим упрощенное описание бизнеса. Владелец, o , обеспечивает важнейший капитал в том смысле, что без него невозможно получить никакую прибыль. Имеется m рабочих w 1 ,..., w m , каждый из которых вносит сумму p в общую прибыль. Позволять
Функция цены для этой коалиционной игры равна
Вычисление значения Шепли для этой коалиционной игры приводит к значению мп / 2 для владельца и п / 2 на каждого из m работников.
Это можно понять с точки зрения синергии. Функция синергии является
поэтому единственные коалиции, которые создают синергию, — это коалиции один на один между владельцем и любым отдельным работником.
Используя приведенную выше формулу для значения Шепли в терминах мы вычисляем
и
Результат также можно понять с точки зрения усреднения по всем ордерам. Данный рабочий присоединяется к коалиции после того, как владелец (и, следовательно, вносит p ) в половину заказов и, таким образом, вносит средний вклад в размере при присоединении. Когда владелец присоединяется, в среднем половина работников уже присоединилась, поэтому средний вклад владельца при присоединении составляет .
Игра в перчатках [ править ]
Игра в перчатках — это коалиционная игра, в которой у игроков есть перчатки на левую и правую руку, и цель — сформировать пары. Позволять
где у игроков 1 и 2 перчатки для правой руки, а у игрока 3 — перчатка для левой руки.
Функция цены для этой коалиционной игры равна
Формула для расчета значения Шепли:
где R — порядок игроков и — это набор игроков из N которые предшествуют i в порядке R. ,
В следующей таблице показаны предельные вклады Игрока 1.
Наблюдать
С помощью аргумента симметрии можно показать, что
По аксиоме эффективности сумма всех значений Шепли равна 1, что означает, что
Свойства [ править ]
Значение Шепли имеет множество полезных свойств.Примечательно, что это единственное правило оплаты, удовлетворяющее четырем свойствам: эффективность, симметрия, линейность и нулевой игрок. [8] Видеть [9] : 147–156 для получения дополнительных характеристик значения Шепли.
Эффективность [ править ]
Сумма значений Шепли всех агентов равна стоимости большой коалиции, так что весь выигрыш распределяется между агентами:
Доказательство :
с является телескопической суммой и существует |N|! разные порядки R .
Симметрия [ править ]
Если и два действующих лица эквивалентны в том смысле, что
для каждого подмножества из который не содержит ни ни , затем .
Это свойство также называется равным обращением с равными .
Линейность [ править ]
Если две коалиционные игры описываются функциями выигрыша и объединяются, то распределенные выигрыши должны соответствовать выигрышам, полученным из и выгоды, полученные от :
для каждого в . Также для любого действительного числа ,
для каждого в .
Нулевой игрок [ править ]
Значение Шепли нулевого игрока в игре равен нулю. Игрок является нулевым в если для всех коалиций которые не содержат .
Автономный тест [ править ]
Если является субаддитивной функцией множества , т. е. , то для каждого агента : .
Аналогично, если является супераддитивной функцией множества , т. е. , то для каждого агента : .
Таким образом, если сотрудничество имеет положительные внешние эффекты, все агенты (слабо) выигрывают, а если оно имеет отрицательные внешние эффекты, все агенты (слабо) проигрывают. [9] : 147–156
Анонимность [ править ]
Если и два агента и представляет собой функцию усиления, идентичную разве что роли и были обменены, то . Это означает, что маркировка агентов не играет роли в распределении их доходов.
Маржинализм [ править ]
Значение Шепли можно определить как функцию, которая использует только предельные вклады игрока. в качестве аргументов.
Значение Ауманна-Шепли [ править ]
В своей книге 1974 года Ллойд Шепли и Роберт Ауманн расширили концепцию значения Шепли на бесконечные игры (определенные относительно неатомной меры ), создав диагональную формулу. [10] Позже это было расширено Жаном-Франсуа Мертенсом и Авраамом Нейманом .
Как видно выше, ценность игры для n человек связывает с каждым игроком ожидание его вклада в ценность коалиции или игроков перед ним в случайном порядке всех игроков. Когда игроков много и каждый человек играет лишь второстепенную роль, набор всех игроков, предшествующих данному, эвристически рассматривается как хорошая выборка игроков, так что ценность данного бесконечно малого игрока колеблется вокруг «его» вклада в ценность «идеальной» выборки всех игроков.
Символически, если v — функция ценности коалиции, связывающая каждую коалицию c с измеренным подмножеством измеримого множества I, которое можно представить как без потери общности.
где обозначает значение Шепли бесконечно малого игрока ds в игре, tI представляет собой идеальный образец набора всех игроков I, содержащего долю t всех игроков, и — коалиция, полученная после ds присоединения к tI . Это эвристическая форма диагональной формулы .
Предполагая некоторую регулярность функции ценности, например, предполагая, что v можно представить как дифференцируемую функцию неатомарной меры на I , µ , с функцией плотности , с ( характеристическая функция c ). В таких условиях
- ,
как можно показать, аппроксимировав плотность ступенчатой функцией и сохранив пропорцию t для каждого уровня функции плотности, и
Тогда диагональная формула имеет форму, разработанную Ауманном и Шепли (1974):
Выше µ может иметь векторное значение (пока функция определена и дифференцируема в диапазоне µ , приведенная выше формула имеет смысл).
В приведенном выше рассуждении, если мера содержит атомы уже не соответствует действительности — вот почему диагональная формула в основном применима к неатомным играм.
Для расширения этой диагональной формулы были использованы два подхода, когда функция f больше не является дифференцируемой. Мертенс возвращается к исходной формуле и берет производную после интеграла, тем самым получая выгоду от эффекта сглаживания. Нейман придерживался другого подхода. Возвращаясь к элементарному применению подхода Мертенса от Мертенса (1980): [11]
Это работает, например, для большинства игр, хотя исходную диагональную формулу нельзя использовать напрямую. Как Мертенс расширяет это далее, определяя симметрии, для которых значение Шепли должно быть инвариантным, и усредняя по таким симметриям, чтобы создать дополнительный эффект сглаживания, коммутируя средние значения с операцией производной, как указано выше. [12] Обзор неатомарных ценностей можно найти в Neyman (2002). [13]
на Обобщение коалиции
Значение Шепли присваивает значения только отдельным агентам. Это было обобщено [14] применить к группе агентов C as,
С точки зрения синергетической функции выше это читается [6] [7]
где сумма учитывает все подмножества из которые содержат .
Эта формула предполагает интерпретацию, согласно которой ценность Шепли коалиции следует рассматривать как стандартную ценность Шепли отдельного игрока, если коалиция рассматривается как одиночный игрок.
Ценность игрока для другого игрока [ править ]
Значение Шепли был разложен в [15] в матрицу значений
Каждое значение представляет ценность игрока игроку . Эта матрица удовлетворяет
то есть ценность игрока для всей игры — это сумма их ценности для всех отдельных игроков.
С точки зрения синергии определено выше, это гласит
где сумма учитывает все подмножества из которые содержат и .
Это можно интерпретировать как сумму по всем подмножествам, содержащим игроков. и , где для каждого подмножества ты
- воспользоваться синергией из этого подмножества
- разделите его на количество игроков в подмножестве . Интерпретируйте это как игрока прибавочной стоимости. выгоды от этой коалиции
- далее разделите это на чтобы получить роль игрока значение, присвоенное игроку
Другими словами, ценность синергии каждой коалиции поровну делится между всеми пары игроков в этой коалиции, где генерирует излишек для .
В машинном обучении [ править ]
Значение Шепли обеспечивает принципиальный способ объяснить предсказания нелинейных моделей, распространенных в области машинного обучения . Интерпретируя модель, обученную на наборе признаков, как функцию ценности коалиции игроков, значения Шепли обеспечивают естественный способ вычислить, какие характеристики способствуют прогнозу. [16] или способствовать неопределенности прогноза. [17] Это объединяет несколько других методов, включая локально интерпретируемые модельно-независимые объяснения (LIME), [18] ДипЛИФТ, [19] и послойное распространение релевантности. [20]
См. также [ править ]
Ссылки [ править ]
- ^ Шепли, Ллойд С. (21 августа 1951 г.). «Заметки об игре для n человек — II: Ценность игры для n человек» (PDF) . Санта-Моника, Калифорния: Корпорация RAND.
- ^ Рот, Элвин Э., изд. (1988). Значение Шепли: Очерки в честь Ллойда С. Шепли . Кембридж: Издательство Кембриджского университета. дои : 10.1017/CBO9780511528446 . ISBN 0-521-36177-Х .
- ^ Харт, Сергей (1989). «Ценность Шепли». В Итуэлле, Дж.; Милгейт, М.; Ньюман, П. (ред.). Нью-Пэлгрейв: Теория игр . Нортон. стр. 210–216. дои : 10.1007/978-1-349-20181-5_25 . ISBN 978-0-333-49537-7 .
- ^ Харт, Сергей (12 мая 2016 г.). «Библиография кооперативных игр: теория ценности» .
- ^ Доказательство уникальности см. Итииси, Тацуро (1983). Теория игр для экономического анализа . Нью-Йорк: Академическая пресса. стр. 118–120. ISBN 0-12-370180-5 .
- ^ Jump up to: Перейти обратно: а б Грабиш, Мишель (октябрь 1997 г.). «Альтернативные представления дискретных нечетких мер для принятия решений». Международный журнал неопределенности, нечеткости и систем, основанных на знаниях . 5 (5): 587–607. дои : 10.1142/S0218488597000440 . ISSN 0218-4885 .
- ^ Jump up to: Перейти обратно: а б Грабиш, Мишель (1 декабря 1997 г.). «Аддитивные дискретные нечеткие меры k-порядка и их представление». Нечеткие множества и системы . 92 (2): 167–189. дои : 10.1016/S0165-0114(97)00168-1 . ISSN 0165-0114 .
- ^ Шепли, Ллойд С. (1953). «Ценность игр для n человек». В Куне, HW; Такер, AW (ред.). Вклад в теорию игр . Анналы математических исследований. Том. 28. Издательство Принстонского университета. стр. 307–317. дои : 10.1515/9781400881970-018 . ISBN 9781400881970 .
- ^ Jump up to: Перейти обратно: а б Эрве Мулен (2004). Справедливое разделение и коллективное благосостояние . Кембридж, Массачусетс: MIT Press. ISBN 9780262134231 .
- ^ Ауманн, Роберт Дж.; Шепли, Ллойд С. (1974). Ценности неатомных игр . Принстон: Принстонский университет. Нажимать. ISBN 0-691-08103-4 .
- ^ Мертенс, Жан-Франсуа (1980). «Ценности и производные». Математика исследования операций . 5 (4): 523–552. дои : 10.1287/moor.5.4.523 . JSTOR 3689325 .
- ^ Мертенс, Жан-Франсуа (1988). «Значение Шепли в недифференцируемом случае». Международный журнал теории игр . 17 (1): 1–65. дои : 10.1007/BF01240834 . S2CID 118017018 .
- ^ Нейман, А., 2002. Ценность игр с бесконечным количеством игроков, «Справочник по теории игр с экономическими приложениями», «Справочник по теории игр с экономическими приложениями», Elsevier, издание 1, том 3, номер 3, 00. RJ Aumann & С. Харт (ред.). [1]
- ^ Грабиш, Мишель; Рубенс, Марк (1999). «Аксиоматический подход к понятию взаимодействия игроков в кооперативных играх». Международный журнал теории игр . 28 (4): 547–565. дои : 10.1007/s001820050125 . S2CID 18033890 .
- ^ Хаускен, Кьель; Мор, Матиас (2001). «Ценность игрока в играх с участием n человек» . Социальный выбор и благосостояние . 18 (3): 465–83. дои : 10.1007/s003550000070 . JSTOR 41060209 . S2CID 27089088 .
- ^ Лундберг, Скотт М.; Ли, Су-Ин (2017). «Единый подход к интерпретации прогнозов модели» . Достижения в области нейронных систем обработки информации . 30 : 4765–4774. arXiv : 1705.07874 . Проверено 30 января 2021 г.
- ^ Уотсон, Дэвид; О'Хара, Джошуа; Налог, Ник; Мадд, Ричард; Гай, Идо (2023). «Объяснение прогнозируемой неопределенности с помощью теоретико-информационного Шепли» (PDF) . Достижения в области нейронных систем обработки информации . 37 . arXiv : 2306.05724 . Проверено 19 декабря 2023 г.
- ^ Рибейро, Марко Тулио; Сингх, Самир; Гестрин, Карлос (13 августа 2016 г.). « Почему я должен тебе доверять?» . Материалы 22-й Международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных . Нью-Йорк, штат Нью-Йорк, США: ACM. стр. 1135–1144. дои : 10.1145/2939672.2939778 . ISBN 978-1-4503-4232-2 .
- ^ Шрикумар, Аванти; Гринсайд, Пейтон; Кундадже, Аншул (17 июля 2017 г.). «Изучение важных функций посредством распространения различий в активации» . ПМЛР : 3145–3153. ISSN 2640-3498 . Проверено 30 января 2021 г.
- ^ Бах, Себастьян; Биндер, Александр; Монтавон, Грегуар; Клаушен, Фредерик; Мюллер, Клаус-Роберт ; Самек, Войцех (10 июля 2015 г.). Суарес, Оскар Дениз (ред.). «О пиксельных объяснениях решений нелинейного классификатора посредством послойного распространения релевантности» . ПЛОС ОДИН . 10 (7). Публичная научная библиотека (PLoS): e0130140. Бибкод : 2015PLoSO..1030140B . дои : 10.1371/journal.pone.0130140 . ISSN 1932-6203 . ПМЦ 4498753 . ПМИД 26161953 .
Дальнейшее чтение [ править ]
- Фридман, Джеймс В. (1986). Теория игр с приложениями к экономике . Нью-Йорк: Издательство Оксфордского университета. стр. 209–215 . ISBN 0-19-503660-3 .