Jump to content

Значение Шепли

Ллойд Шепли в 2012 году

Значение Шепли — это концепция решения в теории кооперативных игр . Он был назван в честь Ллойда Шепли , который представил его в 1951 году и получил за него Нобелевскую премию по экономике в 2012 году. [1] [2] Каждой кооперативной игре присваивается уникальное распределение (среди игроков) общего излишка, созданного коалицией всех игроков. Ценность Шепли характеризуется набором желательных свойств. Харт (1989) дает обзор этой темы. [3] [4]

Формальное определение [ править ]

Формально коалиционная игра определяется как:Существует набор N (из n игроков) и функция который сопоставляет подмножества игроков с реальными числами: , с , где обозначает пустое множество. Функция называется характеристической функцией.

Функция имеет следующий смысл: если S — коалиция игроков, то ( S ), называемая ценностью коалиции S , описывает общую ожидаемую сумму выигрышей членов коалиции. можно получить путем сотрудничества.

Значение Шепли — это один из способов распределения общего выигрыша между игроками при условии, что все они сотрудничают. Это «справедливый» дистрибутив в том смысле, что это единственный дистрибутив с определенными желательными свойствами, перечисленными ниже. Согласно значению Шепли, [5] сумма, которую игрок i в коалиционной игре получает является

где n — общее количество игроков, а сумма распространяется на все подмножества S из N, не содержащие игрока i , включая пустой набор. Также обратите внимание, что биномиальный коэффициент . Формулу можно интерпретировать следующим образом: представьте себе, что коалиция формируется по одному актору за раз, причем каждый актор требует своего вклада. в качестве справедливой компенсации, а затем для каждого участника взять среднее значение этого вклада по возможным различным перестановкам , в которых может быть сформирована коалиция.

Альтернативная эквивалентная формула для значения Шепли:

где сумма колеблется по всем заказы игроков и это набор игроков в которые предшествуют в порядке . Наконец, это также можно выразить как

который можно интерпретировать как

С точки зрения синергии [ править ]

Из характеристической функции можно подсчитать синергию , которую обеспечивает каждая группа игроков. Синергия – уникальная функция , такой, что

для любого подмножества игроков. Другими словами, «общая ценность» коалиции происходит в результате суммирования синергии каждого возможного подмножества .

Дана характеристическая функция , функция синергии рассчитывается через

используя принцип исключения включения . Другими словами, синергия коалиции это ценность , что еще не учтено его подмножествами.

Значения Шепли выражаются через функцию синергии следующим образом: [6] [7]

где сумма ведется по всем подмножествам из включая игрока .

Это можно интерпретировать как

Другими словами, синергия каждой коалиции делится поровну между всеми ее членами.

Примеры [ править ]

Бизнес-пример [ править ]

Рассмотрим упрощенное описание бизнеса. Владелец, o , обеспечивает важнейший капитал в том смысле, что без него невозможно получить никакую прибыль. Имеется m рабочих w 1 ,..., w m , каждый из которых вносит сумму p в общую прибыль. Позволять

Функция цены для этой коалиционной игры равна

Вычисление значения Шепли для этой коалиционной игры приводит к значению мп / 2 для владельца и п / 2 на каждого из m работников.

Это можно понять с точки зрения синергии. Функция синергии является

поэтому единственные коалиции, которые создают синергию, — это коалиции один на один между владельцем и любым отдельным работником.

Используя приведенную выше формулу для значения Шепли в терминах мы вычисляем

и

Результат также можно понять с точки зрения усреднения по всем ордерам. Данный рабочий присоединяется к коалиции после того, как владелец (и, следовательно, вносит p ) в половину заказов и, таким образом, вносит средний вклад в размере при присоединении. Когда владелец присоединяется, в среднем половина работников уже присоединилась, поэтому средний вклад владельца при присоединении составляет .

Игра в перчатках [ править ]

Игра в перчатках — это коалиционная игра, в которой у игроков есть перчатки на левую и правую руку, и цель — сформировать пары. Позволять

где у игроков 1 и 2 перчатки для правой руки, а у игрока 3 — перчатка для левой руки.

Функция цены для этой коалиционной игры равна

Формула для расчета значения Шепли:

где R — порядок игроков и — это набор игроков из N которые предшествуют i в порядке R. ,

В следующей таблице показаны предельные вклады Игрока 1.

Наблюдать

С помощью аргумента симметрии можно показать, что

По аксиоме эффективности сумма всех значений Шепли равна 1, что означает, что

Свойства [ править ]

Значение Шепли имеет множество полезных свойств.Примечательно, что это единственное правило оплаты, удовлетворяющее четырем свойствам: эффективность, симметрия, линейность и нулевой игрок. [8] Видеть [9] : 147–156  для получения дополнительных характеристик значения Шепли.

Эффективность [ править ]

Сумма значений Шепли всех агентов равна стоимости большой коалиции, так что весь выигрыш распределяется между агентами:

Доказательство :

с является телескопической суммой и существует |N|! разные порядки R .

Симметрия [ править ]

Если и два действующих лица эквивалентны в том смысле, что

для каждого подмножества из который не содержит ни ни , затем .

Это свойство также называется равным обращением с равными .

Линейность [ править ]

Если две коалиционные игры описываются функциями выигрыша и объединяются, то распределенные выигрыши должны соответствовать выигрышам, полученным из и выгоды, полученные от :

для каждого в . Также для любого действительного числа ,

для каждого в .

Нулевой игрок [ править ]

Значение Шепли нулевого игрока в игре равен нулю. Игрок является нулевым в если для всех коалиций которые не содержат .

Автономный тест [ править ]

Если является субаддитивной функцией множества , т. е. , то для каждого агента : .

Аналогично, если является супераддитивной функцией множества , т. е. , то для каждого агента : .

Таким образом, если сотрудничество имеет положительные внешние эффекты, все агенты (слабо) выигрывают, а если оно имеет отрицательные внешние эффекты, все агенты (слабо) проигрывают. [9] : 147–156 

Анонимность [ править ]

Если и два агента и представляет собой функцию усиления, идентичную разве что роли и были обменены, то . Это означает, что маркировка агентов не играет роли в распределении их доходов.

Маржинализм [ править ]

Значение Шепли можно определить как функцию, которая использует только предельные вклады игрока. в качестве аргументов.

Значение Ауманна-Шепли [ править ]

В своей книге 1974 года Ллойд Шепли и Роберт Ауманн расширили концепцию значения Шепли на бесконечные игры (определенные относительно неатомной меры ), создав диагональную формулу. [10] Позже это было расширено Жаном-Франсуа Мертенсом и Авраамом Нейманом .

Как видно выше, ценность игры для n человек связывает с каждым игроком ожидание его вклада в ценность коалиции или игроков перед ним в случайном порядке всех игроков. Когда игроков много и каждый человек играет лишь второстепенную роль, набор всех игроков, предшествующих данному, эвристически рассматривается как хорошая выборка игроков, так что ценность данного бесконечно малого игрока колеблется вокруг «его» вклада в ценность «идеальной» выборки всех игроков.

Символически, если v — функция ценности коалиции, связывающая каждую коалицию c с измеренным подмножеством измеримого множества I, которое можно представить как без потери общности.

где обозначает значение Шепли бесконечно малого игрока ds в игре, tI представляет собой идеальный образец набора всех игроков I, содержащего долю t всех игроков, и — коалиция, полученная после ds присоединения к tI . Это эвристическая форма диагональной формулы .

Предполагая некоторую регулярность функции ценности, например, предполагая, что v можно представить как дифференцируемую функцию неатомарной меры на I , µ , с функцией плотности , с ( характеристическая функция c ). В таких условиях

,

как можно показать, аппроксимировав плотность ступенчатой ​​функцией и сохранив пропорцию t для каждого уровня функции плотности, и

Тогда диагональная формула имеет форму, разработанную Ауманном и Шепли (1974):

Выше µ может иметь векторное значение (пока функция определена и дифференцируема в диапазоне µ , приведенная выше формула имеет смысл).

В приведенном выше рассуждении, если мера содержит атомы уже не соответствует действительности — вот почему диагональная формула в основном применима к неатомным играм.

Для расширения этой диагональной формулы были использованы два подхода, когда функция f больше не является дифференцируемой. Мертенс возвращается к исходной формуле и берет производную после интеграла, тем самым получая выгоду от эффекта сглаживания. Нейман придерживался другого подхода. Возвращаясь к элементарному применению подхода Мертенса от Мертенса (1980): [11]

Это работает, например, для большинства игр, хотя исходную диагональную формулу нельзя использовать напрямую. Как Мертенс расширяет это далее, определяя симметрии, для которых значение Шепли должно быть инвариантным, и усредняя по таким симметриям, чтобы создать дополнительный эффект сглаживания, коммутируя средние значения с операцией производной, как указано выше. [12] Обзор неатомарных ценностей можно найти в Neyman (2002). [13]

на Обобщение коалиции

Значение Шепли присваивает значения только отдельным агентам. Это было обобщено [14] применить к группе агентов C as,

С точки зрения синергетической функции выше это читается [6] [7]

где сумма учитывает все подмножества из которые содержат .

Эта формула предполагает интерпретацию, согласно которой ценность Шепли коалиции следует рассматривать как стандартную ценность Шепли отдельного игрока, если коалиция рассматривается как одиночный игрок.

Ценность игрока для другого игрока [ править ]

Значение Шепли был разложен в [15] в матрицу значений

Каждое значение представляет ценность игрока игроку . Эта матрица удовлетворяет

то есть ценность игрока для всей игры — это сумма их ценности для всех отдельных игроков.

С точки зрения синергии определено выше, это гласит

где сумма учитывает все подмножества из которые содержат и .

Это можно интерпретировать как сумму по всем подмножествам, содержащим игроков. и , где для каждого подмножества ты

  • воспользоваться синергией из этого подмножества
  • разделите его на количество игроков в подмножестве . Интерпретируйте это как игрока прибавочной стоимости. выгоды от этой коалиции
  • далее разделите это на чтобы получить роль игрока значение, присвоенное игроку

Другими словами, ценность синергии каждой коалиции поровну делится между всеми пары игроков в этой коалиции, где генерирует излишек для .

В машинном обучении [ править ]

Значение Шепли обеспечивает принципиальный способ объяснить предсказания нелинейных моделей, распространенных в области машинного обучения . Интерпретируя модель, обученную на наборе признаков, как функцию ценности коалиции игроков, значения Шепли обеспечивают естественный способ вычислить, какие характеристики способствуют прогнозу. [16] или способствовать неопределенности прогноза. [17] Это объединяет несколько других методов, включая локально интерпретируемые модельно-независимые объяснения (LIME), [18] ДипЛИФТ, [19] и послойное распространение релевантности. [20]

См. также [ править ]

Ссылки [ править ]

  1. ^ Шепли, Ллойд С. (21 августа 1951 г.). «Заметки об игре для n человек — II: Ценность игры для n человек» (PDF) . Санта-Моника, Калифорния: Корпорация RAND.
  2. ^ Рот, Элвин Э., изд. (1988). Значение Шепли: Очерки в честь Ллойда С. Шепли . Кембридж: Издательство Кембриджского университета. дои : 10.1017/CBO9780511528446 . ISBN  0-521-36177-Х .
  3. ^ Харт, Сергей (1989). «Ценность Шепли». В Итуэлле, Дж.; Милгейт, М.; Ньюман, П. (ред.). Нью-Пэлгрейв: Теория игр . Нортон. стр. 210–216. дои : 10.1007/978-1-349-20181-5_25 . ISBN  978-0-333-49537-7 .
  4. ^ Харт, Сергей (12 мая 2016 г.). «Библиография кооперативных игр: теория ценности» .
  5. ^ Доказательство уникальности см. Итииси, Тацуро (1983). Теория игр для экономического анализа . Нью-Йорк: Академическая пресса. стр. 118–120. ISBN  0-12-370180-5 .
  6. ^ Jump up to: Перейти обратно: а б Грабиш, Мишель (октябрь 1997 г.). «Альтернативные представления дискретных нечетких мер для принятия решений». Международный журнал неопределенности, нечеткости и систем, основанных на знаниях . 5 (5): 587–607. дои : 10.1142/S0218488597000440 . ISSN   0218-4885 .
  7. ^ Jump up to: Перейти обратно: а б Грабиш, Мишель (1 декабря 1997 г.). «Аддитивные дискретные нечеткие меры k-порядка и их представление». Нечеткие множества и системы . 92 (2): 167–189. дои : 10.1016/S0165-0114(97)00168-1 . ISSN   0165-0114 .
  8. ^ Шепли, Ллойд С. (1953). «Ценность игр для n человек». В Куне, HW; Такер, AW (ред.). Вклад в теорию игр . Анналы математических исследований. Том. 28. Издательство Принстонского университета. стр. 307–317. дои : 10.1515/9781400881970-018 . ISBN  9781400881970 .
  9. ^ Jump up to: Перейти обратно: а б Эрве Мулен (2004). Справедливое разделение и коллективное благосостояние . Кембридж, Массачусетс: MIT Press. ISBN  9780262134231 .
  10. ^ Ауманн, Роберт Дж.; Шепли, Ллойд С. (1974). Ценности неатомных игр . Принстон: Принстонский университет. Нажимать. ISBN  0-691-08103-4 .
  11. ^ Мертенс, Жан-Франсуа (1980). «Ценности и производные». Математика исследования операций . 5 (4): 523–552. дои : 10.1287/moor.5.4.523 . JSTOR   3689325 .
  12. ^ Мертенс, Жан-Франсуа (1988). «Значение Шепли в недифференцируемом случае». Международный журнал теории игр . 17 (1): 1–65. дои : 10.1007/BF01240834 . S2CID   118017018 .
  13. ^ Нейман, А., 2002. Ценность игр с бесконечным количеством игроков, «Справочник по теории игр с экономическими приложениями», «Справочник по теории игр с экономическими приложениями», Elsevier, издание 1, том 3, номер 3, 00. RJ Aumann & С. Харт (ред.). [1]
  14. ^ Грабиш, Мишель; Рубенс, Марк (1999). «Аксиоматический подход к понятию взаимодействия игроков в кооперативных играх». Международный журнал теории игр . 28 (4): 547–565. дои : 10.1007/s001820050125 . S2CID   18033890 .
  15. ^ Хаускен, Кьель; Мор, Матиас (2001). «Ценность игрока в играх с участием n человек» . Социальный выбор и благосостояние . 18 (3): 465–83. дои : 10.1007/s003550000070 . JSTOR   41060209 . S2CID   27089088 .
  16. ^ Лундберг, Скотт М.; Ли, Су-Ин (2017). «Единый подход к интерпретации прогнозов модели» . Достижения в области нейронных систем обработки информации . 30 : 4765–4774. arXiv : 1705.07874 . Проверено 30 января 2021 г.
  17. ^ Уотсон, Дэвид; О'Хара, Джошуа; Налог, Ник; Мадд, Ричард; Гай, Идо (2023). «Объяснение прогнозируемой неопределенности с помощью теоретико-информационного Шепли» (PDF) . Достижения в области нейронных систем обработки информации . 37 . arXiv : 2306.05724 . Проверено 19 декабря 2023 г.
  18. ^ Рибейро, Марко Тулио; Сингх, Самир; Гестрин, Карлос (13 августа 2016 г.). « Почему я должен тебе доверять?» . Материалы 22-й Международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных . Нью-Йорк, штат Нью-Йорк, США: ACM. стр. 1135–1144. дои : 10.1145/2939672.2939778 . ISBN  978-1-4503-4232-2 .
  19. ^ Шрикумар, Аванти; Гринсайд, Пейтон; Кундадже, Аншул (17 июля 2017 г.). «Изучение важных функций посредством распространения различий в активации» . ПМЛР : 3145–3153. ISSN   2640-3498 . Проверено 30 января 2021 г.
  20. ^ Бах, Себастьян; Биндер, Александр; Монтавон, Грегуар; Клаушен, Фредерик; Мюллер, Клаус-Роберт ; Самек, Войцех (10 июля 2015 г.). Суарес, Оскар Дениз (ред.). «О пиксельных объяснениях решений нелинейного классификатора посредством послойного распространения релевантности» . ПЛОС ОДИН . 10 (7). Публичная научная библиотека (PLoS): e0130140. Бибкод : 2015PLoSO..1030140B . дои : 10.1371/journal.pone.0130140 . ISSN   1932-6203 . ПМЦ   4498753 . ПМИД   26161953 .

Дальнейшее чтение [ править ]

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 1c3f6997fa34c1454f62cdd748d99e3b__1716229920
URL1:https://arc.ask3.ru/arc/aa/1c/3b/1c3f6997fa34c1454f62cdd748d99e3b.html
Заголовок, (Title) документа по адресу, URL1:
Shapley value - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)