Jump to content

Теория некооперативных игр

(Перенаправлено из Некооперативной игры )

Некооперативная игра — это форма игры, рассматриваемая в теории игр . Некооперативные игры используются в ситуациях, когда между участниками игры существует конкуренция. В этой модели нет внешних правил, которые обеспечивают сотрудничество игроков, поэтому ее обычно используют для моделирования конкурентной среды. Об этом говорится в различных отчетах, наиболее известным из которых является статья Джона Нэша . [1]

При этом по этому поводу можно привести множество аргументов, поскольку десятилетия исследований показали, что модели некооперативных игр также могут использоваться для демонстрации сотрудничества, и наоборот, модель кооперативной игры используется для демонстрации конкуренции.

Некоторыми примерами этого может быть использование модели отказа от сотрудничества при определении стабильности и устойчивости картелей и коалиций. [2] [3]

Игры с ненулевой суммой и игры с нулевой суммой являются типами некооперативных игр. [4]

Некооперативная теория игр в академической литературе [ править ]

Ссылаясь на вышеупомянутую статью Джона Нэша 1951 года в журнале Annals of Mathematics . Равновесие Нэша , теория некооперативных игр, по сути, часто называют «некооперативным равновесием». [5]

Согласно Тамеру Башару в конспектах лекций по теории некооперативных игр , некооперативная игра требует указания:

  1. количество игроков;
  2. возможные действия, доступные каждому игроку, и любые ограничения, которые могут на него налагаться;
  3. целевая функция каждого игрока, которую он или она пытается оптимизировать;
  4. любое время очередности выполнения действий, если игрокам разрешено действовать более одного раза;
  5. любое получение информации, которое происходит, и то, как информация, доступная игроку в каждый момент времени, зависит от прошлых действий других игроков;
  6. существует ли игрок (природа), действие которого является исходом вероятностного события с фиксированным (известным) распределением. [6]
  7. Полезность каждого игрока для всего профиля действий.

Предположения [ править ]

  1. Идеальная память : каждый игрок помнит свои решения и известную информацию. [7]
  2. Собственный интерес : каждый игрок не учитывает влияние действий на других, а только на свой собственный. [7]
  3. Рациональность : каждый игрок заинтересован в максимизации своей полезности или выигрыша. [8] [9]
  4. Полная информация : каждый игрок знает предпочтения и стратегии других игроков. [8]
  5. Каждый игрок одинаково понимает суть игры. [8]

Создание некооперативной игры (базовая игра) [ править ]

Чтобы понять использование модели некооперативной игры, мы должны сначала понять, как создать некооперативную игру.

Ниже будут представлены требования для создания базовой игры без сотрудничества, чтобы способствовать базовому пониманию модели.

Во-первых, следуя вышеупомянутым требованиям, нам нужно знать, сколько игроков. Для простоты объяснения пусть число игроков равно n. В игре для двух или трех игроков все еще относительно легко представить игру в виде матрицы. Однако по мере увеличения количества игроков это становится значительно сложнее и отнимает больше времени. Таким образом, мы представляем это в виде математических уравнений.

Поэтому набор Player будет выглядеть так: {1,....., n }.

Во-вторых, Нам необходимо определить возможные действия, которые может предпринять каждый из игроков. Для простоты объяснения обозначим множество действий игрока как X

Поэтому действие игрока, заданного игроком, будет выглядеть так { X 1,....., X n }.

Наконец, нам нужно будет определить полезность игрока для каждого профиля действий. Для этого критерия не существует фиксированной методологии, поскольку полезность каждого игрока определяется предполагаемыми выгодами от результата. Однако теоретически мы обычно присваиваем ценность полезности игрока, чтобы иметь возможность определить рациональное решение каждого игрока и предпочтительный результат. Это отличается от ожидаемой полезности , которая рассматривается при решении игры. [1] [6] [10]

Вы можете обратиться к списку распространенных примеров ниже, чтобы увидеть, как эти шаги создают неконкурентную игру.

Анализ [ править ]

Некооперативные игры обычно анализируются с помощью теории некооперативных игр, которая пытается предсказать индивидуальные стратегии и выигрыши игроков, а также найти равновесие Нэша. [11] [12] Эта структура часто требует детальных знаний о возможных действиях и уровнях информации каждого игрока. [13] Она противоположна теории кооперативных игр , которая фокусируется на предсказании того, какие группы игроков («коалиции») сформируются, совместные действия, которые эти группы предпримут, и возникающие в результате коллективные выплаты. Теория кооперативных игр не анализирует стратегические переговоры, которые происходят внутри каждой коалиции и влияют на распределение коллективного выигрыша между ее участниками. Далее, в отличие от теории кооперативных игр , предполагается, что участвующие игроки заранее знают об игре, в которой они участвуют, из-за встроенных обязательств. [14]

Некооперативная теория игр обеспечивает низкоуровневый подход, поскольку она моделирует все процедурные детали игры, тогда как кооперативная теория игр описывает только структуру, стратегии и выигрыши коалиций. Поэтому кооперативную теорию игр называют коалиционной , а некооперативную — процедурной . [13] Некооперативная теория игр в этом смысле более инклюзивна, чем кооперативная теория игр.

Это также более общий подход, поскольку кооперативные игры можно анализировать с использованием терминов некооперативной теории игр, где арбитраж доступен для обеспечения соблюдения соглашения, это соглашение выходит за рамки некооперативной теории: но можно утверждать, что достаточно предположения, охватывающие все возможные стратегии, которые могут принять игроки в отношении арбитража. Это приведет соглашение в рамки некооперативной теории. В качестве альтернативы можно описать арбитра как сторону соглашения и соответствующим образом смоделировать соответствующие процессы и выплаты.

Соответственно, было бы желательно, чтобы все игры были реализованы в рамках некооперативной структуры. Однако во многих случаях недостаточно информации для точного моделирования формальных процедур, доступных игрокам в процессе стратегических переговоров; или полученная модель будет слишком сложной, чтобы ее можно было использовать в реальном мире. В таких случаях теория кооперативных игр предлагает упрощенный подход, который позволяет анализировать игру в целом без каких-либо предположений о переговорных силах.

Кроме того, мы также должны рассмотреть ограничения, которые может иметь некооперативная модель. Мы можем получить более ясную картину, взглянув на список предположений, изложенных выше. Как уже упоминалось, существует множество сценариев, в которых идеальная симметрия информации невозможна, что приводит к ошибкам в процессе принятия решений. [15]

Во-вторых, можно оспорить предположение о корыстных интересах и рациональности. Приводятся аргументы в пользу того, что рациональность может привести к тому, что предположение о личной заинтересованности окажется недействительным, и наоборот. Одним из таких примеров может быть снижение прибыли и выручки в попытках вытеснить конкурентов в борьбе за более высокую долю рынка. Таким образом, это не соответствует обоим предположениям, поскольку игрок больше озабочен падением своего противника, чем максимизацией своей прибыли. Можно утверждать, что, хотя это математически обосновано и осуществимо, это не обязательно лучший метод рассмотрения реальных экономических проблем, которые являются более сложными по своей природе. [15]

Примеры [ править ]

Стратегические игры также являются формой некооперативной теории игр, в которой перечислены только доступные стратегии и комбинации вариантов для получения результатов.

Камень-ножницы-бумага [ править ]

Самый простой пример – игра «камень-ножницы-бумага» . В игре «камень-ножницы-бумага» между двумя игроками нет возможности сотрудничества: если игрок 1 решает играть в «камень», то в интересах игрока 2 играть в «бумагу»; если Игрок 2 решает играть в «бумагу», то в интересах Игрока 1 сыграть в «ножницы»; и если Игрок 1 играет в «ножницы», Игрок 2 в своих интересах будет играть в «Камень». Предпочтения игроков цикличны, и кооперативный результат не достигается. Это не соответствует свойству транзитивного предпочтения.

крадут сладости Двое детей

Предположим, владелец магазина поймал двоих детей за кражу сладостей. Двое детей по отдельности разговаривали с владельцем магазина в офисе магазина. В этом случае у детей есть только два выхода: промолчать (ни один ребенок в этом не признается) или сказать, что сверстники украли сладости. Если один ребенок признается, что украл сладости, а другой нет, сознавшийся ребенок получит предупреждение, а другой ребенок будет наказан на четыре недели. Если оба ребенка признаются в краже сладостей, они оба получат двухнедельное наказание. Если они оба будут это отрицать, то оба ребенка будут наказаны на три недели. Один ребенок должен полагаться на мнение другого ребенка, чтобы избежать незначительного наказания. Связь между ними заключается в том, что теория игр обычно рассматривает то, как отдельные лица или группы делают выбор, который повлияет на другие стороны.

Двое детей за кражу сладостей
Ребенок А/ Ребенок Б Признание Непризнание
Признание -2, -2 0, -4
Непризнание -4, 0 -3, -3

Первой мыслью обоих детей, должно быть, были их интересы, но это привело бы к самому суровому наказанию для обоих. Лучший вариант для них — и признать, и наказать на две недели. Таким образом, это равновесие Нэша, также называемое некооперативным равновесием.

Дилемма заключенного [ править ]

Стандартная игра «Дилемма заключенного».

Игра «Дилемма узника» еще один известный пример игры без сотрудничества. В игре участвуют два игрока или обвиняемые, которых держат в разных комнатах и ​​поэтому они не могут общаться. Игроки должны самостоятельно решить, сотрудничать ли с другим игроком или предать его и признаться перед правоохранительными органами. Как показано на диаграмме, оба игрока получат более высокий выигрыш в виде более мягкого тюремного заключения, если они оба промолчат. Если оба сознаются, они получают меньшую награду в виде более строгого тюремного заключения. Если один игрок сознается, а другой хранит молчание и сотрудничает, исповедник получит более высокий выигрыш, а молчаливый игрок получит меньший выигрыш, чем если бы оба игрока сотрудничали друг с другом.

Таким образом, равновесие Нэша заключается в том, что игроки оба предают друг друга, когда игроки больше защищаются от наказания.

Игра «Битва полов» [ править ]

В игре участвуют два игрока, мальчик и девочка, которые решают пойти на свидание на футбольный матч или в оперу, что соответственно представляет собой предпочтительное занятие для мальчика и девочки (т. е. мальчик предпочитает футбольный матч, а девочка предпочитает оперу). [16] Этот пример представляет собой некооперативную игру с ненулевой суммой (TNNC) для двух человек с противоположными выигрышами или конфликтующими предпочтениями. [16] Поскольку существует два равновесия Нэша, этот случай представляет собой чистую координационную задачу без возможности уточнения или выбора. [8] Таким образом, два игрока будут пытаться максимизировать свой выигрыш или пожертвовать собой ради другого, но эта стратегия без координации приведет к двум исходам с еще худшими выигрышами для обоих, если у них возникнут разногласия по поводу того, что делать на свидании.

Игра Битва полов
Мальчик/Девочка Футбол Опера
Футбол (2, 1) (-1, -1)
Опера (-1, -1) (1, 2)

Игра «Сопоставление монет» [ править ]

Эта игра представляет собой игру двух человек с нулевой суммой. Чтобы сыграть в эту игру, каждому из игроков нужно будет дать по честному двустороннему пенни. Чтобы начать игру, каждый из игроков выбирает, подбросить ли свою монету орлом или решкой. Это действие должно быть выполнено в тайне, и не должно быть никаких попыток расследовать выбор другого игрока. После того, как оба игрока подтвердят свои решения, они одновременно раскроют свой выбор. На этом завершаются действия, предпринятые игроками для определения результата. [10]

Условия победы в этой игре различны для обоих игроков. Для простоты объяснения давайте обозначим игроков как Игрок 1 и Игрок 2. Чтобы Игрок 1 выиграл, грани монет должны совпадать (это означает, что они оба должны быть орлом или решкой). Чтобы игрок 2 выиграл, грани монет должны быть разными (это означает, что они должны быть в виде комбинации орла и решки). [10]

Выигрыш/приз в этой игре — получение пенни проигравшего в дополнение к вашему собственному.

Следовательно, матрица выигрышей будет выглядеть так:

Игрок1 \ Игрок 2 Руководители Решка
Руководители 1, -1 -1, 1
Решка -1, 1 1, -1

Глядя на эту матрицу, мы можем сделать несколько основных выводов. [10]

  1. В любом сценарии есть проигравший и победитель.
  2. Это игра с нулевой суммой, в которой выплата победителю равна проигрышу проигравшего.
  3. Равновесия Нэша в чистой стратегии не существует.

Более подробное и всестороннее лечение можно найти в основной статье.

некооперативной теорией Разница между кооперативной и игр

Существует различие между теорией кооперативных игр и теорией некооперативных игр, которое следует за утверждением Нэша: «Эта теория (кооперативных игр) основана на анализе взаимосвязей различных коалиций, которые могут быть сформированы участниками игры. Наша теория (некооперативной игры), напротив, основана на отсутствии коалиций, поскольку предполагается, что каждый участник действует независимо, без сотрудничества или общения с кем-либо из других». [17]

Некооперативная теория игр моделирует различные ситуации, в которых агенты не могут найти решение конфликта, вынуждающего действовать друг против друга. [18] [7] Эта форма теории игр уделяет пристальное внимание участвующим людям и их рациональному принятию решений. [13] В каждом случае есть победители и проигравшие, и тем не менее, агенты могут оказаться с худшими по Парето результатами, когда каждый агент оказывается в худшем положении, и существует потенциальный результат для каждого агента, который будет лучше. [19] Агенты будут иметь возможность предсказывать, что будут делать их противники. Теория кооперативных игр моделирует ситуации, в которых возможно обязательное соглашение. Другими словами, теория кооперативных игр предполагает, что агенты сотрудничают для достижения общей цели, и их не обязательно называть командой, поскольку правильный термин — коалиция. У каждого агента есть свои навыки или вклад, которые придают коалиции силу. [20]

Кроме того, предполагалось, что теория некооперативных игр предназначена для анализа влияния независимых решений на общество в целом. [21] Для сравнения, теория кооперативных игр фокусируется только на эффектах участников определенной коалиции, когда коалиция пытается улучшить коллективное благосостояние. [21]

Многие результаты или решения, предложенные агентами, участвующими в теории игр, важны для понимания соперничества между этими агентами в ряде стратегических условий. [18]

Решения [ править ]

Решения в некооперативных играх аналогичны всем другим играм в теории игр, но без обязательных соглашений, налагаемых внешней властью. Решения обычно основаны на концепции равновесия Нэша , и эти решения достигаются с использованием методов, перечисленных в разделе «Концепция решения» . Большинство решений, используемых в некооперативной игре, представляют собой усовершенствования, разработанные на основе равновесия Нэша , включая минимаксную смешанную стратегию, доказанную Джоном фон Нейманом . [19] [9] [22]

См. также [ править ]

Ссылки [ править ]

  1. ^ Jump up to: Перейти обратно: а б Нэш, Джон (1951). «Некооперативные игры» . Анналы математики . 54 (2): 286–295. дои : 10.2307/1969529 . ISSN   0003-486X . JSTOR   1969529 .
  2. ^ Палсуле-Десаи, Омкар Д. (01 марта 2015 г.). «Полный и частичный сговор в конкурирующих коалициях» . Международный обзор теории игр . 17 (1): 1540006. doi : 10.1142/S021919891540006X . ISSN   0219-1989 .
  3. ^ Карраро, Карло, изд. (26 июня 2003 г.). Эндогенное формирование экономических коалиций . Издательство Эдварда Элгара. дои : 10.4337/9781781009888 . ISBN  978-1-78100-988-8 .
  4. ^ Ибрагим, Халид (4 октября 2021 г.). «Игра против помех для борьбы с интеллектуальными помехами в сетях когнитивного радио» . Доступ IEEE . 9 : 137941–137956. дои : 10.1109/ACCESS.2021.3117563 . S2CID   238751752 .
  5. ^ «Краткое введение в теорию некооперативных игр» . 10 июня 2010 г. Архивировано из оригинала 10 июня 2010 г. Проверено 27 апреля 2021 г.
  6. ^ Jump up to: Перейти обратно: а б Башар, Тамер (26 января 2010 г.). «Конспекты лекций по теории некооперативных игр» (PDF) . Институт Гамильтона и CTVR в Тринити-колледже, Дублин, Ирландия .
  7. ^ Jump up to: Перейти обратно: а б с Фудзивара-Греве, Такако (2015). «Теория некооперативных игр» . Монографии по математической экономике . 1 . дои : 10.1007/978-4-431-55645-9 . ISBN  978-4-431-55644-2 . ISSN   2364-8279 .
  8. ^ Jump up to: Перейти обратно: а б с д Агирре, Иньяки. «Заметки о теории некооперативных игр и микроэкономической теории IV» (PDF) .
  9. ^ Jump up to: Перейти обратно: а б Фон Нейман, Джон (2007). Теория игр и экономическое поведение . Принстонский университет. Пр. ISBN  978-0-691-13061-3 . OCLC   1081636887 .
  10. ^ Jump up to: Перейти обратно: а б с д Такако, Фудзивара-Греве (23 октября 2016 г.). Теория некооперативных игр . Монографии по математической экономике. Том. 1 (1-е изд.). Спрингер Токио. дои : 10.1007/978-4-431-55645-9 . ISBN  978-4-431-56415-7 .
  11. ^ Чандрасекаран, Р. «Теория кооперативных игр» (PDF) .
  12. ^ Бранденбургер, Адам. «Теория кооперативных игр: характеристические функции, распределение, предельный вклад» (PDF) . Архивировано из оригинала (PDF) 27 мая 2016 г.
  13. ^ Jump up to: Перейти обратно: а б с Шатен, Оливье (2018). «Теория кооперативных и некооперативных игр». В Ожье, Ми; Тис, Дэвид Дж. (ред.). Лондон: Пэлгрейв Макмиллан, Великобритания. стр. 345–346. дои : 10.1057/978-1-137-00772-8_468 . ISBN  978-0-230-53721-7 . {{cite book}}: |work= игнорируется ( помощь ) ; Отсутствует или пусто |title= ( помощь )
  14. ^ Ван Дамм, Э. (2001). «Теория игр: Некооперативная игра» . www.sciencedirect.com . Проверено 24 апреля 2023 г.
  15. ^ Jump up to: Перейти обратно: а б Михаэлидис, Панайотис Г.; Пападакис, Теодулос Элефтериос (28 января 2023 г.). История экономических идей (1-е изд.). Пэлгрейв Макмиллан Чам. стр. 117–131. дои : 10.1007/978-3-031-19697-3 . ISBN  978-3-031-19697-3 .
  16. ^ Jump up to: Перейти обратно: а б Бисвас, Тапан (1997). Принятие решений в условиях неопределенности . дои : 10.1007/978-1-349-25817-8 . ISBN  978-0-333-66261-8 . S2CID   153559123 .
  17. ^ Нэш, Джон (31 декабря 1997 г.), «3. Некооперативные игры. Анналы математики 54 (1951) 286–295». , Классика теории игр , Princeton University Press, стр. 14–26, doi : 10.1515/9781400829156-008 , ISBN  9781400829156 , получено 27 апреля 2022 г.
  18. ^ Jump up to: Перейти обратно: а б Агирре, Инаки (24 апреля 2023 г.). «Теория некооперативных игр» (PDF) . Проверено 24 апреля 2023 г.
  19. ^ Jump up to: Перейти обратно: а б «Некооперативные игры» . Энциклопедия.com . Проверено 2 мая 2022 г.
  20. ^ Хамиди, Марьям; Ляо, Хайтао; Сидаровский, Ференц (16 ноября 2016 г.). «Некооперативные и кооперативные теоретико-игровые модели для договоров аренды на основе использования» . Европейский журнал операционных исследований . 255 (1): 163–174. дои : 10.1016/j.ejor.2016.04.064 . ISSN   0377-2217 .
  21. ^ Jump up to: Перейти обратно: а б Теория некооперативных игр (PDF) . Монографии по математической экономике. Том. 1. 2015. doi : 10.1007/978-4-431-55645-9 . ISBN  978-4-431-55644-2 .
  22. ^ в. Нойманн, Дж. (декабрь 1928 г.). «К теории настольных игр» . Математические летописи . 100 (1): 295–320. дои : 10.1007/bf01448847 . ISSN   0025-5831 . S2CID   122961988 .

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 77da167804ce538e4f1e8cfa982059fe__1707880620
URL1:https://arc.ask3.ru/arc/aa/77/fe/77da167804ce538e4f1e8cfa982059fe.html
Заголовок, (Title) документа по адресу, URL1:
Non-cooperative game theory - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)