Jump to content

конкурс Штакельберга

(Перенаправлено с конкурса Штакельберга )

Модель лидерства Штакельберга — это стратегическая игра в экономике , в которой сначала движется фирма-лидер, а затем последовательно движутся фирмы-последователи (поэтому ее иногда называют «игрой лидер-последователь»). Она названа в честь немецкого экономиста Генриха Фрайхера фон Штакельберга, опубликовавшего в 1934 году «Marktform und Gleichgewicht» («Структура рынка и равновесие») , в котором была описана модель. С точки зрения теории игр , игроки в этой игре являются лидером и последователем и соревнуются в количестве. Лидера Штакельберга иногда называют лидером рынка.

Существуют и другие ограничения на поддержание равновесия Штакельберга. Лидер должен заранее знать , что ведомый наблюдает за его действиями. У последователя не должно быть средств принять на себя обязательство совершить действие будущего лидера, не являющегося Штакельбергом, и лидер должен это знать. Действительно, если бы «последователь» мог совершить действие лидера Штакельберга и «лидер» знал об этом, лучшим ответом лидера было бы разыграть действие последователя Штакельберга.

Фирмы могут участвовать в конкуренции по Штакельбергу, если у одной из них есть какое-то преимущество, позволяющее ей двигаться первым. В более общем плане лидер должен обладать властью брать на себя обязательства . Движение в первую очередь является наиболее очевидным средством обязательства: как только лидер сделал свой ход, он не может его отменить — он привержен этому действию. Движение первым может быть возможным, если лидером является действующая монополия отрасли, а последователем является новый участник отрасли. Удержание избыточных мощностей является еще одним средством принятия обязательств.

Идеальное равновесие Нэша в подыграх

[ редактировать ]

Модель Штакельберга можно решить, чтобы найти идеальное равновесие или равновесие Нэша в подигре (SPNE), то есть профиль стратегии, который лучше всего служит каждому игроку с учетом стратегий другого игрока и который влечет за собой, что каждый игрок играет в равновесии Нэша в каждой подигре .

В самых общих чертах, пусть функция цены для отрасли (дуополии) будет равна ; Цена — это просто функция общего (отраслевого) выпуска, поэтому где индекс представляет лидера и представляет последователя. Предположим, фирма имеет структуру затрат . Модель решается методом обратной индукции . Лидер думает, какова будет лучшая реакция последователя, т.е. как он отреагирует , когда увидит количество лидера. Затем лидер выбирает величину, которая максимизирует его выигрыш, предвидя прогнозируемую реакцию последователя. Последователь фактически наблюдает это и в состоянии равновесия выбирает ожидаемое количество в качестве ответа.

Чтобы рассчитать SPNE, сначала необходимо рассчитать лучшие функции отклика ведомого (расчет перемещается «назад» из-за обратной индукции).

Прибыль фирмы (последователь) — это доход минус затраты. Выручка — это произведение цены и количества, а себестоимость определяется структурой затрат фирмы, поэтому прибыль равна: . Лучший ответ – найти значение это максимизирует данный , т.е. с учетом выпуска лидера (фирмы ), находится объем выпуска, который максимизирует прибыль ведомого. Следовательно, максимум относительно предстоит найти. Сначала дифференцируйте относительно :

Установка этого значения на ноль для максимизации:

Значения которые удовлетворяют этому уравнению, являются лучшими ответами. Теперь рассматривается лучшая функция отклика лидера. Эта функция рассчитывается путем рассмотрения результатов ведомого как функции результатов лидера, как только что было вычислено.

Прибыль фирмы (лидер) является , где — количество последователей как функция количества лидера, а именно функция, рассчитанная выше. Лучший ответ – найти значение это максимизирует данный , т.е. при условии наилучшей функции отклика ведомого (фирмы) ), находится объем выпуска, максимизирующий прибыль лидера. Следовательно, максимум относительно предстоит найти. Во-первых, дифференцируйте относительно :

Установка этого значения на ноль для максимизации:

Следующий пример является очень общим. Он предполагает обобщенную линейную структуру спроса.

и для простоты накладывает некоторые ограничения на структуру затрат, чтобы проблему можно было решить.

и

для удобства вычислений.

Прибыль подписчика составляет:

Задача максимизации решается (из общего случая):

Рассмотрим проблему лидера:

Замена на из проблемы подписчика:

Задача максимизации решается (из общего случая):

Теперь решаем для урожайность , оптимальное действие лидера:

Это лучший ответ лидера на реакцию последователя в равновесии. Фактическое значение последователя теперь можно найти, введя это значение в его функцию реакции, рассчитанную ранее:

Все равновесия Нэша . Очевидно (если предположить, что предельные издержки равны нулю – т.е. затраты по существу игнорируются), что лидер имеет значительное преимущество. Интуитивно понятно, что если бы положение лидера было не лучше, чем у его последователя, он просто принял бы стратегию конкуренции Курно .

Подключение количества последователей , обратно в функцию лучшего ответа лидера не даст . Это связано с тем, что, как только лидер взял на себя обязательства по достижению результата и наблюдал за последователями, он всегда хочет сократить свой результат постфактум. Однако неспособность сделать это позволяет ей получать более высокие прибыли, чем при Курно.

Экономический анализ

[ редактировать ]

Представление в развернутой форме часто используется для анализа модели «лидер-последователь» Штакельберга. Модель , также называемая « деревом решений », показывает комбинацию результатов и выигрышей обеих фирм в игре Штакельберга.

Игра Штакельберга, представленная в развернутой форме.

На изображении слева в развернутом виде изображена игра Штакельберга. Выплаты показаны справа. Этот пример довольно прост. Существует базовая структура затрат, включающая только предельные затраты отсутствуют ( постоянные затраты ). Функция спроса линейна, а ценовая эластичность спроса равна 1. Однако она иллюстрирует преимущество лидера.

Последователь хочет выбрать максимизировать свою отдачу . Взяв производную первого порядка и приравняв ее нулю (для максимизации), получим как максимальное значение .

Лидер хочет выбрать максимизировать свою отдачу . Однако в равновесии он знает, что последователь выберет как указано выше. Таким образом, на самом деле лидер хочет максимизировать свой выигрыш. (заменив для функции наилучшего отклика ведомого). В результате дифференцирования максимальный выигрыш определяется выражением . Включение этого в функцию наилучшего ответа последователя дает . Предположим, что предельные издержки для фирм равны (поэтому у лидера нет другого рыночного преимущества, кроме первого шага) и, в частности, . Лидер произведет 2000, а последователь — 1000. Это принесет лидеру прибыль (выплату) в два миллиона, а последователю — один миллион. Просто двигаясь первым, лидер получает вдвое большую прибыль, чем его последователь. Однако прибыль Курно здесь составляет 1,78 миллиона на штуку (строго, за штуку), так что лидер мало что выиграл, а ведомый потерял. Однако это зависит от примера. Могут быть случаи, когда лидер Штакельберга имеет огромную прибыль сверх прибыли Курно, приближающуюся к монопольной прибыли (например, если лидер также имел большое преимущество в структуре затрат, возможно, из-за лучшей производственной функции ). Также могут быть случаи, когда последователь действительно получает более высокую прибыль, чем лидер, но только потому, что у него, скажем, гораздо меньшие затраты. Такое поведение последовательно работает на рынках дуополии, даже если фирмы асимметричны.

Правдоподобные и недостоверные угрозы со стороны последователя

[ редактировать ]

Если бы после того, как лидер выбрал равновесное количество, последователь отклонился от равновесия и выбрал какое-то неоптимальное количество, это не только навредило бы самому себе, но и могло бы навредить лидеру. Если последователь выберет гораздо большее количество, чем его лучший ответ, рыночная цена снизится, и прибыль лидера упадет, возможно, ниже прибыли уровня Курно. В этом случае ведомый может объявить лидеру до начала игры, что, если лидер не выберет равновесное количество по Курно, ведомый выберет отклоняющееся количество, которое ударит по прибыли лидера. В конце концов, количество, выбранное лидером в равновесии, является оптимальным только в том случае, если ведомый также играет в равновесии. Однако лидеру ничего не угрожает. Как только лидер выбрал равновесное количество, для последователя было бы иррационально отклоняться, потому что это тоже повредит. Как только лидер сделал выбор, последователю будет выгоднее играть по равновесному пути. Следовательно, такая угроза со стороны последователя не будет заслуживать доверия.

Однако в (бесконечно) повторяющейся игре Штакельберга последователь может принять стратегию наказания, при которой он угрожает наказать лидера в следующем периоде, если он не выберет неоптимальную стратегию в текущем периоде. Эта угроза может быть правдоподобной, поскольку для последователя может быть разумным наказать в следующем периоде, чтобы лидер после этого выбрал количества Курно.

Штакельберг по сравнению с Курно

[ редактировать ]

Модели Штакельберга и Курно схожи, поскольку в обеих конкуренция ведется по количеству. Однако, как видно, первый ход дает лидеру Штакельберга решающее преимущество. В игре Штакельберга также имеется важное предположение о совершенной информации : ведомый должен соблюдать количество, выбранное лидером, иначе игра сводится к Курно. При несовершенстве информации описанные выше угрозы могут быть правдоподобными. Если ведомый не может наблюдать за ходом лидера, для ведомого уже не является иррациональным выбор, скажем, уровня количества Курно (фактически это и есть равновесное действие). Однако должно быть так, что информация несовершенна , и ведомый не может наблюдать за движением лидера, потому что для ведомого нерационально не наблюдать, если он может, после того, как лидер переместился. Если он может наблюдать, он будет это делать, чтобы принять оптимальное решение. Любая угроза со стороны последователя, утверждающего, что он не будет наблюдать, даже если сможет, столь же неправдоподобна, как и приведенные выше. Это пример того, как слишком много информации вредит игроку. В соревновании Курно именно одновременность игры (несовершенство знаний) не приводит к тому, что ни один из игроков ( при прочих равных условиях ) находится в невыгодном положении.

Теоретико-игровые соображения

[ редактировать ]

Как уже упоминалось, несовершенство информации в игре на лидерство сводится к конкуренции по Курно. Однако некоторые профили стратегии Курно поддерживаются как равновесия Нэша , но могут быть устранены как невероятные угрозы (как описано выше), применяя концепцию решения подыгрового совершенства . Действительно, именно это делает профиль стратегии Курно равновесием Нэша в игре Штакельберга и не позволяет ему быть идеальным на подыграх.

Рассмотрим игру Штакельберга (т. е. такую, которая удовлетворяет описанным выше требованиям для поддержания равновесия Штакельберга), в которой по какой-то причине лидер считает, что какое бы действие он ни предпринял, ведомый выберет величину Курно (возможно, лидер считает, что ведомый иррационально). Если лидер разыграл действие Штакельберга, то (он полагает), что последователь сыграет Курно. Следовательно, для лидера играть по Штакельбергу неоптимально. Фактически, его лучший ответ (по определению равновесия Курно) — это сыграть в количество Курно. Как только он это сделает, лучшим ответом ведомого будет сыграть по Курно.

Рассмотрим следующие профили стратегий: лидер играет по Курно; последователь играет по Курно, если лидер играет по Курно, а последователь играет по Штакельбергу, если лидер играет по Штакельбергу, и если лидер играет во что-то еще, последователь играет произвольную стратегию (следовательно, это фактически описывает несколько профилей). Этот профиль представляет собой равновесие Нэша. Как утверждалось выше, на пути равновесия игра является лучшим ответом на лучший ответ. Однако игра по Курно не была бы лучшим ответом лидера, если бы последователь играл бы Штакельберга, если бы он (лидер) играл Штакельберга. В этом случае лучшим ответом лидера будет игра Штакельберга. Следовательно, что делает этот профиль (или, скорее, эти профили) равновесием Нэша (или, скорее, равновесием Нэша), так это тот факт, что последователь будет играть не по Штакельбергу, если лидер будет играть по Штакельбергу.

Однако сам этот факт (то, что последователь будет играть не по Штакельбергу, если лидер будет играть по Штакельбергу) означает, что этот профиль не является равновесием Нэша в подигре, начиная с того момента, когда лидер уже сыграл в Штакельберга (подыгра вне пути равновесия). . Если лидер уже сыграл в Штакельберга, лучший ответ для последователя — сыграть в Штакельберга (и, следовательно, это единственное действие, которое приводит к равновесию Нэша в этой подигре). Следовательно, профиль стратегии Курно не является идеальным для подыгры.

Сравнение с другими моделями олигополии

[ редактировать ]

По сравнению с другими моделями олигополии,

  • Совокупный выпуск Штакельберга больше, чем совокупный выпуск Курно, но меньше, чем совокупный выпуск Бертрана .
  • Цена Штакельберга ниже цены Курно, но выше цены Бертрана.
  • Потребительский излишек Штакельберга больше потребительского излишка Курно, но ниже потребительского излишка Бертрана.
  • Совокупный выпуск Штакельберга превышает выпуск чистой монополии или картеля , но меньше выпуска совершенной конкуренции .
  • Цена Штакельберга ниже цены чистой монополии или картеля, но выше цены совершенной конкуренции.

Приложения

[ редактировать ]

Концепция Штакельберга была распространена на динамические игры Штакельберга. [1] [2] С добавлением времени в качестве измерения были обнаружены явления, отсутствующие в статических играх, такие как нарушение лидером принципа оптимальности. [2]

В последние годы игры Штакельберга нашли применение в области безопасности. [3] В этом контексте защитник (лидер) разрабатывает стратегию защиты ресурса, при которой ресурс остается в безопасности независимо от стратегии, принятой злоумышленником (последователем). Дифференциальные игры Штакельберга также используются для моделирования цепочек поставок и каналов сбыта . [4] Другие приложения игр Штакельберга включают гетерогенные сети , [5] генетическая конфиденциальность , [6] [7] робототехника , [8] [9] автономное вождение , [10] [11] электрические сети , [12] [13] и интегрированные энергетические системы . [14]

См. также

[ редактировать ]
  1. ^ Симаан, М.; Круз, Дж. Б. (май 1973 г.). «О стратегии Штакельберга в играх с ненулевой суммой» . Журнал теории оптимизации и приложений . 11 (5): 533–555. дои : 10.1007/BF00935665 . ISSN   0022-3239 . S2CID   121400147 .
  2. ^ Jump up to: а б Симаан, М.; Круз, Дж. Б. (июнь 1973 г.). «Дополнительные аспекты стратегии Штакельберга в играх с ненулевой суммой» . Журнал теории оптимизации и приложений . 11 (6): 613–626. дои : 10.1007/BF00935561 . ISSN   0022-3239 .
  3. ^ Браун, Джеральд (2006). «Защита критической инфраструктуры». Интерфейсы . 36 (6): 530–544. дои : 10.1287/inte.1060.0252 . hdl : 10945/36732 . S2CID   16223037 .
  4. ^ Он, Сюли; Прасад, Ашутош; Сетхи, Суреш П.; Гутьеррес, Хенаро Дж. (декабрь 2007 г.). «Обзор дифференциальных игровых моделей Штакельберга в каналах поставок и сбыта» . Журнал системной науки и системной инженерии . 16 (4): 385–413. CiteSeerX   10.1.1.727.2952 . дои : 10.1007/s11518-007-5058-2 . ISSN   1004-3756 . S2CID   11443159 .
  5. ^ Гош, Субха; Де, Дебашис (28 апреля 2021 г.). «E²M³: энергоэффективная массивная MIMO – MISO 5G HetNet с использованием игры Stackelberg» . Журнал суперкомпьютеров . 77 (11): 13549–13583. дои : 10.1007/s11227-021-03809-1 . ISSN   0920-8542 . S2CID   235569547 .
  6. ^ Ван, Чжию; Воробейчик Евгений; Ся, Вэйи; Клейтон, Эллен Райт; Кантарчиоглу, Мурат; Малин, Брэдли (2 февраля 2017 г.). «Расширение доступа к крупномасштабным геномным данным при обеспечении конфиденциальности: теоретико-игровой подход» . Американский журнал генетики человека . 100 (2): 316–322. дои : 10.1016/j.ajhg.2016.12.002 . ISSN   0002-9297 . ПМК   5294764 . ПМИД   28065469 .
  7. ^ Ван, Чжию; Воробейчик Евгений; Ся, Вэйи; Лю, Юнтай; Вудерс, Мирна; Го, Цзя; Инь, Чжицзюнь; Клейтон, Эллен Райт; Кантарчиоглу, Мурат; Малин, Брэдли А. (2021). «Использование теории игр для предотвращения многоэтапных вторжений в конфиденциальность при обмене данными» . Достижения науки . 7 (50): eabe9986. Бибкод : 2021SciA....7.9986W . дои : 10.1126/sciadv.abe9986 . ПМЦ   8664254 . ПМИД   34890225 .
  8. ^ Кох, Джоуи Дж.; Дин, Гохуэй; Хекман, Кристофер; Чен, Лицзюнь; Ронконе, Алессандро (24 октября 2020 г.). «Совместное управление мобильными роботами с помощью обучения Штакельберга» . Международная конференция IEEE/RSJ по интеллектуальным роботам и системам (IROS) 2020 г. Лас-Вегас, Невада, США: IEEE. стр. 7985–7992. arXiv : 2008.00679 . дои : 10.1109/IROS45743.2020.9341376 . ISBN  978-1-7281-6212-6 . S2CID   220935562 .
  9. ^ Ранджбар-Сахраи, Биджан; Станкова, Катерина; Тейлс, Карл; Вайс, Герхард (2 сентября 2013 г.). «Подход к покрытию на основе Штакельберга в невыпуклых средах» . Достижения в области искусственной жизни, ECAL 2013 . Массачусетский технологический институт Пресс: 462–469. CiteSeerX   10.1.1.650.4481 . дои : 10.7551/978-0-262-31709-2-ch066 . ISBN  978-0-262-31709-2 . S2CID   11668402 .
  10. ^ Йоу, Джехонг; Лангари, Реза (2020). «Теоретико-игровая модель слияния дорожек Штакельберга». arXiv : 2003.09786 . {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )
  11. ^ Купер, Мэтт; Ли, Джун Ки; Бек, Джейкоб; Фишман, Джошуа Д.; Джиллетт, Майкл; Папакипос, Зоя; Чжан, Аарон; Рамос, Джером; Шах, Анш (2019), Саличс, Мигель А.; Ге, Шужи Сэм; Баракова, Эмилия Иванова; Кабибихан, Джон-Джон (ред.), «Наказание Штакельберга и автономные транспортные средства для защиты от хулиганов» , Social Robotics , vol. 11876, Чам: Springer International Publishing, стр. 368–377, arXiv : 1908.08641 , doi : 10.1007/978-3-030-35888-4_34 , ISBN  978-3-030-35887-7 , S2CID   201645147 , получено 3 мая 2021 г.
  12. ^ Цю, Хайфэн; Гу, Вэй; Ван, Лу; Пан, Гуаншэн; Сюй, Иньлян; У, Чжи (июнь 2021 г.). «Трехслойный игровой подход Штакельберга для надежного управления электропитанием в общественных сетях» . Транзакции IEEE по промышленной информатике . 17 (6): 4073–4083. дои : 10.1109/TII.2020.3015733 . ISSN   1551-3203 . S2CID   226558914 .
  13. ^ Ан, Лу; Чакраборти, Аранья; Дуэль-Халлен, Александра (14 декабря 2020 г.). «Инвестиционная игра Stackelberg в области безопасности для обеспечения стабильности напряжения энергосистем» . 59-я конференция IEEE по принятию решений и управлению (CDC) , 2020 г. Чеджу, Корея (Южная): IEEE. стр. 3359–3364. arXiv : 2006.11665 . дои : 10.1109/CDC42340.2020.9304301 . ISBN  978-1-7281-7447-1 . S2CID   219965779 .
  14. ^ Чжэн, Вэйе; Хилл, Дэвид Дж. (01 марта 2021 г.). «Механизм стимулирования координации распределенной эксплуатации интегрированных электроэнергетических и тепловых систем» . Прикладная энергетика . 285 : 116373. doi : 10.1016/j.apenergy.2020.116373 . ISSN   0306-2619 . S2CID   233833095 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 63586810eead7db0ee472966f77d85c3__1697278020
URL1:https://arc.ask3.ru/arc/aa/63/c3/63586810eead7db0ee472966f77d85c3.html
Заголовок, (Title) документа по адресу, URL1:
Stackelberg competition - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)