Парадокс сетевого магазина
Парадокс сетевых магазинов - это очевидный парадокс теории игр, описывающий решения, которые может принять сетевой магазин , где «стратегия сдерживания» кажется оптимальной вместо стратегии обратной индукции стандартных рассуждений теории игр .
Парадокс был впервые сформулирован Райнхардом Зельтеном в 1978 году. [1]
Игра «Сетевой магазин» [ править ]
Монополист . (Игрок А) имеет филиалы в 20 городах Ему предстоит встретиться с 20 потенциальными конкурентами, по одному в каждом городе, которые смогут выбрать в или вне . Они делают это в последовательном порядке и по одному. Если потенциальный конкурент выбирает out , он получает выигрыш 1, а игрок А получает выигрыш 5. Если он выберет в , он получит выигрыш либо 2, либо 0, в зависимости от реакции Игрока А на его действие. Игрок А в ответ на выбор в , необходимо выбрать одну из двух стратегий ценообразования, кооперативный или агрессивный . Если он выберет кооператив , и игрок А, и участник получают выигрыш 2, и если А выбирает агрессивный , каждый игрок получает выигрыш 0.
Эти результаты приводят к двум теориям игры: индукции (теоретически оптимальная версия игры) и теории сдерживания (теория со слабым доминированием):
Теория индукции [ править ]
Рассмотрите решение, которое должен принять 20-й и последний участник: выбирать ли в или вне . Он знает, что если он выберет в Игрок А получает более высокий выигрыш от выбора сотрудничества, чем от агрессивности, и в последний период игры больше нет будущих конкурентов, которых Игроку А нужно было бы запугать с рынка. Зная об этом, на рынок выходит 20-й конкурент, и Игрок А будет сотрудничать (получив выигрыш 2 вместо 0).
Исход заключительного периода, так сказать, предрешен. Теперь рассмотрим период 19 и решение потенциального конкурента. Он знает, что А будет сотрудничать в следующем периоде, независимо от того, что произойдет в периоде 19. Таким образом, если войдет игрок 19, агрессивная стратегия не сможет удержать игрока 20 от входа. Игрок 19 знает это и выбирает в . Игрок А решает сотрудничать .
Конечно, этот процесс обратной индукции продолжается вплоть до первого конкурента. Каждый потенциальный конкурент выбирает в , и Игрок А всегда сотрудничает. Игрок А получает выигрыш 40 (2×20), а каждый участник получает по 2.
Теория сдерживания
Эта теория утверждает, что игрок А сможет получить выигрыш выше 40. Предположим, что игрок А находит аргумент индукции убедительным. Он решит, сколько периодов в конце играть по такой стратегии, скажем, 3. В периодах 1–17 он решит всегда быть агрессивным по отношению к выбору ИН. Если все потенциальные конкуренты знают об этом, маловероятно, что потенциальные конкуренты 1–17 будут беспокоить сетевой магазин , рискуя таким образом безопасной выплатой 1 («А» не будет принимать ответных мер, если они выберут « out "). Если несколько участников протестируют сетевой магазин в начале игры и увидят, что их встречают агрессивной стратегией, остальные участники, скорее всего, не будут тестировать дальше. Если предположить, что все 17 отпугнуты, Игрок А получает 91 (17×5 + 2×3) даже если 10 участников войдут и проверят волю Игрока А, Игрок А все равно получит выигрыш 41 (10×0+ 7×5 + 3×2), что составляет лучше, чем индукционный (теоретически правильный) выигрыш.
сетевых Парадокс магазинов
Если игрок А будет следовать матрице выигрышей теории игр для достижения оптимального выигрыша, он получит более низкий выигрыш, чем при стратегии «сдерживания». Это создает очевидный парадокс теории игр: теория игр утверждает, что стратегия индукции должна быть оптимальной, но похоже, что вместо этого оптимальной является «стратегия сдерживания».
«Стратегия сдерживания» не является идеальным равновесием в рамках подигры : она опирается на неправдоподобную угрозу реагирования на в с агрессивный . Рациональный игрок не будет реализовывать неправдоподобную угрозу, но парадокс заключается в том, что, тем не менее, кажется, что игроку А выгодно реализовать угрозу.
Ответ Селтена [ править ]
Рейнхарда Зельтена Ответом на этот очевидный парадокс является утверждение, что идея «сдерживания», хотя и иррациональна по стандартам теории игр , на самом деле является приемлемой идеей с точки зрения рациональности, которую фактически используют люди. Селтен утверждает, что люди могут принимать решения на трех уровнях: рутина, воображение и рассуждение.
Полная информация? [ редактировать ]
Теория игр основана на идее, что каждая матрица моделируется с предположением о наличии полной информации : что «каждый игрок знает выигрыши и стратегии, доступные другим игрокам», где слово «выигрыш» описывает поведение — то, что пытается сделать игрок. чтобы максимизировать. Если в первый город входит конкурент и монополист ведет себя агрессивно, второй конкурент заметил, что монополист, с точки зрения общего знания о выигрышах и стратегиях, не максимизирует предполагаемые выигрыши; ожидать, что монополист сделает это в этом городе, кажется сомнительным.
Если конкуренты допускают даже очень небольшую вероятность того, что монополист злонамерен, и придают внутреннюю ценность своей агрессивности (или видимости), и монополист это знает, то даже если монополист имеет выигрыши, как описано выше, реагируя на вступление в рынок Агрессивный город на раннем этапе будет оптимальным, если он увеличит вероятность того, что последующие конкуренты будут относиться к злобности монополиста.
Уровни принятия Селтену решений по
Рутинный уровень [ править ]
Люди используют свой прошлый опыт результатов решений, чтобы направлять свою реакцию на выбор в настоящем. «Основные критерии сходства между ситуациями принятия решений грубы, а иногда и неадекватны». (Зельтен)
Уровень воображения [ править ]
Человек пытается визуализировать, как выбор различных альтернатив может повлиять на вероятный ход будущих событий. На этом уровне используется рутинный уровень процедурных решений. Этот метод похож на компьютерное моделирование.
Уровень рассуждения [ править ]
Человек прилагает сознательное усилие, чтобы проанализировать ситуацию рациональным способом, используя как прошлый опыт, так и логическое мышление. Этот способ принятия решений использует упрощенные модели, предположения которых являются продуктом воображения, и является единственным методом рассуждения, разрешенным и ожидаемым теорией игр.
Процесс принятия решений [ править ]
Предрешение [ править ]
Человек выбирает, какой метод (рутину, воображение или рассуждение) использовать для решения проблемы, и само это решение принимается на рутинном уровне.
Окончательное решение [ править ]
В зависимости от того, какой уровень выбран, человек начинает процедуру принятия решения. Затем человек приходит к (возможно, разному) решению для каждого доступного уровня (если бы мы выбрали воображение, мы пришли бы к обычному решению и к возможному решению, основанному на воображении). Селтен утверждает, что люди всегда могут принять рутинное решение, но, возможно, не на более высоких уровнях. Как только люди примут все свои уровни решения, они смогут решить, какой ответ использовать… окончательное решение. Окончательное решение принимается на рутинном уровне и определяет фактическое поведение.
См. также [ править ]
Ссылки [ править ]
- ^ Зельтен, Рейнхард (1 апреля 1978 г.). «Парадокс сети магазинов» . Теория и решение . 9 (2): 127–159. дои : 10.1007/BF00131770 . ISSN 1573-7187 .
- Ордешук, Питер К. (1992). «Репутация и парадокс сетевых магазинов» . Букварь по политической теории . Рутледж. стр. 247–249. ISBN 0-415-90241-Х .
- Зельтен, Рейнхард (1978). «Парадокс сети магазинов». Теория и решение . 9 (2): 127–159. дои : 10.1007/BF00131770 . ISSN 0040-5833 . S2CID 143946876 .