Jump to content

Сверхрациональность

В экономике и теории игр считается, что участник обладает сверхрациональностью (или перенормированной рациональностью ), если он обладает совершенной рациональностью (и, таким образом, максимизирует свою полезность ), но предполагает, что все остальные игроки также сверхрациональны и что сверхрациональный человек всегда будет придумывать ту же стратегию, что и любой другой сверхрациональный мыслитель, столкнувшийся с той же проблемой. Применяя это определение, сверхрациональный игрок, играющий против сверхрационального противника в дилемме заключенного, будет сотрудничать, в то время как рационально корыстный игрок отступит.

Это правило принятия решения не является основной моделью в теории игр и было предложено Дугласом Хофштадтером в его статье, серии и книге «Метамагические темы». [1] как альтернативный тип рационального принятия решений, отличный от общепринятого теоретико-игрового . Хофштадтер дал такое определение: «Сверхрациональные мыслители по рекурсивному определению включают в свои расчеты тот факт, что они принадлежат к группе сверхрациональных мыслителей». [1]

В отличие от предполагаемого « человека, отвечающего взаимностью », сверхрациональный мыслитель не всегда будет поддерживать равновесие, которое максимизирует общую социальную полезность, и поэтому не является филантропом .

Дилемма заключенного [ править ]

Идея сверхрациональности заключается в том, что два логических мыслителя, анализирующих одну и ту же проблему, придут к одному и тому же правильному ответу. Например, если два человека хорошо разбираются в математике и им обоим предстоит решить одну и ту же сложную задачу, оба получат одинаковый правильный ответ. В математике знание того, что два ответа будут одинаковыми, не меняет ценности задачи, но в теории игр знание того, что ответ будет одинаковым, может изменить сам ответ.

обычно Дилемма заключенного формулируется с точки зрения тюремного заключения для преступников, но ее можно с таким же успехом сформулировать и с помощью денежных призов. Каждому из двух игроков предоставляется выбор: сотрудничать (C) или отказаться (D). Игроки выбирают, не зная, что собирается делать другой. Если оба будут сотрудничать, каждый получит по 100 долларов. Если они оба откажутся, каждый из них получит по 1 доллару. Если один сотрудничает, а другой отказывается, то игрок-дезертир получает 150 долларов, а сотрудничающий игрок не получает ничего.

Четыре исхода и выигрыш для каждого игрока перечислены ниже.

Игрок Б сотрудничает Дефекты игрока Б
Игрок А сотрудничает Оба получают по 100 долларов. Игрок А: $0
Игрок Б: 150 долларов.
Дефекты игрока А Игрок А: $150
Игрок Б: $0
Оба получают по 1 доллару

Один из действенных способов рассуждения игроков заключается в следующем:

  1. Если предположить, что другой игрок откажется, то если я буду сотрудничать, я ничего не получу, а если откажусь, то получу доллар.
  2. Предполагая, что другой игрок сотрудничает, я получаю 100 долларов, если я сотрудничаю, и 150 долларов, если я отступлю.
  3. Поэтому, что бы ни делал другой игрок, мой выигрыш увеличивается в случае отказа, хотя бы на один доллар.

Вывод таков: разумнее всего отступить. Этот тип рассуждений определяет теоретико-игровую рациональность, и два теоретико-игровых рациональных игрока, играющие в эту игру, оба отказываются и получают по доллару каждый.

Сверхрациональность — это альтернативный метод рассуждения. Во-первых, предполагается, что ответ на симметричную задачу будет одинаковым для всех сверхрациональных игроков. Таким образом, сходство принимается во внимание, прежде чем узнать, какой будет стратегия. Стратегия находится путем максимизации выигрыша каждого игрока при условии, что все они используют одну и ту же стратегию. Поскольку сверхрациональный игрок знает, что другой сверхрациональный игрок сделает то же самое, что бы это ни было, у двух сверхрациональных игроков есть только два варианта выбора. Оба будут сотрудничать или оба откажутся, в зависимости от ценности сверхрационального ответа. Таким образом, оба сверхрациональных игрока будут сотрудничать, поскольку этот ответ максимизирует их выигрыш. Два сверхрациональных игрока, играющих в эту игру, получат по 100 долларов каждый.

Обратите внимание, что сверхрациональный игрок, играющий против теоретико-игрового рационального игрока, откажется, поскольку стратегия только предполагает, что сверхрациональные игроки согласятся. Сверхрациональный игрок, играющий против игрока с неопределенной сверхрациональностью, иногда отступает, а иногда сотрудничает, основываясь на вероятности того, что другой игрок является сверхрациональным. [ нужна ссылка ]

Хотя стандартная теория игр предполагает общеизвестные знания о рациональности, она делает это по-другому. Теоретико-игровой анализ максимизирует выигрыш, позволяя каждому игроку менять стратегии независимо от других, хотя в конечном итоге он предполагает, что ответ в симметричной игре будет одинаковым для всех. Это определение теоретико-игрового равновесия Нэша , которое определяет стабильную стратегию как стратегию, в которой ни один игрок не может улучшить выигрыши путем одностороннего изменения курса. Сверхрациональное равновесие в симметричной игре — это такое равновесие, при котором стратегии всех игроков должны быть одинаковыми перед шагом максимизации. (Не существует общепринятого распространения концепции сверхрациональности на асимметричные игры.)

Некоторые утверждают, [ ВОЗ? ] эта сверхрациональность подразумевает своего рода магическое мышление , при котором каждый игрок предполагает, что его решение сотрудничать заставит другого игрока сотрудничать, даже если общения нет. Хофштадтер отмечает, что концепция «выбора» не применяется, когда цель игрока состоит в том, чтобы что-то выяснить, и что решение не заставляет другого игрока сотрудничать, а скорее та же самая логика приводит к одному и тому же ответу независимо от коммуникации. или причина и следствие. Эти дебаты ведутся о том, разумно ли для людей действовать сверхрационально, а не о том, что означает сверхрациональность, и аналогичны спорам о том, разумно ли для людей действовать «рационально», как это описано теорией игр. (при этом они могут выяснить, что другие игроки сделают или сделали, задав себе вопрос, что бы я сделал на их месте, и применив обратную индукцию и повторяющееся устранение доминирующих стратегий ).

Вероятностные стратегии [ править ]

Для простоты вышеизложенное объяснение сверхрациональности игнорировало смешанные стратегии : возможность того, что лучшим выбором может быть подбрасывание монеты или, в более общем смысле, выбор различных результатов с некоторой вероятностью . В дилемме заключенного сотрудничать с вероятностью 1 сверхрационально, даже если допускаются смешанные стратегии, поскольку средний выигрыш, когда один игрок сотрудничает, а другой отказывается, такой же, как и в случае, когда оба игрока сотрудничают и, таким образом, отступают, увеличивает риск отступления обоих, что уменьшает ожидаемую выплату. Но в некоторых случаях сверхрациональная стратегия носит смешанный характер.

Например, если выигрыши будут следующими:

CC — 100 долларов США/100 долларов США
Компакт-диск – 0 долларов США/1 000 000 долларов США.
DC – 1 000 000 долларов США/0 долларов США
ДД – 1 доллар/1 доллар

Таким образом, отказ от решения приносит огромную награду: сверхрациональная стратегия предполагает отказ с вероятностью 499 900/999 899 или чуть более 49,995%. По мере того, как вознаграждение увеличивается до бесконечности, вероятность далее приближается только к 1/2, а потери от принятия более простой стратегии 1/2 (которые уже минимальны) приближаются к 0. В менее экстремальном примере, если выигрыш для одного кооператора и стоимость одного перебежчика составляла 400 и 0 долларов соответственно, в сверхрациональном мире смешанной стратегии вероятность перебежки составляет 100/299 или примерно 1/3.

В аналогичных ситуациях с большим количеством игроков может оказаться необходимым использование устройства рандомизации. Одним из примеров, обсуждаемых Хофштадтером, является дилемма Платонии : эксцентричный триллионер связывается с 20 людьми и сообщает им, что если один и только один из них отправит ему или ей телеграмму (предположительно ничего не стоящую) к полудню следующего дня, этот человек получит миллиард долларов. Если они получат больше одной телеграммы или вообще не получат ни одной, денег никто не получит, а общение между игроками будет запрещено. В этой ситуации сверхрациональным поступком (если известно, что все 20 сверхрациональны) является отправка телеграммы с вероятностью p=1/20, то есть каждый получатель, по сути, бросает 20-гранный кубик и отправляет только телеграмму. если выпадет «1». Это максимизирует вероятность получения ровно одной телеграммы.

Обратите внимание, однако, что это не решение в традиционном теоретико-игровом анализе. Каждый из двадцати теоретически рациональных игроков отправит телеграммы и, следовательно, ничего не получит. Это потому, что отправка телеграмм является доминирующей стратегией ; если отдельный игрок отправляет телеграммы, у него есть шанс получить деньги, но если он не отправляет телеграммы, он ничего не может получить. (Если бы все телеграммы были гарантированно доставлены, они бы отправили только одну, и никто бы не рассчитывал получить деньги).

Формализации и связанные с ними концепции [ править ]

Вопрос о том, следует ли сотрудничать при решении одноразовой дилеммы заключённого в некоторых обстоятельствах, также поднимался в литературе по теории принятия решений, вызванной проблемой Ньюкомба . Теория причинного решения предполагает, что сверхрациональность иррациональна, в то время как теория доказательного решения поддерживает ход рассуждений, аналогичный сверхрациональности, и рекомендует сотрудничать в дилемме узника против аналогичного оппонента. [2] [3]

Программное равновесие было предложено как механистическая модель сверхрациональности. [4] [5] [6]

См. также [ править ]

Ссылки [ править ]

  1. Перейти обратно: Перейти обратно: а б Хофштадтер, Дуглас (июнь 1983 г.). «Дилеммы для сверхрациональных мыслителей, ведущие к заманчивой лотерее» . Научный американец . 248 (6). - перепечатано в: Хофштадтер, Дуглас (1985). Метамагические темы . Основные книги. стр. 737–755. ISBN  0-465-04566-9 .
  2. ^ Льюис, Дэвид (1979). «Дилемма заключенных - проблема Ньюкомба». Философия и связи с общественностью . 8 (3): 235–240. дои : 10.1093/0195036468.003.0011 . JSTOR   2265034 .
  3. ^ Брамс, Стивен Дж. (1975). «Проблема Ньюкомба и дилемма заключенных». Журнал разрешения конфликтов . 19 (4): 596–612.
  4. ^ Ховард, СП (май 1988 г.). «Сотрудничество в дилемме узника». Теория и решение . 24 (3): 203–213. дои : 10.1007/BF00148954 .
  5. ^ Бараш, М.; Кристиано, П .; Фалленштейн, Б.; Херрешофф, М.; ЛаВиктуар, П.; Юдковский, Э. (2014). «Надежное сотрудничество в дилемме узника: программное равновесие через логику доказуемости». arXiv : 1401.5577 [ cs.GT ].
  6. ^ Остерхельд, Каспар; Трейтлейн, Йоханнес; Гросс, Роджер; Конитцер, Винсент; Ферстер, Якоб (2023). «Кооперативное равновесие, основанное на сходстве» . Труды по нейронным системам обработки информации (NeurIPS) .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: cee7320ef2f67812217b4baac2865e4d__1720626240
URL1:https://arc.ask3.ru/arc/aa/ce/4d/cee7320ef2f67812217b4baac2865e4d.html
Заголовок, (Title) документа по адресу, URL1:
Superrationality - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)