Эволюционно стабильная стратегия
Эволюционно стабильная стратегия | |
---|---|
Концепция решения в теории игр | |
Отношение | |
Подмножество | Равновесие Нэша |
Суперсет | Стохастически устойчивое равновесие , Стабильное сильное равновесие Нэша |
Пересекается с | Подыгра идеальное равновесие , Дрожащая рука идеальное равновесие , Идеальное байесовское равновесие |
Значение | |
Предложено | Джон Мейнард Смит и Джордж Р. Прайс |
Используется для | Биологическое моделирование и эволюционная теория игр |
Пример | Голубь-ястреб |
Эволюционно стабильная стратегия ( ЭСС ) — это стратегия (или набор стратегий), которая непроницаема при принятии популяцией в целях адаптации к конкретной среде, то есть ее нельзя заменить альтернативной стратегией (или набором стратегий), которая может быть новым или изначально редким. Представлен Джоном Мейнардом Смитом и Джорджем Р. Прайсом в 1972/3 году, [1] [2] это важная концепция в поведенческой экологии , эволюционной психологии , математической теории игр и экономике , имеющая применение в других областях, таких как антропология , философия и политология .
С точки зрения теории игр, ESS — это равновесное уточнение равновесия Нэша , которое также является «эволюционно стабильным ». Таким образом, однажды закрепившись в популяции, одного естественного отбора достаточно, чтобы предотвратить замену ее альтернативными ( мутантными ) стратегиями (хотя это не исключает возможности того, что лучшая стратегия или набор стратегий возникнут в ответ на селективное давление, возникающее в результате изменение окружающей среды).
История
[ редактировать ]Эволюционно стабильные стратегии были определены и представлены Джоном Мейнардом Смитом и Джорджем Р. Прайсом в статье Nature 1973 года . [2] На рецензирование статьи для журнала Nature было потрачено так много времени , что этому предшествовало эссе Мейнарда Смита 1972 года в сборнике эссе под названием « Об эволюции» . [1] Эссе 1972 года иногда цитируется вместо статьи 1973 года, но в университетских библиотеках гораздо чаще имеются экземпляры журнала Nature . Статьи в журнале Nature обычно короткие; в 1974 году Мейнард Смит опубликовал более длинную статью в « Журнале теоретической биологии» . [3] Мейнард Смит объясняет это далее в своей книге «Эволюция и теория игр» 1982 года . [4] Иногда вместо них указываются. Фактически, ESS стала настолько важной в теории игр, что часто не приводится никаких ссылок, поскольку предполагается, что читатель с ней знаком.
Мейнард Смит математически формализовал устный аргумент Прайса, который он прочитал во время рецензирования статьи Прайса. Когда Мейнард Смит понял, что несколько неорганизованный Прайс не готов редактировать свою статью для публикации, он предложил добавить Прайса в качестве соавтора.
Эта концепция была заимствована у Р. Х. Макартура. [5] и У. Д. Гамильтона [6] работа над соотношением полов , вытекающая из принципа Фишера Гамильтона (1967) , особенно из концепции непобедимой стратегии . Мейнард Смит был совместно награжден премией Крафорда в 1999 году за разработку концепции эволюционно стабильных стратегий и применение теории игр к эволюции поведения. [7]
Использование ESS:
- ESS был основным элементом, использованным для анализа эволюции в Ричарда Докинза бестселлере 1976 года «Эгоистичный ген» .
- ESS был впервые использован в социальных науках Робертом Аксельродом в его книге «Эволюция сотрудничества» 1984 года . С тех пор он широко использовался в социальных науках, включая антропологию , экономику , философию и политологию .
- В социальных науках основной интерес представляет ЭСС не как завершение биологической эволюции, а как конечная точка культурной эволюции или индивидуального обучения. [8]
- В эволюционной психологии ESS используется прежде всего как модель биологической эволюции человека .
Мотивация
[ редактировать ]Равновесие Нэша — традиционная концепция решения в теории игр . Это зависит от когнитивных способностей игроков. Предполагается, что игроки знают структуру игры и сознательно пытаются предсказать ходы своих противников и максимизировать свои собственные выигрыши . Кроме того, предполагается, что все игроки об этом знают (см. общеизвестные сведения ). Эти предположения затем используются для объяснения того, почему игроки выбирают стратегии равновесия Нэша.
Эволюционно стабильные стратегии мотивированы совершенно иначе. Здесь предполагается, что стратегии игроков биологически закодированы и наследуются . Люди не имеют контроля над своей стратегией и не должны знать об игре. Они размножаются и подчиняются силам естественного отбора , при этом выигрыш от игры представляет собой репродуктивный успех (биологическую приспособленность ). Предполагается, что альтернативные стратегии игры иногда возникают в результате процесса, подобного мутации . Чтобы быть ESS, стратегия должна быть устойчивой к этим альтернативам.
Учитывая радикально разные мотивирующие предположения, может показаться неожиданным, что ESS и равновесия Нэша часто совпадают. Фактически, каждая ESS соответствует равновесию по Нэшу, но некоторые равновесия по Нэшу не являются ESS.
Равновесие Нэша
[ редактировать ]ESS — это уточненная или модифицированная форма равновесия Нэша . (Примеры, противопоставляющие эти два примера, см. в следующем разделе.) В равновесии Нэша, если все игроки принимают свои соответствующие роли, ни один игрок не сможет получить выгоду, переключившись на какую-либо альтернативную стратегию. В игре для двух игроков это стратегическая пара. Пусть E( S , T ) представляет собой выигрыш от игры по стратегии S против стратегии T . Пара стратегий ( S , S ) является равновесием Нэша в игре двух игроков тогда и только тогда, когда для обоих игроков для любой стратегии T :
- Е( S , S ) ≥ E( Т , S )
В этом определении стратегия T ≠ S может быть нейтральной альтернативой стратегии S (результат такой же, но не лучший). Равновесие по Нэшу предполагается стабильным, даже если Т что у игроков нет долгосрочного стимула принять Т вместо S. набирает одинаковые баллы, при условии , Этот факт представляет собой отправную точку ЕСС.
Мейнард Смит и Прайс [2] укажите два условия, чтобы стратегия S была ESS. Для всех T ≠ S либо
- E( S , S ) > E( T , S ) или
- E( S , S ) = E( T , S ) и E( S , T ) > E( T , T )
Первое условие иногда называют строгим равновесием Нэша. [9] Второе иногда называют «вторым условием Мейнарда Смита». Второе условие означает, что хотя стратегия T нейтральна по отношению к выигрышу по сравнению со стратегией S , популяция игроков, которые продолжают играть по стратегии S, преимущество при игре против T. имеет
Существует также альтернативное, более строгое определение ESS, предложенное Томасом. [10] Это делает другой акцент на роли концепции равновесия Нэша в концепции ESS. Следуя терминологии, данной в первом определении выше, это определение требует, чтобы для всех T ≠ S
- E( S , S ) ≥ E( T , S ), и
- Е( S , Т ) > Е( Т , Т )
В этой формулировке первое условие указывает, что стратегия представляет собой равновесие Нэша, а второе указывает, что выполняется второе условие Мейнарда Смита. Обратите внимание, что эти два определения не совсем эквивалентны: например, каждая чистая стратегия в координационной игре, представленной ниже, является ESS по первому определению, но не по второму.
На словах это определение выглядит так: Выигрыш первого игрока, когда оба игрока играют по стратегии S, выше (или равен) выигрышу первого игрока, когда он переходит на другую стратегию T, а второй игрок сохраняет свою стратегию S. и выигрыш первого игрока, когда только его противник меняет свою стратегию на T, выше, чем его выигрыш в случае, если оба игрока изменят свои стратегии на T.
Эта формулировка более четко подчеркивает роль условия равновесия Нэша в ESS. Это также позволяет естественным образом определить связанные понятия, такие как слабая ESS или эволюционно стабильное множество . [10]
Примеры различий между равновесиями Нэша и ESS
[ редактировать ]
|
|
В большинстве простых игр равновесия ESS и Нэша идеально совпадают. Например, в дилемме заключенного существует только одно равновесие Нэша, и его стратегия ( Дефект ) также является ЕСС.
В некоторых играх могут быть равновесия Нэша, не являющиеся ESS. Например, при нанесении вреда соседу (чья матрица выигрышей показана здесь) и ( A , A ), и ( B , B ) являются состояниями равновесия Нэша, поскольку игроки не могут добиться большего, отказавшись от любого из них. Однако только B является ESS (и сильным Нэшем). A не является ESS, поэтому B может нейтрально вторгнуться в популяцию стратегов A и доминировать, потому что B имеет более высокие баллы против B чем A против B. , Эта динамика фиксируется вторым условием Мейнарда Смита, поскольку E( A , A ) = E( B , A ), но это не тот случай, когда E( A , B ) > E( B , B ).
|
|
Равновесия по Нэшу с альтернативами с одинаковым рейтингом могут быть ESS. Например, в игре «Навреди всем » C является ESS, поскольку удовлетворяет второму условию Мейнарда Смита. Стратеги D могут временно вторгнуться в популяцию стратегов C , набрав одинаково хорошие результаты против C , но они заплатят за это, когда начнут играть друг против друга; C выигрывает лучше у D, у D. чем Таким образом, здесь, хотя E( C , C ) = E( D , C ), это также тот случай, когда E( C , D ) > E( D , D ). В результате C является ESS.
Даже если в игре есть равновесие Нэша в чистой стратегии, вполне возможно, что ни одна из этих чистых стратегий не является ESS. Рассмотрим игру с курицей . В этой игре есть два равновесия Нэша в чистой стратегии ( Swerve , Stay ) и ( Stay , Swerve ). Однако в отсутствие некоррелированной асимметрии ни Swerve , ни Stay не являются ESS. Существует третье равновесие Нэша, смешанная стратегия , которая является ESS для этой игры (объяснение см. в игре «Ястреб-голубь» и «Лучший ответ» ).
Этот последний пример указывает на важное различие между равновесием Нэша и ESS. Равновесия Нэша определяются на основе наборов стратегий (спецификация стратегии для каждого игрока), тогда как ESS определяется на основе самих стратегий. Равновесия, определенные ESS, всегда должны быть симметричными и, следовательно, иметь меньше точек равновесия.
Против. эволюционно стабильное состояние
[ редактировать ]В популяционной биологии две концепции эволюционно стабильной стратегии (ЭСС) и эволюционно стабильного состояния тесно связаны, но описывают разные ситуации.
В рамках эволюционно стабильной стратегии, если ее примут все члены популяции, ни одна мутантная стратегия не сможет вторгнуться. [4] Поскольку практически все члены населения используют эту стратегию, «рациональной» альтернативы не существует. ESS является частью классической теории игр .
В эволюционно стабильном состоянии генетический состав популяции восстанавливается отбором после нарушения, если нарушение не слишком велико. Эволюционно стабильное состояние — это динамическое свойство популяции, которая возвращается к использованию стратегии или комбинации стратегий, если она выходит из этого исходного состояния. Это часть популяционной генетики , динамических систем или эволюционной теории игр . Сейчас это называется конвергентной стабильностью. [11]
Б. Томас (1984) применяет термин ESS к индивидуальной стратегии, которая может быть смешанной, а термин «эволюционно стабильное популяционное состояние» — к популяционной смеси чистых стратегий, которая может быть формально эквивалентна смешанной ESS. [12]
Эволюционно стабильна ли популяция, не зависит от ее генетического разнообразия: она может быть генетически мономорфной или полиморфной . [4]
Стохастическая ESS
[ редактировать ]В классическом определении ESS ни одна мутантная стратегия не может вторгнуться. В ограниченных популяциях любой мутант в принципе может вторгнуться, хотя и с низкой вероятностью, а это означает, что никакая ESS не может существовать. Вместо этого в бесконечной популяции ESS можно определить как стратегию, которая, если она подвергнется вторжению новой мутантной стратегии с вероятностью p, сможет противостоять вторжению со стороны одного исходного индивидуума с вероятностью >p, как иллюстрируется эволюцией хеджирование ставок . [13]
Дилемма заключенного
[ редактировать ]Сотрудничать | Дефект | |
Сотрудничать | 3, 3 | 1, 4 |
Дефект | 4, 1 | 2, 2 |
Дилемма заключенного |
Распространенной моделью альтруизма и социального сотрудничества является дилемма Узника . Здесь группа игроков коллективно выиграла бы, если бы они могли играть в «Сотрудничество» , но поскольку «Дефект» показывает лучшие результаты, у каждого отдельного игрока есть стимул играть в «Дефект» . Одним из решений этой проблемы является введение возможности возмездия, заставляя людей неоднократно играть в игру против одного и того же игрока. В так называемой повторяющейся дилемме заключённого одни и те же два человека снова и снова разыгрывают дилемму заключённого. В то время как дилемма Узника имеет только две стратегии ( Сотрудничать и Дефект ), повторенная дилемма Узника имеет огромное количество возможных стратегий. Поскольку у человека может быть свой план действий на случай непредвиденных обстоятельств для каждой истории, а игра может повторяться неопределенное количество раз, на самом деле таких планов действий на случай непредвиденных обстоятельств может быть бесконечное количество.
Три простых плана действий на случай непредвиденных обстоятельств, которым было уделено значительное внимание, — это «Всегда отказываться» , «Всегда сотрудничать» и «Око за око» . Первые две стратегии делают одно и то же независимо от действий другого игрока, в то время как последний отвечает в следующем раунде, делая то, что было сделано с ним в предыдущем раунде — он отвечает на Сотрудничество с Сотрудничеством и Дефект с Дефектом .
Если вся популяция будет играть по принципу «Око за око» и появится мутант, который будет играть в «Всегда отступать» , то «Око за око» превзойдет «Всегда отступать» . Если популяция мутанта станет слишком большой — процент мутанта будет оставаться небольшим. Таким образом, «Око за око» является ЭСС в отношении только этих двух стратегий . С другой стороны, остров игроков, постоянно отступающих, будет устойчив к вторжению нескольких игроков «око за око» , но не против большого их количества. [14] Если мы введем «Всегда сотрудничать» , популяция « Око за око» больше не будет ESS. Поскольку популяция игроков «Око за око» всегда сотрудничает, стратегия «Всегда сотрудничать» ведет себя в этой популяции одинаково. В результате мутант, играющий в «Всегда сотрудничать», не будет уничтожен. Однако, несмотря на то, что популяции «Всегда сотрудничать» и «Око за око» могут сосуществовать, если есть небольшой процент населения, который всегда отказывается , избирательное давление направлено против «Всегда сотрудничать » и в пользу «Око за око» . Это связано с более низкими выигрышами от сотрудничества, чем от отступничества в случае, если противник откажется.
Это демонстрирует трудности применения формального определения ESS к играм с большими стратегическими пространствами и побудило некоторых рассмотреть альтернативы.
Поведение человека
[ редактировать ]Области социобиологии и эволюционной психологии пытаются объяснить поведение и социальные структуры животных и людей, в основном с точки зрения эволюционно стабильных стратегий. Социопатия (хроническое антисоциальное или криминальное поведение) может быть результатом сочетания двух таких стратегий. [15]
Эволюционно стабильные стратегии изначально рассматривались для биологической эволюции, но они могут применяться и в других контекстах. Фактически, существуют устойчивые состояния для большого класса адаптивной динамики . В результате их можно использовать для объяснения поведения человека, лишенного каких-либо генетических влияний.
См. также
[ редактировать ]- Адаптация против хищников
- Поведенческая экология
- Эволюционная психология
- Фитнес-ландшафт
- Игра «Ястреб-голубь»
- Койнофилия
- Социобиология
- Война на истощение (игра)
Ссылки
[ редактировать ]- ^ Jump up to: Перейти обратно: а б Мейнард Смит, Дж. (1972). «Теория игр и эволюция боевых действий». Об эволюции . Издательство Эдинбургского университета. ISBN 0-85224-223-9 .
- ^ Jump up to: Перейти обратно: а б с Мейнард Смит, Дж .; Прайс, Греция (1973). «Логика животных конфликтов». Природа . 246 (5427): 15–8. Бибкод : 1973Natur.246...15S . дои : 10.1038/246015a0 .
- ^ Мейнард Смит, Дж. (1974). «Теория игр и эволюция конфликтов животных» (PDF) . Журнал теоретической биологии . 47 (1): 209–21. дои : 10.1016/0022-5193(74)90110-6 . ПМИД 4459582 .
- ^ Jump up to: Перейти обратно: а б с Мейнард Смит, Джон (1982). Эволюция и теория игр . ISBN 0-521-28884-3 .
- ^ Макартур, Р.Х. (1965). Уотерман Т.; Горовиц Х. (ред.). Теоретическая и математическая биология . Нью-Йорк: Блейсделл.
- ^ Гамильтон, WD (1967). «Необычайное соотношение полов». Наука . 156 (3774): 477–88. Бибкод : 1967Sci...156..477H . дои : 10.1126/science.156.3774.477 . JSTOR 1721222 . ПМИД 6021675 .
- ^ Пресс-релиз . Архивировано 3 марта 2016 г. в Wayback Machine на премию Крафорда 1999 г.
- ^ Александр, Джейсон Маккензи (23 мая 2003 г.). «Эволюционная теория игр» . Стэнфордская энциклопедия философии . Проверено 31 августа 2007 г.
- ^ Харсаньи, Дж (1973). «Нечетность числа точек равновесия: новое доказательство». Межд. Дж. Теория игр . 2 (1): 235–50. дои : 10.1007/BF01737572 .
- ^ Jump up to: Перейти обратно: а б Томас, Б. (1985). «Об эволюционно устойчивых множествах». Дж. Математика. Биология . 22 : 105–115. дои : 10.1007/bf00276549 .
- ^ Апалу, Дж.; Браун, Дж. С.; Винсент, TL (2009). «Эволюционная теория игр: ESS, стабильность конвергенции и NIS» . Исследования в области эволюционной экологии . 11 : 489–515. Архивировано из оригинала 9 августа 2017 г. Проверено 10 января 2018 г.
- ^ Томас, Б. (1984). «Эволюционная стабильность: состояния и стратегии». Теор. Население. Биол . 26 (1): 49–67. дои : 10.1016/0040-5809(84)90023-6 .
- ^ Кинг, Оливер Д.; Мазель, Джоанна (1 декабря 2007 г.). «Эволюция адаптации хеджирования ставок к редким сценариям» . Теоретическая популяционная биология . 72 (4): 560–575. дои : 10.1016/j.tpb.2007.08.006 . ПМК 2118055 . ПМИД 17915273 .
- ^ Аксельрод, Роберт (1984). Эволюция сотрудничества . ISBN 0-465-02121-2 .
- ^ Мили, Л. (1995). «Социобиология социопатии: интегрированная эволюционная модель». Поведенческие и мозговые науки . 18 (3): 523–99. дои : 10.1017/S0140525X00039595 .
Дальнейшее чтение
[ редактировать ]- Вейбулл, Йорген (1997). Эволюционная теория игр . МТИ Пресс . ISBN 978-0-262-73121-8 . Классический справочник-учебник.
- Хайнс, WGS (1987). «Эволюционно-стабильные стратегии: обзор базовой теории». Теоретическая популяционная биология . 31 (2): 195–272. дои : 10.1016/0040-5809(87)90029-3 . ПМИД 3296292 .
- Лейтон-Браун, Кевин; Шохам, Йоав (2008). Основы теории игр: краткое междисциплинарное введение . Сан-Рафаэль, Калифорния: Издательство Morgan & Claypool. ISBN 978-1-59829-593-1 . . 88-страничное математическое введение; см. раздел 3.8. Бесплатно онлайн. Архивировано 15 августа 2000 г. в Wayback Machine во многих университетах.
- Паркер, Джорджия (1984) Эволюционные стабильные стратегии. В поведенческой экологии: эволюционный подход (2-е изд.) Кребс, Дж. Р. и Дэвис Н. Б., ред. стр. 30–61. Блэквелл, Оксфорд.
- Шохам, Йоав; Лейтон-Браун, Кевин (2009). Мультиагентные системы: алгоритмические, теоретико-игровые и логические основы . Нью-Йорк: Издательство Кембриджского университета . ISBN 978-0-521-89943-7 . Архивировано из оригинала 1 мая 2011 г. Проверено 17 декабря 2008 г. . Полный справочник с вычислительной точки зрения; см. раздел 7.7. Можно скачать бесплатно в Интернете .
- Мейнард Смит, Джон . (1982) Эволюция и теория игр . ISBN 0-521-28884-3 . Классическая ссылка.
Внешние ссылки
[ редактировать ]- Эволюционно стабильные стратегии поведения животных: онлайн-учебник Майкла Д. Брида.
- Теория игр и эволюционно стабильные стратегии , сайт Кеннета Н. Прествича в Колледже Святого Креста.
- Кнол «Эволюционно стабильные стратегии» [ постоянная мертвая ссылка ] Архивировано: https://web.archive.org/web/20091005015811/http://knol.google.com/k/klaus-rohde/evolutionally-stable-strategies-and/xk923bc3gp4/50# .