Выиграть-остаться, проиграть-переключиться
В психологии , теории игр , статистике и обучении машинном стратегия «выигрыш-остание», «проигрыш-переключение» (также «выигрыш-остание», «проигрыш-сдвиг» ) — это эвристическая стратегия обучения, используемая для моделирования обучения в ситуациях принятия решений. Впервые он был изобретен как улучшение по сравнению с рандомизацией в задачах о бандитах . [ 1 ] это было применено к дилемме заключенного , чтобы смоделировать эволюцию альтруизма Позже . [ 2 ]
Правило обучения основывает свое решение только на результате предыдущей игры. Результаты делятся на успехи (победы) и неудачи (проигрыши). Если игра в предыдущем раунде завершилась успехом, то агент применяет ту же стратегию в следующем раунде. Альтернативно, если игра закончилась неудачей, агент переключается на другое действие.
Масштабное эмпирическое исследование игроков в игру «камень, ножницы, бумага» показывает, что реальные игроки применяют вариант этой стратегии вместо равновесной стратегии Нэша , заключающейся в совершенно случайном выборе между тремя вариантами. [ 3 ] [ 4 ]
Ссылки
[ редактировать ]- ^ Роббинс, Х. (1952). «Некоторые аспекты последовательного планирования экспериментов» . Бюллетень Американского математического общества . 58 (5): 527–535. дои : 10.1090/s0002-9904-1952-09620-8 .
- ^ Новак, М.; Зигмунд, К. (1 июля 1993 г.). «Стратегия выигрыша-остания и проигрыша, которая превосходит игру «око за око» в игре «Дилемма заключенного». Природа . 364 (6432): 56–58. Бибкод : 1993Natur.364...56N . дои : 10.1038/364056a0 . ПМИД 8316296 . S2CID 4238908 .
- ^ Морган, Джеймс (2 мая 2014 г.). «Как победить в камень-ножницы-бумага» . Новости Би-би-си .
- ^ Ван, Чжицзянь; Сюй, Бинь; Чжоу, Хай-Цзюнь (25 июля 2014 г.). «Социальный цикл и условные реакции в игре «Камень-ножницы-бумага» . Научные отчеты . 4 : 5830. дои : 10.1038/srep05830 . ПМК 5376050 . ПМИД 25060115 .
См. также
[ редактировать ]