Информационный набор (теория игр)
Набор информации является основой для принятия решений в игре и включает в себя действия, доступные обеим сторонам, и преимущества каждого действия. Информационный набор — важное понятие в неидеальных играх. В теории игр набор информации — это набор всех возможных действий в игре для данного игрока, построенный на его наблюдениях, и набор для конкретного игрока, который, учитывая то, что этот игрок наблюдал, показывает вершины решений, доступные игроку. которые для них неотличимы в данный момент игры . Чтобы получить лучшее представление о вершинах принятия решений, обратитесь к рисунку 1. Если в игре есть совершенная информация , каждый информационный набор содержит только один элемент, а именно точку, фактически достигнутую на этом этапе игры, поскольку каждый игрок знает точное сочетание случайных ходов. игрока и стратегии до текущего момента в игре. В противном случае некоторые игроки не могут быть уверены в том, в каком состоянии находится игра; например, незнание того, что именно произошло в прошлом или что следует сделать прямо сейчас.

Информационные наборы используются в играх развернутой формы и часто изображаются в виде деревьев игры . Деревья игр показывают путь от начала игры и последующие пути, которые могут быть проложены в зависимости от следующего хода каждого игрока. Для задач игры с неидеальной информацией существует скрытая информация. То есть каждый игрок не имеет полного знания информации об оппоненте, например, о картах, которые не появляются в игре в покер. Поэтому при построении дерева игры сложно точно определить, где находится узел, основываясь только на известной информации, так как мы не знаем определенной информации о нашем противнике. Мы можем только быть уверены, что находимся в одном из множества возможных узлов. Эта неспособность различить набор узлов в игровом дереве конкретного игрока известна как «набор информации». Наборы информации можно легко отобразить в деревьях игры для отображения возможных ходов каждого игрока, обычно с помощью пунктирных линий, кругов или даже путем простого обозначения вершин, которые показывают варианты действий конкретного игрока на текущем этапе игры, как показано на рисунке 1.
Более конкретно, в развернутой форме набор информации представляет собой набор узлов принятия решений, таких, что:
- Каждый узел в наборе принадлежит одному игроку.
- Когда игра достигает набора информации, игрок с ходом не может различать узлы в наборе информации, т.е. если набор информации содержит несколько узлов, участники, связанные с этим набором информации, не уверены в том, какой узел выбрать для своего хода.
Игры в развернутой форме часто предполагают, что каждый игрок может сделать несколько ходов, что также приводит к формированию множества наборов информации. Игрок должен сделать выбор в каждой из этих вершин на основе вариантов в наборе информации. Это известно как стратегия игрока и может обеспечить путь игрока от начала игры до конца, который также известен как ход игры. В ходе игры результат всегда будет известен в зависимости от стратегии каждого игрока, если только не будут задействованы случайные ходы, тогда не всегда будет единственный результат. Не все игры основаны на стратегии, поскольку они также могут включать в себя случайные ходы. Когда задействованы случайные ходы, вектор стратегий может привести к распределению вероятностей нескольких исходов игры, которые могут произойти. Если задействована случайность, в играх может быть создано несколько исходов, поскольку ходы каждый раз могут быть разными. Однако, исходя из силы стратегии, некоторые результаты могут иметь более высокую вероятность, чем другие.
Если предположить, что в игре имеется несколько наборов информации, игра преобразуется из статической игры в динамическую. Ключом к решению динамической игры является расчет набора информации каждого игрока и принятие решений на основе их выбора на разных этапах. Например, когда игрок А делает выбор первым, игрок Б примет лучшее для него решение на основе выбора А. Игрок А, в свою очередь, может предсказать реакцию Б и сделать выбор в его пользу. Понятие информационного множества было введено Джоном фон Нейманом , мотивированным изучением игры в покер .
Пример [ править ]


Справа — две версии игры «Битва полов» , показанные в развернутом виде . Ниже также показана нормальная форма для обеих этих игр.
Первая игра просто последовательная: когда игрок 2 делает выбор, обе стороны уже знают, выбрал ли игрок 1 O(пера) или F(футбол).
Вторая игра также является последовательной, но пунктирной линией показан набор информации игрока 2 . Это обычный способ показать, что когда игрок 2 делает ход, он или она не знает, что сделал игрок 1.
Эта разница также приводит к разным прогнозам на две игры. В первой игре преимущество имеет игрок 1. Они знают, что могут безопасно выбрать O(pera), потому что как только игрок 2 узнает , что игрок 1 выбрал оперу, игрок 2 скорее пойдет на o(pera) и получит 2 , чем выберет f(ootball) и получит 0 . Формально это применение совершенства подигр для решения игры.
Во второй игре игрок 2 не может наблюдать за тем, что делал игрок 1, так что это может быть и одновременная игра . Таким образом, совершенство подигры не дает нам ничего такого, чего не может дать равновесие Нэша , и у нас есть три стандартных возможных равновесия:
- Оба выбирают оперу
- оба выбирают футбол
- или оба используют смешанную стратегию : игрок 1 выбирает O(пера) в 3/5 случаев, а игрок 2 выбирает f(футбол) в 2/5 случаев
|
|
См. также [ править ]
Ссылки [ править ]
- Бинмор, Кен (2007). Теория игр: очень краткое введение . Издательство Оксфордского университета. стр. 88–89. ISBN 978-0-19-921846-2 .