Jump to content

Информационный набор (теория игр)

Набор информации является основой для принятия решений в игре и включает в себя действия, доступные обеим сторонам, и преимущества каждого действия. Информационный набор — важное понятие в неидеальных играх. В теории игр набор информации — это набор всех возможных действий в игре для данного игрока, построенный на его наблюдениях, и набор для конкретного игрока, который, учитывая то, что этот игрок наблюдал, показывает вершины решений, доступные игроку. которые для них неотличимы в данный момент игры . Чтобы получить лучшее представление о вершинах принятия решений, обратитесь к рисунку 1. Если в игре есть совершенная информация , каждый информационный набор содержит только один элемент, а именно точку, фактически достигнутую на этом этапе игры, поскольку каждый игрок знает точное сочетание случайных ходов. игрока и стратегии до текущего момента в игре. В противном случае некоторые игроки не могут быть уверены в том, в каком состоянии находится игра; например, незнание того, что именно произошло в прошлом или что следует сделать прямо сейчас.

Рисунок 1. Дерево игры, которое отображает возможный набор информации каждого игрока, показывая варианты в каждой вершине (A и B для игрока 1 и 2 соответственно).

Информационные наборы используются в играх развернутой формы и часто изображаются в виде деревьев игры . Деревья игр показывают путь от начала игры и последующие пути, которые могут быть проложены в зависимости от следующего хода каждого игрока. Для задач игры с неидеальной информацией существует скрытая информация. То есть каждый игрок не имеет полного знания информации об оппоненте, например, о картах, которые не появляются в игре в покер. Поэтому при построении дерева игры сложно точно определить, где находится узел, основываясь только на известной информации, так как мы не знаем определенной информации о нашем противнике. Мы можем только быть уверены, что находимся в одном из множества возможных узлов. Эта неспособность различить набор узлов в игровом дереве конкретного игрока известна как «набор информации». Наборы информации можно легко отобразить в деревьях игры для отображения возможных ходов каждого игрока, обычно с помощью пунктирных линий, кругов или даже путем простого обозначения вершин, которые показывают варианты действий конкретного игрока на текущем этапе игры, как показано на рисунке 1.

Более конкретно, в развернутой форме набор информации представляет собой набор узлов принятия решений, таких, что:

  1. Каждый узел в наборе принадлежит одному игроку.
  2. Когда игра достигает набора информации, игрок с ходом не может различать узлы в наборе информации, т.е. если набор информации содержит несколько узлов, участники, связанные с этим набором информации, не уверены в том, какой узел выбрать для своего хода.

Игры в развернутой форме часто предполагают, что каждый игрок может сделать несколько ходов, что также приводит к формированию множества наборов информации. Игрок должен сделать выбор в каждой из этих вершин на основе вариантов в наборе информации. Это известно как стратегия игрока и может обеспечить путь игрока от начала игры до конца, который также известен как ход игры. В ходе игры результат всегда будет известен в зависимости от стратегии каждого игрока, если только не будут задействованы случайные ходы, тогда не всегда будет единственный результат. Не все игры основаны на стратегии, поскольку они также могут включать в себя случайные ходы. Когда задействованы случайные ходы, вектор стратегий может привести к распределению вероятностей нескольких исходов игры, которые могут произойти. Если задействована случайность, в играх может быть создано несколько исходов, поскольку ходы каждый раз могут быть разными. Однако, исходя из силы стратегии, некоторые результаты могут иметь более высокую вероятность, чем другие.

Если предположить, что в игре имеется несколько наборов информации, игра преобразуется из статической игры в динамическую. Ключом к решению динамической игры является расчет набора информации каждого игрока и принятие решений на основе их выбора на разных этапах. Например, когда игрок А делает выбор первым, игрок Б примет лучшее для него решение на основе выбора А. Игрок А, в свою очередь, может предсказать реакцию Б и сделать выбор в его пользу. Понятие информационного множества было введено Джоном фон Нейманом , мотивированным изучением игры в покер .

Пример [ править ]

Битва полов 1
Battle of the sexes 1
Битва полов 2
Battle of the sexes 2

Справа — две версии игры «Битва полов» , показанные в развернутом виде . Ниже также показана нормальная форма для обеих этих игр.

Первая игра просто последовательная: когда игрок 2 делает выбор, обе стороны уже знают, выбрал ли игрок 1 O(пера) или F(футбол).

Вторая игра также является последовательной, но пунктирной линией показан набор информации игрока 2 . Это обычный способ показать, что когда игрок 2 делает ход, он или она не знает, что сделал игрок 1.

Эта разница также приводит к разным прогнозам на две игры. В первой игре преимущество имеет игрок 1. Они знают, что могут безопасно выбрать O(pera), потому что как только игрок 2 узнает , что игрок 1 выбрал оперу, игрок 2 скорее пойдет на o(pera) и получит 2 , чем выберет f(ootball) и получит 0 . Формально это применение совершенства подигр для решения игры.

Во второй игре игрок 2 не может наблюдать за тем, что делал игрок 1, так что это может быть и одновременная игра . Таким образом, совершенство подигры не дает нам ничего такого, чего не может дать равновесие Нэша , и у нас есть три стандартных возможных равновесия:

  1. Оба выбирают оперу
  2. оба выбирают футбол
  3. или оба используют смешанную стратегию : игрок 1 выбирает O(пера) в 3/5 случаев, а игрок 2 выбирает f(футбол) в 2/5 случаев

См. также [ править ]

Ссылки [ править ]

  • Бинмор, Кен (2007). Теория игр: очень краткое введение . Издательство Оксфордского университета. стр. 88–89. ISBN  978-0-19-921846-2 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 47348a2d9f4b986495ada0b6dac4cbd3__1696189140
URL1:https://arc.ask3.ru/arc/aa/47/d3/47348a2d9f4b986495ada0b6dac4cbd3.html
Заголовок, (Title) документа по адресу, URL1:
Information set (game theory) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)