Jump to content

Комбинаторная теория игр

(Перенаправлено с «Вверх» (теория игр) )
Математики играют в Конане на семинаре по комбинаторной теории игр

Комбинаторная теория игр — это раздел математики и теоретической информатики , который обычно изучает последовательные игры с совершенной информацией . Исследование в основном ограничивалось играми которых для двух игроков, в игроки по очереди меняли определенные способы или ходы для достижения определенного условия победы. Комбинаторная теория игр традиционно не изучала азартные игры или игры, в которых используется несовершенная или неполная информация, отдавая предпочтение играм, предлагающим полную информацию , в которых состояние игры и набор доступных ходов всегда известны обоим игрокам. [1] Однако по мере развития математических методов типы игр, которые можно анализировать математически, расширяются, поэтому границы этой области постоянно меняются. [2] Ученые обычно определяют, что они подразумевают под «игрой», в начале статьи, и эти определения часто различаются, поскольку они специфичны для анализируемой игры и не предназначены для отражения всего объема этой области.

К комбинаторным играм относятся такие известные игры, как шахматы , шашки и го , которые считаются нетривиальными, и крестики-нолики , которые считаются тривиальными в том смысле, что их «легко решить». Некоторые комбинаторные игры также могут иметь неограниченную игровую зону, например бесконечные шахматы . В комбинаторной теории игр ходы в этих и других играх представляются в виде дерева игры .

Комбинаторные игры также включают в себя комбинаторные головоломки для одного игрока, такие как судоку , и автоматы без участия игрока, такие как « Игра жизни» Конвея (хотя в самом строгом определении можно сказать, что «игры» требуют более одного участника, поэтому обозначения «головоломка» и «автоматы». [3] )

Теория игр в целом включает в себя азартные игры, игры с несовершенными знаниями и игры, в которых игроки могут действовать одновременно, и они, как правило, представляют ситуации принятия решений из реальной жизни.

Комбинаторная теория игр имеет другой акцент, чем «традиционная» или «экономическая» теория игр, которая изначально была разработана для изучения игр с простой комбинаторной структурой, но с элементами случайности (хотя она также учитывает последовательные ходы, см. Игра развернутой формы ). По сути, комбинаторная теория игр предоставила новые методы анализа деревьев игр, например, с использованием сюрреалистических чисел , которые являются подклассом всех игр с идеальной информацией для двух игроков. [3] Типы игр, изучаемые комбинаторной теорией игр, также представляют интерес для искусственного интеллекта , особенно для автоматизированного планирования и планирования . В комбинаторной теории игр меньше внимания уделяется совершенствованию практических алгоритмов поиска (таких как эвристика альфа-бета-отсечения , включенная в большинство учебников по искусственному интеллекту), но больше внимания уделяется описательным теоретическим результатам (таким как меры сложности игры или доказательства оптимального решения). существование без обязательного указания алгоритма, например аргумента о краже стратегии ).

Важным понятием комбинаторной теории игр является понятие решенной игры . Например, игра «Крестики-нолики» считается решенной игрой, поскольку можно доказать, что любая игра закончится ничьей, если оба игрока играют оптимально. Получить аналогичные результаты для игр с богатой комбинаторной структурой сложно. Например, в 2007 году было объявлено, что шашки решены слабо — оптимальная игра обеих сторон также приводит к ничьей, — но этот результат был компьютерным доказательством . [4] Другие игры реального мира в большинстве случаев слишком сложны, чтобы их можно было сегодня провести полный анализ, хотя в последнее время теория добилась некоторых успехов в анализе эндшпиля го. Применение комбинаторной теории игр к позиции пытается определить оптимальную последовательность ходов для обоих игроков до конца игры и тем самым обнаружить оптимальный ход в любой позиции. На практике этот процесс мучительно сложен, если только игра не очень проста.

Может быть полезно провести различие между комбинаторными «математическими играми», представляющими интерес в первую очередь для математиков и ученых, над которыми нужно размышлять и решать, и комбинаторными «играми», представляющими интерес для населения в целом как форма развлечения и соревнования. [5] Однако ряд игр попадают в обе категории. Nim — это игровая игра, положившая начало комбинаторной теории игр, и одна из первых компьютеризированных игр. Например, [6] Крестики-нолики до сих пор используются для обучения игрового ИИ основным принципам проектирования студентов информатике . [7]

Комбинаторная теория игр возникла в связи с теорией беспристрастных игр , в которой любая игра, доступная одному игроку, должна быть доступна и другому. Одной из таких игр является Nim , которую можно решить полностью. Ним — это беспристрастная игра для двух игроков, в которой действуют обычные условия игры , что означает, что игрок, который не может двигаться, проигрывает. В 1930-х годах теорема Спрэга–Грунди показала, что все беспристрастные игры эквивалентны кучам в Ниме, показав тем самым, что крупные унификации возможны в играх, рассматриваемых на комбинаторном уровне, в которых важны детальные стратегии, а не только выигрыши.

В 1960-х годах Элвин Р. Берлекамп , Джон Х. Конвей и Ричард К. Гай совместно представили теорию партийной игры , в которой смягчено требование о том, чтобы игра, доступная одному игроку, была доступна обоим. Их результаты были опубликованы в книге « Пути к победе в математических играх» в 1982 году. Однако первой работой, опубликованной по этой теме, была книга Конвея 1976 года «О числах и играх» , также известная как ONAG, которая представила концепцию сюрреалистических чисел и ее обобщение. игры. Книга «О числах и играх» также стала плодом сотрудничества Берлекэмпа, Конвея и Гая.

Комбинаторные игры обычно имеют такую ​​форму, в которой один игрок выигрывает, когда у другого не остается ходов. Любую конечную игру, имеющую только два возможных результата, легко преобразовать в эквивалентную, в которой применяется это соглашение. Одной из наиболее важных концепций теории комбинаторных игр является концепция суммы двух игр, то есть игра, в которой каждый игрок может выбрать ход либо в одной игре, либо в другой в любой момент игры, и игрок выигрывает. когда его противник не имеет хода ни в одной игре. Такой способ объединения игр приводит к созданию богатой и мощной математической структуры.

Конвей заявил в книге «О числах и играх» , что вдохновение для теории партийных игр было основано на его наблюдениях за игрой в эндшпилях го , которые часто можно разложить на суммы более простых эндшпилей, изолированных друг от друга в разных частях доски.

Во вступительном тексте « Пути к победе» представлено большое количество игр, но в качестве мотивирующих примеров для вводной теории использовались следующие:

  • Синий-Красный Хакенбуш . На конечном уровне эта партийная комбинаторная игра позволяет создавать игры, значениями которых являются двоично-рациональные числа . На бесконечном уровне он позволяет построить все реальные значения, а также множество бесконечных, относящихся к классу сюрреалистических чисел .
  • Blue–Red–Green Hackenbush — допускает дополнительные игровые значения, не являющиеся числами в традиционном понимании, например, звезда .
  • Жабы и лягушки — допускают различные игровые значения. В отличие от большинства других игр, позиция легко представляется короткой строкой символов.
  • Доминирование - Различные интересные игры, например горячие игры , появляются в качестве позиций в Доминировании, потому что иногда есть стимул двигаться, а иногда нет. игры Это позволяет обсуждать температуру .
  • Ним Беспристрастная игра . Это позволяет создавать нимберы . (Его также можно рассматривать как особый случай сине-красно-зеленого Хакенбуша, состоящий только из зеленого цвета.)

Классическая игра Го оказала влияние на раннюю комбинаторную теорию игр, а Берлекамп и Вульф впоследствии разработали для нее теорию эндшпиля и температуры (см. Ссылки). Вооружившись этим, они смогли построить правдоподобные позиции в эндшпиле го, из которых они могли бы дать опытным игрокам в го выбор сторон, а затем победить их в любом случае.

Другая игра, изучаемая в контексте комбинаторной теории игр, — это шахматы . В 1953 году Алан Тьюринг писал об игре: «Если можно совершенно недвусмысленно объяснить на английском языке, при необходимости с помощью математических символов, как следует производить вычисления, то всегда можно запрограммировать любой цифровой компьютер для выполнения таких вычислений». , при условии, что емкость хранилища достаточна». [8] В статье 1950 года Клод Шеннон оценил нижнюю границу сложности дерева игры в шахматы в 10 120 , и сегодня это называется числом Шеннона . [9] Шахматы остаются неразгаданными, хотя обширные исследования, в том числе работы с использованием суперкомпьютеров, позволили создать базы таблиц шахматных эндшпилей , которые показывают результат идеальной игры для всех эндшпилей с семью фигурами или меньше. Бесконечные шахматы имеют еще большую комбинаторную сложность, чем шахматы (если только не изучаются только ограниченные эндшпили или составные позиции с небольшим количеством фигур).

Проще говоря, игра — это список возможных «ходов», которые могут сделать два игрока, называемые левым и правым . Игровая позиция, возникающая в результате любого хода, может считаться другой игрой. Эта идея рассмотрения игр с точки зрения их возможных переходов в другие игры приводит к рекурсивному математическому определению игр, которое является стандартным в комбинаторной теории игр. В этом определении каждая игра имеет обозначение {L|R} . L — набор игровых позиций, на которые может перейти левый игрок, а R — набор игровых позиций, на которые может перейти правый игрок; каждая позиция в L и R определяется как игра с использованием одних и тех же обозначений.

Используя в качестве примера «Доминирование» , пометьте каждую из шестнадцати ячеек доски размером четыре на четыре: A1 для самой верхней левой клетки, C2 для третьей клетки слева во втором ряду сверху и так далее. Мы используем, например, (D3, D4) для обозначения игровой позиции, в которой вертикальное домино находится в правом нижнем углу. Тогда начальную позицию можно описать в обозначениях комбинаторной теории игр как

В стандартной игре Cross-Cram игроки чередуют ходы, но это чередование неявно обрабатывается определениями комбинаторной теории игр, а не закодировано в игровых состояниях.

В приведенной выше игре описан сценарий, в котором у любого игрока остается только один ход, и если любой из игроков делает этот ход, он побеждает. (Нерелевантный открытый квадрат в C3 был исключен из диаграммы.) Символ {|} в списке ходов каждого игрока (соответствующий единственному оставшемуся квадрату после хода) называется нулевой игрой и фактически может обозначаться сокращенно 0. В нулевая игра, ни у одного игрока нет допустимых ходов; таким образом, игрок, чья очередь настала, когда появляется нулевая игра, автоматически проигрывает.

Тип игры на схеме выше также имеет простое название; это называется звездной игрой , которую также можно сократить *. В звездной игре единственный правильный ход ведет к нулевой игре, а это означает, что тот, кто придет в ход во время звездной игры, автоматически побеждает.

Дополнительный тип игры, которого нет в «Доминировании», — это зацикленная игра, в которой правильный ход влево или вправо — это игра, которая затем может вернуться к первой игре. Шашки , например, становятся зацикленными, когда одна из фигур продвигается, так как тогда она может бесконечно переключаться между двумя или более клетками. Игра, не обладающая такими ходами, называется безцикловой .

Сокращения игр

[ редактировать ]

Числа обозначают количество свободных ходов или преимущество хода конкретного игрока. По соглашению положительные числа представляют преимущество для левых, а отрицательные числа представляют преимущество для правых. Они определяются рекурсивно, где 0 является базовым случаем.

0 = {|}
1 = {0|}, 2 = {1|}, 3 = {2|}
−1 = {|0}, −2 = {|−1}, −3 = {|−2}

Нулевая игра – это проигрыш первого игрока.

Сумма числовых игр ведет себя как целые числа, например 3 + −2 = 1.

Звезда , записанная как * или {0|0}, означает победу первого игрока, поскольку любой игрок должен (если первым сделать ход в игре) перейти к нулевой игре и, следовательно, выиграть.

∗ + ∗ = 0, потому что первый игрок должен превратить одну копию ∗ в 0, а затем другому игроку придется также превратить другую копию ∗ в 0; в этот момент первый игрок проиграет, поскольку 0 + 0 не допускает ходов.

Игра* не является ни положительной, ни отрицательной; эта и все другие игры, в которых выигрывает первый игрок (независимо от того, на какой стороне он находится), называются нечеткими с 0 или спутанными с 0; символически мы пишем ∗ || 0.

Up , обозначаемый как ↑, — это позиция в комбинаторной теории игр. [10] В стандартных обозначениях ↑ = {0|∗}.

−↑ знак равно ↓ ( вниз )

Up строго положительное (↑ > 0), но бесконечно малое . Up определяется в разделе «Пути к победе в математических играх» .

Вниз , записываемый как ↓, — это позиция в комбинаторной теории игр. [10] В стандартных обозначениях ↓ = {∗|0}.

−↓ знак равно ↑ ( вверх )

Вниз строго отрицательное (↓ <0), но бесконечно малое . Даун определяется в разделе «Пути к победе в математических играх» .

«Горячие» игры

[ редактировать ]

Рассмотрим игру {1|−1}. Оба хода в этой игре дают преимущество игроку, который их делает; поэтому игру называют «горячей»; оно больше любого числа меньше -1, меньше любого числа больше 1 и нечетко с любым промежуточным числом. Записывается как ±1. Его можно добавлять к числам или умножать на положительные числа ожидаемым образом; например, 4 ± 1 = {5|3}.

Беспристрастная игра — это игра, в которой в любой позиции игры оба игрока могут делать одни и те же ходы. Например, Ним беспристрастен, поскольку любой набор объектов, который может удалить один игрок, может быть удален и другим. Однако доминирование не является беспристрастным, поскольку один игрок раскладывает костяшки по горизонтали, а другой – по вертикали. Точно так же шашки не беспристрастны, поскольку у игроков есть фигуры разного цвета. Для любого порядкового числа можно определить беспристрастную игру, обобщающую Ним, в которой на каждом ходу любой игрок может заменить это число любым меньшим порядковым числом; игры, определенные таким образом, известны как нимберы . Теорема Спрэга -Грунди утверждает, что каждая беспристрастная игра эквивалентна нимберу.

Самые «маленькие» числа – самые простые и наименьшие при обычном порядке ординалов – это 0 и ∗.

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ Уроки игры, с. 3
  2. ^ Анализ покера, проведенный Томасом С. Фергюссоном, является примером комбинаторной теории игр, распространяющейся на игры, включающие элементы случайности. Исследование игры «Ним для трех игроков» является примером исследования, выходящего за рамки игр для двух игроков. Анализ партизанских игр, проведенный Конвеем, Гаем и Берлекэмпом, является, пожалуй, самым известным расширением рамок комбинаторной теории игр, выходящим за рамки изучения беспристрастных игр.
  3. ^ Перейти обратно: а б Демейн, Эрик Д .; Хирн, Роберт А. (2009). «Игры с алгоритмами: алгоритмическая комбинаторная теория игр» . В Альберте, Майкл Х.; Новаковски, Ричард Дж. (ред.). Игры без шансов 3 . Публикации НИИ математических наук. Том. 56. Издательство Кембриджского университета. стр. 3–56. arXiv : cs.CC/0106019 .
  4. ^ Шеффер, Дж.; Берч, Н.; Бьернссон, Ю.; Кишимото, А.; Мюллер, М.; Лейк, Р.; Лу, П.; Сатфен, С. (2007). «Шашки решены». Наука . 317 (5844): 1518–1522. Бибкод : 2007Sci...317.1518S . CiteSeerX   10.1.1.95.5393 . дои : 10.1126/science.1144079 . ПМИД   17641166 . S2CID   10274228 .
  5. ^ Френкель, Авиезри (2009). «Комбинаторные игры: избранная библиография с кратким введением для гурманов». Игры без шансов 3 . 56 : 492.
  6. ^ Грант, Юджин Ф.; Ларднер, Рекс (2 августа 1952 г.). «Городской разговор – Оно» . Житель Нью-Йорка .
  7. ^ Рассел, Стюарт ; Норвиг, Питер (2021). «Глава 5: Состязательный поиск и игры». Искусственный интеллект: современный подход . Серия Пирсона по искусственному интеллекту (4-е изд.). Pearson Education, Inc., стр. 146–179. ISBN  978-0-13-461099-3 .
  8. ^ Алан Тьюринг. «Цифровые компьютеры в применении к играм» . Университет Саутгемптона и Королевский колледж Кембриджа. п. 2.
  9. ^ Клод Шеннон (1950). «Программирование компьютера для игры в шахматы» (PDF) . Философский журнал . 41 (314): 4. Архивировано из оригинала (PDF) 6 июля 2010 г.
  10. ^ Перейти обратно: а б Э. Берлекамп; Дж. Х. Конвей; Р. Гай (1982). Пути выигрыша в математических играх . Том. I. Академическая пресса. ISBN  0-12-091101-9 .
    Э. Берлекамп; Дж. Х. Конвей; Р. Гай (1982). Пути выигрыша в математических играх . Том. II. Академическая пресса. ISBN  0-12-091102-7 .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: e31687c44eb8c2bfa5997bc9d5a5569b__1706761260
URL1:https://arc.ask3.ru/arc/aa/e3/9b/e31687c44eb8c2bfa5997bc9d5a5569b.html
Заголовок, (Title) документа по адресу, URL1:
Combinatorial game theory - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)