Теорема Спрэга – Гранди
В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
В комбинаторной теории игр теорема Спрэга -Грунди утверждает, что каждая беспристрастная игра в соответствии с соглашением о нормальной игре эквивалентна игре с одной кучей nim или бесконечному обобщению nim. Следовательно, его можно представить как натуральное число , размер кучи в эквивалентной ему игре «ним», как порядковое число в бесконечном обобщении, или, альтернативно, как нимбер , значение этой игры с одной кучей в алгебраической системе, Операция сложения объединяет несколько куч в одну эквивалентную кучу в nim.
Значение Гранди или значение нима любой беспристрастной игры — это уникальный номер, которому игра эквивалентна. В случае игры, позиции которой индексируются натуральными числами (как и сам nim, который индексируется по размерам кучи), последовательность нимберов для последовательных позиций игры называется ним-последовательностью игры.
Теорема Спрага-Грунди и ее доказательство воплощают основные результаты теории, открытой независимо Р. П. Спрэгом (1936). [1] и П.М. Гранди (1939). [2]
Определения
[ редактировать ]Для целей теоремы Спрага-Грунди игра для двух игроков — это последовательная игра с совершенной информацией, удовлетворяющая условию окончания (все игры заканчиваются: нет бесконечных линий игры) и нормальному условию игры (игрок тот, кто не может двигаться, проигрывает).
В любой момент игры позиция игрока — это набор ходов, которые ему разрешено сделать. В качестве примера мы можем определить нулевую игру как игру для двух игроков, в которой ни один из игроков не имеет допустимых ходов. Ссылаясь на двух игроков как (для Алисы) и (для Боба) мы бы обозначили их позиции как , поскольку набор ходов, которые может сделать каждый игрок, пуст.
Беспристрастная игра — это игра, в которой в любой момент игры каждому игроку разрешен одинаковый набор ходов. в обычной игре Ним является примером беспристрастной игры. В ним есть одна или несколько куч предметов, и два игрока (назовем их Алисой и Бобом) по очереди выбирают кучу и убирают из нее 1 или несколько предметов. Победителем становится тот игрок, который уберет последний предмет из финальной кучи. Игра беспристрастна , поскольку для любой заданной конфигурации размеров стопок ходы, которые Алиса может сделать в свой ход, — это точно такие же ходы, которые Бобу было бы разрешено сделать, если бы настал его ход. Напротив, такая игра, как шашки, не является беспристрастной, потому что, предположим, что Алиса играет красными, а Боб играет черными, для любого данного расположения фигур на доске, если бы наступила очередь Алисы, ей было бы разрешено перемещать только красные фигуры. , и если бы настала очередь Боба, ему было бы разрешено передвигать только черные фигуры.
Обратите внимание, что любая конфигурация беспристрастной игры может быть записана как одна позиция, поскольку ходы будут одинаковыми независимо от того, чей ход. Например, положение нулевой игры можно просто записать , потому что, если сейчас очередь Алисы, ей нечего делать ходов, а если очередь Боба, у него тоже нет ходов. Ход может быть связан с позицией, в которой он оставляет следующего игрока.
Это позволяет определять позиции рекурсивно. Например, рассмотрим следующую игру «Ним», в которую играют Алиса и Боб.
Пример игры Ним
[ редактировать ]Sizes of heaps Moves A B C 1 2 2 Alice takes 1 from A 0 2 2 Bob takes 1 from B 0 1 2 Alice takes 1 from C 0 1 1 Bob takes 1 from B 0 0 1 Alice takes 1 from C 0 0 0 Bob has no moves, so Alice wins
- На шаге 6 игры (когда все стопки пусты) позиция , потому что у Боба нет действительных ходов. Мы называем эту должность .
- На шаге 5 у Алисы был ровно один вариант: удалить один объект из кучи C, оставив Боба без ходов. Поскольку ее ход оставляет Боба на позиции , ее позиция написана . Мы называем эту должность .
- На шаге 4 у Боба было два варианта: удалить один из B или удалить один из C. Однако обратите внимание, что на самом деле не имело значения, из какой кучи Боб удалил объект: в любом случае у Алисы останется ровно один объект в ровно одна стопка. Итак, используя наше рекурсивное определение, у Боба действительно есть только один ход: . Таким образом, позиция Боба такова: .
- На шаге 3 у Алисы было 3 варианта: удалить два из C, удалить один из C или удалить один из B. Удаление двух из C оставляет Боба на месте. . Удаление одной стопки из C оставляет Бобу две стопки, каждая размером в единицу, т. е. позицию , как описано в шаге 4. Однако удаление 1 из B оставит у Боба два объекта в одной куче. Тогда его ходы были бы и , поэтому ее ход приведет к позиции . Мы называем эту позицию . Позиция Алисы тогда представляет собой набор всех ее ходов: .
- Следуя той же рекурсивной логике, на шаге 2 позиция Боба равна
- Наконец, на шаге 1 позиция Алисы такова:
Нимберс
[ редактировать ]Особые имена , , и упоминаемые в нашем примере игры, называются нимберами . В целом, число соответствует позиции в игре ним, где ровно объекты ровно в одну кучу. Формально нимбы определяются индуктивно следующим образом: является , , и для всех , .
Хотя слово nimber происходит от игры nim , nimbers можно использовать для описания позиций в любой конечной, беспристрастной игре, и фактически теорема Спрэга–Грунди утверждает, что каждый случай конечной, беспристрастной игры может быть связан с одиночный нимбер.
Объединение игр
[ редактировать ]Две игры можно объединить, сложив их позиции. Например, рассмотрим еще одну игру в ним с кучами. , , и .
Пример игры 2
[ редактировать ]Sizes of heaps Moves A' B' C' 1 1 1 Alice takes 1 from A' 0 1 1 Bob takes one from B' 0 0 1 Alice takes one from C' 0 0 0 Bob has no moves, so Alice wins.
Мы можем объединить его с нашим первым примером , чтобы получить комбинированную игру с шестью стопками: , , , , , и :
Комбинированная игра
[ редактировать ]Sizes of heaps Moves A B C A' B' C' 1 2 2 1 1 1 Alice takes 1 from A 0 2 2 1 1 1 Bob takes 1 from A' 0 2 2 0 1 1 Alice takes 1 from B' 0 2 2 0 0 1 Bob takes 1 from C' 0 2 2 0 0 0 Alice takes 2 from B 0 0 2 0 0 0 Bob takes 2 from C 0 0 0 0 0 0 Alice has no moves, so Bob wins.
Чтобы различать эти две игры, для первой игры-примера мы обозначим ее начальную позицию и раскрасим его в синий цвет:
Для второго примера игры мы обозначим начальную позицию и раскрасим его в красный цвет:
Чтобы вычислить начальную позицию комбинированной игры , помните, что игрок может либо сделать ход в первой игре, оставив нетронутой вторую игру, либо сделать ход во второй игре, оставив нетронутой первую игру. Таким образом, стартовая позиция комбинированной игры такова:
Явная формула добавления позиций: , что означает, что сложение является как коммутативным, так и ассоциативным.
Эквивалентность
[ редактировать ]Позиции в беспристрастных играх делятся на два исходных класса : либо побеждает следующий игрок (тот, чья очередь), - позиция ), или побеждает предыдущий игрок (a - позиция ). Так, например, это - положение, в то время как это -позиция.
Две позиции и эквивалентны , если независимо от позиции к ним добавляется, они всегда находятся в одном и том же классе результатов. Формально, тогда и только тогда, когда , находится в том же классе результатов, что и .
Если использовать наши примеры бега, обратите внимание: как в первой, так и во второй играх выше мы можем показать, что на каждом ходу у Алисы есть ход, который вынуждает Боба совершить -позиция. Таким образом, оба и являются -позиции. (Обратите внимание, что в комбинированной игре Боб является игроком с -позиции. Фактически, это -позиция, которая, как мы увидим в лемме 2, означает .)
Первая лемма
[ редактировать ]В качестве промежуточного шага к доказательству основной теоремы покажем, что для каждой позиции и каждый -позиция , эквивалентность держит. Согласно приведенному выше определению эквивалентности, это означает, что и общий класс результатов для всех .
Предположим, что это -позиция. Тогда у предыдущего игрока есть выигрышная стратегия для : реагировать на перемещения в соответствии с их выигрышной стратегией для (который существует в силу будучи -позиция) и реагировать на ходы в в соответствии с их выигрышной стратегией для (существующий по аналогичной причине). Так также должен быть -позиция.
С другой стороны, если это -позиция, то также является -позиция, поскольку у следующего игрока есть выигрышная стратегия: выбрать - позиция среди вариантов, и мы делаем вывод из предыдущего пункта, что добавление на эту позицию все еще -позиция. Таким образом, в данном случае должно быть - позиция, как и .
Поскольку это единственные два случая, лемма верна.
Вторая лемма
[ редактировать ]В качестве дальнейшего шага мы покажем, что тогда и только тогда, когда это -позиция.
Предположим, что в прямом направлении . Применяя определение эквивалентности с , мы находим это (что равно по коммутативности сложения) находится в том же классе результатов, что и . Но должно быть -позиция: за каждый ход, сделанный в одной копии , предыдущий игрок может ответить тем же ходом в другой копии и поэтому всегда делает последний ход.
В обратном направлении, поскольку это -положение по гипотезе, как следует из первой леммы, , что . Аналогично, поскольку также является -позиция, следует из первой леммы в виде что . В силу ассоциативности и коммутативности правые части этих результатов равны. Более того, является отношением эквивалентности , поскольку равенство является отношением эквивалентности для классов результатов. Через транзитивность , мы можем заключить, что .
Доказательство
[ редактировать ]мы доказываем, что все позиции эквивалентны нимберу Методом структурной индукции . Более конкретный результат, заключающийся в том, что начальная позиция данной игры должна быть эквивалентна нимберу, показывает, что игра сама эквивалентна нимберу.
Рассмотрим позицию . По гипотезе индукции все варианты эквивалентны нимберам, скажем . Так что пусть . Мы покажем это , где - это mex (минимальное исключение) чисел , то есть наименьшее целое неотрицательное число, не равное некоторому .
Первое, что мы должны отметить, это то, что , посредством второй леммы. Если равно нулю, то утверждение тривиально верно. В противном случае рассмотрим . Если следующий игрок сделает ход в , то предыдущий игрок может перейти на в и наоборот, если следующий игрок сделает ход . После этого позиция -позиция по прямой импликации леммы. Поэтому, это -позиция и, ссылаясь на обратную импликацию леммы, .
Теперь давайте покажем, что это -позиция, что, еще раз используя вторую лемму, означает, что . Мы делаем это, давая явную стратегию для предыдущего игрока.
Предположим, что и пусты. Затем это нулевое множество, очевидно, -позиция.
Или рассмотрим случай, когда следующий игрок перемещается по компоненту к варианту где . Потому что было минимальное исключенное число, предыдущий игрок может войти к . И, как было показано ранее, любая позиция плюс сама по себе является -позиция.
Наконец, предположим, что следующий игрок перемещается по компоненту к варианту . Если затем предыдущий игрок входит к ; в противном случае, если , предыдущий игрок входит к ; в любом случае результатом является позиция плюс она сама. (Невозможно, чтобы потому что было определено, что оно отличается от всех .)
Подводя итог, мы имеем и . В силу транзитивности мы заключаем, что , по желанию.
Разработка
[ редактировать ]Если – позиция беспристрастной игры, единственное целое число такой, что называется его значением Гранди, или числом Гранди, а функция, присваивающая это значение каждой такой позиции, называется функцией Спрага–Грунди. Р. Л. Спрэг и П. М. Гранди независимо друг от друга дали явное определение этой функции, не основанное на какой-либо концепции эквивалентности ним-позициям, и показали, что она обладает следующими свойствами:
- Стоимость Гранди для одной стопки нимов размером (т.е. позиции ) является ;
- Позиция – это проигрыш следующего игрока, который сделает ход (т. -позиция) тогда и только тогда, когда его значение Гранди равно нулю; и
- Значение Гранди суммы конечного набора позиций - это просто нимм -сумма значений Гранди его слагаемых.
Из этих результатов непосредственно следует, что если позиция имеет значение Гранди , затем имеет то же значение Гранди, что и , и, следовательно, принадлежит к одному и тому же классу результатов для любой позиции . Таким образом, хотя Спрэг и Гранди никогда явно не формулировали теорему, описанную в этой статье, она следует непосредственно из их результатов и принадлежит им. [3] [4] Эти результаты впоследствии были развиты в области комбинаторной теории игр , в частности, Ричардом Гаем , Элвином Берлекэмпом , Джоном Хортоном Конвеем и другими, где они теперь заключены в теорему Спрага-Грунди и ее доказательство в форме, описанной здесь. Эта область представлена в книгах « Пути к победе в математических играх» и «О числах и играх» .
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Спрэг, Р.П. (1936). «О математических файтингах» . Математический журнал Тохоку (на немецком языке). 41 : 438-444. ЖФМ 62.1070.03 . Например, 0013.29004 .
- ^ Гранди, премьер-министр (1939). «Математика и игры» . Эврика . 2 :6–8. Архивировано из оригинала 27 сентября 2007 г. Перепечатано, 1964, 27 : 9–11.
- ^ Смит, Седрик AB (1960), «Патрик Майкл Гранди, 1917–1959», Журнал Королевского статистического общества, серия A , 123 (2): 221–22.
- ^ Шлейхер, Дирк; Столл, Майкл (2006). «Введение в игры и числа Конвея». Московский математический журнал . 6 (2): 359–388. arXiv : math.CO/0410026 . дои : 10.17323/1609-4514-2006-6-2-359-388 . S2CID 7175146 .
Внешние ссылки
[ редактировать ]- Игра Гранди в «разрубить узел»
- Легко читаемый вводный отчет математического факультета Калифорнийского университета в Лос-Анджелесе.
- Игра Ним на sputsoft.com
- Милванг-Йенсен, Брит, Калифорния (2000), Комбинаторные игры, теория и приложения (PDF) , CiteSeerX 10.1.1.89.805