Поммерман Вызов
Pommerman Challenge — мультиагентная игра для тестирования автономных систем искусственного интеллекта . [ нужна ссылка ]
Структура игры
[ редактировать ]Команда из двух агентов соревнуется друг с другом на доске 11х11. Каждый агент может наблюдать только за частью доски, и агенты не могут общаться. Цель – сбить противников с ног. Агенты размещают взрывчатку, чтобы разрушать стены, и собирают бонусы , появляющиеся из этих стен, избегая при этом смерти. Игровые объекты могут двигаться непредсказуемо или перемещаться агентом. [ нужна ссылка ]
Играть
[ редактировать ]Игра предполагает принятие решений в режиме реального времени. Агенты должны выбирать ходы примерно за 0,1 секунды. [1]
Алгоритмы
[ редактировать ]Требование реального времени ограничивает использование ресурсоемких методов, таких как поиск по дереву Монте-Карло . Коэффициент ветвления при каждом ходе может достигать 1296, поскольку на каждом этапе действуют все четыре агента, выбирая одну из шести возможностей. Агенты выбирают, учитывая взрывы, время жизни которых составляет 10 шагов. Взрывы сводят на нет методы поиска по дереву , поскольку поиск с уровнями менее 10 игнорирует взрывы, в то время как более глубокие поиски рассматривают слишком много вариантов (с учетом фактора ветвления). [ нужна ссылка ]
Гибридный подход использует поиск по дереву ограниченной глубины с последующим исследованием детерминистического/пессимистического сценария. Ограничение глубины сохраняет дерево поиска небольшим. Детерминистический подход позволяет прогнозировать далекое будущее, опуская ветвление. «Хорошими» действиями часто являются те, которые хорошо работают при пессимистических сценариях, особенно если важна безопасность. Определение худшей последовательности положений объекта может подсказать, куда его переместить.
После создания пессимистических сценариев агент количественно определяет выживаемость каждого хода, то есть условно количество позиций, в которых агент может затем оставаться в безопасности (не сталкиваясь с другими агентами).
Соревнования
[ редактировать ]В течение 2018–2019 годов было организовано 3 конкурса с незначительно изменившимися правилами.
Онлайн - ФФА
[ редактировать ]Этот раунд представлял собой разминочное онлайн-мероприятие, в котором каждый участник контролировал только одного агента. Результаты: [2]
- 1-е место: Agent47Agent от Ичена Гонга
- 2-е место: aiKiller от Мартона Горега
НейрИПС 2018 - Команда
[ редактировать ]Первые соревнования Поммермана с очным финалом. Результаты: [2]
- 1-е место: перекрестки хакодзаки Тосихиро Такахаши.
- 2-е место: «Айзенах», Мартон Гёрёг
- 3-е место: dypm Такаюки Осогами
В 3 наиболее эффективных решениях использовался онлайн-поиск по дереву.
NeurIPS 2019 - Командное радио
[ редактировать ]Второе соревнование с очным финалом улучшило общение между агентами-сотрудниками. Результаты: [3]
- 1-е место: Мартон Грёг
- 2-е место: Пол Ясек
- 3-е место: Ифань Чжан
Ссылки
[ редактировать ]- ^ Родригес, Хесус (18 марта 2019 г.). «Эта новая технология помогает создавать автономных, самообучающихся агентов искусственного интеллекта, прошедших тест Pommerman…» . На пути к науке о данных . Проверено 25 мая 2019 г.
- ^ Перейти обратно: а б Официальная страница Pommerman объявляет итоги 2018 года . Официальный сайт Поммермана
- ^ Канал Pommerman в Твиттере объявляет итоги 2019 года . Канал Поммермана в Твиттере
Внешние ссылки
[ редактировать ]- Официальный сайт
- PlayGround: Исследования искусственного интеллекта в области многоагентного обучения.: MultiAgentLearning/playground , MultiAgentLearning, 24 мая 2019 г. , получено 25 мая 2019 г.
- «Discord — Бесплатный голосовой и текстовый чат для геймеров» . Раздор . Проверено 26 мая 2019 г.
- Поммерман Вызов на X