Jump to content

Нейроэволюция дополняющих топологий

(Перенаправлено с NeuroEvolution of Augmenting Topology )

NeuroEvolution of Augmenting Topologies ( NEAT ) — генетический алгоритм (GA) для генерации развивающихся искусственных нейронных сетей ( метод нейроэволюции ), разработанный Кеннетом Стэнли и Ристо Мииккулайненом в 2002 году в Техасском университете в Остине . Он изменяет как весовые параметры, так и структуру сетей, пытаясь найти баланс между пригодностью разработанных решений и их разнообразием. Он основан на применении трех ключевых методов: отслеживании генов с помощью исторических маркеров, позволяющих осуществлять скрещивание топологий, применении видообразования (эволюции видов) для сохранения инноваций и постепенной разработке топологий из простых исходных структур («усложнение»).

Производительность

[ редактировать ]

В простых задачах управления алгоритм NEAT часто создает эффективные сети быстрее, чем другие современные нейроэволюционные методы и методы обучения с подкреплением . [1] [2]

Алгоритм

[ редактировать ]

Традиционно топологию нейронной сети выбирает человек-экспериментатор, а эффективные значения веса соединения изучаются посредством процедуры обучения. Это приводит к ситуации, когда может потребоваться процесс проб и ошибок для определения подходящей топологии. NEAT — это пример искусственной нейронной сети с развитием топологии и веса (TWEANN), которая пытается одновременно изучить значения веса и соответствующую топологию для нейронной сети.

Чтобы закодировать сеть в фенотип для GA, NEAT использует схему прямого кодирования, которая означает, что каждое соединение и нейрон представлены явно. В этом отличие от схем косвенного кодирования, которые определяют правила, позволяющие строить сеть без явного представления каждого соединения и нейрона, что обеспечивает более компактное представление.

Подход NEAT начинается с персептронной сети прямой связи, состоящей только из входных и выходных нейронов. По мере того, как эволюция проходит через отдельные этапы, сложность топологии сети может возрастать либо за счет вставки нового нейрона в путь соединения, либо за счет создания нового соединения между (ранее не связанными) нейронами.

Конкурирующие конвенции

[ редактировать ]

Проблема конкурирующих соглашений возникает, когда существует более одного способа представления информации в фенотипе. Например, если геном содержит нейроны A , B и C и представлен [ABC], если этот геном скрещен с идентичным геномом (с точки зрения функциональности), но упорядоченное скрещивание [CBA] приведет к появлению потомков, в которых отсутствует информация ( [ABA] или [CBC]), фактически в этом примере потеряна 1/3 информации. NEAT решает эту проблему, отслеживая историю генов с помощью глобального числа инноваций, которое увеличивается по мере добавления новых генов. При добавлении нового гена глобальный номер инновации увеличивается и присваивается этому гену. Таким образом, чем выше число, тем позже был добавлен ген. Для конкретного поколения, если идентичная мутация возникает более чем в одном геноме, им обоим присваивается один и тот же номер, однако в дальнейшем число мутаций останется неизменным на неопределенный срок.

Эти инновационные цифры позволяют NEAT сопоставлять гены, которые можно скрещивать друг с другом. [1]

Выполнение

[ редактировать ]

Оригинальная реализация Кена Стэнли опубликована под лицензией GPL . Он интегрируется с Guile GNU , интерпретатором схем . Эта реализация NEAT считается общепринятой базовой отправной точкой для реализации алгоритма NEAT.

Расширения

[ редактировать ]

В 2003 году Стэнли разработал расширение NEAT, которое позволяет эволюции происходить в реальном времени, а не посредством итерации поколений, как это используется в большинстве генетических алгоритмов. Основная идея состоит в том, чтобы подвергнуть популяцию постоянной оценке с помощью «пожизненного» таймера для каждого человека в популяции. Когда таймер сети истекает, ее текущая мера приспособленности проверяется, чтобы увидеть, находится ли она в нижней части популяции, и если да, то она отбрасывается и заменяется новой сетью, созданной от двух родителей с высокой приспособленностью. Для новой сети устанавливается таймер, и он помещается в популяцию для участия в текущих оценках.

Первым применением rtNEAT стала видеоигра под названием Neuro-Evolving Robotic Operatives или NERO. На первом этапе игры отдельные игроки размещают роботов в «песочнице» и обучают их определенной тактической доктрине. После обучения группы роботов второй этап игры позволяет игрокам сразить своих роботов с роботами, обученными каким-либо другим игроком, чтобы увидеть, насколько хорошо их режимы обучения подготовили их роботов к битве.

Поэтапная обрезка

[ редактировать ]

Расширение NEAT Кена Стэнли, разработанное Колином Грином, добавляет периодическую обрезку сетевых топологий возможных решений в процессе эволюции. Это дополнение решило проблему, связанную с тем, что неограниченный автоматизированный рост создаст ненужную структуру.

ГиперНИАТ

[ редактировать ]

HyperNEAT специализируется на разработке крупномасштабных структур. Первоначально он был основан на теории CPPN и является активной областью исследований.

NEAT, генерирующий контент (cgNEAT), разрабатывает индивидуальный контент видеоигр на основе предпочтений пользователя. Первой видеоигрой, в которой реализован cgNEAT, является Galactic Arms Race , космический шутер, в котором уникальное оружие системы частиц разрабатывается на основе статистики использования игроками. [3] Каждое оружие системы частиц в игре контролируется развитым CPPN , аналогично технике эволюции в программе интерактивного искусства NEAT Particles .

odNEAT — это онлайн-децентрализованная версия NEAT, предназначенная для систем с несколькими роботами. [4] odNEAT выполняется на самих роботах во время выполнения задач для непрерывной оптимизации параметров и топологии контроллеров на базе искусственных нейронных сетей. Таким образом, роботы, выполняющие odNEAT, имеют потенциал адаптироваться к меняющимся условиям и научиться новому поведению при выполнении своих задач. Онлайн-эволюционный процесс реализуется в соответствии с моделью физически распределенного острова. Каждый робот оптимизирует внутреннюю совокупность решений-кандидатов (внутриостровная вариация), а два или более роботов обмениваются решениями-кандидатами при встрече (миграция между островами). Таким образом, каждый робот потенциально самодостаточен, и эволюционный процесс извлекает выгоду из обмена контроллерами между несколькими роботами для более быстрого синтеза эффективных контроллеров.

См. также

[ редактировать ]
  1. ^ Перейти обратно: а б Кеннет О. Стэнли и Ристо Мииккулайнен (2002). «Развитие нейронных сетей посредством расширения топологий». Эволюционные вычисления 10 (2): 99–127.
  2. ^ Мэтью Э. Тейлор, Шимон Уайтсон и Питер Стоун (2006). «Сравнение методов эволюционного и временного различия в области обучения с подкреплением». GECCO 2006: Материалы конференции по генетическим и эволюционным вычислениям.
  3. ^ Эрин Дж. Гастингс, Ратан К. Гуха и Кеннет О. Стэнли (2009). «Автоматическое создание контента в видеоигре «Галактическая гонка вооружений». Транзакции IEEE по вычислительному интеллекту и искусственному интеллекту в играх, том 4, номер 1, страницы 245–263, Нью-Йорк: IEEE Press, 2009.
  4. ^ Сильва, Фернандо; Урбано, Пауло; Коррейя, Луис; Кристенсен, Андерс Люне (15 сентября 2015 г.). «odNEAT: алгоритм децентрализованной онлайн-эволюции роботизированных контроллеров». Эволюционные вычисления . 23 (3): 421–449. дои : 10.1162/evco_a_00141 . hdl : 10071/10504 . ПМИД   25478664 . S2CID   20815070 .

Библиография

[ редактировать ]

Реализации

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: edd32141789cbb3ed06d26633df86d16__1716559500
URL1:https://arc.ask3.ru/arc/aa/ed/16/edd32141789cbb3ed06d26633df86d16.html
Заголовок, (Title) документа по адресу, URL1:
Neuroevolution of augmenting topologies - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)