ПВЛВ
Модель первичной изученной ценности ( PVLV ) (DA) нейронов , предсказывающих вознаграждение является возможным объяснением свойств дофаминовых . [ 1 ] Он моделирует поведенческие и нейронные данные о павловском обусловливании и дофаминергических нейронах среднего мозга , которые срабатывают пропорционально неожиданному вознаграждению. Это альтернатива алгоритму временных разностей (TD) . [ 2 ]
Используется в составе Leabra .
Ссылки
[ редактировать ]- ^ О'Рейли, RC; Фрэнк, MJ; Хейзи, Т.Э. и Ватц, Б. (2007). «PVLV: первичное значение и усвоенное значение, алгоритм обучения Павлова» . Поведенческая нейронаука . 121 (1): 31–4. CiteSeerX 10.1.1.67.6739 . дои : 10.1037/0735-7044.121.1.31 . ПМИД 17324049 .
- ^ «Леабра ПБВМ» . CCNLab.