PVLV
Model pierwotnej wartości wyuczonej ( PVLV ) jest możliwym wyjaśnieniem przewidywanych przez nagrodę właściwości odpalania neuronów dopaminowych (DA). Symuluje dane behawioralne i neuronowe dotyczące warunkowania Pawłowa i neuronów dopaminergicznych śródmózgowia , które aktywują się proporcjonalnie do nieoczekiwanych nagród. Jest to alternatywa dla algorytmu różnic czasowych (TD) .
Jest używany jako część Leabra .
- ^ O'Reilly, RC; Frank, MJ; Zamglony, TE & Watz, B. (2007). „PVLV: podstawowa wartość i wyuczona wartość Pawłowa algorytm uczenia się” . Neuronauka behawioralna . 121 (1): 31–4. CiteSeerX 10.1.1.67.6739 . doi : 10.1037/0735-7044.121.1.31 . PMID 17324049 .
- Bibliografia _ _ CCNLab.