PVLV

Model pierwotnej wartości wyuczonej ( PVLV ) jest możliwym wyjaśnieniem przewidywanych przez nagrodę właściwości odpalania neuronów dopaminowych (DA). Symuluje dane behawioralne i neuronowe dotyczące warunkowania Pawłowa i neuronów dopaminergicznych śródmózgowia , które aktywują się proporcjonalnie do nieoczekiwanych nagród. Jest to alternatywa dla algorytmu różnic czasowych (TD) .

Jest używany jako część Leabra .