PVLV

Model pierwotnej wartości wyuczonej ( PVLV ) jest możliwym wyjaśnieniem przewidywanych przez nagrodę właściwości odpalania neuronów dopaminowych (DA). Symuluje dane behawioralne i neuronowe dotyczące warunkowania Pawłowa i neuronów dopaminergicznych śródmózgowia , które aktywują się proporcjonalnie do nieoczekiwanych nagród. Jest to alternatywa dla algorytmu różnic czasowych (TD) .

Jest używany jako część Leabra .

  1. ^    O'Reilly, RC; Frank, MJ; Zamglony, TE & Watz, B. (2007). „PVLV: podstawowa wartość i wyuczona wartość Pawłowa algorytm uczenia się” . Neuronauka behawioralna . 121 (1): 31–4. CiteSeerX 10.1.1.67.6739 . doi : 10.1037/0735-7044.121.1.31 . PMID 17324049 .
  2. Bibliografia _ _ CCNLab.