Teoria pola decyzyjnego

Teoria pola decyzyjnego ( DFT ) to dynamiczno-poznawcze podejście do podejmowania decyzji przez człowieka. Jest to model poznawczy , który opisuje, w jaki sposób ludzie faktycznie podejmują decyzje, a nie racjonalna lub normatywna teoria , która określa, co ludzie powinni lub powinni robić. Jest to również dynamiczny model podejmowania decyzji , a nie model statyczny, ponieważ opisuje, w jaki sposób preferencje danej osoby ewoluują w czasie, aż do podjęcia decyzji, zamiast zakładać stały stan preferencji. Proces ewolucji preferencji jest matematycznie przedstawiony jako proces stochastyczny zwany procesem dyfuzji . Służy do przewidywania, w jaki sposób ludzie podejmują decyzje w warunkach niepewności, jak decyzje zmieniają się pod presją czasu i jak kontekst wyboru zmienia preferencje. Model ten może być wykorzystany do przewidywania nie tylko dokonywanych wyborów, ale także czasu decyzji lub reakcji .

Artykuł „Teoria pola decyzyjnego” został opublikowany przez Jerome'a ​​​​R. Busemeyera i Jamesa T. Townsenda w 1993 r. Wykazano, że DFT wyjaśnia wiele zagadkowych odkryć dotyczących zachowań związanych z wyborem człowieka, w tym naruszenia dominacji stochastycznej , naruszenia silnej przechodniości stochastycznej , naruszenia niezależności między alternatywami, wpływ pozycji szeregowej na preferencje, efekty kompromisu dotyczącego dokładności prędkości, odwrotna zależność między prawdopodobieństwem a czasem decyzji, zmiany decyzji pod presją czasu, a także odwrócenie preferencji między wyborami a cenami. DFT oferuje również pomost do neuronauki . Ostatnio autorzy teorii pola decyzyjnego rozpoczęli także eksplorację nowego kierunku teoretycznego zwanego poznaniem kwantowym .

Wstęp

Nazwa teoria pola decyzyjnego została wybrana, aby odzwierciedlić fakt, że inspiracja dla tej teorii pochodzi z wcześniejszego podejścia – modelu konfliktu unikania zawartego w ogólnej teorii psychologicznej Kurta Lewina , którą nazwał teorią pola . DFT należy do ogólnej klasy modeli sekwencyjnego próbkowania, które są powszechnie stosowane w różnych dziedzinach poznania.

Podstawowe idee leżące u podstaw procesu decyzyjnego dla modeli sekwencyjnego doboru próby przedstawiono na rysunku 1 poniżej. Załóżmy, że decydent ma początkowo do wyboru trzy ryzykowne perspektywy, A, B, C, w czasie t = 0. Oś pozioma na rysunku przedstawia czas namysłu (w sekundach), a oś pionowa reprezentuje siłę preferencji. Każda trajektoria na rysunku reprezentuje stan preferencji dla jednej z ryzykownych perspektyw w każdym momencie.

Rysunek 1 — Przykładowe ścieżki dla procesu dyfuzji

Intuicyjnie, w każdym momencie decydent myśli o różnych korzyściach dla każdego potencjalnego klienta, co wywołuje afektywną reakcję lub wartościowość dla każdego potencjalnego klienta. Te wartościowości są integrowane w czasie, aby wytworzyć stan preferencji w każdym momencie. W tym przykładzie, podczas wczesnych etapów przetwarzania (między 200 a 300 ms), uwaga skupia się na korzyściach sprzyjających prospektowi C, ale później (po 600 ms) uwaga jest przenoszona na korzyści sprzyjające prospektowi A. Zasadą zatrzymania tego procesu jest kontrolowany przez próg (który w tym przykładzie jest ustawiony na 1,0): akceptowany jest pierwszy prospekt, który osiągnął najwyższy próg, którym w tym przypadku jest prospekt A po około dwóch sekundach. Prawdopodobieństwo wyboru określa pierwsza opcja wygrania wyścigu i przekroczenia górnego progu, a czas decyzji jest równy czasowi namysłu potrzebnemu jednemu z kandydatów do osiągnięcia tego progu.

Próg jest ważnym parametrem do kontrolowania kompromisów między prędkością a dokładnością. Jeśli próg jest ustawiony na niższą wartość (około 0,30) na rysunku 1, wtedy prospekt C zostałby wybrany zamiast prospekta A (i zrobiono to wcześniej). W ten sposób decyzje mogą się odwrócić pod presją czasu. Wysokie progi wymagają osiągnięcia silnego stanu preferencji, co pozwala na pobranie większej ilości informacji o prospektach, wydłużenie procesu deliberacji i zwiększenie dokładności. Niskie progi pozwalają słabemu stanowi preferencji określić decyzję, co odcina próbkowanie informacji o perspektywach, skracając proces deliberacji i zmniejszając trafność. Pod dużą presją czasu decydenci muszą wybrać niski próg; ale pod niewielką presją czasu można zastosować wyższy próg w celu zwiększenia dokładności. Bardzo ostrożni i rozważni decydenci zwykle stosują wysoki próg, a impulsywni i nieostrożni decydenci używają niskiego progu. Aby przedstawić nieco bardziej sformalizowany opis teorii, załóżmy, że decydent ma do wyboru trzy działania, a także załóżmy dla uproszczenia, że ​​są tylko cztery możliwe wyniki końcowe. Zatem każde działanie jest definiowane przez rozkład prawdopodobieństwa dla tych czterech wyników. Wartości afektywne wytwarzane przez każdą wypłatę są reprezentowane przez wartości m j . W dowolnym momencie decydent przewiduje wypłatę każdego działania, co daje chwilową ocenę U i (t) dla działania i. Ta chwilowa ocena jest ważoną uwagą średnią afektywnej oceny każdej wypłaty: U i (t) = Σ W ij (t)m j . Zakłada się , że waga uwagi w czasie t, W ij (t), dla wypłaty j oferowanej przez działanie i, zmienia się zgodnie ze stacjonarnym procesem stochastycznym. Odzwierciedla to ideę, że uwaga przesuwa się z chwili na chwilę, powodując zmiany w przewidywanej wypłacie każdego działania w czasie. Chwilowa ocena każdego działania jest porównywana z innymi działaniami w celu utworzenia wartościowości dla każdego działania w każdym momencie, v i (t) = U i (t) – U.(t), gdzie U.(t) jest równe średniej z wszystkie chwilowe akcje. Wartościowość reprezentuje chwilową zaletę lub wadę każdego działania. Całkowita wartościowość równoważy się do zera, więc wszystkie opcje nie mogą stać się atrakcyjne jednocześnie. Wreszcie, wartościowości są danymi wejściowymi do systemu dynamicznego, który integruje wartościowości w czasie, aby wygenerować wyjściowe stany preferencji. Wyjściowy stan preferencji dla działania i w czasie t jest symbolizowany jako P i (t). Układ dynamiczny jest opisany następującym liniowym stochastycznym równaniem różnicowym dla małego kroku czasowego h w procesie deliberacji: P i (t+h) = Σ s ij P j (t)+v i (t+h). współczynnik samo sprzężenia zwrotnego, s ii = s > 0, steruje pamięcią dla przeszłych wartościowości wejściowych dla stanu preferencji. Wartości s ii < 1 sugerują zanik pamięci lub wpływ poprzednich wartościowości w czasie, natomiast wartości s ii > 1 sugerują wzrost wpływu w czasie (efekty pierwszeństwa). Ujemne współczynniki bocznego sprzężenia zwrotnego, s ij = s ji < 0 dla i nierównego j, powodują konkurencję między działaniami, tak że silni hamują słabych. Innymi słowy, wraz ze wzrostem preferencji dla jednego działania, zmniejsza się preferencja dla innych działań. Zakłada się, że wielkości bocznych współczynników hamowania są rosnącą funkcją podobieństwa między opcjami wyboru. Te boczne współczynniki hamowania są ważne dla wyjaśnienia wpływu kontekstu na preferencje opisane później. Formalnie jest to proces Markowa; formuły macierzowe zostały wyprowadzone matematycznie do obliczania prawdopodobieństw wyboru i rozkładu czasów odpowiedzi wyboru.

Teorię pola decyzyjnego można również postrzegać jako dynamiczną i stochastyczną teorię błądzenia losowego podejmowania decyzji, przedstawioną jako model umieszczony pomiędzy wzorcami aktywacji neuronów niższego poziomu a bardziej złożonymi pojęciami podejmowania decyzji występującymi w psychologii i ekonomii.

Wyjaśnienie wpływu kontekstu

DFT jest w stanie wyjaśnić skutki kontekstu, których wiele teorii podejmowania decyzji nie jest w stanie wyjaśnić.

Wiele klasycznych probabilistycznych modeli wyboru spełnia dwa racjonalne typy zasad wyboru. Jedna zasada nazywa się niezależnością nieistotnych alternatyw i zgodnie z tą zasadą, jeśli prawdopodobieństwo wyboru opcji X jest większe niż opcji Y, gdy dostępne są tylko X, Y, to prawdopodobieństwo wyboru opcji X zamiast Y jest większe, nawet jeśli nowa opcja Z jest dodawana do zbioru wyborów. Innymi słowy, dodanie opcji nie powinno zmieniać relacji preferencji między pierwotną parą opcji. Druga zasada nazywa się regularnością i zgodnie z tą zasadą prawdopodobieństwo wybrania opcji X ze zbioru zawierającego tylko X i Y powinno być większe lub równe prawdopodobieństwu wybrania opcji X z większego zbioru zawierającego opcje X, Y, oraz nową opcję Z. Innymi słowy, dodanie opcji powinno tylko zmniejszyć prawdopodobieństwo wyboru jednej z pierwotnych par opcji. Jednak wyniki empiryczne uzyskane przez badaczy konsumenckich badających zachowania związane z wyborem człowieka wykazały systematyczne efekty kontekstowe, które systematycznie naruszają obie te zasady.

Pierwszym efektem kontekstu jest efekt podobieństwa. Efekt ten pojawia się wraz z wprowadzeniem trzeciej opcji S, która jest podobna do X, ale nie jest zdominowana przez X. Załóżmy na przykład, że X to BMW, Y to Ford focus, a S to Audi. Audi jest podobne do BMW, ponieważ oba nie są bardzo ekonomiczne, ale oba są wysokiej jakości i sportowe. Ford focus różni się od BMW i Audi tym, że jest bardziej ekonomiczny, ale gorszej jakości. Załóżmy, że w przypadku wyboru binarnego X jest wybierany częściej niż Y. Następnie załóżmy, że nowy zestaw wyborów jest tworzony przez dodanie opcji S, która jest podobna do X. Jeśli X jest podobny do S i oba są bardzo różne od Y, ludzie mają tendencję do postrzegania X i S jako jednej grupy, a Y jako innej opcji. Zatem prawdopodobieństwo Y pozostaje takie samo, niezależnie od tego, czy S jest przedstawiane jako opcja, czy nie. Jednak prawdopodobieństwo X zmniejszy się o około połowę wraz z wprowadzeniem S. Powoduje to, że prawdopodobieństwo wyboru X spadnie poniżej Y, gdy S zostanie dodane do zbioru wyborów. Narusza to niezależność właściwości nieistotnych alternatyw, ponieważ w przypadku wyboru binarnego X jest wybierany częściej niż Y, ale gdy dodaje się S, wówczas Y jest wybierany częściej niż X.

Drugim efektem kontekstu jest efekt kompromisu. Efekt ten występuje po dodaniu opcji C, która jest kompromisem między X i Y. Na przykład przy wyborze między C = Honda i X = BMW, ta druga opcja jest mniej ekonomiczna, ale ma wyższą jakość. Jeśli jednak do zestawu wyboru zostanie dodana inna opcja Y = Ford Focus, wówczas C = Honda stanie się kompromisem między X = BMW i Y = Ford Focus. Załóżmy, że w przypadku wyboru binarnego X (BMW) jest wybierany częściej niż C (Honda). Ale gdy do zestawu dodamy opcję Y (Ford Focus), to opcja C (Honda) staje się kompromisem między X (BMW) a Y (Ford Focus), a C jest wybierana częściej niż X. To kolejne naruszenie o niezależności właściwości nieistotnych alternatyw, ponieważ X jest wybierany częściej niż C w wyborze binarnym, ale C, gdy opcja Y jest dodawana do zbioru wyborów, to C jest wybierane częściej niż X.

Trzeci efekt nazywany jest efektem przyciągania. Efekt ten występuje, gdy trzecia opcja D jest bardzo podobna do X, ale D jest wadliwa w porównaniu z X. Na przykład D może być nowym samochodem sportowym opracowanym przez nowego producenta, który jest podobny do opcji X = BMW, ale kosztuje więcej niż BMW . Dlatego istnieje niewielki lub żaden powód, aby wybierać D zamiast X, aw tej sytuacji D jest rzadko wybierane zamiast X. Jednak dodanie D do zbioru wyborów zwiększa prawdopodobieństwo wyboru X. W szczególności prawdopodobieństwo wyboru X z zbiór zawierający X,Y,D jest większy niż prawdopodobieństwo wybrania X ze zbioru zawierającego tylko X i Y. Wadliwa opcja D sprawia, że ​​X świeci, a ten efekt przyciągania narusza zasadę regularności, która mówi, że dodanie kolejnej opcji nie może zwiększyć popularność opcji w stosunku do pierwotnego podzbioru.

DFT uwzględnia wszystkie trzy efekty przy użyciu tych samych zasad i tych samych parametrów we wszystkich trzech ustaleniach. Według DFT mechanizm przełączania uwagi jest kluczowy dla wywołania efektu podobieństwa, ale boczne połączenia hamujące są kluczowe dla wyjaśnienia efektów kompromisu i przyciągania. Jeśli proces przełączania uwagi zostanie wyeliminowany, efekt podobieństwa zniknie, a jeśli wszystkie połączenia boczne zostaną ustawione na zero, znikną efekty przyciągania i kompromisu. Ta właściwość teorii pociąga za sobą interesującą prognozę wpływu presji czasu na preferencje. Efekty kontrastu wytwarzane przez hamowanie boczne wymagają czasu, aby się nabudować, co oznacza, że ​​efekty przyciągania i kompromisu powinny stać się większe przy dłuższym rozważaniu (zob. Roe, Busemeyer i Townsend 2001 ). Alternatywnie, jeśli efekty kontekstowe są wytwarzane przez przejście z reguły średniej ważonej przy wyborze binarnym na szybką strategię heurystyczną dla wyboru triady, wówczas efekty te powinny wzrosnąć pod presją czasu. Badania empiryczne pokazują, że przedłużanie procesu decyzyjnego zwiększa efekty, a presja czasu zmniejsza efekty.

Neuronauka

Teoria pola decyzyjnego wykazała zdolność do wyjaśnienia szerokiego zakresu ustaleń wynikających z behawioralnego podejmowania decyzji, których czysto algebraiczne i deterministyczne modele często stosowane w ekonomii i psychologii nie mogą wyjaśnić. Niedawne badania, które rejestrują aktywacje nerwowe u naczelnych innych niż ludzie podczas zadań związanych z podejmowaniem decyzji percepcyjnych, ujawniły, że wskaźniki odpalania neuronów ściśle naśladują akumulację preferencji teoretyczną opartą na behawioralnych dyfuzyjnych modelach podejmowania decyzji.

Procesy decyzyjne decyzji sensoryczno-motorycznych zaczynają być dość dobrze rozumiane zarówno na poziomie behawioralnym, jak i neuronalnym. Typowe wyniki wskazują, że aktywacja nerwowa dotycząca informacji o ruchu bodźca jest akumulowana w czasie aż do wartości progowej, a reakcja behawioralna następuje, gdy tylko aktywacja w zarejestrowanym obszarze przekroczy wartość progową. Wniosek, jaki można wyciągnąć, jest taki, że obszary nerwowe odpowiedzialne za planowanie lub przeprowadzanie pewnych działań są również odpowiedzialne za podejmowanie decyzji o przeprowadzeniu działania, co jest zdecydowanie ucieleśnionym pojęciem.

Z matematycznego punktu widzenia wzorzec aktywacji skoku, jak również rozkład czasu wyboru i odpowiedzi, można dobrze opisać za pomocą tak zwanych modeli dyfuzji — zwłaszcza w przypadku zadań z wymuszonym wyborem dwóch alternatywnych rozwiązań . Modele dyfuzyjne, takie jak teoria pola decyzyjnego, można postrzegać jako stochastyczne, rekurencyjne modele sieci neuronowych, z wyjątkiem tego, że dynamika jest aproksymowana przez układy liniowe. Przybliżenie liniowe jest ważne dla utrzymania matematycznej analizy systemów zaburzonych przez szumy wejściowe. Oprócz tych zastosowań neurobiologicznych, kognitywiści wykorzystali modele dyfuzji (lub ich dyskretny czas, błądzenie losowe, analogi) do modelowania wydajności w różnych zadaniach, od wykrywania sensorycznego i dyskryminacji percepcyjnej po rozpoznawanie pamięci i kategoryzację. Zatem modele dyfuzyjne zapewniają potencjał do stworzenia teoretycznego pomostu między neuronowymi modelami zadań czuciowo-motorycznych a behawioralnymi modelami złożonych zadań poznawczych.

Notatki

  1. ^ Busemeyer, JR i Townsend, JT (1993) Teoria pola decyzyjnego: dynamiczne poznawcze podejście do podejmowania decyzji . Przegląd psychologiczny, 100, 432–459.
  2. ^ Busemeyer, JR i Diederich, A. (2002). Przegląd teorii pola decyzyjnego. Matematyczne nauki społeczne, 43(3), 345-370.
  3. ^ Busemeyer, JR i Johnson, JG (2004). Modele obliczeniowe podejmowania decyzji. Blackwell podręcznik oceny i podejmowania decyzji, 133-154.
  4. ^ a b c d e f Busemeyer, JR i Johnson, JG (2008). Mikroprocesowe modele podejmowania decyzji. Cambridge Handbook of Computational Psychology, 302-321.
  5. ^   Oliveira, IFD; Zehavi, S.; Davidov, O. (sierpień 2018). „Przechodniość stochastyczna: aksjomaty i modele”. Journal of Psychologii Matematycznej . 85 : 25–35. doi : 10.1016/j.jmp.2018.06.002 . ISSN 0022-2496 .
  6. ^    Regenwetter, Michel; Dana, Jason; Davis-Stober, Clintin P. (2011). „Przechodniość preferencji”. Przegląd psychologiczny . 118 (1): 42–56. doi : 10.1037/a0021150 . ISSN 1939-1471 . PMID 21244185 .
  7. ^   Twerskiego, Amos (1969). „Nieprzechodniość preferencji”. Przegląd psychologiczny . 76 (1): 31–48. doi : 10.1037/h0026750 . ISSN 0033-295X .
  8. ^ a b c d   Busemeyer, JR; Jessup, RK; Johnson, JG; Townsend, JT (2006). „Budowanie mostów między modelami neuronowymi a złożonymi zachowaniami decyzyjnymi”. Sieci neuronowe . 19 (8): 1047–1058. doi : 10.1016/j.neunet.2006.05.043 . PMID 16979319 .
  9. ^ a b   Ashby, FG (2000). „Stochastyczna wersja teorii ogólnego uznania”. Journal of Psychologii Matematycznej . 44 (2): 310–329. doi : 10.1006/jmps.1998.1249 . PMID 10831374 .
  10. ^ a b   Nosofsky, RM; Palmeri, TJ (1997). „Oparty na przykładach model błądzenia losowego klasyfikacji przyspieszonej”. Przegląd psychologiczny . 104 (2): 226–300. doi : 10.1037/0033-295X.104.2.266 . PMID 9127583 .
  11. ^ a b   Laming, DR (1968). Teoria informacji o czasach wyboru i reakcji . Nowy Jork: prasa akademicka. OCLC 425332 .
  12. ^ ab Łącze   , SW; Heath, RA (1975). „Sekwencyjna teoria dyskryminacji psychologicznej”. Psychometria . 40 : 77–111. doi : 10.1007/BF02291481 . S2CID 49042143 .
  13. ^ a b Smith, PL (1995). „Psychofizyczne modele wizualnego prostego czasu reakcji”. Przegląd psychologiczny . 102 (3): 567–593. doi : 10.1037/0033-295X.102.3.567 .
  14. Bibliografia _ _   _ McClelland, JL (2001). „Przebieg czasowy wyboru percepcyjnego: nieszczelny, konkurencyjny model akumulatora”. Przegląd psychologiczny . 108 (3): 550–592. doi : 10.1037/0033-295X.108.3.550 . PMID 11488378 .
  15. ^ a b Ratcliff, R. (1978). „Teoria odzyskiwania pamięci”. Przegląd psychologiczny . 85 (2): 59–108. doi : 10.1037/0033-295X.85.2.59 .
  16. ^   Diederich, A. (2003). „Konto MDFT dotyczące podejmowania decyzji pod presją czasu” . Biuletyn i przegląd psychonomiczny . 10 (1): 157–166. doi : 10.3758/BF03196480 . PMID 12747503 .
  17. ^   Roe, RM; Busemeyer, JR; Townsend, JT (2001). „Wieloalternatywna teoria pola decyzyjnego: dynamiczny koneksjonistyczny model podejmowania decyzji”. Przegląd psychologiczny . 108 (2): 370–392. doi : 10.1037/0033-295X.108.2.370 . PMID 11381834 .
  18. ^ Pettibone, JC (2012). „Testowanie wpływu presji czasu na wybór asymetrycznej dominacji i kompromisowych wabików” (PDF) . Osądzanie i podejmowanie decyzji . 7 (4): 513–523.
  19. ^ Simonson, I. (1989). „Wybór oparty na powodach: przypadek efektu przyciągania i kompromisu”. Dziennik badań konsumenckich . 16 (2): 158–174. doi : 10.1086/209205 .
  20. Bibliografia _ Nowlis, SM; Sherman, SJ (2000). „Starając się mocno lub prawie nie próbując: analiza wpływu kontekstu na wybór”. Journal of Consumer Psychology . 9 (4): 189–200. doi : 10.1207/S15327663JCP0904_1 .
  21. ^    Schall, JD (2003). „Neuralne korelaty procesów decyzyjnych: chronometria neuronowa i mentalna”. Aktualna opinia w neurobiologii . 13 (2): 182–186. doi : 10.1016/S0959-4388(03)00039-4 . PMID 12744971 . S2CID 2816799 .
  22. ^    Złoto, JI; Shadlen, Minnesota (2000). „Reprezentacja percepcyjnej decyzji w rozwijaniu poleceń okoruchowych”. Natura . 404 (6776): 390–394. Bibcode : 2000Natur.404..390G . doi : 10.1038/35006062 . PMID 10746726 . S2CID 4410921 .
  23. ^   Mazurek, ja; Roitman, JD; Ditterich, J.; Shadlen, Minnesota (2003). „Rola integratorów neuronowych w percepcyjnym podejmowaniu decyzji” . Kora mózgowa . 13 (11): 1257–1269. doi : 10.1093/cercor/bhg097 . PMID 14576217 .
  24. Bibliografia   _ Cherian, A.; Segraves, M. (2003). „Porównanie zachowania makaków i wyższej aktywności neuronalnej wzgórka z przewidywaniami na podstawie modeli decyzji dwóch wyborów”. Dziennik neurofizjologii . 90 (3): 1392–1407. doi : 10.1152/jn.01049.2002 . PMID 12761282 .
  25. Bibliografia   _ Newsome, WT (2001). „Neuralna podstawa decyzji percepcyjnej w korze ciemieniowej (obszar LIP) małpy rezus”. Dziennik neurofizjologii . 86 (4): 1916–1936. doi : 10.1152/jn.2001.86.4.1916 . PMID 11600651 .
  26. ^ Podsumowanie można znaleźć w:    Smith, PL; Ratcliff, R. (2004). „Psychologia i neurobiologia prostych decyzji”. Trendy w neuronaukach . 27 (3): 161–168. doi : 10.1016/j.tins.2004.01.006 . PMID 15036882 . S2CID 6182265 .