CLARION (architektura kognitywna)

Connectionist Learning with Adaptive Rule Induction On-line ( CLARION ) to obliczeniowa architektura kognitywna , która została wykorzystana do symulacji wielu dziedzin i zadań w psychologii poznawczej i psychologii społecznej , a także do implementacji inteligentnych systemów w aplikacjach sztucznej inteligencji . Ważną cechą CLARION jest rozróżnienie między procesami jawnymi i niejawnymi oraz skupienie się na uchwyceniu interakcji między tymi dwoma typami procesów. System został stworzony przez grupę badawczą kierowaną przez Rona Suna .

Clarion Framework

Przegląd

CLARION jest integracyjną architekturą poznawczą, służy do wyjaśniania i symulowania zjawisk poznawczo-psychologicznych, co potencjalnie może prowadzić do ujednoliconego wyjaśnienia zjawisk psychologicznych. Istnieją trzy warstwy teorii CLARION, pierwsza warstwa to podstawowa teoria umysłu. Główne teorie składają się z kilku odrębnych podsystemów, które są podstawowymi strukturami CLARION, z podwójną strukturą reprezentacji w każdym podsystemie (reprezentacje ukryte kontra jawne; Sun i in., 2005). Jego podsystemy obejmują podsystem skoncentrowany na działaniu, podsystem nieskoncentrowany na działaniu, podsystem motywacyjny i podsystem metapoznawczy . Druga warstwa składa się z modeli obliczeniowych, które realizują podstawową teorię, jest bardziej szczegółowa niż teoria pierwszego poziomu, ale nadal jest ogólna. Trzecia warstwa składa się z konkretnych zaimplementowanych modeli i symulacji procesów lub zjawisk psychologicznych. Modele tej warstwy wynikają z teorii podstawowej i ogólnych modeli obliczeniowych.

Podwójna struktura reprezentacji

Rozróżnienie między procesami jawnymi i niejawnymi ma fundamentalne znaczenie dla architektury kognitywnej Clarion. To rozróżnienie jest motywowane przede wszystkim dowodami wspierającymi pamięć ukrytą i uczenie się utajone . Clarion wychwytuje rozróżnienie implicit-explicit niezależnie od rozróżnienia między pamięcią proceduralną a pamięcią deklaratywną . Aby uchwycić rozróżnienie implicit-explicit, Clarion postuluje istnienie dwóch równoległych i oddziałujących na siebie systemów reprezentacyjnych, przechwytujących odpowiednio wiedzę jawną i niejawną. Wiedza jawna jest związana z reprezentacją lokalistyczną, a wiedza niejawna z reprezentacją rozproszoną.

Wiedza jawna znajduje się na najwyższym poziomie architektury, podczas gdy wiedza niejawna znajduje się na najniższym poziomie. Na obu poziomach podstawowymi jednostkami reprezentacyjnymi są koneksjonistyczne , przy czym oba poziomy różnią się typem kodowania. Na najwyższym poziomie wiedza jest kodowana przy użyciu lokalnych węzłów fragmentów, podczas gdy na najniższym poziomie wiedza jest kodowana w sposób rozproszony poprzez kolekcje (mikro)węzłów cech. Wiedza może być redundantnie kodowana między dwoma poziomami i może być przetwarzana równolegle w obrębie dwóch poziomów. Na najwyższym poziomie przetwarzanie informacji obejmuje przekazywanie aktywacji między węzłami fragmentów za pomocą reguł, a na dolnym poziomie przetwarzanie informacji obejmuje propagację aktywacji (mikro)cech przez sztuczne sieci neuronowe . Przepływy informacji z góry na dół i z dołu do góry są możliwe dzięki powiązaniom między tymi dwoma poziomami. Takie powiązania są ustanawiane przez fragmenty Clarion, z których każdy składa się z pojedynczego węzła fragmentu, zbioru węzłów (mikro)funkcji oraz powiązań między węzłem fragmentu a węzłami (mikro)funkcji. W ten sposób pojedyncza porcja wiedzy może być wyrażona zarówno w jawnej (tj. lokalnej), jak i ukrytej (tj. rozproszonej), chociaż taka dwoista ekspresja nie zawsze jest wymagana.

Podwójna struktura reprezentacji umożliwia procesom niejawnym i jawnym komunikowanie się i potencjalnie redundantne kodowanie treści. W rezultacie teoria Clarion może wyjaśniać różne zjawiska, takie jak efekty przyspieszenia uczenia się, wzrost wydajności związany z werbalizacją, wzrost wydajności w zadaniach transferowych oraz zdolność do przeprowadzania rozumowania opartego na podobieństwach, pod względem synergistycznej interakcji między niejawnymi i wyraźne procesy. Te interakcje obejmują zarówno przepływ aktywacji w architekturze (np. rozumowanie oparte na podobieństwach jest wspierane przez rozłożenie aktywacji na fragmenty poprzez wspólne (mikro)funkcje), jak i procesy uczenia się oddolnego, odgórnego i równoległego. W uczeniu się oddolnym skojarzenia między (mikro)cechami na najniższym poziomie są wyodrębniane i kodowane jako jawne reguły. W uczeniu się z góry na dół reguły na najwyższym poziomie kierują rozwojem ukrytych skojarzeń na najniższym poziomie. Dodatkowo uczenie się może odbywać się równolegle, dotykając jednocześnie procesów ukrytych i jawnych. Dzięki tym procesom uczenia się wiedza może być kodowana w sposób redundantny lub uzupełniający, zgodnie z historią agenta. Efekty synergii wynikają częściowo z interakcji tych procesów uczenia się. Innym ważnym mechanizmem wyjaśniającym efekty synergii jest kombinacja i względna równowaga sygnałów z różnych poziomów architektury. Na przykład w jednym badaniu modelowania opartym na Clarion zaproponowano, że wynikająca z lęku nierównowaga we względnym udziale procesów ukrytych i jawnych może być mechanizmem odpowiedzialnym za degradację wydajności pod presją.

podsystemy

Architektura kognitywna Clarion składa się z czterech podsystemów.

Podsystem zorientowany na działanie

Rolą podsystemu zorientowanego na działanie jest kontrolowanie zarówno działań zewnętrznych, jak i wewnętrznych . Warstwa niejawna składa się z sieci neuronowych zwanych sieciami neuronowymi działania, natomiast warstwa jawna składa się z reguł działania. Może istnieć synergia między tymi dwiema warstwami, na przykład nauka umiejętności może zostać przyspieszona, gdy agent musi jasno określić zasady dotyczące danej procedury. Argumentowano, że sama wiedza ukryta nie może optymalizować tak dobrze, jak połączenie wiedzy jawnej i ukrytej.

Podsystem niezorientowany na działanie

Rolą podsystemu niezorientowanego na działanie jest utrzymywanie wiedzy ogólnej. Warstwa niejawna składa się z asocjacyjnych sieci neuronowych, podczas gdy dolna warstwa to reguły asocjacyjne. Wiedza dzieli się dalej na semantyczną i epizodyczną, gdzie semantyczna to wiedza uogólniona, a epizodyczna to wiedza mająca zastosowanie do bardziej szczegółowych sytuacji. Należy również zauważyć, że ponieważ istnieje warstwa ukryta, nie cała wiedza deklaratywna musi być jawna.

Podsystem motywacyjny

Rolą podsystemu motywacyjnego jest zapewnienie podstawowych motywacji dla percepcji, działania i poznania. System motywacyjny w CLARION składa się z motywów na najniższym poziomie, a każdy motyw może mieć różną siłę. Istnieją popędy niskiego poziomu, a także popędy wysokiego poziomu, których celem jest utrzymanie agenta w stanie trwałego, celowego, skupionego i adaptacyjnego. Warstwa jawna systemu motywacyjnego składa się z celów. Wyraźne cele są używane, ponieważ są bardziej stabilne niż ukryte stany motywacyjne. ramy CLARION uważają, że ludzkie procesy motywacyjne są bardzo złożone i nie mogą być reprezentowane tylko poprzez jawną reprezentację.

Przykłady niektórych dysków niskiego poziomu obejmują:

  • żywność
  • woda
  • reprodukcja
  • unikanie nieprzyjemnych bodźców (nie wyklucza się wzajemnie z innymi popędami niskiego poziomu, ale oddzielnie dla możliwości bardziej specyficznych bodźców)

Przykłady niektórych dysków wysokiego poziomu obejmują:

  • Przynależność i przynależność
  • Uznanie i osiągnięcie
  • Dominacja i władza
  • Uczciwość

Istnieje również możliwość powstania napędów pochodnych (zwykle w wyniku próby zaspokojenia napędów podstawowych), które można utworzyć albo poprzez warunkowanie, albo za pomocą instrukcji zewnętrznych. każdy potrzebny napęd będzie miał proporcjonalną siłę, zostanie również wzięta pod uwagę szansa

Podsystem metapoznawczy

Rolą podsystemu metapoznawczego jest monitorowanie, kierowanie i modyfikowanie operacji wszystkich pozostałych podsystemów. Działania w podsystemie metapoznawczym obejmują: wyznaczanie celów dla podsystemu zorientowanego na działanie, ustawianie parametrów dla podsystemu działającego i niedziałającego oraz zmianę trwającego procesu zarówno w podsystemie działającym, jak i niedziałającym.

Uczenie się

Uczenie się może być reprezentowane zarówno przez wiedzę jawną, jak i ukrytą, indywidualnie, jednocześnie reprezentując uczenie się oddolne i odgórne. Uczenie się z wiedzą ukrytą jest reprezentowane przez Q-learning, podczas gdy uczenie się z wiedzą jawną jest reprezentowane przez jednorazowe uczenie się , takie jak testowanie hipotez. Uczenie oddolne (Sun i in., 2001) jest reprezentowane przez sieć neuronową propagującą się do warstwy jawnej za pomocą algorytmu Rule-Extraction-Refinement (RER), podczas gdy uczenie odgórne może być reprezentowane na różne sposoby.

Porównanie z innymi architekturami kognitywnymi

Dla porównania z kilkoma innymi architekturami kognitywnymi (Sun, 2016):

  • ACT-R stosuje podział na pamięć proceduralną i deklaratywną, który jest nieco podobny do rozróżnienia firmy CLARION na podsystem skoncentrowany na działaniu i podsystem nieskoncentrowany na działaniu. Jednak ACT-R nie ma wyraźnego rozróżnienia (opartego na procesach lub opartego na reprezentacji) między procesami ukrytymi i jawnymi, co jest fundamentalnym założeniem teorii CLARION.
  • Soar nie obejmuje wyraźnej różnicy opartej na reprezentacji lub procesie między poznaniem ukrytym a jawnym lub między pamięcią proceduralną a deklaratywną; opiera się na ideach przestrzeni problemowych, stanów i operatorów. Gdy na stosie celów znajduje się wyjątkowy cel, różne produkcje proponują różnych operatorów i preferencje operatorów do osiągnięcia celu.
  • EPIC przyjmuje system produkcyjny podobny do ACT-R. Nie obejmuje jednak dychotomii procesów ukrytych i jawnych, co jest istotne w CLARION.

Zastosowania teoretyczne

CLARION został wykorzystany do uwzględnienia różnych danych psychologicznych (Sun, 2002, 2016), takich jak zadanie szeregowego czasu reakcji, zadanie sztucznej nauki gramatyki, zadanie kontroli procesu, zadanie wnioskowania kategorycznego, zadanie arytmetyki alfabetycznej i zadanie Wieża Hanoi. Zadania szeregowego czasu reakcji i kontroli procesu są typowymi zadaniami uczenia się ukrytego (głównie obejmującymi ukryte procedury reaktywne), podczas gdy Wieża Hanoi i arytmetyka alfabetyczna to zadania nabywania umiejętności poznawczych wysokiego poziomu (ze znaczną obecnością jawnych procesów). Ponadto przeprowadzono szeroko zakrojone prace nad złożonym zadaniem nawigacji po polu minowym, które obejmuje złożone, sekwencyjne podejmowanie decyzji. Rozpoczęto również prace nad zadaniami związanymi z decyzjami organizacyjnymi i innymi zadaniami symulacji społecznej (np. Naveh i Sun, 2006), a także zadaniami metakognitywnymi.

Inne zastosowania architektury kognitywnej obejmują symulację kreatywności (Helie i Sun, 2010) oraz zajmowanie się obliczeniowymi podstawami świadomości (lub sztucznej świadomości ) (Coward i Sun, 2004).

  1. ^ a b c   Sun, Ron (2016-03-01). Anatomia umysłu: badanie mechanizmów i procesów psychologicznych za pomocą architektury poznawczej Clarion . Oxford University Press. doi : 10.1093/acprof:oso/9780199794553.001.0001 . ISBN 978-0-19-979455-3 .
  2. ^   Słońce, Ron (2001-09-01). Dwoistość umysłu: oddolne podejście do poznania . Prasa psychologiczna. doi : 10.4324/9781410604378 . ISBN 978-1-4106-0437-8 .
  3. ^   Słońce, Ron; Merrill, Edward; Peterson, Todd (2001). „Od ukrytych umiejętności do jawnej wiedzy: oddolny model uczenia się umiejętności” . Kognitywistyka . 25 (2): 203–244. doi : 10.1207/s15516709cog2502_2 . ISSN 1551-6709 .
  4. ^    Słońce, Ron; Zhang, Xi (2006-06-01). „Rozliczanie różnych danych rozumowania w architekturze poznawczej” . Dziennik eksperymentalnej i teoretycznej sztucznej inteligencji . 18 (2): 169–191. doi : 10.1080/09528130600557713 . ISSN 0952-813X . S2CID 29729283 .
  5. ^    Domangue, Thomas J.; Mathews, Robert C.; Słońce, Ron; Roussel, Lewis G.; Guidry, Claire E. (2004). „Wpływ przetwarzania opartego na modelu i pamięci na szybkość i dokładność generowania ciągów gramatycznych” . Journal of Experimental Psychology: uczenie się, pamięć i poznanie . 30 (5): 1002–1011. doi : 10.1037/0278-7393.30.5.1002 . ISSN 1939-1285 . PMID 15355132 .
  6. ^    Wilson, Mikołaj R.; Słońce, Ron; Mathews, Robert C. (2009-07-01). „Oparta na motywacji symulacja degradacji wydajności pod presją” . Sieci neuronowe . 22 (5–6): 502–508. doi : 10.1016/j.neunet.2009.06.022 . ISSN 0893-6080 . PMID 19608380 .

Tchórz, LA & Sun, R. (2004). Kryteria skutecznej teorii świadomości i kilka wstępnych prób. Świadomość i poznanie , 13 , 268-301.

Helie, H. i Sun, R. (2010). Inkubacja, wgląd i kreatywne rozwiązywanie problemów: ujednolicona teoria i model koneksjonistyczny. Przegląd psychologiczny , 117 , 994-1024.

Naveh, I. & Sun, R. (2006). Kognitywna symulacja nauki akademickiej. Obliczeniowa i matematyczna teoria organizacji , 12 , 313-337.

Słońce, R. (2002). Dwoistość umysłu: oddolne podejście do poznania . Mahwah, NJ: Lawrence Erlbaum Associates.

Słońce, R. (2016). Anatomia umysłu: badanie mechanizmów i procesów psychologicznych za pomocą architektury poznawczej firmy Clarion. Oxford University Press, Nowy Jork.

Słońce, R. (2003). Samouczek dotyczący oprogramowania CLARION 5.0 . Raport techniczny, Wydział Kognitywistyki, Rensselaer Polytechnic Institute.

Słońce, R., Merrill, E. i Peterson, T. (2001). Od ukrytych umiejętności do jawnej wiedzy: oddolny model uczenia się umiejętności. Kognitywistyka , 25 , 203-244. https://web.archive.org/web/20191218033659/http://www.cogsci.rpi.edu/~rsun/

Sun R., Ślusarz P. i Terry C. (2005). Interakcja jawnego i ukrytego w uczeniu się umiejętności: podejście dwuprocesowe. Przegląd psychologiczny , 112 , 159-192. https://web.archive.org/web/20191218033659/http://www.cogsci.rpi.edu/~rsun/

Słońce, R. i Zhang, X. (2006). Uwzględnianie różnych danych rozumowania w architekturze kognitywnej. Journal of Experimental and Theoretical Artificial Intelligence , 18 , 169-191.

Linki zewnętrzne