Architektura pandemonium

Oryginalny model pandemonium zaproponowany przez Olivera Selfridge'a w 1959 roku

Architektura Pandemonium to teoria kognitywistyki opisująca sposób przetwarzania obrazów wizualnych przez mózg. Ma zastosowania w sztucznej inteligencji i rozpoznawaniu wzorców . Teoria została opracowana przez pioniera sztucznej inteligencji Olivera Selfridge'a w 1959 roku. Opisuje proces rozpoznawania obiektów jako hierarchiczny system wykrywania i kojarzenia przez metaforyczny zestaw „demonów” wysyłających do siebie sygnały. Model ten jest obecnie uznawany za podstawę percepcji wzrokowej w kognitywistyce.

Architektura pandemonium powstała w odpowiedzi na niezdolność teorii dopasowywania szablonów do oferowania biologicznie wiarygodnego wyjaśnienia zjawiska stałości obrazu . Współczesny [ kiedy? ] badacze chwalą tę architekturę za elegancję i pomysłowość; że pomysł posiadania wielu niezależnych systemów (np. detektorów cech ) pracujących równolegle w celu rozwiązania zjawiska stałości obrazu rozpoznawania wzorców jest potężny, ale prosty. Podstawową ideą architektury pandemonium jest to, że wzór jest najpierw postrzegany w jego częściach przed „całością”.

Architektura Pandemonium była jednym z pierwszych modeli obliczeniowych w rozpoznawaniu wzorców. Chociaż nie doskonała, architektura pandemonium wpłynęła na rozwój nowoczesnych koneksjonistycznych , sztucznej inteligencji i rozpoznawania słów .

Historia

Dostrzegamy psa, ale jak i dlaczego?

Większość badań nad percepcją koncentrowała się na systemie wizualnym, badając mechanizmy widzenia i rozumienia obiektów. Krytyczną funkcją naszego układu wzrokowego jest jego zdolność do rozpoznawania wzorców, ale mechanizm, za pomocą którego jest to osiągane, jest niejasny.

Najwcześniejszą teorią, która próbowała wyjaśnić, w jaki sposób rozpoznajemy wzorce, jest model dopasowywania szablonów. Zgodnie z tym modelem porównujemy wszystkie bodźce zewnętrzne z wewnętrzną reprezentacją umysłową. Jeśli istnieje „wystarczające” nakładanie się postrzeganego bodźca i wewnętrznej reprezentacji, „rozpoznamy” bodziec. Chociaż niektóre maszyny stosują model dopasowywania szablonów (np. bankomaty weryfikujące podpisy i numery rozliczeniowe), teoria ta jest krytycznie wadliwa w wyjaśnianiu zjawiska stałości obrazu: możemy łatwo rozpoznać bodziec niezależnie od zmian w jego formie prezentacji (np. , T i T są łatwo rozpoznawalne jako litera T). Jest wysoce nieprawdopodobne, że mamy zapisany szablon dla wszystkich odmian każdego wzoru.

W wyniku krytyki biologicznej wiarygodności modelu dopasowywania szablonów, zaczęły powstawać modele wykrywania cech. W modelu wykrywania cech obraz jest najpierw postrzegany w jego podstawowych elementach, zanim zostanie rozpoznany jako cały obiekt. Na przykład, gdy zostanie nam przedstawiona litera A, najpierw zobaczymy krótką poziomą linię i dwie ukośne długie ukośne linie. Następnie połączylibyśmy cechy, aby uzupełnić percepcję A. Każdy unikalny wzór składa się z innej kombinacji cech, co oznacza, że ​​te, które są utworzone z tymi samymi cechami, będą generować takie samo rozpoznanie. Oznacza to, że niezależnie od tego, jak obrócimy literę A, nadal jest ona postrzegana jako litera A. W tego rodzaju architekturze łatwo jest wyjaśnić zjawisko stałości obrazu, ponieważ wystarczy „dopasować” na podstawowym poziomie cech, który zakłada się, że jest ograniczona i skończona, a więc biologicznie prawdopodobna. Najbardziej znany model wykrywania cech nazywa się architekturą pandemonium.

Architektura pandemonium

Architektura pandemonium została pierwotnie opracowana przez Olivera Selfridge'a pod koniec lat pięćdziesiątych. Architektura składa się z różnych grup „demonów” pracujących niezależnie w celu przetwarzania bodźca wzrokowego. Każda grupa demonów jest przypisana do określonego etapu rozpoznawania, aw obrębie każdej grupy demony działają równolegle. Istnieją cztery główne grupy demonów w oryginalnej architekturze.

Cztery główne etapy przetwarzania architektury pandemonium
Scena
Imię demona Funkcjonować
1 Demon obrazu Rejestruje obraz, który jest odbierany na siatkówce.
2 Demony fabularne Istnieje wiele demonów funkcji, z których każdy reprezentuje określoną cechę. Na przykład istnieje demon funkcji dla krótkich linii prostych, inny dla linii zakrzywionych i tak dalej. Zadaniem każdego demona funkcji jest „krzyczenie”, jeśli wykryje cechę, której odpowiada. Należy zauważyć, że demony funkcji nie mają reprezentować żadnych konkretnych neuronów , ale grupę neuronów, które mają podobne funkcje. Na przykład demon cech linii pionowej jest używany do reprezentowania neuronów reagujących na pionowe linie na obrazie siatkówki.
3 Demony poznawcze Obejrzyj „wrzask” demonów fabularnych. Każdy demon poznawczy odpowiada za określony wzorzec (np. literę w alfabecie). „Wrzeszczenie” demonów kognitywnych opiera się na tym, jak wiele z ich wzorca zostało wykrytych przez demony fabularne. Im więcej cech poznawczych demonów znajduje, które odpowiadają ich wzorcowi, tym głośniej „krzyczą”. Na przykład, jeśli demony cech zakrzywionych, długich prostych i krótkich linii skośnych krzyczą naprawdę głośno, demon poznawczy z literą R może być naprawdę podekscytowany, a demon poznawczy z literą P również może być nieco podekscytowany; ale demon poznawczy z literą Z najprawdopodobniej będzie cichy.
4 Demon decyzji
Reprezentuje końcowy etap przetwarzania. Słucha „wrzasku” wytwarzanego przez poznawcze demony. Wybiera najgłośniejszego demona poznawczego. Wybrany demon staje się naszą świadomą percepcją. Kontynuując nasz poprzedni przykład, demon poznawczy R byłby najgłośniejszy, poparty przez P; dlatego dostrzeżemy R, ale gdybyśmy popełnili błąd z powodu złych warunków wyświetlania (np. litery są szybko migające lub mają części zasłonięte), prawdopodobnie będzie to P. Zauważ, że „pandemonium” reprezentuje po prostu skumulowaną „krzyk” wytwarzany przez system.

Koncepcja demonów cech, że istnieją określone neurony dedykowane do wykonywania wyspecjalizowanego przetwarzania, jest poparta badaniami w neuronauce. Hubel i Wiesel odkryli, że w mózgu kota istnieją specyficzne komórki , które reagują na określone długości i orientacje linii. Podobne znaleziska odkryto u żab , ośmiornic i różne inne zwierzęta. Odkryto, że ośmiornice są wrażliwe tylko na pionowość linii, podczas gdy żaby wykazywały szerszy zakres wrażliwości. Te eksperymenty na zwierzętach pokazują, że detektory cech wydają się być bardzo prymitywnym wynalazkiem. Oznacza to, że nie wynikało to z wyższego rozwoju poznawczego ludzi. Nic dziwnego, że istnieją również dowody na to, że ludzki mózg również posiada te elementarne detektory cech.

Co więcej, ta architektura jest zdolna do uczenia się, podobnie jak sieć neuronowa z propagacją wsteczną . Wagę między demonami poznawczymi i cechami można dostosować proporcjonalnie do różnicy między prawidłowym wzorcem a aktywacją ze strony demonów poznawczych. Kontynuując nasz poprzedni przykład, kiedy po raz pierwszy nauczyliśmy się litery R, ​​wiemy, że składa się z zakrzywionej, długiej prostej i krótkiej linii ustawionej pod kątem. Tak więc, kiedy postrzegamy te cechy, postrzegamy R. Jednak litera P składa się z bardzo podobnych cech, więc na początkowych etapach uczenia się jest prawdopodobne, że ta architektura błędnie identyfikuje R jako P. Jednak poprzez stałą ekspozycję potwierdzania cech R, które mają być zidentyfikowane jako R, wagi cech R do P są dostosowywane, aby odpowiedź P została zahamowana (np. uczenie się hamowania odpowiedzi P po wykryciu krótkiej linii). Zasadniczo architektura pandemonium może rozpoznać każdy wzorzec.

Jak wspomniano wcześniej, ta architektura przewiduje błędy na podstawie liczby nakładających się funkcji. Na przykład najbardziej prawdopodobnym błędem dla R powinno być P. Tak więc, aby pokazać, że ta architektura reprezentuje ludzki system rozpoznawania wzorców, musimy przetestować te przewidywania. Naukowcy skonstruowali scenariusze, w których różne litery są prezentowane w sytuacjach, które utrudniają ich identyfikację; następnie zaobserwowano rodzaje błędów, które wykorzystano do wygenerowania macierzy nieporozumień: gdzie rejestrowane są wszystkie błędy dla każdej litery. Ogólnie rzecz biorąc, wyniki tych eksperymentów były zgodne z przewidywaniami błędów z architektury pandemonium. Również w wyniku tych eksperymentów niektórzy badacze zaproponowali modele, które próbowały wymienić wszystkie podstawowe cechy w Alfabet rzymski .

Krytyka

Główną krytyką architektury pandemonium jest to, że przyjmuje ona całkowicie oddolne przetwarzanie: rozpoznawanie jest całkowicie napędzane przez fizyczne cechy docelowego bodźca. Oznacza to, że nie jest w stanie uwzględnić żadnych efektów przetwarzania odgórnego, takich jak efekty kontekstowe ( np . pareidolia ), gdzie wskazówki kontekstowe mogą ułatwić przetwarzanie (np. efekt wyższości słowa: stosunkowo łatwiej jest zidentyfikować literę, gdy jest częścią słowa niż w izolacji). Nie jest to jednak fatalna krytyka całej architektury, ponieważ stosunkowo łatwo jest dodać grupę demonów kontekstualnych do pracy wraz z demonami poznawczymi w celu uwzględnienia tych efektów kontekstowych.

Demonstracja hipotezy globalnej do lokalnej: ludzie widzą A przed H

Chociaż architektura pandemonium opiera się na fakcie, że może wyjaśnić zjawisko stałości obrazu, niektórzy badacze argumentowali inaczej; i zwrócił uwagę, że architektura pandemonium może mieć te same wady, co modele dopasowywania szablonów. Na przykład litera H składa się z 2 długich linii pionowych i krótkiej linii poziomej; ale jeśli obrócimy H o 90 stopni w dowolnym kierunku, teraz składa się on z 2 długich linii poziomych i krótkiej linii pionowej. Aby rozpoznać obrócone H jako H, potrzebowalibyśmy poznawczego demona obróconego H. W ten sposób możemy skończyć z systemem, który wymaga dużej liczby demonów poznawczych w celu uzyskania dokładnego rozpoznania, co doprowadziłoby do takiej samej krytyki biologicznej wiarygodności modeli dopasowywania szablonów. Trudno jednak ocenić zasadność tej krytyki, ponieważ architektura pandemonium nie precyzuje, w jaki sposób i jakie cechy są wydobywane z napływających informacji sensorycznych, po prostu zarysowuje możliwe etapy rozpoznawania wzorców. Ale oczywiście rodzi to własne pytania, na które krytykowanie takiego modelu jest prawie niemożliwe, jeśli nie zawiera on określonych parametrów. Ponadto teoria wydaje się być raczej niekompletna bez zdefiniowania, w jaki sposób i jakie cechy są wyodrębniane, co okazuje się szczególnie problematyczne w przypadku złożonych wzorców (np. wyodrębnianie wagi i cech psa).

Niektórzy badacze wskazywali również, że dowody wspierające architekturę pandemonium były bardzo wąskie w swojej metodologii. Większość badań wspierających tę architekturę często odnosiła się do jej zdolności do rozpoznawania prostych schematycznych rysunków wybranych z małego, skończonego zbioru (np. liter alfabetu łacińskiego). Dowody z tego typu eksperymentów mogą prowadzić do zbyt ogólnych i mylących wniosków, ponieważ proces rozpoznawania złożonych, trójwymiarowych wzorów może bardzo różnić się od prostych schematów. Co więcej, niektórzy krytykowali metodologię zastosowaną do generowania macierzy pomyłek, ponieważ myli ona pomieszanie percepcyjne (błąd w identyfikacji spowodowany nakładającymi się cechami błędu i prawidłowej odpowiedzi) ze zgadywaniem postpercepcyjnym (ludzie przypadkowo zgadują, ponieważ nie mogą być pewni, co zobaczyli). Jednak ta krytyka została w pewnym stopniu odrzucona, gdy podobne wyniki zostały powtórzone z innymi paradygmatami (np. go/no go i te same różne zadania), potwierdzając twierdzenie, że ludzie mają elementarne detektory cech. Te nowe paradygmaty opierały się na czasie reakcji jako zmiennej zależnej, co pozwoliło również uniknąć problemu pustych komórek, który jest nieodłączny od macierzy zamieszania (analizy statystyczne są trudne do przeprowadzenia i interpretacji, gdy dane mają puste komórki).

Ponadto niektórzy badacze zwrócili uwagę, że teorie akumulacji cech, takie jak architektura pandemonium, mają etapy przetwarzania rozpoznawania wzorców prawie wstecz. Ta krytyka była używana głównie przez zwolenników teorii globalnej do lokalnej, którzy argumentowali i dostarczali dowodów na to, że percepcja zaczyna się od rozmytego obrazu całości, który udoskonala się z czasem, co sugeruje, że ekstrakcja cech nie zachodzi na wczesnych etapach rozpoznawania. Jednak nic nie stoi na przeszkodzie, aby demon rozpoznał globalny wzorzec równolegle z innymi demonami rozpoznającymi lokalne wzorce w ramach globalnego wzorca.

Zastosowania i wpływy

System oparty na pandemonium był w stanie poprawnie zidentyfikować wszystkie te bodźce jako literę A, bez uprzedniego narażenia na te dokładnie bodźce.

Architektura pandemonium została zastosowana do rozwiązania kilku rzeczywistych problemów, takich jak tłumaczenie ręcznie wysyłanych kodów Morse'a i rozpoznawanie ręcznie drukowanych liter. Ogólna dokładność modeli opartych na pandemonium jest imponująca, nawet jeśli system miał krótki okres nauki. Na przykład Doyle skonstruował system oparty na pandemonium z ponad 30 złożonymi analizatorami cech. Następnie nakarmił swój system kilkoma setkami liter do nauki. Podczas tej fazy system przeanalizował wprowadzoną literę i wygenerował własne dane wyjściowe (jak system identyfikuje literę). Dane wyjściowe z systemu porównano z poprawną identyfikacją, która wysyła sygnał błędu z powrotem do systemu w celu odpowiedniego dostosowania wag między analizatorami cech. W fazie testowania prezentowane były nieznane litery (inny styl i rozmiar liter niż te, które były prezentowane w fazie nauki), a system był w stanie osiągnąć blisko 90% dokładności. Ze względu na imponującą zdolność rozpoznawania słów, wszystkie współczesne teorie dotyczące tego, jak ludzie czytają i rozpoznają słowa, opierają się na tej hierarchicznej strukturze: rozpoznawanie słów rozpoczyna się od ekstrakcji cech liter, która następnie aktywuje detektory liter (np. SOLAR, SERIOL, IA, DRC ).

Opierając się na oryginalnej architekturze pandemonium, John Jackson rozszerzył teorię, aby wyjaśnić zjawiska wykraczające poza percepcję. Jackson zaproponował analogię areny, aby wyjaśnić „ świadomość” . Jego arena składała się z trybuny, boiska i pod-areny. Arena była zamieszkana przez mnóstwo demonów. Demony, które zostały wyznaczone na boiskach, były aktywnymi demonami, ponieważ reprezentują aktywne elementy ludzka świadomość. Demony na trybunach mają obserwować tych na boisku, dopóki coś ich nie podnieci, każdego demona ekscytują inne rzeczy. Im bardziej demony są podekscytowane, tym głośniej krzyczą. Jeśli demon wrzeszczy, przekracza ustalony próg, może dołączyć do innych demonów na polu gry i wykonać swoją funkcję, która może następnie podniecić inne demony i ten cykl trwa. Sub-arena w analogii działa jako mechanizm uczenia się i sprzężenia zwrotnego systemu. System uczenia się tutaj jest podobny do innych sieci stylizowanych na sieci neuronowe, które polegają na modyfikowaniu siły połączenia między demonami, innymi słowy, jak demony reagują na wzajemne wrzaski.To wieloagentowe podejście do przetwarzania informacji przez ludzi stało się założeniem dla wielu nowoczesnych systemów sztucznej inteligencji .

Porównania

Porównanie z teoriami dopasowywania szablonów

Chociaż architektura pandemonium powstała jako odpowiedź na główną krytykę teorii dopasowywania szablonów, obie są w rzeczywistości w pewnym sensie podobne: istnieje proces, w którym określony zestaw cech elementów jest dopasowywany do pewnego rodzaju mentalnej reprezentacji. Krytyczna różnica między nimi polega na tym, że obraz jest bezpośrednio porównywany z wewnętrzną reprezentacją w teoriach dopasowywania szablonów, podczas gdy w architekturze pandemonium obraz jest najpierw rozpraszany i przetwarzany na poziomie cech. To nadało architekturze pandemonium ogromną moc, ponieważ jest w stanie rozpoznać bodziec pomimo jego zmian w rozmiarze, stylu i innych przekształceniach; bez założenia nieograniczonej pamięci wzorów. Jest również mało prawdopodobne, aby teorie dopasowywania szablonów działały poprawnie w obliczu realistycznych danych wizualnych, w których obiekty są przedstawiane w trzech wymiarach i często zasłaniane przez inne obiekty (np. połowa książki jest zakryta kartką papieru, ale możemy nadal stosunkowo łatwo rozpoznawać ją jako książkę). Niemniej jednak niektórzy badacze przeprowadzili eksperymenty porównujące te dwie teorie. Nic dziwnego, że wyniki często faworyzowały hierarchiczny model budowania funkcji, taki jak architektura pandemonium.

Porównanie z rozpoznawaniem wzorców Hebba

Model Hebba pod wieloma względami przypomina teorie zorientowane na cechy, takie jak architektura pandemonium. Pierwszy poziom przetwarzania w modelu Hebba nazywa się zbiorami komórek, które mają bardzo podobne funkcje do funkcji demonów. Jednak zespoły komórek są bardziej ograniczone niż demony funkcji, ponieważ mogą wyodrębniać tylko linie, kąty i kontury. Zespoły komórek są łączone, tworząc sekwencje fazowe, co jest bardzo podobne do funkcji demonów poznawczych. W pewnym sensie wielu uważa model hebbowski za skrzyżowanie teorii szablonu i teorii dopasowywania cech, ponieważ cechy wyodrębnione z modeli hebbowskich można uznać za proste szablony.

Zobacz też