Rozpoznawanie obiektów (kognitywistyka)

Rozpoznawanie obiektów wizualnych odnosi się do zdolności do identyfikowania obiektów w widoku na podstawie danych wizualnych. Jedną z ważnych sygnatur wizualnego rozpoznawania obiektów jest „niezmienność obiektów” lub zdolność do identyfikowania obiektów poprzez zmiany w szczegółowym kontekście, w którym obiekty są oglądane, w tym zmiany oświetlenia, ułożenia obiektu i kontekstu tła.

Podstawowe etapy rozpoznawania obiektów

Dowody neuropsychologiczne potwierdzają, że w procesie rozpoznawania obiektów zidentyfikowano cztery określone etapy. Te etapy to:

Etap 1 Przetwarzanie podstawowych składników obiektu, takich jak kolor, głębia i forma.

Etap 2 Te podstawowe komponenty są następnie grupowane na podstawie podobieństwa, dostarczając informacji o wyraźnych krawędziach formy wizualnej. Następnie może nastąpić segregacja między figurą a podłożem .

Etap 3 Wizualna reprezentacja jest dopasowywana do opisów strukturalnych w pamięci.

Etap 4 Atrybuty semantyczne są stosowane do reprezentacji wizualnej, zapewniając znaczenie, a tym samym rozpoznanie.

W ramach tych etapów istnieją bardziej szczegółowe procesy, które mają miejsce w celu uzupełnienia różnych elementów przetwarzania. Ponadto inne istniejące modele proponowały hierarchie integracyjne (od góry do dołu i od dołu do góry), a także przetwarzanie równoległe, w przeciwieństwie do tej ogólnej hierarchii od dołu do góry.

Hierarchiczne przetwarzanie rozpoznawania

Przetwarzanie rozpoznawania wizualnego jest zwykle postrzegane jako oddolna hierarchia, w której informacje są przetwarzane sekwencyjnie z rosnącą złożonością. Podczas tego procesu procesory korowe niższego poziomu, takie jak pierwotna kora wzrokowa , znajdują się na dole hierarchii. Procesory korowe wyższego poziomu, takie jak kora dolnoskroniowa (IT), znajdują się na górze, gdzie ułatwione jest rozpoznawanie wizualne. Wysoko uznaną oddolną teorią hierarchiczną jest opis Untangling Jamesa DiCarlo, w którym każdy etap hierarchicznie ułożonej brzusznej ścieżki wzrokowej wykonuje operacje w celu stopniowego przekształcania reprezentacji obiektów w łatwy do wyodrębnienia format. Z kolei coraz bardziej popularną teorią przetwarzania rozpoznawania jest teoria przetwarzania odgórnego. Jeden model, zaproponowany przez Moshe Bar (2003), opisuje metodę „na skróty”, w której wczesne sygnały wizualne są wysyłane, częściowo analizowane, z wczesnej kory wzrokowej do kory przedczołowej (PFC). Możliwe interpretacje surowych wizualnych danych wejściowych są generowane w PFC, a następnie przesyłane do kory dolnoskroniowej (IT), aktywując następnie odpowiednie reprezentacje obiektów, które są następnie włączane do wolniejszego, oddolnego procesu. Ten „skrót” ma na celu zminimalizowanie liczby reprezentacji obiektów wymaganych do dopasowania, ułatwiając w ten sposób rozpoznawanie obiektów. Badania zmian chorobowych poparły tę propozycję ustaleniami dotyczącymi wolniejszych czasów odpowiedzi u osób ze zmianami PFC, co sugeruje zastosowanie wyłącznie przetwarzania oddolnego.

Stałość obiektu i teorie rozpoznawania obiektów

Istotnym aspektem rozpoznawania obiektów jest stałość obiektu: zdolność rozpoznawania obiektu w różnych warunkach oglądania. Te zmienne warunki obejmują orientację obiektu, oświetlenie i zmienność obiektu (rozmiar, kolor i inne różnice wewnątrz kategorii). Aby system wzrokowy osiągnął stałość obiektu, musi być w stanie wyodrębnić podobieństwo w opisie obiektu z różnych punktów widzenia i opisów siatkówkowych. Uczestnicy, którzy wykonywali zadania związane z kategoryzacją i rozpoznawaniem podczas przechodzenia funkcjonalnego magnesu, stwierdzili zwiększony przepływ krwi wskazujący na aktywację w określonych obszarach mózgu. Zadanie kategoryzacji polegało na tym, że uczestnicy umieszczali obiekty z kanonicznych lub nietypowych widoków jako obiekty wewnętrzne lub zewnętrzne. Zadanie rozpoznawania polega na przedstawieniu uczestnikom obrazów, które oglądali wcześniej. Połowa z tych obrazów była w tej samej orientacji, co poprzednio pokazana, podczas gdy druga połowa została przedstawiona z przeciwnego punktu widzenia. Regiony mózgu zaangażowane w rotację umysłową, takie jak brzuszne i grzbietowe drogi wzrokowe oraz kora przedczołowa, wykazywały największy wzrost przepływu krwi podczas tych zadań, co pokazuje, że są one kluczowe dla zdolności widzenia obiektów pod różnymi kątami. Wygenerowano kilka teorii, aby zapewnić wgląd w to, w jaki sposób można osiągnąć stałość obiektu w celu rozpoznawania obiektów, w tym teorie niezmienne z punktu widzenia, zależne od punktu widzenia i wiele poglądów.

Teorie niezmienne z punktu widzenia

Teorie niezmiennego punktu widzenia sugerują, że rozpoznawanie obiektów opiera się na informacjach strukturalnych, takich jak poszczególne części, co pozwala na rozpoznanie niezależnie od punktu widzenia obiektu. W związku z tym rozpoznanie jest możliwe z dowolnego punktu widzenia, ponieważ poszczególne części obiektu można obracać, aby dopasować je do dowolnego widoku. ^{[ Potrzebne źródło ]} Ta forma analitycznego rozpoznawania wymaga niewiele pamięci, ponieważ tylko części strukturalne muszą być zakodowane, co może generować reprezentacje wielu obiektów poprzez wzajemne powiązania tych części i rotację mentalną. ^{[ potrzebne źródło ]} Uczestnikom badania przedstawiono jeden widok kodowania z każdego z 24 wstępnie wybranych obiektów, a także pięć obrazów wypełniających. Obiekty były następnie reprezentowane w centralnym polu widzenia w tej samej orientacji lub w innej orientacji niż oryginalny obraz. Następnie uczestnicy zostali poproszeni o nazwanie, czy prezentowane są takie same lub różne widoki tych obiektów w orientacji w głąb. Ta sama procedura została następnie wykonana podczas prezentacji obrazów w lewym lub prawym polu widzenia. Torowanie zależne od punktu widzenia obserwowano, gdy widoki testowe były prezentowane bezpośrednio na prawej półkuli, ale nie, gdy widoki testowe były prezentowane bezpośrednio na lewej półkuli. Wyniki potwierdzają model, w którym obiekty są przechowywane w sposób zależny od punktu widzenia, ponieważ wyniki nie zależały od tego, czy ten sam lub inny zestaw części można odzyskać z widoków o różnej orientacji.

Reprezentacja modelu 3D

Model ten, zaproponowany przez Marra i Nishiharę (1978), stwierdza, że rozpoznawanie obiektów uzyskuje się poprzez dopasowanie trójwymiarowych reprezentacji modelu uzyskanych z obiektu wizualnego z trójwymiarowymi reprezentacjami modelu przechowywanymi w pamięci jako zalecenia dotyczące kształtu pionowego. ^{[ wymagane wyjaśnienie ]} Dzięki zastosowaniu programów komputerowych i algorytmów Yi Yungfeng (2009) był w stanie zademonstrować zdolność ludzkiego mózgu do mentalnego konstruowania obrazów 3D przy użyciu tylko obrazów 2D, które pojawiają się na siatkówce. Ich model wykazuje również wysoki stopień zachowania stałości kształtu między obrazami 2D, co pozwala na rozpoznanie obrazu 3D. Trójwymiarowe reprezentacje modelu uzyskane z obiektu są tworzone przez identyfikację wklęsłości obiektu, które dzielą bodziec na poszczególne części. Ostatnie badania sugerują, że obszar mózgu, znany jako ogonowy obszar śródciemieniowy (CIP), jest odpowiedzialny za przechowywanie nachylenia i nachylenia powierzchni planu, które umożliwiają rozpoznanie wklęsłości. Rosenburga i in. wszczepiono małpom cewkę do wyszukiwania twardówki do monitorowania pozycji oka, jednocześnie rejestrując aktywację pojedynczego neuronu z neuronów w CIP. Podczas eksperymentu małpy siedziały 30 cm od ekranu LCD, który wyświetlał bodźce wzrokowe. Wskazówki dotyczące rozbieżności obuocznej były wyświetlane na ekranie, renderując bodźce jako zielono-czerwone anaglify, a krzywe nachylenie-pochylenie mieściły się w zakresie od 0 do 330. Pojedyncza próba składała się z punktu fiksacji, a następnie prezentacji bodźca przez 1 sekundę. Następnie rejestrowano aktywację neuronów za pomocą chirurgicznie wprowadzonych mikroelektrod. Ta aktywacja pojedynczego neuronu dla określonych wklęsłości obiektów prowadzi do odkrycia, że każda oś pojedynczej części obiektu zawierającej wklęsłość znajduje się w magazynach pamięci. Identyfikacja głównej osi obiektu pomaga w procesie normalizacji poprzez rotację mentalną, która jest wymagana, ponieważ w pamięci przechowywany jest tylko kanoniczny opis obiektu. Rozpoznanie uzyskuje się, gdy punkt widzenia obserwowanego obiektu jest mentalnie obracany, aby pasował do zapisanego opisu kanonicznego. ^{[ potrzebne źródło ]}

Rysunek 1. Ten obraz, stworzony na podstawie teorii Biedermana (1987) Recognition by Components, jest przykładem tego, jak obiekty można podzielić na Geony.

Rozpoznawanie według składników

Rozszerzenie modelu Marra i Nishihary, teoria rozpoznawania według składowych , zaproponowana przez Biedermana (1987), proponuje podział informacji wizualnej uzyskanej z obiektu na proste składowe geometryczne, takie jak bloki i cylindry, znane również jako „geony” . " (jony geometryczne), a następnie są dopasowywane do najbardziej podobnej reprezentacji obiektu, która jest przechowywana w pamięci, aby zapewnić identyfikację obiektu (patrz rysunek 1).

Teorie zależne od punktu widzenia

Teorie zależne od punktu widzenia sugerują, że na rozpoznawanie obiektów ma wpływ punkt widzenia, z którego jest widziany, co sugeruje, że obiekty widziane z nowych punktów widzenia zmniejszają dokładność i szybkość identyfikacji obiektu. Ta teoria rozpoznawania opiera się na bardziej holistycznym systemie niż na częściach, co sugeruje, że obiekty są przechowywane w pamięci z wieloma punktami widzenia i kątami. Ta forma rozpoznawania wymaga dużo pamięci, ponieważ każdy punkt widzenia musi być zapisany. Dokładność rozpoznania zależy również od tego, jak znajomy jest obserwowany punkt widzenia obiektu.

Teoria wielu widoków

Teoria ta sugeruje, że rozpoznawanie obiektów leży na kontinuum punktu widzenia, w którym każdy punkt widzenia jest rekrutowany do różnych typów rozpoznawania. Na jednym krańcu tego kontinuum mechanizmy zależne od punktu widzenia są używane do rozróżniania wewnątrz kategorii, podczas gdy na drugim biegunie mechanizmy niezmienne z punktu widzenia są używane do kategoryzacji obiektów.

Substraty neuronowe

Strumień grzbietowy jest pokazany na zielono, a strumień brzuszny na fioletowo.

Strumień grzbietowy i brzuszny

Wizualne przetwarzanie obiektów w mózgu można podzielić na dwie ścieżki przetwarzania: strumień grzbietowy (jak/gdzie), który rozciąga się od kory wzrokowej do płatów ciemieniowych , oraz strumień brzuszny (co), który rozciąga się od kory wzrokowej do kora dolnoskroniowa (IT). Istnienie tych dwóch oddzielnych ścieżek przetwarzania wzrokowego zostało po raz pierwszy zaproponowane przez Ungerleidera i Mishkina (1982), którzy na podstawie swoich badań uszkodzeń zasugerowali, że strumień grzbietowy bierze udział w przetwarzaniu wizualnych informacji przestrzennych, takich jak lokalizacja obiektu (gdzie), a strumień brzuszny bierze udział w przetwarzaniu wizualnych informacji identyfikujących obiekt (co). Od czasu tej wstępnej propozycji alternatywnie sugerowano, że ścieżka grzbietowa powinna być znana jako ścieżka „Jak”, ponieważ przetwarzane tutaj wizualne informacje przestrzenne dostarczają nam informacji o tym, jak wchodzić w interakcje z obiektami. koncentruje się na strumieniu brzusznym .

Funkcjonalna specjalizacja w strumieniu brzusznym

W obrębie strumienia brzusznego w badaniach obrazowania czynnościowego zaobserwowano różne obszary proponowanej specjalizacji czynnościowej. Obszary mózgu, które najczęściej wykazują specjalizację funkcjonalną, to wrzecionowaty obszar twarzy (FFA), który wykazuje zwiększoną aktywację twarzy w porównaniu z przedmiotami, obszar miejsca przyhipokampowego (PPA) dla scen w porównaniu z przedmiotami, obszar ciała poza prążkowiem (EBA) dla części ciała a obiekty, MT+/V5 dla bodźców ruchomych a bodźców statycznych oraz bocznego kompleksu potylicznego (LOC) dla dostrzegalnych kształtów w porównaniu z bodźcami pomieszanymi. (Zobacz też: Przetwarzanie neuronowe dla poszczególnych kategorii obiektów )

Przetwarzanie strukturalne: boczny kompleks potyliczny

Stwierdzono, że boczny kompleks potyliczny (LOC) jest szczególnie ważny dla rozpoznawania obiektów na percepcyjnym poziomie strukturalnym. W badaniu związanym z wydarzeniem [fMRI-en], które dotyczyło adaptacji neuronów aktywowanych podczas wizualnego przetwarzania obiektów, odkryto, że podobieństwo kształtu obiektu jest niezbędne do późniejszej adaptacji w LOC, ale specyficzne cechy obiektu, takie jak krawędzie i kontury nie są. Sugeruje to, że aktywacja w LOC reprezentuje informacje o kształcie obiektu wyższego poziomu, a nie proste cechy obiektu. W powiązanym badaniu [fMRI-en] aktywacja LOC, która nastąpiła niezależnie od wizualnych wskazówek prezentowanego obiektu, takich jak ruch, tekstura lub kontrasty luminancji, sugeruje, że różne wizualne wskazówki niskiego poziomu użyte do zdefiniowania obiektu zbiegają się w „obszarach obiektowych”, aby pomóc w procesie percepcji i rozpoznawania. Żadna ze wspomnianych informacji o kształcie obiektu wyższego poziomu nie wydaje się dostarczać żadnych informacji [semantic-en] o obiekcie, ponieważ LOC pokazuje odpowiedź neuronalną na różne formy, w tym nieznane, abstrakcyjne obiekty.

Dalsze eksperymenty sugerowały, że LOC składa się z hierarchicznego systemu selektywności kształtu, co wskazuje na większą selektywną aktywację w tylnych obszarach dla fragmentów obiektów, podczas gdy regiony [przedniej] wykazują większą aktywację dla pełnych lub częściowych obiektów. Jest to zgodne z wcześniejszymi badaniami, które sugerują hierarchiczną reprezentację w brzusznej korze skroniowej, gdzie pierwotne przetwarzanie cech zachodzi w obszarach tylnych , a integracja tych cech w cały i znaczący obiekt zachodzi w regionach [przednich].

Przetwarzanie semantyczne

Powiązania semantyczne pozwalają na szybsze rozpoznawanie obiektów. Kiedy obiekt był wcześniej kojarzony z jakimś znaczeniem semantycznym, ludzie są bardziej skłonni do poprawnej identyfikacji obiektu. Badania wykazały, że skojarzenia semantyczne pozwalają na znacznie szybsze rozpoznanie obiektu, nawet gdy obiekt jest oglądany pod różnymi kątami. Kiedy obiekty są oglądane pod coraz większymi kątami odchylenia od tradycyjnej płaszczyzny widzenia, obiekty, które miały wyuczone skojarzenia semantyczne, miały krótszy czas reakcji w porównaniu z obiektami, które nie miały żadnych wyuczonych skojarzeń semantycznych. Tak więc, gdy rozpoznawanie obiektów staje się coraz trudniejsze, asocjacje semantyczne umożliwiają znacznie łatwiejsze rozpoznawanie. Podobnie podmiot można przygotować do rozpoznania obiektu poprzez obserwację czynności, która jest po prostu związana z obiektem docelowym. To pokazuje, że przedmioty mają zestaw skojarzeń sensorycznych, motorycznych i semantycznych, które pozwalają osobie prawidłowo rozpoznać przedmiot. Potwierdza to twierdzenie, że mózg wykorzystuje wiele części, próbując dokładnie zidentyfikować obiekt.

Dzięki informacjom dostarczonym przez pacjentów [neuropsychologicznych] zidentyfikowano dysocjację przetwarzania rozpoznawania między przetwarzaniem strukturalnym a przetwarzaniem [semantycznym], ponieważ informacje strukturalne, kolorowe i asocjacyjne mogą być selektywnie upośledzone. W jednym PET stwierdzono, że obszary zaangażowane w asocjacyjne przetwarzanie semantyczne obejmują lewy przedni górny / środkowy zakręt skroniowy i lewy biegun skroniowy w porównaniu z informacjami strukturalnymi i kolorystycznymi, a także prawy biegun skroniowy porównywalne tylko z zadaniami związanymi z podejmowaniem decyzji dotyczących koloru. Wyniki te wskazują, że przechowywana wiedza percepcyjna i wiedza semantyczna obejmują oddzielne obszary korowe w rozpoznawaniu obiektów, jak również wskazują, że istnieją półkuliste różnice w obszarach skroniowych.

Badania dostarczyły również dowodów wskazujących, że wizualne informacje semantyczne zbiegają się w zakrętach wrzecionowatych płatów dolnoskroniowych. W badaniu, w którym porównano wiedzę semantyczną kategorii z atrybutami, stwierdzono, że odgrywają one odrębne role w sposobie, w jaki przyczyniają się do rozpoznawania. Dla porównań kategorycznych boczne obszary zakrętu wrzecionowatego były aktywowane przez żywe obiekty, w porównaniu z obiektami nieożywionymi, które aktywowały regiony przyśrodkowe. W celu porównania atrybutów stwierdzono, że prawy zakręt wrzecionowaty był aktywowany przez formę globalną, w porównaniu z lokalnymi szczegółami, które aktywowały lewy zakręt wrzecionowaty. Wyniki te sugerują, że rodzaj kategorii obiektu określa, który region zakrętu wrzecionowatego jest aktywowany do przetwarzania rozpoznawania semantycznego, podczas gdy atrybuty obiektu określają aktywację w lewym lub prawym zakręcie wrzecionowatym, w zależności od tego, czy przetwarzana jest forma globalna, czy lokalny szczegół .

Ponadto zaproponowano, że aktywacja w obszarach [przedniej] zakrętów wrzecionowatych wskazuje na pomyślne rozpoznanie. Stwierdzono jednak, że poziomy aktywacji zależą od znaczenia semantycznego obiektu. Termin znaczenie semantyczne odnosi się tutaj do „miary wkładu cech semantycznych w podstawowe znaczenie pojęcia”. Wyniki pokazały, że obiekty o wysokim znaczeniu semantycznym, takie jak artefakty , spowodowało wzrost aktywacji w porównaniu z obiektami o niskim znaczeniu semantycznym, takimi jak obiekty naturalne. Wynika to z proponowanej zwiększonej trudności w rozróżnianiu obiektów naturalnych, ponieważ mają one bardzo podobne właściwości strukturalne, co utrudnia ich identyfikację w porównaniu z artefaktami. Dlatego im łatwiej jest zidentyfikować obiekt, tym większe prawdopodobieństwo, że zostanie pomyślnie rozpoznany.

Innym warunkiem, który wpływa na skuteczność rozpoznawania obiektów, jest facylitacja kontekstowa . Uważa się, że podczas zadań rozpoznawania obiektów obiektowi towarzyszy „ramka kontekstowa”, która dostarcza informacji semantycznych o typowym kontekście obiektu. Stwierdzono, że gdy obiekt jest poza kontekstem, wydajność rozpoznawania obiektów jest utrudniona przez wolniejsze czasy odpowiedzi i większe niedokładności w porównaniu z zadaniami rozpoznawania, gdy obiekt był w odpowiednim kontekście. Na podstawie wyników badania z wykorzystaniem [fMRI-en] zaproponowano, że w mózgu istnieje „sieć kontekstowa” dla powiązanych kontekstowo obiektów, których aktywność występuje głównie w Kora przyhipokampowa (PHC) i kompleks retrosplenialny (RSC). Stwierdzono , że w PHC aktywność w obszarze Parahippocampal Place Area (PPA) ma pierwszeństwo przed scenami, a nie przedmiotami; zasugerowano jednak, że aktywność w POZ dla pojedynczych obiektów w zadaniach kontekstualnej facylitacji może wynikać z późniejszego myślenia o scenie przestrzennej, w której obiekt jest kontekstowo reprezentowany. Dalsze eksperymenty wykazały, że aktywacja została znaleziona zarówno dla kontekstów nieprzestrzennych, jak i przestrzennych w PHC, chociaż aktywacja z kontekstów nieprzestrzennych była ograniczona do [przedniej] PHC i tylnej PHC dla kontekstów przestrzennych.

Pamięć rozpoznawania

Kiedy ktoś widzi przedmiot, wie, czym jest ten przedmiot, ponieważ widział go w przeszłości; to jest pamięć rozpoznawania . Nieprawidłowości w brzusznym (czym) strumieniu drogi wzrokowej wpływają nie tylko na naszą zdolność rozpoznawania obiektu, ale także na sposób, w jaki obiekt jest nam prezentowany. Godną uwagi cechą pamięci rozpoznawania wizualnego jest jej niezwykła pojemność: nawet po obejrzeniu tysięcy obrazów w pojedynczych próbach ludzie wykonują z dużą dokładnością kolejne testy pamięci i zapamiętują znaczne szczegóły dotyczące obrazów, które widzieli

Kontekst

Kontekst pozwala na znacznie większą dokładność rozpoznawania obiektów. Kiedy możliwy do zidentyfikowania obiekt jest rozmazany, dokładność rozpoznawania jest znacznie większa, gdy obiekt jest umieszczony w znajomym kontekście. Ponadto nawet nieznany kontekst pozwala na dokładniejsze rozpoznanie obiektu w porównaniu z obiektem pokazanym w izolacji. Można to przypisać faktowi, że obiekty są zwykle widoczne w niektórych ustawieniach, a nie w ogóle. Gdy ustawienie, w którym znajduje się obiekt, jest znane widzowi, znacznie łatwiej jest określić, czym jest obiekt. Chociaż kontekst nie jest wymagany do prawidłowego rozpoznania, jest częścią skojarzenia, które tworzy się z określonym obiektem.

Kontekst staje się szczególnie ważny podczas rozpoznawania twarzy lub emocji. Kiedy emocje twarzy są prezentowane bez kontekstu, zdolność, z jaką ktoś jest w stanie dokładnie opisać pokazaną emocję, jest znacznie niższa niż w przypadku podania kontekstu. Zjawisko to pozostaje prawdziwe we wszystkich grupach wiekowych i kulturach, co oznacza, że kontekst jest niezbędny do dokładnego zidentyfikowania emocji twarzy u wszystkich osób.

Znajomość

Znajomość jest mechanizmem bezkontekstowym w tym sensie, że to, co się rozpoznaje, wydaje się znajome, bez poświęcania czasu na szukanie kontekstu, w jakim obiekt jest znany. Region brzuszno-boczny płata czołowego bierze udział w kodowaniu pamięci podczas przypadkowego uczenia się, a następnie w późniejszym utrzymywaniu i odzyskiwaniu wspomnień semantycznych. Znajomość może wywoływać procesy percepcyjne inne niż te związane z nieznanymi przedmiotami, co oznacza, że nasze postrzeganie skończonej liczby znanych obiektów jest wyjątkowe. Odchylenia od typowych punktów widzenia i kontekstów mogą wpływać na skuteczność, z jaką obiekt jest rozpoznawany najskuteczniej. Stwierdzono, że nie tylko znane przedmioty są rozpoznawane skuteczniej, gdy ogląda się je ze znanego punktu widzenia w przeciwieństwie do nieznanego, ale także zasada ta ma zastosowanie do nowych obiektów. Prowadzi to do wniosku, że reprezentacje obiektów w naszym mózgu są zorganizowane w bardziej znany sposób niż obiekty obserwowane w środowisku. Rozpoznawanie jest w dużej mierze uzależnione nie tylko od kształtu i/lub widoku obiektu, ale także od dynamicznych informacji. Znajomość może korzystnie wpłynąć na postrzeganie dynamicznych wyświetlaczy punktowych, poruszających się obiektów, płci twarzy i rozpoznawania twarzy.

Wspomnienie

Wspomnienie ma wiele podobieństw ze znajomością; jest to jednak zależne od kontekstu i wymaga określonych informacji z badanego incydentu.

Utrata wartości

Utrata rozpoznawania obiektów nazywana jest wizualną agnozją obiektów . Istnieją dwie szerokie kategorie agnozji obiektów wizualnych : aperceptywna i asocjacyjna. Kiedy agnozja obiektu pojawia się z powodu uszkodzenia w dominującej półkuli, często towarzyszy jej głębokie zaburzenie językowe, w tym utrata znaczenia słowa.

Skutki uszkodzeń w strumieniu brzusznym

Rozpoznawanie obiektów jest złożonym zadaniem i obejmuje kilka różnych obszarów mózgu – nie tylko jeden. Jeśli jeden obszar jest uszkodzony, rozpoznawanie obiektów może być zakłócone. Główny obszar rozpoznawania obiektów znajduje się w płacie skroniowym . Stwierdzono na przykład, że zmiany dotyczą kory okołowęchowej u szczurów powoduje upośledzenie rozpoznawania obiektów, zwłaszcza ze wzrostem niejednoznaczności cech. Wydaje się, że noworodkowe zmiany aspiracyjne kompleksu ciała migdałowatego u małp spowodowały większą utratę pamięci obiektów niż wczesne zmiany hipokampa. Jednak u dorosłych małp upośledzenie pamięci obiektowej jest lepiej tłumaczone uszkodzeniem kory okołowęchowej i śródwęchowej niż przez uszkodzenie jąder migdałowatych. Połączone zmiany w ciele migdałowatym i hipokampie (A + H) u szczurów upośledzały wydajność zadania rozpoznawania obiektów, gdy interwały retencji zostały zwiększone powyżej 0 s i gdy bodźce testowe były powtarzane w ramach sesji. Uszkodzenie [amigdala-en] lub [hippocampus-en] nie wpływa na rozpoznawanie obiektów, podczas gdy uszkodzenie A + H powoduje wyraźne deficyty. W zadaniu rozpoznawania obiektów poziom rozróżniania był istotnie niższy w zmianach elektrolitycznych gałki bladej (część zwojów podstawy ) u szczurów w porównaniu z grupami Substantia-Innominata/Ventral Pallidum, która z kolei była gorsza w porównaniu z grupą kontrolną i przegrodą przyśrodkową/pionowym pasmem ukośnym Broca; jednak tylko globus pallidus nie rozróżniał nowych i znanych obiektów. Zmiany te uszkadzają brzuszną (co) ścieżkę wzrokowego przetwarzania obiektów w mózgu.

Wizualne agnozje

[Agnosia-en] jest rzadkim zjawiskiem i może być wynikiem udaru, demencji, urazu głowy, infekcji mózgu lub dziedzicznej. Agnozja apercepcyjna to deficyt w postrzeganiu przedmiotów, powodujący niemożność zrozumienia znaczenia przedmiotów. Podobnie asocjacyjna agnozja wizualna to niezdolność do zrozumienia znaczenia przedmiotów; jednak tym razem deficyt dotyczy pamięci semantycznej. Obie te agnozje mogą wpływać na ścieżkę rozpoznawania obiektów, jak teoria widzenia Marra. Mówiąc dokładniej, w przeciwieństwie do agnozji apercepcyjnej, pacjenci z agnozją asocjacyjną są bardziej skuteczni w rysowaniu, kopiowaniu i dopasowywaniu zadań; jednak ci pacjenci wykazują, że mogą postrzegać, ale nie rozpoznawać. agnozja integracyjna (podtyp agnozji asocjacyjnej) to niezdolność do zintegrowania oddzielnych części w celu utworzenia całego obrazu. W przypadku tego typu agnozji dochodzi do uszkodzenia brzusznego (czego) strumienia ścieżki przetwarzania wzrokowego. Agnozja orientacji obiektu to niezdolność do wyodrębnienia orientacji obiektu pomimo odpowiedniego rozpoznania obiektu. W przypadku tego typu agnozji dochodzi do uszkodzenia grzbietowego (gdzie) strumienia ścieżki przetwarzania wzrokowego. Może to wpływać na rozpoznawanie obiektów pod względem znajomości, a tym bardziej w przypadku nieznanych obiektów i punktów widzenia. Trudność w rozpoznawaniu twarzy można wytłumaczyć [prosopagnosia-en]. Ktoś z prozopagnozją nie może zidentyfikować twarzy, ale nadal jest w stanie dostrzec wiek, płeć i ekspresję emocjonalną. Region mózgu, który określa w rozpoznawanie twarzy to wrzecionowaty obszar twarzy . Prozopagnozję można również podzielić na podtypy apercepcyjne i asocjacyjne. Rozpoznawanie poszczególnych krzeseł, samochodów, zwierząt również może być zaburzone; dlatego obiekty te mają podobne cechy percepcyjne jak twarz, które są rozpoznawane w obszarze twarzy wrzecionowatej.

choroba Alzheimera

Rozróżnienie między kategorią a atrybutem w reprezentacji semantycznej może informować o naszej zdolności do oceny funkcji semantycznej w starzeniu się i stanach chorobowych wpływających na pamięć semantyczną, takich jak choroba Alzheimera (AD). Ze względu na deficyty pamięci semantycznej osoby z chorobą Alzheimera mają trudności z rozpoznawaniem obiektów jako pamięć semantyczna wiadomo, że jest używany do pobierania informacji do nazywania i kategoryzowania obiektów. W rzeczywistości toczy się ożywiona dyskusja, czy deficyt pamięci semantycznej w AD odzwierciedla utratę wiedzy semantycznej dla poszczególnych kategorii i pojęć, czy też utratę wiedzy o cechach i atrybutach percepcyjnych.

Zobacz też