Statystyczna akwizycja języka

Statystyczne nabywanie języka , gałąź psycholingwistyki rozwojowej , bada proces, w którym ludzie rozwijają zdolność postrzegania, tworzenia, rozumienia i komunikowania się za pomocą języka naturalnego we wszystkich jego aspektach ( fonologicznym , składniowym , leksykalnym , morfologicznym , semantycznym ) poprzez użycie ogólnych mechanizmów uczenia się działających na wzorcach statystycznych w danych wejściowych językowych. Uczenie się statystyczne Acquisition twierdzi, że nauka języka przez niemowlęta opiera się raczej na postrzeganiu wzorców niż na wrodzonej gramatyce biologicznej. Kilka elementów statystycznych, takich jak częstotliwość słów, częstość ramek, wzorce fonotaktyczne i inne prawidłowości, dostarcza informacji na temat struktury języka i znaczenia ułatwiających przyswajanie języka.

Filozofia

Podstawą badania statystycznej akwizycji języka jest wielowiekowa debata między racjonalizmem (lub jego współczesnym przejawem w społeczności psycholingwistycznej, natywizmem ) a empiryzmem , przy czym badacze w tej dziedzinie zdecydowanie opowiadają się za tą drugą kategorią. Natywizm to stanowisko, zgodnie z którym ludzie rodzą się z wrodzoną specyficzną dla domeny , zwłaszcza wrodzoną zdolnością do uczenia się języków. Począwszy od siedemnastowiecznych filozofów racjonalistycznych, takich jak Kartezjusz , Spinoza i Leibniz dla współczesnych filozofów, takich jak Richard Montague i lingwistów, takich jak Noam Chomsky , natywiści zakładają wrodzony mechanizm uczenia się ze specyficzną funkcją przyswajania języka.

W dzisiejszych czasach debata ta w dużej mierze dotyczyła poparcia Chomsky'ego dla uniwersalnej gramatyki , właściwości, które muszą posiadać wszystkie języki naturalne, poprzez kontrowersyjne postulowanie urządzenia do akwizycji języka (LAD), instynktownego mentalnego „organu” odpowiedzialnego za naukę języka, który przeszukuje wszystkie języki. możliwe alternatywy językowe i wybiera parametry, które najlepiej pasują do środowiskowego wkładu językowego ucznia. Wiele teorii Chomsky'ego opiera się na ubóstwie bodźca (POTS), twierdzenie, że dane językowe dziecka są tak ograniczone i uszkodzone, że nauka języka na podstawie samych tych danych jest niemożliwa. Na przykład wielu zwolenników POTS twierdzi, że ponieważ dzieci nigdy nie są narażone na negatywne dowody, to znaczy informacje o tym, jakie wyrażenia są niegramatyczne, struktura języka, którego się uczą, nie przypominałaby poprawnej mowy bez mechanizmu uczenia się specyficznego dla języka. Argument Chomsky'ego za wewnętrznym systemem odpowiedzialnym za język, biolingwistyką, przedstawia model trójczynnikowy. „Wyposażenie genetyczne” pozwala niemowlęciu wydobywać informacje językowe, wykrywać reguły i mieć uniwersalną gramatykę. „Środowisko zewnętrzne” rzuca światło na potrzebę interakcji z innymi i korzyści wynikające z kontaktu z językiem we wczesnym wieku. Ostatni czynnik obejmuje właściwości mózgu, zasady uczenia się i wydajność obliczeniową, które umożliwiają dzieciom szybkie przyswajanie języka przy użyciu wzorców i strategii.

Wyraźnym przeciwieństwem tego stanowiska jest empiryzm, teoria epistemologiczna , zgodnie z którą cała wiedza pochodzi z doświadczenia zmysłowego. Ta szkoła myślenia często charakteryzuje rodzący się umysł jako tabula rasa lub czystą kartę i może być na wiele sposobów powiązana z perspektywą wychowania w „debacie natura kontra wychowanie ”. Ten punkt widzenia ma długą tradycję historyczną, która jest analogiczna do racjonalizmu, począwszy od siedemnastowiecznych filozofów-empirystów, takich jak Locke , Bacon , Hobbes , a w następnym stuleciu Hume'a _ Podstawowym założeniem empiryzmu jest to, że informacja w środowisku jest wystarczająco ustrukturyzowana, aby jej wzorce były zarówno wykrywalne, jak i możliwe do wydobycia przez ogólne mechanizmy uczenia się. Jeśli chodzi o przyswajanie języka , wzorce te mogą mieć charakter językowy lub społeczny.

Chomsky jest bardzo krytyczny wobec tej empirycznej teorii przyswajania języka. Powiedział: „To prawda, że ​​było dużo pracy nad próbami zastosowania modeli statystycznych do różnych problemów językowych. Myślę, że było kilka sukcesów, ale wiele porażek”. Twierdzi, że pomysł wykorzystania metod statystycznych do przyswajania języka jest po prostu naśladowaniem procesu, a nie prawdziwym zrozumieniem sposobu przyswajania języka.

Paradygmaty eksperymentalne

Procedura preferencji Headturn (HPP)

Jednym z najczęściej używanych paradygmatów eksperymentalnych w badaniach zdolności niemowląt do statystycznego przyswajania języka jest procedura Headturn Preference (HPP), opracowana przez psychologa Stanforda Anne Fernald w 1985 r. W celu zbadania preferencji niemowląt w zakresie prototypowej mowy skierowanej do dzieci nad normalną mową dorosłego. W klasycznym paradygmacie HPP niemowlęta mogą swobodnie obracać głowę i siedzieć między dwoma głośnikami z zamontowanymi światłami. Następnie miga światło prawego lub lewego głośnika, gdy ten głośnik dostarcza niemowlęciu pewnego rodzaju słuchowego lub językowego bodźca wejściowego. Wiarygodna orientacja w daną stronę jest uważana za wskazanie preferencji dla danych wejściowych związanych z mówcą tej strony. Od tego czasu paradygmat ten nabiera coraz większego znaczenia w badaniu percepcji mowy niemowląt , zwłaszcza w przypadku danych wejściowych na poziomie wyższym niż sylaba . kawałków, choć z pewnymi modyfikacjami, w tym z wykorzystaniem czasu słuchania zamiast preferencji bocznej jako odpowiedniej miary zależnej.

Procedura warunkowego zwrotu głowy

Podobnie jak HPP, Procedura Warunkowego Odwrócenia Głowy również wykorzystuje zróżnicowaną preferencję niemowlęcia dla danej strony jako wskazanie preferencji lub, częściej, znajomości danych wejściowych lub mowy związanych z tą stroną. Stosowany w badaniach prozodycznych znaczników granicznych przez Gout i in. (2004), a później Werker w jej klasycznych badaniach kategorycznej percepcji fonemów języka ojczystego , niemowlęta są uwarunkowane jakimś atrakcyjnym obrazem lub pokazem, aby patrzyły w jednym z dwóch kierunków za każdym razem, gdy usłyszysz określone wejście, całe słowo w przypadku dny moczanowej i pojedyncza sylaba fonemiczna w Werker's. Po warunkowaniu niemowlęciu przedstawia się następnie nowe lub bardziej złożone dane wejściowe, a jego zdolność do wykrycia wcześniejszego słowa docelowego lub rozróżnienia danych wejściowych z dwóch prób jest obserwowana na podstawie tego, czy odwraca głowę w oczekiwaniu na uwarunkowany pokaz, czy nie.

Przewidujący ruch gałek ocznych

Podczas gdy HPP i procedura warunkowego zwrotu głowy pozwalają na obserwację reakcji behawioralnych na bodźce i po fakcie wnioskowanie o tym, jakie oczekiwania podmiotu musiały być motywacją do tego zachowania, paradygmat antycypacyjnego ruchu gałek ocznych pozwala badaczom bezpośrednio obserwować oczekiwania podmiotu przed wystąpieniem zdarzenia . Śledząc ruchy gałek ocznych badanych , badacze byli w stanie zbadać podejmowanie decyzji przez niemowlęta i sposoby, w jakie niemowlęta kodują wiedzę probabilistyczną i działają na jej podstawie przewidywać swoje otoczenie. Ten paradygmat ma również tę zaletę, że porównuje różnice w zachowaniu ruchów gałek ocznych w szerszym przedziale wiekowym niż inne.

Sztuczne języki

Języki sztuczne , czyli języki na małą skalę, które zazwyczaj mają bardzo ograniczone słownictwo i uproszczone zasady gramatyczne , są powszechnie używanym paradygmatem dla badaczy psycholingwistycznych . Sztuczne języki pozwalają badaczom izolować interesujące nas zmienne i sprawować większy stopień kontroli nad danymi wejściowymi, które otrzyma badany. Niestety, nadmiernie uproszczony charakter tych języków i brak szeregu zjawisk wspólnych dla wszystkich ludzkich języków naturalnych, takich jak rytm , wysokość tonu zmiany i sekwencyjne regularności rodzą pytania o zewnętrzną ważność wszelkich ustaleń uzyskanych przy użyciu tego paradygmatu, nawet po podjęciu prób zwiększenia złożoności i bogactwa używanych języków. Brak złożoności lub zmniejszona złożoność sztucznego języka nie uwzględnia potrzeby dziecka rozpoznawania danej sylaby w języku naturalnym, niezależnie od zmienności dźwięku właściwej dla języka naturalnego, chociaż „jest możliwe, że złożoność języka naturalnego faktycznie ułatwia naukę”.

W związku z tym eksperymenty ze sztucznym językiem są zazwyczaj przeprowadzane w celu zbadania, jakie są istotne zmienne językowe, z jakich źródeł informacji mogą korzystać niemowlęta i kiedy oraz w jaki sposób naukowcy mogą modelować proces uczenia się i przyswajania . Na przykład Aslin i Newport wykorzystali sztuczne języki do zbadania, jakie cechy wkładu językowego tworzą określone wzorce wyraźne i łatwo wykrywalne przez niemowlęta, co pozwala im łatwo porównać wykrywanie powtórzeń sylab z sylabami końcowymi wyrazów i wyciągać wnioski na temat warunków, w których każda cecha jest uznawana za ważną.

Nagrania audio i audiowizualne

Wykazano, że uczenie się statystyczne odgrywa dużą rolę w przyswajaniu języka, ale interakcje społeczne wydają się również niezbędnym elementem uczenia się. W jednym badaniu niemowlęta, którym przedstawiono nagrania dźwiękowe lub audiowizualne osób mówiących po mandaryńsku, nie potrafiły rozróżnić fonemów języka. Oznacza to, że samo słuchanie dźwięków nie wystarczy do nauki języka; interakcje społeczne skłaniają niemowlę do zbierania danych statystycznych. Określone interakcje ukierunkowane na niemowlęta są znane jako język „skierowany do dzieci”, ponieważ jest bardziej powtarzalny i asocjacyjny, co ułatwia naukę. Te interakcje „skierowane do dzieci” mogą być również powodem, dla którego łatwiej jest uczyć się języka jako dziecko niż jako dorosły.

Dwujęzyczni

Badania niemowląt dwujęzycznych, takie jak badanie Bijeljac-Babic i in., przeprowadzone na niemowlętach uczących się francuskiego, dostarczyły wglądu w rolę prozodii w przyswajaniu języka. Badanie Bijeljac-Babic wykazało, że dominacja języka wpływa na „wrażliwość na kontrasty prozodyczne”. Chociaż nie było to badanie dotyczące statystycznego uczenia się, jego odkrycia dotyczące rozpoznawania wzorców prozodycznych mogą mieć implikacje dla statystycznego uczenia się.

Możliwe, że rodzaj doświadczenia językowego i wiedzy zdobytej podczas statystycznej nauki pierwszego języka wpływa na przyswajanie drugiego języka. Niektóre badania wskazują na możliwość, że trudność w nauce drugiego języka może wynikać z wzorców strukturalnych i wskazówek językowych, które ktoś już wychwycił z nauki pierwszego języka. W tym sensie znajomość i umiejętności przetwarzania pierwszego języka z akwizycji statystycznej mogą działać jako czynnik komplikujący, gdy próbuje się nauczyć nowego języka z różnymi strukturami zdań, regułami gramatycznymi i wzorami mowy. [ potrzebny cytat ]

Ważne ustalenia

Nauka kategorii fonetycznej

Pierwszym krokiem w rozwijaniu wiedzy o systemie tak złożonym, jak język naturalny, jest nauczenie się rozróżniania ważnych klas dźwięków specyficznych dla języka, zwanych fonemami, które rozróżniają znaczenie słów. Psycholog UBC, Janet Werker , od czasu swojej wpływowej serii eksperymentów w latach 80. XX wieku była jedną z najwybitniejszych postaci w próbach zrozumienia procesu, w którym ludzkie dzieci rozwijają te rozróżnienia fonologiczne. Podczas gdy dorośli, którzy mówią różnymi językami, nie są w stanie rozróżnić znaczących różnic dźwiękowych w innych językach, które nie wyznaczają różnych znaczeń w ich własnym, dzieci rodzą się ze zdolnością do uniwersalnego rozróżniania wszystkich dźwięków mowy. Praca Werkera wykazała, że ​​podczas gdy niemowlęta w wieku od sześciu do ośmiu miesięcy wciąż są w stanie dostrzec różnicę między pewnymi spółgłosek hindi i angielskich , całkowicie utraciły tę zdolność o 11 do 13 miesięcy.

Obecnie powszechnie przyjmuje się, że dzieci używają jakiejś formy percepcyjnego uczenia się dystrybucyjnego , w ramach której kategorie są odkrywane przez grupowanie podobnych przypadków bodźca wejściowego, aby tworzyć kategorie fonetyczne we wczesnym okresie życia. Stwierdzono, że rozwijające się dzieci są skutecznymi sędziami autorytetu językowego, sprawdzając dane wejściowe, na których wzorują swój język, przenosząc uwagi na mówców, którzy błędnie wymawiają słowa. Niemowlęta używają również śledzenia statystycznego do obliczania prawdopodobieństwa, że ​​​​poszczególne fonemy będą następować po sobie.

Rozbiór gramatyczny zdania

Analiza składniowa to proces, w którym ciągły strumień mowy jest dzielony na odrębne znaczące jednostki, np. zdania , słowa i sylaby. Saffran (1996) reprezentuje wyjątkowo przełomowe badanie w tej linii badań. Niemowlętom przedstawiono dwie minuty ciągłej mowy w sztucznym języku z komputerowego głosu, aby usunąć wszelkie zakłócenia spowodowane zewnętrznymi zmiennymi, takimi jak prozodia lub intonacja . Po tej prezentacji niemowlęta były w stanie odróżnić słowa od niesłów, co zmierzono dłuższym czasem patrzenia w drugim przypadku.

Ważnym pojęciem w zrozumieniu tych wyników jest prawdopodobieństwo przejściowe , prawdopodobieństwo wystąpienia elementu, w tym przypadku sylaby, następującego po lub poprzedzającego inny element. W tym eksperymencie sylaby, które pasowały do ​​siebie w słowach, miały znacznie większe prawdopodobieństwo przejścia niż sylaby na granicach słów , które po prostu sąsiadowały. Niewiarygodne, niemowlęta po krótkiej, dwuminutowej prezentacji były w stanie śledzić te statystyki i rozpoznawać wysokie prawdopodobieństwo słowa. Dalsze badania od tego czasu powtórzyły te wyniki z językami naturalnymi nieznanymi niemowlętom, wskazując, że uczące się niemowlęta również śledzą kierunek (do przodu lub do tyłu) prawdopodobieństw przejściowych. Chociaż procesy neuronalne stojące za tym zjawiskiem pozostają w dużej mierze nieznane, ostatnie doniesienia z badań wykazały zwiększoną aktywność lewego dolnego zakrętu czołowego i środkowego zakrętu czołowego podczas wykrywania granic słów.

Rozwój tendencji do porządkowania sylab jest ważnym krokiem na drodze do pełnego rozwoju języka. Zdolność do kategoryzowania sylab i grupowania często współwystępujących sekwencji może mieć kluczowe znaczenie w rozwoju protoleksykonu , zestawu wspólnych szablonów słów specyficznych dla języka, opartych na charakterystycznych wzorcach słów, które słyszy niemowlę. Rozwój tego protoleksykonu może z kolei pozwolić na rozpoznawanie nowych typów wzorców, np . spółgłosek w języku angielskim, co pozwoliłoby niemowlętom na dalsze analizowanie słów poprzez rozpoznawanie wspólnych wyrażeń prozodycznych jako autonomicznych jednostek językowych, rozpoczynając od nowa dynamiczny cykl nauki słów i języków.

Skojarzenia z etykietami referencyjnymi

Pytanie, w jaki sposób początkujący użytkownicy języka są w stanie skojarzyć wyuczone etykiety z odpowiednim desygnatem , osobą lub przedmiotem w środowisku, które nazwa ta etykieta, było w centrum filozoficznych rozważań nad językiem i znaczeniem od Platona przez Quine'a do Hofstadtera . Ten problem polega na znalezieniu pewnego stałego związku między słowem a przedmiotem, na znalezieniu znaczenia słowa bez ulegania nieskończonej rekurencji wyszukiwania w słowniku, jest znany jako problem uziemienia symboli .

Badacze wykazali, że problem ten jest ściśle powiązany ze zdolnością analizowania języka i że te słowa, które są łatwe do segmentacji ze względu na ich wysokie prawdopodobieństwo przejścia, są również łatwiejsze do odwzorowania na odpowiedni desygnat. Służy to jako kolejny dowód na postęp rozwojowy przyswajania języka, przy czym dzieci wymagają zrozumienia rozkładu dźwięków języków naturalnych, aby utworzyć kategorie fonetyczne, przeanalizować słowa w oparciu o te kategorie, a następnie użyć tych analiz do odwzorowania ich na obiekty jako etykiety.

Najwcześniejsze rozwojowo rozumienie skojarzeń referencyjnych odnotowano w wieku sześciu miesięcy, kiedy niemowlęta rozumiały słowa „ mama ” i „ tatuś ” lub ich rodzinne lub kulturowe odpowiedniki. Dalsze badania wykazały, że niemowlęta szybko rozwijają tę zdolność iw wieku siedmiu miesięcy są w stanie nauczyć się skojarzeń między ruchomymi obrazami a bezsensownymi słowami i sylabami.

Należy zauważyć, że istnieje rozróżnienie, często mylone w badaniach akwizycji, między mapowaniem etykiety na konkretną instancję lub osobę a mapowaniem etykiety na całą klasę obiektów. Ten ostatni proces jest czasami określany jako uogólnienie lub nauka zasad. Badania wykazały, że jeśli dane wejściowe są kodowane w kategoriach percepcyjnie najistotniejszych wymiarów, a nie konkretnych szczegółów, a wzorce w danych wejściowych wskazują, że pewna liczba obiektów jest nazywana zamiennie w tym samym kontekście, osoba ucząca się języka będzie znacznie bardziej skłonna do uogólnienia tej nazwy do każdej instancji z odpowiednimi funkcjami. Ta tendencja jest silnie uzależniona od spójności wskazówek kontekstowych i stopnia, w jakim konteksty słów nakładają się na dane wejściowe. Różnice te są ponadto powiązane z dobrze znanymi wzorcami niedostatecznej i nadmiernej generalizacji w uczeniu się słów przez niemowlęta . Badania wykazały również, że śledzona jest również częstotliwość współwystępowania referentów, co pomaga tworzyć skojarzenia i rozwiewać niejasności w modelach odniesień obiektowych.

Zdolność do odpowiedniego uogólniania na całe klasy jeszcze niewidzianych słów, w połączeniu z umiejętnością analizowania ciągłej mowy i śledzenia prawidłowości porządkowania słów, może być kluczowymi umiejętnościami niezbędnymi do rozwijania biegłości i znajomości składni i gramatyki.

Różnice w populacjach autystycznych

Według ostatnich badań nie ma neuronalnych dowodów na statystyczną naukę języka u dzieci z zaburzeniami ze spektrum autyzmu . Pod wpływem ciągłego strumienia sztucznej mowy dzieci neurotypowe wykazywały mniejszą aktywność korową w grzbietowo-bocznej korze czołowej (zwłaszcza w środkowym zakręcie czołowym ), ponieważ zwiększały się wskazówki dotyczące granic słów. Jednak aktywność w tych sieciach pozostała niezmieniona u dzieci autystycznych, niezależnie od dostarczonych wskazówek werbalnych. Dowody te, podkreślające znaczenie prawidłowego funkcjonowania płata czołowego, potwierdzają teorię „funkcji wykonawczych”, używaną do wyjaśnienia niektórych biologicznie powiązanych przyczyn autystycznych deficytów językowych. Z upośledzoną pamięcią roboczą, podejmowaniem decyzji, planowaniem i wyznaczaniem celów, które są kluczowymi funkcjami płata czołowego, dzieci z autyzmem są zagubione, jeśli chodzi o kontakty towarzyskie i komunikację (Ozonoff i in., 2004). Ponadto naukowcy odkryli, że poziom zaburzeń komunikacyjnych u dzieci autystycznych był odwrotnie skorelowany ze wzrostem sygnału w tych samych regionach podczas kontaktu ze sztucznymi językami. Na podstawie tych dowodów naukowcy doszli do wniosku, że dzieci z zaburzeniami ze spektrum autyzmu nie mają architektury neuronowej umożliwiającej identyfikację granic słów w ciągłej mowie. Wykazano, że umiejętność wczesnej segmentacji słów pozwala przewidzieć późniejszy rozwój języka, co może wyjaśniać, dlaczego opóźnienie językowe jest charakterystyczną cechą zaburzeń ze spektrum autyzmu.

Statystyczna nauka języka w różnych sytuacjach

Nauka języka odbywa się w różnych kontekstach, w których zarówno niemowlę, jak i opiekun angażują się w interakcje społeczne. W ostatnich badaniach zbadano, w jaki sposób niemowlęta i dorośli wykorzystują statystyki międzysytuacyjne, aby dowiedzieć się nie tylko o znaczeniu słów, ale także o ograniczeniach w kontekście. Na przykład Smith i jego współpracownicy zaproponowali, aby niemowlęta uczyły się języka, nabywając skłonność do przypisywania przedmiotom podobnych przedmiotów, które pochodzą z dobrze zdefiniowanych kategorii. Ważna dla tego poglądu jest idea, że ​​ograniczenia, które pomagają w nauce słów, nie są niezależne od samego wkładu lub doświadczenia niemowlęcia. Raczej ograniczenia pojawiają się, gdy niemowlęta dowiadują się o sposobach używania słów i zaczynają zwracać uwagę na pewne cechy przedmiotów, które były używane w przeszłości do reprezentowania słów.

Problem z uczeniem się indukcyjnym może wystąpić, ponieważ słowa są często używane w niejednoznacznych sytuacjach, w których dostępnych jest więcej niż jedno możliwe odniesienie. Może to prowadzić do zamieszania u niemowląt, ponieważ mogą one nie być w stanie rozróżnić, które słowa należy rozszerzyć, aby oznaczyć obiekty, do których się odnoszą. Smith i Yu zaproponowali, że sposobem na rozróżnienie w takich niejednoznacznych sytuacjach jest śledzenie par odniesień do słów w wielu scenach. Na przykład niemowlę, które słyszy słowo w obecności przedmiotu A i przedmiotu B, nie będzie pewne, czy to słowo odnosi się do przedmiotu A, czy do przedmiotu B. Jeśli jednak niemowlę ponownie usłyszy etykietę w obecności przedmiotu B i przedmiot C, niemowlę może dojść do wniosku, że przedmiot B jest odpowiednikiem etykiety, ponieważ przedmiot B konsekwentnie łączy się z etykietą w różnych sytuacjach.

Modele obliczeniowe

Modele obliczeniowe są od dawna wykorzystywane do badania mechanizmów, za pomocą których osoby uczące się języka przetwarzają informacje językowe i manipulują nimi . Modele tego typu pozwalają naukowcom systematycznie kontrolować ważne zmienne uczenia się, którymi często trudno w ogóle manipulować u uczestników.

Modele asocjacyjne

Asocjacyjne sieci neuronowe modele akwizycji języka są jednymi z najstarszych typów modeli kognitywnych , wykorzystującymi rozproszone reprezentacje i zmiany wag połączeń między węzłami, które składają się na te reprezentacje, do symulacji uczenia się w sposób przypominający reorganizację neuronów opartą na plastyczności która stanowi podstawę ludzkiego uczenia się i pamięci . Modele asocjacyjne stanowią zerwanie z klasycznymi modelami poznawczymi, charakteryzującymi się dyskretnymi i pozbawionymi kontekstu symbolami , na rzecz dynamicznego systemowego podejścia do języka, które lepiej radzi sobie z kwestiami czasowymi .

Prekursorem tego podejścia i jednym z pierwszych typów modeli uwzględniających wymiar czasu w rozumieniu i produkcji językowej była prosta rekurencyjna sieć Elmana ( SRN). Wykorzystując sieć zwrotnego do reprezentowania przeszłych stanów systemu, SRN były w stanie w zadaniu przewidywania słów pogrupować dane wejściowe w samoorganizujące się kategorie gramatyczne oparte wyłącznie na statystycznych wzorcach współwystępowania.

, ale pozostawiając wiele innych bez odpowiedzi, takich jak reprezentacja tych statystycznie nabytych leksemów . Szczególne znaczenie w ostatnich badaniach miała próba zrozumienia dynamicznej interakcji zmiennych związanych z uczeniem się (np. opartym na języku) i uczącym się (np. mówiącym) w organizacji leksykalnej i konkurencji u osób dwujęzycznych . W nieustannych wysiłkach zmierzających do przejścia w kierunku bardziej realistycznych modeli psychologicznych wielu badaczy zwróciło się ku podzbiorowi modeli asocjacyjnych, samoorganizującym się mapom (SOM), jako ustalonym, poznawczo wiarygodnym modelom rozwoju języka.

SOM były pomocne dla badaczy w identyfikowaniu i badaniu ograniczeń i zmiennych będących przedmiotem zainteresowania w wielu procesach akwizycji oraz w badaniu konsekwencji tych odkryć dla teorii językowych i poznawczych. Identyfikując pamięć roboczą jako ważne ograniczenie zarówno dla osób uczących się języków, jak i dla obecnych modeli obliczeniowych, badacze byli w stanie wykazać, że manipulowanie tą zmienną pozwala na ładowanie syntaktyczne , rysowanie nie tylko kategorycznej, ale rzeczywistej treści treści z pozycyjnego współwystępowania słów w zdania.

Modele probabilistyczne

Niektóre najnowsze modele przyswajania języka koncentrowały się na metodach wnioskowania bayesowskiego w celu uwzględnienia zdolności niemowląt do odpowiedniego analizowania strumieni mowy i nabywania znaczeń słów. Modele tego typu w dużym stopniu opierają się na pojęciu prawdopodobieństwa warunkowego (prawdopodobieństwo A na podstawie B), zgodnie z ustaleniami dotyczącymi używania przez niemowlęta przejściowych prawdopodobieństw słów i sylab do nauki słów.

Modele wykorzystujące te metody probabilistyczne były w stanie połączyć wcześniej dychotomiczne perspektywy uczenia się języka teorii społecznych , które podkreślają znaczenie uczenia się intencji mówcy, oraz teorie statystyczne i asocjacyjne , które opierają się na kontekstach międzysytuacyjnych, w jeden wspólny problem wnioskowania. Podejście to doprowadziło do ważnych wyników w wyjaśnianiu zjawisk nabywania, takich jak wzajemna wyłączność , uczenie się w jednej próbie lub szybkie mapowanie oraz wykorzystanie intencji społecznych .

Chociaż wyniki te wydają się solidne, badania dotyczące zdolności tych modeli do radzenia sobie z bardziej złożonymi sytuacjami, takimi jak mapowanie wielu odniesień do pojedynczej etykiety, mapowanie wielu etykiet do pojedynczego odniesienia oraz akwizycja języka dwujęzycznego w porównaniu z sukcesami modeli asocjacyjnych w tych obszarach jeszcze do zbadania. Pozostaje jednak nadzieja, że ​​te typy modeli można połączyć, aby zapewnić kompleksowy opis przyswajania języka.

Hipoteza C/V

Wzdłuż linii częstotliwości probabilistycznych hipoteza C/V zasadniczo stwierdza, że ​​wszyscy słuchacze języka używają częstotliwości spółgłosek do rozróżniania słów (rozróżnień leksykalnych) w ciągłych ciągach mowy w porównaniu z samogłoskami. Samogłoski są bardziej istotne dla identyfikacji rytmicznej. Kilka dalszych badań ujawniło to odkrycie, ponieważ wykazały, że samogłoski są przetwarzane niezależnie od ich lokalnego rozkładu statystycznego. Inne badania wykazały, że stosunek spółgłosek do samogłosek nie wpływa na rozmiary leksykonów przy porównywaniu różnych języków. W przypadku języków o wyższym stosunku spółgłosek dzieci mogą bardziej polegać na sąsiednich spółgłoskach niż na częstotliwości rymów lub samogłosek.

Algorytmy akwizycji języka

Niektóre modele akwizycji języka zostały oparte na algorytmach analizy adaptacyjnej i indukcji gramatycznej .