Demaskowanie obuuszne
Obuuszne demaskowanie to zjawisko percepcji słuchowej odkryte przez Irę Hirsha . Podczas demaskowania obuusznego mózg łączy informacje z obu uszu, aby poprawić wykrywanie sygnału i identyfikację w hałasie . Zjawisko to najczęściej obserwuje się, gdy występuje różnica między fazą międzyuszną sygnału a fazą międzyuszną szumu. Gdy taka różnica występuje, następuje poprawa progu maskowania w porównaniu z sytuacją odniesienia, w której fazy międzyuszne są takie same lub gdy bodziec został zaprezentowany monofonicznie. Te dwa przypadki zwykle dają bardzo podobne progi. Wielkość poprawy jest znana jako „różnica poziomów maskowania obuusznego” (BMLD) lub po prostu „różnica poziomów maskowania”.
Obuuszne demaskowanie jest najskuteczniejsze przy niskich częstotliwościach. BMLD dla czystych tonów w hałasie szerokopasmowym osiąga maksymalną wartość około 15 decybeli (dB) przy 250 Hz i stopniowo spada do 2-3 dB przy 1500 Hz. Następnie BMLD stabilizuje się na poziomie 2-3 dB dla wszystkich wyższych częstotliwości, aż do co najmniej 4 kHz. Obuuszne demaskowanie można również zaobserwować w przypadku wąskopasmowych szumów maskujących, ale efekt zachowuje się inaczej: można zaobserwować większe BMLD i niewiele jest dowodów na spadek wraz ze wzrostem częstotliwości.
Udoskonalona identyfikacja mowy w hałasie została po raz pierwszy opisana przez JCR Licklidera . Licklider zauważył, że różnica w fazie międzyusznej, która została wykorzystana do demaskowania, jest podobna do międzyusznej różnicy czasu , która zmienia się w zależności od kierunku źródła dźwięku i bierze udział w lokalizacji dźwięku. Fakt, że mowa może zostać zdemaskowana, a ukryte sygnały różnią się w zależności od kierunku dźwięku, podniósł prawdopodobieństwo, że obuuszne demaskowanie odgrywa rolę w efekcie przyjęcia koktajlowego .
System etykietowania
Systematyczny system etykietowania różnych konfiguracji bodźców, zastosowany po raz pierwszy przez Jeffressa, został przyjęty przez większość autorów w tej dziedzinie. Nazwy warunków są zapisywane jako NxSy, gdzie x to międzyuszna konfiguracja szumu, a y to międzyuszna konfiguracja sygnału. Niektóre typowe wartości x i y obejmują:
- 0 oznacza, że sygnał lub szum są identyczne w obu uszach
- π oznacza, że sygnał lub szum ma międzyuszną różnicę faz wynoszącą π radianów
- τ oznacza, że sygnał lub szum ma międzyuszną różnicę czasu , gdzie dokładna wartość różnicy czasu τ jest określona gdzie indziej.
- ρ oznacza, że szum ma korelację międzyuszną mniejszą niż jeden, przy czym dokładna korelacja jest określona gdzie indziej.
- m oznacza, że sygnał lub szum są monofoniczne.
teorie
Obuuszne demaskowanie ma dwa główne ramy wyjaśniające. Opierają się one na międzyusznej korelacji krzyżowej i odejmowaniu międzyusznym.
Konto korelacji krzyżowej opiera się na istnieniu sieci wykrywania koincydencji w śródmózgowiu, podobnej do tej zaproponowanej przez Lloyda A. Jeffressa w celu uwzględnienia wrażliwości na międzyuszne różnice czasowe w lokalizacji dźwięku . Każdy detektor koincydencji otrzymuje strumień potencjałów czynnościowych z dwojga uszu za pośrednictwem sieci aksonów, które wprowadzają różnicowe opóźnienia transmisji. Uważa się, że wykrycie sygnału ma miejsce, gdy szybkość odpowiedzi najbardziej aktywnego detektora koincydencji jest zmniejszona przez obecność sygnału. Korelacja krzyżowa sygnałów w obu uszach jest często używana jako matematyczny surogat do modelowania takiej tablicy neuronów wykrywających zbieg okoliczności; zmniejszony wskaźnik odpowiedzi przekłada się na zmniejszenie maksimum korelacji krzyżowej.
Konto subtraktywne jest znane jako teoria „wyrównania-anulowania” lub „EC”. W tym ujęciu przebiegi w obu uszach (lub ich wewnętrzne reprezentacje) są czasowo wyrównywane (wyrównywane) przez mózg, zanim zostaną odjęte jeden od drugiego. W efekcie detektory koincydencji są zastępowane neuronami, które są wzbudzane potencjałami czynnościowymi z jednego ucha, ale hamowane przez potencjały czynnościowe z drugiego. Jednak teoria EC nie jest ogólnie sformułowana w tak wyraźnych terminach neurologicznych, aw mózgu nie zidentyfikowano żadnego odpowiedniego substratu neuronalnego. Niemniej jednak teoria EC okazała się bardzo popularną ramą modelowania i wypadła dobrze w bezpośrednim porównaniu z modelami korelacji krzyżowej w eksperymentach psychoakustycznych
Wskazówki percepcyjne
Ucho filtruje dochodzące dźwięki na różne częstotliwości: określone miejsce w ślimaku i określone włókno nerwu słuchowego reagują tylko na ograniczony zakres częstotliwości. W związku z tym naukowcy zbadali sygnały generowane przez mieszaninę mowy i hałasu w obojgu uszach w wąskim paśmie częstotliwości wokół sygnału. Po dodaniu sygnału i szumu wąskopasmowego sumowanie wektorów , w którym wypadkowa amplituda i faza różnią się od amplitudy samego szumu lub sygnału. W przypadku obuusznego bodźca demaskującego różnice między parametrami międzyusznymi sygnału i szumu oznaczają, że w każdym uchu nastąpi inne sumowanie wektorów. W konsekwencji, niezależnie od konstrukcji bodźca, w uszach słuchacza występują fluktuacje zarówno poziomu, jak i różnic fazowych bodźców.
Eksperymenty sprawdziły, które z tych wskazówek system słuchowy może najlepiej wykryć. Pokazały one, że przy niskich częstotliwościach (szczególnie 500 Hz) układ słuchowy jest najbardziej wrażliwy na międzyuszne różnice czasowe . Wydaje się jednak, że przy wyższych częstotliwościach następuje przejście do stosowania międzyusznych różnic poziomów.
praktyczne implikacje
W życiu codziennym mowę łatwiej zrozumieć w hałasie, gdy mowa i hałas dochodzą z różnych kierunków, co jest zjawiskiem znanym jako „przestrzenne uwolnienie od maskowania”. W tej sytuacji mowa i hałas mają wyraźne międzyuszne różnice czasowe i międzyuszne różnice poziomów. Różnice czasowe są spowodowane różnicami w długości ścieżki dźwiękowej do obu uszu, a różnice poziomów są spowodowane efektem cieniowania akustycznego głowy. Te dwa sygnały odgrywają główną rolę w lokalizacji dźwięku i wykazano, że oba mają niezależny wpływ na uwalnianie przestrzenne z maskowania. Międzyuszne różnice poziomów mogą spowodować, że jedno ucho lub drugie będzie miało lepszy stosunek sygnału do szumu , co umożliwi słuchaczowi uzyskanie poprawy zrozumiałości poprzez zwykłe słuchanie tego ucha. Jednak międzyuszne różnice czasowe można wykorzystać jedynie poprzez porównanie przebiegów w obu uszach. Udane modele przestrzennego uwolnienia od maskowania mają tendencję do wykorzystywania teorii wyrównania-anulowania do generowania efektów międzyusznych różnic czasowych.