Zespół krytyczny

W audiologii i psychoakustyce koncepcja pasm krytycznych , wprowadzona przez Harveya Fletchera w 1933 r. i udoskonalona w 1940 r., opisuje pasmo częstotliwości „filtra słuchowego” utworzonego przez ślimak , narząd zmysłu słuchu w uchu wewnętrznym . Z grubsza, pasmo krytyczne to pasmo częstotliwości audio , w którym drugi ton będzie zakłócał percepcję pierwszego tonu poprzez maskowanie słuchowe .

Z psychofizjologicznego punktu widzenia , odczucia bicia i chropowatości słuchowej można powiązać z niezdolnością mechanizmu analizy częstotliwości słuchowej do rozróżnienia sygnałów wejściowych, których różnica częstotliwości jest mniejsza niż szerokość pasma krytycznego i wynikającego z tego nieregularnego „łaskotania” układu mechanicznego ( błony podstawnej ), który rezonuje w odpowiedzi na takie wpisy. Pasma krytyczne są również ściśle związane ze maskowania słuchowego – zmniejszoną słyszalnością sygnału dźwiękowego w obecności drugiego sygnału o wyższym natężeniu w tym samym paśmie krytycznym. Zjawiska maskowania mają szerokie implikacje, począwszy od złożonej relacji między głośnością (percepcyjny układ odniesienia) a intensywnością (fizyczny układ odniesienia) po algorytmy kompresji dźwięku .

Filtry słuchowe

Filtry są stosowane w wielu aspektach audiologii i psychoakustyki , w tym w peryferyjnym układzie słuchowym. Filtr to urządzenie, które wzmacnia określone częstotliwości i tłumi inne. W szczególności filtr pasmowo-przepustowy umożliwia przejście zakresu częstotliwości w paśmie, zatrzymując jednocześnie częstotliwości poza częstotliwościami odcięcia.

Filtr środkowoprzepustowy pokazujący częstotliwość środkową (Fc), dolną (F1) i górną (F2) częstotliwość odcięcia oraz szerokość pasma. Górna i dolna częstotliwość odcięcia są definiowane jako punkt, w którym amplituda spada do 3dB poniżej amplitudy szczytowej. Szerokość pasma jest odległością między górną i dolną częstotliwością odcięcia i jest zakresem częstotliwości przepuszczanych przez filtr.

Kształt i organizacja błony podstawnej oznacza, że ​​różne częstotliwości rezonują szczególnie silnie w różnych punktach wzdłuż błony. Prowadzi to do tonotopowej organizacji wrażliwości na zakresy częstotliwości wzdłuż membrany, którą można modelować jako macierz nakładających się filtrów pasmowo-przepustowych zwanych „filtrami słuchowymi”. Filtry słuchowe są powiązane z punktami wzdłuż błony podstawnej i określają selektywność częstotliwościową ślimaka, a tym samym rozróżnianie przez słuchacza różnych dźwięków. Są nieliniowe, zależne od poziomu, a szerokość pasma zmniejsza się od podstawy do wierzchołka ślimaka, gdy strojenie błony podstawnej zmienia się z wysokiej na niską częstotliwość. Szerokość pasma filtra słuchowego nazywana jest szerokością pasma krytycznego, jak po raz pierwszy zasugerował Fletcher (1940). Jeżeli sygnał i element maskujący są prezentowane jednocześnie, wówczas tylko częstotliwości maskujące mieszczące się w krytycznym paśmie szerokości pasma przyczyniają się do maskowania sygnału. Im większa krytyczna szerokość pasma, tym niższy stosunek sygnału do szumu (SNR) i tym bardziej sygnał jest maskowany.

ERB związany z częstotliwością środkową. Diagram przedstawia zależność ERB od częstotliwości środkowej zgodnie ze wzorem Glasberga i Moore'a.

Inną koncepcją związaną z filtrem słuchowym jest równoważna prostokątna szerokość pasma (ERB). ERB pokazuje zależność między filtrem słuchowym, częstotliwością i krytyczną szerokością pasma. ERB przepuszcza taką samą ilość energii, jak odpowiadający mu filtr słuchowy i pokazuje, jak zmienia się ona wraz z częstotliwością wejściową. Przy niskim poziomie dźwięku ERB jest aproksymowany następującym równaniem według Glasberga i Moore'a:

ERB(f) = 24,7 * (4,37 f / 1000 + 1),

gdzie ERB jest w Hz, a f to częstotliwość środkowa w Hz.

Uważa się, że każdy ERB odpowiada około 0,9 mm na błonie podstawnej. ERB można przekształcić w skalę odnoszącą się do częstotliwości i pokazującą położenie filtra słuchowego wzdłuż błony podstawnej. Na przykład liczba ERB 3,36 odpowiada częstotliwości na wierzchołkowym końcu błony podstawnej, podczas gdy liczba ERB 38,9 odpowiada podstawie, a wartość 19,5 mieści się w połowie między nimi.

Jednym z typów filtrów używanych do modelowania filtrów słuchowych jest filtr gammatonowy . Zapewnia prosty filtr liniowy , który jest zatem łatwy do wdrożenia, ale sam w sobie nie może uwzględniać nieliniowych aspektów układu słuchowego; jest jednak używany w różnych modelach układu słuchowego . Odmiany i ulepszenia modelu gammatone filtrowania słuchowego obejmują filtr gammachirp, filtry gammatone z wszystkimi biegunami i jednym zerem, dwustronny filtr gammatone i modele kaskadowe filtrów oraz różne zależne od poziomu i dynamicznie nieliniowe wersje te.

Krzywe strojenia psychoakustycznego

Kształty filtrów słuchowych znajdują się na podstawie analizy strojenia psychoakustycznego, które są wykresami pokazującymi próg wykrycia tonu przez podmiot w funkcji parametrów maski.

Krzywe strojenia psychoakustycznego można zmierzyć za pomocą metody szumów karbowanych. Ta forma pomiaru może zająć dużo czasu, a znalezienie każdego zamaskowanego progu może zająć około 30 minut. W metodzie karbowanego szumu pacjent jest przedstawiany z karbowanym szumem jako maską i sinusoidą (czysty ton) jako sygnałem. Hałas karbowany jest używany jako maska, aby zapobiec słyszeniu uderzeń, które występują, gdy używana jest maska ​​sinusoidalna. Hałas z karbem to szum z karbem wokół częstotliwości sygnału, który badany próbuje wykryć, i zawiera szum w określonym paśmie. Mierzona jest szerokość pasma zmian szumu i maskowane progi dla sinusoidy. Maskowane progi są obliczane poprzez jednoczesne maskowanie, gdy sygnał jest odtwarzany podmiotowi w tym samym czasie co maskujący, a nie później.

Aby uzyskać prawdziwą reprezentację filtrów słuchowych u jednego pacjenta, należy obliczyć wiele krzywych dostrajania psychoakustycznego z sygnałem o różnych częstotliwościach. Dla każdej mierzonej krzywej strojenia psychoakustycznego należy obliczyć co najmniej pięć, a najlepiej od trzynastu do piętnastu progów, z różnymi szerokościami karbów. Należy również obliczyć dużą liczbę progów, ponieważ filtry słuchowe są asymetryczne, więc progi powinny być mierzone również z karbem asymetrycznym do częstotliwości sygnału. Ze względu na wiele potrzebnych pomiarów, czas potrzebny na znalezienie kształtu filtrów słuchowych danej osoby jest bardzo długi. Aby skrócić potrzebny czas, przy znajdowaniu zamaskowanych progów można zastosować metodę rosnącą. Jeśli do obliczenia progu stosowana jest metoda rosnąca, czas potrzebny na obliczenie kształtu filtra ulega radykalnemu skróceniu, ponieważ obliczenie progu zajmuje około dwóch minut. Dzieje się tak, ponieważ próg jest rejestrowany, gdy podmiot po raz pierwszy słyszy dźwięk, a nie wtedy, gdy reaguje na określony poziom bodźca przez określony procent czasu.

Anatomia i fizjologia błony podstawnej

Ucho ludzkie składa się z trzech obszarów: ucha zewnętrznego, środkowego i wewnętrznego. W uchu wewnętrznym znajduje się ślimak . Ślimak to formacja w kształcie ślimaka, która umożliwia przenoszenie dźwięku drogą czuciowo-nerwową, a nie drogą przewodzącą. Ślimak jest złożoną strukturą, składającą się z trzech warstw płynu. Scala vestibuli i scala media są oddzielone błoną Reissnera, podczas gdy scala media i scala tympani są oddzielone błoną podstawną. Poniższy schemat ilustruje złożony układ przedziałów i ich podziały:

Przekrój przez ślimak, pokazujący różne przedziały (jak opisano powyżej)

Błona podstawna rozszerza się w miarę postępu od podstawy do wierzchołka. Dlatego podstawa (najcieńsza część) ma większą sztywność niż wierzchołek. Oznacza to, że amplituda fali dźwiękowej przechodzącej przez błonę podstawną zmienia się, gdy przechodzi ona przez ślimak. Kiedy wibracja jest przenoszona przez ślimak, płyn w trzech przedziałach powoduje, że błona podstawna reaguje w sposób przypominający falę. Ta fala jest określana jako „fala podróżująca”; termin ten oznacza, że ​​błona podstawna nie wibruje po prostu jako jedna jednostka od podstawy w kierunku wierzchołka.

Kiedy dźwięk dociera do ludzkiego ucha, czas potrzebny na przebycie fali przez ślimak wynosi tylko 5 milisekund.

Kiedy fale biegnące o niskiej częstotliwości przechodzą przez ślimak, amplituda fali stopniowo wzrasta, a następnie prawie natychmiast zanika. Umiejscowienie wibracji na ślimaku zależy od częstotliwości prezentowanych bodźców. Na przykład niższe częstotliwości stymulują głównie wierzchołek, w porównaniu z wyższymi częstotliwościami, które stymulują podstawę ślimaka. Ten atrybut fizjologii błony podstawnej można zilustrować w postaci mapy miejsce-częstotliwość:

Uproszczony schemat błony podstawnej, przedstawiający zmianę częstotliwości charakterystycznej od podstawy do wierzchołka

Błona podstawna podtrzymuje narząd Cortiego , który znajduje się w środku scala. Narząd Cortiego zawiera zarówno zewnętrzne, jak i wewnętrzne komórki rzęsate. W jednym uchu znajduje się około 15 000 do 16 000 tych komórek rzęsatych. Zewnętrzne komórki rzęsate mają stereocilia wystające w kierunku błony nakrywkowej, która znajduje się nad narządem Cortiego. Stereocilia reagują na ruch błony nakrywkowej, gdy dźwięk powoduje wibracje w ślimaku. Kiedy to nastąpi, stereocilia oddziela się i tworzy się kanał, który umożliwia zajście procesów chemicznych. Ostatecznie sygnał dociera do ósmego nerwu, po czym następuje przetwarzanie w mózgu.

Związek z maskowaniem

Filtry słuchowe są ściśle związane z maskowaniem w sposobie ich pomiaru, a także w sposobie działania w układzie słuchowym. Jak opisano wcześniej, krytyczna szerokość pasma filtra zwiększa się wraz ze wzrostem częstotliwości, wraz z tym filtr staje się bardziej asymetryczny wraz ze wzrostem poziomu.

Asymetria filtra słuchowego. Diagram przedstawia rosnącą asymetrię filtra słuchowego wraz ze wzrostem poziomu wejściowego. Podświetlone filtry pokazują kształt dla poziomu wejściowego 90 dB (różowy) i poziomu wejściowego 20 dB (zielony). Schemat zaadaptowany z Moore'a i Glasberga, który przedstawiał zaokrąglone (roex) kształty filtrów.

Uważa się, że te dwie właściwości filtra słuchowego przyczyniają się do rozprzestrzeniania się maskowania w górę, to znaczy niskie częstotliwości lepiej maskują wysokie częstotliwości niż odwrotne. Ponieważ zwiększenie poziomu powoduje spłycenie nachylenia niskich częstotliwości, poprzez zwiększenie ich amplitudy, niskie częstotliwości maskują wysokie częstotliwości bardziej niż przy niższym poziomie wejściowym.

Filtr słuchowy może zredukować efekty maski podczas słuchania sygnału w szumie tła przy użyciu odsłuchu poza częstotliwością. Jest to możliwe, gdy częstotliwość środkowa maskera różni się od częstotliwości sygnału. W większości sytuacji słuchacz wybiera słuchanie „przez” filtr dźwiękowy, który jest wyśrodkowany na sygnale, jednak jeśli obecny jest element maskujący, może to nie być odpowiednie. Filtr słuchowy wyśrodkowany na sygnale może również zawierać dużą ilość elementu maskującego, co powoduje, że SNR filtra jest niski i zmniejsza zdolność słuchacza do wykrycia sygnału. Jeśli jednak słuchacz słuchał przez nieco inny filtr, który nadal zawierał znaczną ilość sygnału, ale mniej maski, SNR wzrasta, umożliwiając słuchaczowi wykrycie sygnału.

Słuchanie poza częstotliwością. Diagram A pokazuje filtr słuchowy wyśrodkowany na sygnale i sposób, w jaki część maskera mieści się w tym filtrze, co skutkuje niskim współczynnikiem SNR. Diagram B pokazuje filtr dalej wzdłuż błony podstawnej, który nie jest wyśrodkowany na sygnale, ale zawiera znaczną ilość tego sygnału i mniej maski. To przesunięcie zmniejsza efekt maski poprzez zwiększenie SNR. Diagram zaadaptowany z Gelfand (2004).

Pierwszy diagram powyżej pokazuje filtr słuchowy wyśrodkowany na sygnale i sposób, w jaki część maskera mieści się w tym filtrze. Skutkuje to niskim SNR. Drugi diagram pokazuje następny filtr wzdłuż błony podstawnej, który nie jest wyśrodkowany na sygnale, ale zawiera znaczną ilość tego sygnału i mniej maski. Zmniejsza to efekt maski poprzez zwiększenie SNR.

Powyższe dotyczy modelu maskowania widma mocy. Ogólnie rzecz biorąc, model ten opiera się na systemie słuchowym zawierającym szereg filtrów słuchowych i wyborze filtra z sygnałem w centrum lub z najlepszym SNR. Tylko masker, który wpada w filtr słuchowy, przyczynia się do maskowania, a próg słyszenia sygnału przez osobę jest określany przez ten maskujący.

Normalne i upośledzone filtry słuchowe

W „normalnym” uchu filtr słuchowy ma kształt podobny do pokazanego poniżej. Ten wykres odzwierciedla selektywność częstotliwości i strojenie błony podstawnej.

Filtr słuchowy „normalnego” ślimaka

Dostrojenie błony podstawnej wynika z jej budowy mechanicznej. U podstawy błony podstawnej jest wąska i sztywna i najlepiej reaguje na wysokie częstotliwości. Jednak w wierzchołku membrana jest szeroka i elastyczna i najlepiej reaguje na niskie częstotliwości. Dlatego różne sekcje błony podstawnej wibrują w zależności od częstotliwości dźwięku i dają maksymalną odpowiedź przy tej konkretnej częstotliwości.

Jednak w uszkodzonym uchu filtr słuchowy ma inny kształt niż w „normalnym” uchu.

Filtr słuchowy uszkodzonego ślimaka

Filtr słuchowy uszkodzonego ucha jest bardziej płaski i szerszy w porównaniu do normalnego ucha. Dzieje się tak, ponieważ selektywność częstotliwości i dostrojenie błony podstawnej jest zmniejszone, gdy zewnętrzne komórki rzęsate są uszkodzone. Kiedy uszkodzone są tylko zewnętrzne komórki rzęsate, filtr jest szerszy po stronie niskich częstotliwości. Kiedy zarówno zewnętrzne, jak i wewnętrzne komórki rzęsate są uszkodzone, filtr jest szerszy po obu stronach. Jest to mniej powszechne. Poszerzenie filtra słuchowego występuje głównie po stronie filtra o niskiej częstotliwości. Zwiększa to podatność na maskowanie niskich częstotliwości, tj. rozprzestrzenianie się maskowania w górę, jak opisano powyżej.

Zobacz też

Linki zewnętrzne