Indeks jakości mowy w aparacie słuchowym

Wskaźnik jakości mowy w aparatach słuchowych ( HASQI ) jest miarą jakości dźwięku pierwotnie zaprojektowaną do oceny jakości mowy osób z aparatami słuchowymi . Wykazano również, że jest w stanie ocenić jakość dźwięku dla dźwięków innych niż mowa i dla słuchaczy bez ubytku słuchu .

Tło

Chociaż postrzeganie jakości dźwięku można zmierzyć za pomocą pomiarów percepcyjnych, przeprowadzenie testów jest czasochłonne. W związku z tym opracowano szereg wskaźników umożliwiających ocenę jakości dźwięku bez konieczności słuchania przez człowieka. Standaryzowane przykłady z telefonii obejmują PESQ , POLQA , PEVQ i PEAQ . HASQI został pierwotnie opracowany przez Kates i Arehart w celu oceny, w jaki sposób zniekształcenia wprowadzane przez aparaty słuchowe obniżają jakość. Wyprodukowali także nową wersję w 2014 roku.

Kressnera i in. przetestowali korpus mowy inny niż zestaw danych wykorzystany do opracowania HASQI i wykazali, że indeks dobrze uogólnia słuchaczy bez ubytku słuchu z wydajnością porównywalną z PESQ. Kendrick i in. wykazali, że HASQI może oceniać jakość dźwięku muzyki oraz codziennych dźwięków geofonicznych, biofonicznych i antrofonicznych, chociaż w ich badaniu wykorzystano bardziej ograniczony zestaw degradacji.

metoda

HASQI i jego wersja z 2014 r. to metody dwustronne, które wymagają zarówno czystego odniesienia, jak i zdegradowanego sygnału, aby umożliwić ocenę. Indeks próbuje uchwycić skutki szumu, zniekształceń nieliniowych, filtrowania liniowego i zmian widmowych, obliczając różnicę lub korelację między kluczowymi cechami audio. Odbywa się to poprzez badanie obwiedni sygnału o krótkim czasie w celu ilościowego określenia degradacji spowodowanej szumem i filtrowaniem nieliniowym oraz obwiedni sygnału o długim czasie w celu ilościowego określenia skutków filtrowania liniowego. Wersja 2 HASQI zawiera model do uchwycenia niektórych aspektów peryferyjnego układu słuchowego zarówno dla słuchaczy normalnych, jak i niedosłyszących.

Kendrick i in. opracował metodę ślepą (single-ended), bHASQI, wykorzystującą uczenie maszynowe. Umożliwia to ocenę jakości dźwięku tylko na podstawie sygnału o obniżonej jakości bez potrzeby korzystania z czystego odniesienia.

Zobacz też

Percepcyjna ocena jakości mowy (PESQ)
Percepcyjna Obiektywna Analiza Jakości Odsłuchu (POLQA)
Percepcyjna ocena jakości wideo (PEVQ)
Percepcyjna ocena jakości dźwięku (PEAQ)

Linki zewnętrzne

Kod do oceny bHASQI Kod źródłowy do wykrywania ślepych i pomiaru zniekształceń i przesterowań