Indeks jakości mowy w aparacie słuchowym

Wskaźnik jakości mowy w aparatach słuchowych ( HASQI ) jest miarą jakości dźwięku pierwotnie zaprojektowaną do oceny jakości mowy osób z aparatami słuchowymi . Wykazano również, że jest w stanie ocenić jakość dźwięku dla dźwięków innych niż mowa i dla słuchaczy bez ubytku słuchu .

Tło

Chociaż postrzeganie jakości dźwięku można zmierzyć za pomocą pomiarów percepcyjnych, przeprowadzenie testów jest czasochłonne. W związku z tym opracowano szereg wskaźników umożliwiających ocenę jakości dźwięku bez konieczności słuchania przez człowieka. Standaryzowane przykłady z telefonii obejmują PESQ , POLQA , PEVQ i PEAQ . HASQI został pierwotnie opracowany przez Kates i Arehart w celu oceny, w jaki sposób zniekształcenia wprowadzane przez aparaty słuchowe obniżają jakość. Wyprodukowali także nową wersję w 2014 roku.

Kressnera i in. przetestowali korpus mowy inny niż zestaw danych wykorzystany do opracowania HASQI i wykazali, że indeks dobrze uogólnia słuchaczy bez ubytku słuchu z wydajnością porównywalną z PESQ. Kendrick i in. wykazali, że HASQI może oceniać jakość dźwięku muzyki oraz codziennych dźwięków geofonicznych, biofonicznych i antrofonicznych, chociaż w ich badaniu wykorzystano bardziej ograniczony zestaw degradacji.

metoda

HASQI i jego wersja z 2014 r. to metody dwustronne, które wymagają zarówno czystego odniesienia, jak i zdegradowanego sygnału, aby umożliwić ocenę. Indeks próbuje uchwycić skutki szumu, zniekształceń nieliniowych, filtrowania liniowego i zmian widmowych, obliczając różnicę lub korelację między kluczowymi cechami audio. Odbywa się to poprzez badanie obwiedni sygnału o krótkim czasie w celu ilościowego określenia degradacji spowodowanej szumem i filtrowaniem nieliniowym oraz obwiedni sygnału o długim czasie w celu ilościowego określenia skutków filtrowania liniowego. Wersja 2 HASQI zawiera model do uchwycenia niektórych aspektów peryferyjnego układu słuchowego zarówno dla słuchaczy normalnych, jak i niedosłyszących.

Kendrick i in. opracował metodę ślepą (single-ended), bHASQI, wykorzystującą uczenie maszynowe. Umożliwia to ocenę jakości dźwięku tylko na podstawie sygnału o obniżonej jakości bez potrzeby korzystania z czystego odniesienia.

Zobacz też

Linki zewnętrzne