Indeks jakości mowy w aparacie słuchowym
Wskaźnik jakości mowy w aparatach słuchowych ( HASQI ) jest miarą jakości dźwięku pierwotnie zaprojektowaną do oceny jakości mowy osób z aparatami słuchowymi . Wykazano również, że jest w stanie ocenić jakość dźwięku dla dźwięków innych niż mowa i dla słuchaczy bez ubytku słuchu .
Tło
Chociaż postrzeganie jakości dźwięku można zmierzyć za pomocą pomiarów percepcyjnych, przeprowadzenie testów jest czasochłonne. W związku z tym opracowano szereg wskaźników umożliwiających ocenę jakości dźwięku bez konieczności słuchania przez człowieka. Standaryzowane przykłady z telefonii obejmują PESQ , POLQA , PEVQ i PEAQ . HASQI został pierwotnie opracowany przez Kates i Arehart w celu oceny, w jaki sposób zniekształcenia wprowadzane przez aparaty słuchowe obniżają jakość. Wyprodukowali także nową wersję w 2014 roku.
Kressnera i in. przetestowali korpus mowy inny niż zestaw danych wykorzystany do opracowania HASQI i wykazali, że indeks dobrze uogólnia słuchaczy bez ubytku słuchu z wydajnością porównywalną z PESQ. Kendrick i in. wykazali, że HASQI może oceniać jakość dźwięku muzyki oraz codziennych dźwięków geofonicznych, biofonicznych i antrofonicznych, chociaż w ich badaniu wykorzystano bardziej ograniczony zestaw degradacji.
metoda
HASQI i jego wersja z 2014 r. to metody dwustronne, które wymagają zarówno czystego odniesienia, jak i zdegradowanego sygnału, aby umożliwić ocenę. Indeks próbuje uchwycić skutki szumu, zniekształceń nieliniowych, filtrowania liniowego i zmian widmowych, obliczając różnicę lub korelację między kluczowymi cechami audio. Odbywa się to poprzez badanie obwiedni sygnału o krótkim czasie w celu ilościowego określenia degradacji spowodowanej szumem i filtrowaniem nieliniowym oraz obwiedni sygnału o długim czasie w celu ilościowego określenia skutków filtrowania liniowego. Wersja 2 HASQI zawiera model do uchwycenia niektórych aspektów peryferyjnego układu słuchowego zarówno dla słuchaczy normalnych, jak i niedosłyszących.
Kendrick i in. opracował metodę ślepą (single-ended), bHASQI, wykorzystującą uczenie maszynowe. Umożliwia to ocenę jakości dźwięku tylko na podstawie sygnału o obniżonej jakości bez potrzeby korzystania z czystego odniesienia.
Zobacz też
- Percepcyjna ocena jakości mowy (PESQ)
- Percepcyjna Obiektywna Analiza Jakości Odsłuchu (POLQA)
- Percepcyjna ocena jakości wideo (PEVQ)
- Percepcyjna ocena jakości dźwięku (PEAQ)
Linki zewnętrzne
- Kod do oceny bHASQI Kod źródłowy do wykrywania ślepych i pomiaru zniekształceń i przesterowań