Doskonalenie mowy

Ulepszanie mowy ma na celu poprawę jakości mowy za pomocą różnych algorytmów. Celem ulepszenia jest poprawa zrozumiałości i/lub ogólnej percepcyjnej jakości sygnału mowy o obniżonej jakości przy użyciu technik przetwarzania sygnału audio .

Wzmocnienie mowy zdegradowanej przez hałas lub redukcja szumów jest najważniejszą dziedziną poprawy mowy i jest wykorzystywana w wielu zastosowaniach, takich jak telefony komórkowe , VoIP , systemy telekonferencyjne , rozpoznawanie mowy , diaryzacja mówców i aparaty słuchowe .

Algorytmy

Algorytmy poprawy mowy w celu redukcji szumów można podzielić na trzy podstawowe klasy: techniki filtrowania, przywracanie widma i metody oparte na modelach.

Techniki filtrowania

Metoda odejmowania widmowego
Filtrowanie Wienera
podprzestrzenne sygnału (SSA)

Przywracanie

widmowe Minimalny błąd średniokwadratowy Krótkookresowy estymator amplitudy spektralnej (MMSE-STSA)

Oparty na modelu mowy

Zobacz też

^ J. Benesty, S. Makino, J. Chen (red.). Wzmocnienie mowy . s. 1-8. Springera, 2005. ISBN 978-3-540-24039-6 .
^ Sahidullah, Md; Patino, Jose; Cornell, Samuele; Yin, Ruiking; Sivasankaran, Sunit; Bredin, Herve; Korszunow, Paweł; Brutti, Alessio; Serizel, Romain; Wincenty, Emmanuel; Evans, Mikołaj; Marcel, Sebastien; Squartini, Stefano; Barras, Claude (2019-11-06). „Szybkie zgłoszenie do DIHARD II: wkład i wyciągnięte wnioski” . arXiv : 1911.02388 [ eess.AS ].
^ J. Benesty, MM Sondhi, Y. Huang (red.). Springer Handbook of Speech Processing . s. 843-869. Springera, 2007. ISBN 978-3-540-49125-5 .

J. Benesty, MM Sondhi, Y. Huang (red.). Springer Handbook of Speech Processing . Springera, 2007. ISBN 978-3-540-49125-5 .
J. Benesty, S. Makino, J. Chen (red.). Wzmocnienie mowy . Springera, 2005. ISBN 978-3-540-24039-6 .
PC Loizou. Wzmocnienie mowy: teoria i praktyka . CRC Press, 2013. ISBN 978-1-466-50421-9 .

[1] J. Benesty, S. Makino, J. Chen (red.). Wzmocnienie mowy . s. 1-8. Springera, 2005. ISBN 978-3-540-24039-6 .

[2] Sahidullah, Md; Patino, Jose; Cornell, Samuele; Yin, Ruiking; Sivasankaran, Sunit; Bredin, Herve; Korszunow, Paweł; Brutti, Alessio; Serizel, Romain; Wincenty, Emmanuel; Evans, Mikołaj; Marcel, Sebastien; Squartini, Stefano; Barras, Claude (2019-11-06). „Szybkie zgłoszenie do DIHARD II: wkład i wyciągnięte wnioski” . arXiv : 1911.02388 [ eess.AS ].

[3] J. Benesty, MM Sondhi, Y. Huang (red.). Springer Handbook of Speech Processing . s. 843-869. Springera, 2007. ISBN 978-3-540-49125-5 .