Doskonalenie mowy

Ulepszanie mowy ma na celu poprawę jakości mowy za pomocą różnych algorytmów. Celem ulepszenia jest poprawa zrozumiałości i/lub ogólnej percepcyjnej jakości sygnału mowy o obniżonej jakości przy użyciu technik przetwarzania sygnału audio .

Wzmocnienie mowy zdegradowanej przez hałas lub redukcja szumów jest najważniejszą dziedziną poprawy mowy i jest wykorzystywana w wielu zastosowaniach, takich jak telefony komórkowe , VoIP , systemy telekonferencyjne , rozpoznawanie mowy , diaryzacja mówców i aparaty słuchowe .

Algorytmy

Algorytmy poprawy mowy w celu redukcji szumów można podzielić na trzy podstawowe klasy: techniki filtrowania, przywracanie widma i metody oparte na modelach.

  • Techniki filtrowania
  • Przywracanie
  • widmowe Minimalny błąd średniokwadratowy Krótkookresowy estymator amplitudy spektralnej (MMSE-STSA)
  • Oparty na modelu mowy

Zobacz też

  1. ^   J. Benesty, S. Makino, J. Chen (red.). Wzmocnienie mowy . s. 1-8. Springera, 2005. ISBN 978-3-540-24039-6 .
  2. ^ Sahidullah, Md; Patino, Jose; Cornell, Samuele; Yin, Ruiking; Sivasankaran, Sunit; Bredin, Herve; Korszunow, Paweł; Brutti, Alessio; Serizel, Romain; Wincenty, Emmanuel; Evans, Mikołaj; Marcel, Sebastien; Squartini, Stefano; Barras, Claude (2019-11-06). „Szybkie zgłoszenie do DIHARD II: wkład i wyciągnięte wnioski” . arXiv : 1911.02388 [ eess.AS ].
  3. ^   J. Benesty, MM Sondhi, Y. Huang (red.). Springer Handbook of Speech Processing . s. 843-869. Springera, 2007. ISBN 978-3-540-49125-5 .