Podprzestrzeń sygnału

W przetwarzaniu sygnałów metody podprzestrzeni sygnału są empirycznymi liniowymi metodami redukcji wymiarowości i redukcji szumów . Podejścia te wzbudziły ostatnio duże zainteresowanie i badania w kontekście ulepszania mowy, modelowania mowy i badań nad klasyfikacją mowy. Podprzestrzeń sygnału jest również wykorzystywana do wyszukiwania kierunku radiowego za pomocą algorytmu MUZYKA .

Zasadniczo metody reprezentują zastosowanie podejścia analizy głównych składowych (PCA) do zespołów obserwowanych szeregów czasowych uzyskanych przez próbkowanie , na przykład próbkowanie sygnału audio . Takie próbki można postrzegać jako wektory w wielowymiarowej przestrzeni wektorowej nad liczbami rzeczywistymi . PCA służy do identyfikacji zestawu ortogonalnych wektorów bazowych (sygnały bazowe), które wychwytują jak najwięcej energii w zespole obserwowanych próbek. Przestrzeń wektorowa rozpięta przez wektory bazowe zidentyfikowane w analizie jest wtedy podprzestrzenią sygnału . Podstawowym założeniem jest to, że informacja w sygnałach mowy jest prawie całkowicie zawarta w małej liniowej podprzestrzeni ogólnej przestrzeni możliwych wektorów próbek, podczas gdy szum addytywny jest zwykle rozprowadzany w większej przestrzeni izotropowo (na przykład, gdy jest to biały szum ).

Rzutując próbkę na podprzestrzeń sygnału, to znaczy utrzymując tylko składową próbki, która znajduje się w podprzestrzeni sygnału zdefiniowanej przez liniowe kombinacje kilku pierwszych wektorów bazowych o największej energii, i odrzucając resztę próbki, która jest w pozostała część przestrzeni ortogonalnej do tej podprzestrzeni, uzyskuje się wtedy pewną ilość filtrowania szumu.

Redukcję szumów podprzestrzennych sygnału można porównać do metod filtrowania Wienera . Istnieją dwie główne różnice:

  • Podstawowymi sygnałami stosowanymi w filtracji Wienera są zwykle sinusoidy harmoniczne , na które sygnał można rozłożyć za pomocą transformaty Fouriera . W przeciwieństwie do tego, sygnały bazowe używane do konstruowania podprzestrzeni sygnału są identyfikowane empirycznie i mogą to być na przykład ćwierkanie lub szczególne charakterystyczne kształty stanów przejściowych po określonych zdarzeniach wyzwalających, a nie czyste sinusoidy.
  • Filtr Wienera płynnie przechodzi między składowymi liniowymi zdominowanymi przez sygnał i składowymi liniowymi zdominowanymi przez szum. Składowe szumu są odfiltrowywane, ale nie do końca; składowe sygnału są zachowane, ale nie do końca; i istnieje strefa przejściowa, która jest częściowo akceptowana. W przeciwieństwie do tego, podejście do podprzestrzeni sygnału stanowi ostre odcięcie: składowa ortogonalna albo leży w podprzestrzeni sygnału, w którym to przypadku jest w 100% akceptowana, albo jest do niej ortogonalna, w którym to przypadku jest w 100% odrzucana. Ta redukcja wymiarowości, abstrakcja sygnału do znacznie krótszego wektora, może być szczególnie pożądaną cechą metody.

W najprostszym przypadku metody podprzestrzeni sygnału zakładają szum biały, ale opisano również rozszerzenia podejścia do usuwania szumu kolorowego i oceny wzmocnienia mowy opartego na podprzestrzeni w celu niezawodnego rozpoznawania mowy.