cepstrum

W analizie Fouriera cepstrum ( / s k ɛ p s t r ʌ m , s ɛ p odwrotnej -, - ( t r ə m ) / ; liczba mnoga cepstra , przymiotnik cepstral jest wynikiem obliczenia transformaty Fouriera IFT) logarytmu estymowanego widma sygnału . Metoda jest narzędziem do badania struktur okresowych w częstotliwości . Cepstrum mocy ma zastosowanie w analizie ludzkiej mowy .

Termin cepstrum powstał poprzez odwrócenie pierwszych czterech liter widma . Operacje na cepstrach nazywane są analizą quefrency (lub quefrency alanysis ), lifteringiem lub analizą cepstralną . Można go wymawiać na dwa podane sposoby, przy czym drugi ma tę zaletę, że pozwala uniknąć pomyłki z kepstrum .

Etapy tworzenia cepstrum z historii czasu

Pochodzenie

Koncepcja cepstrum została wprowadzona w 1963 roku przez BP Bogerta, MJ Healy'ego i JW Tukeya . Służy jako narzędzie do badania struktur okresowych w widmach częstotliwości. Efekty te związane są z zauważalnymi echami lub odbiciami w sygnale lub z występowaniem częstotliwości harmonicznych ( poddźwięki , podtony ). Matematycznie zajmuje się problemem dekonwolucji sygnałów w przestrzeni częstotliwości.

Odniesienia do artykułu Bogerta w bibliografii są często redagowane niepoprawnie. [ Potrzebne źródło ] Terminy „quefrency”, „alanysis”, „cepstrum” i „saphe” zostały wymyślone przez autorów poprzez zmianę kolejności liter w częstotliwości, analizie, widmie i fazie. Terminy wymyślone są zdefiniowane analogicznie do terminów starszych.

Ogólna definicja

Cepstrum jest wynikiem następującej sekwencji operacji matematycznych:

  • transformacja sygnału z dziedziny czasu do dziedziny częstotliwości
  • obliczenie logarytmu amplitudy widmowej
  • transformacja do dziedziny częstotliwości, gdzie ostateczna zmienna niezależna, częstotliwość, ma skalę czasową.

typy

Cepstrum jest używany w wielu wariantach. Najważniejsze są:

  • cepstrum mocy: logarytm pochodzi z „widma mocy”
  • złożony cepstrum: Logarytm jest pobierany z widma, które jest obliczane za pomocą analizy Fouriera

W celu wyjaśnienia cepstrum we wzorach zastosowano następujące skróty:

Skrót Wyjaśnienie
Sygnał, który jest funkcją czasu
cepstrum
Transformata Fouriera : Skrót ten może oznaczać np. ciągłą transformatę Fouriera , dyskretną transformatę Fouriera (DFT) lub nawet transformację z , ponieważ transformacja z jest uogólnieniem DFT.
Odwrotność transformaty Fouriera
Logarytm x . _ Wybór podstawy b zależy od użytkownika. W niektórych artykułach podstawa nie jest określona, ​​inne preferują podstawę 10 lub e . Wybór podstawy nie ma wpływu na podstawowe zasady obliczeń, ale czasami podstawa e prowadzi do uproszczeń (patrz „złożony cepstrum”).
Wartość bezwzględna lub wielkość wartości zespolonej , która jest obliczana z części rzeczywistej i urojonej za pomocą twierdzenia Pitagorasa .
Absolutny kwadrat
Kąt fazowy wartości zespolonej

cepstrum mocy

„Cepstrum” zostało pierwotnie zdefiniowane jako cepstrum mocy przez następującą zależność:

Cepstrum mocy ma główne zastosowania w analizie sygnałów dźwiękowych i wibracyjnych. Jest to narzędzie uzupełniające analizę spektralną.

Czasami jest również określany jako:

Ze względu na ten wzór cepstrum jest czasami nazywane widmem widma . Można wykazać, że oba wzory są ze sobą zgodne, ponieważ rozkład widmowy częstotliwości pozostaje taki sam, a jedyną różnicą jest współczynnik skalowania, który można później zastosować. Niektóre artykuły preferują drugą formułę.

Inne zapisy są możliwe dzięki temu, że logarytm widma mocy jest równy logarytmowi widma przy zastosowaniu współczynnika skalującego 2:

i dlatego:

co zapewnia związek z prawdziwym cepstrum (patrz poniżej).

Ponadto należy zauważyć, że ostatnia operacja kwadratury we wzorze na widmo mocy czasami nazywana niepotrzebną i dlatego czasami jest

Prawdziwy cepstrum jest bezpośrednio powiązany z cepstrum mocy:

Wyprowadza się go z cepstrum zespolonego (zdefiniowanego poniżej) poprzez odrzucenie informacji o fazie (zawartej w części urojonej logarytmu zespolonego ) . Skupia się na efektach okresowych w amplitudach widma:

Złożony cepstrum

Złożony cepstrum został zdefiniowany przez Oppenheima w jego rozwoju teorii systemów homomorficznych. Formuła podawana jest także w innej literaturze.

Ponieważ jest złożony termin logarytmiczny można również zapisać jako fazy, a następnie jako sumę. Dalsze uproszczenie jest oczywiste, jeśli log jest logarytmem naturalnym o podstawie e :

Dlatego: Złożony cepstrum można również zapisać jako:

Złożony cepstrum zachowuje informacje o fazie. W ten sposób zawsze można powrócić z dziedziny częstotliwości do dziedziny czasu za pomocą operacji odwrotnej:

gdzie b jest podstawą użytego logarytmu.

Głównym zastosowaniem jest modyfikacja sygnału w dziedzinie częstotliwości (liftering) jako operacja analogowa do filtrowania w dziedzinie częstotliwości widmowych. Przykładem jest tłumienie efektów echa przez tłumienie pewnych częstotliwości.

Cepstrum fazowe (po widmie fazowym ) jest powiązane z cepstrum zespolonym jako

widmo fazowe = (zespolony cepstrum − odwrócenie czasowe zespolonego cepstrumu) 2 .

Pojęcia pokrewne

Zmienna niezależna wykresu cepstralnego nazywana jest quefrency . Częstotliwość jest miarą czasu, ale nie w sensie sygnału w dziedzinie czasu . Na przykład, jeśli częstotliwość próbkowania sygnału audio wynosi 44100 Hz i występuje duży szczyt w cepstrum, którego częstotliwość wynosi 100 próbek, szczyt wskazuje na obecność częstotliwości podstawowej, która wynosi 44100/100 = 441 Hz. Ten szczyt występuje w cepstrum, ponieważ harmoniczne w widmie są okresowe, a okres odpowiada częstotliwości podstawowej, ponieważ harmoniczne są całkowitymi wielokrotnościami częstotliwości podstawowej.

Kepstrum , co oznacza odpowiedź czasową równania Kołmogorowa na szereg potęgowy, jest podobne do cepstrum i ma do niego taki sam stosunek, jak wartość oczekiwana ma się do średniej statystycznej, tj. cepstrum jest wielkością mierzoną empirycznie, podczas gdy kepstrum jest wielkością teoretyczną ilość. Był używany przed cepstrum.

Autocepstrum jest definiowane jako cepstrum autokorelacji . Autocepstrum jest dokładniejsze niż cepstrum w analizie danych z echem.

Kontynuując temat anagramu, filtr działający na cepstrum można nazwać podnośnikiem . Podnośnik dolnoprzepustowy jest podobny do filtra dolnoprzepustowego w dziedzinie częstotliwości . Można to zaimplementować przez pomnożenie przez okno w dziedzinie częstotliwości, a następnie konwersję z powrotem do dziedziny częstotliwości, co daje zmodyfikowany sygnał, tj. ze zmniejszonym echem sygnału.

Interpretacja

Cepstrum można postrzegać jako informację o szybkości zmian w różnych pasmach widma. Został pierwotnie wynaleziony do charakteryzowania echa sejsmicznego wynikającego z trzęsień ziemi i wybuchów bomb . Został również wykorzystany do określenia podstawowej częstotliwości ludzkiej mowy i analizy radarowego . Wyznaczanie tonu cepstrum jest szczególnie skuteczne, ponieważ efekty pobudzenia głosowego (wysokość) i traktu głosowego (formanty) sumują się w logarytmie widma mocy, a zatem są wyraźnie rozdzielone.

Cepstrum jest reprezentacją używaną w homomorficznym przetwarzaniu sygnałów , do konwersji sygnałów połączonych przez splot (takich jak źródło i filtr) na sumy ich cepstr, w celu separacji liniowej. W szczególności cepstrum mocy jest często używane jako wektor cech do reprezentowania ludzkiego głosu i sygnałów muzycznych. W przypadku tych zastosowań widmo jest zwykle najpierw przekształcane przy użyciu skali mel . Wynik nazywany jest cepstrum częstotliwości mel lub MFC (jego współczynniki nazywane są współczynnikami cepstralnymi częstotliwości mel lub MFCC). Służy do identyfikacji głosu, wykrywania tonu i wielu innych. Cepstrum jest przydatne w tych zastosowaniach, ponieważ okresowe wzbudzenie o niskiej częstotliwości ze strun głosowych i filtrowanie formantowe traktu głosowego , które splatają się w dziedzinie czasu i mnożą się w dziedzinie częstotliwości , są addytywne i występują w różnych obszarach w domenie częstotliwości .

Należy zauważyć, że czysta fala sinusoidalna nie może być używana do testowania cepstrum w celu określenia wysokości tonu na podstawie częstotliwości, ponieważ czysta fala sinusoidalna nie zawiera żadnych harmonicznych i nie prowadzi do szczytów częstotliwości. Zamiast tego należy użyć sygnału testowego zawierającego harmoniczne (takie jak suma co najmniej dwóch sinusów, gdzie drugi sinus jest pewną harmoniczną (wielokrotnością) pierwszego sinusa, lub lepiej, sygnał o kształcie fali kwadratowej lub trójkątnej, ponieważ takie sygnały zapewniają wiele alikwotów w widmie.).

Ważną właściwością domeny cepstralnej jest to, że splot dwóch sygnałów można wyrazić jako dodanie ich złożonej cepstry:

Aplikacje

Koncepcja cepstrum doprowadziła do wielu zastosowań:

  • zajmowanie się wnioskowaniem odbiciowym (zastosowania radarowe, sonarowe, sejsmologia ziemi)
  • oszacowanie podstawowej częstotliwości głośnika (wysokość dźwięku)
  • analiza i rozpoznawanie mowy
  • zastosowania medyczne w analizie elektroencefalogramu (EEG) i fal mózgowych
  • analiza drgań maszyn na podstawie wzorców harmonicznych (usterki przekładni, awarie łopatek turbin, ...)

Ostatnio zastosowano dekonwolucję opartą na cepstrumie, aby usunąć efekt stochastycznych ciągów impulsów, które pochodzą z sygnału sEMG , z widma mocy samego sygnału sEMG. W ten sposób zachowano tylko informacje o kształcie i amplitudzie potencjału czynnościowego jednostki motorycznej (MUAP), a następnie wykorzystano je do oszacowania parametrów modelu MUAP w dziedzinie czasu.

Schroeder i Noll zaproponowali krótkotrwałą analizę cepstrum do zastosowania do określania wysokości tonu ludzkiej mowy.

Dalsza lektura