Profile klas wysokości harmonicznej
Profile klasy wysokości harmonicznej (HPCP) to grupa cech, które program komputerowy wyodrębnia z sygnału audio na podstawie profilu klasy wysokości tonu — deskryptora proponowanego w kontekście systemu rozpoznawania akordów. HPCP to funkcja ulepszonego rozkładu wysokości tonu, która jest sekwencją wektorów cech, które do pewnego stopnia opisują tonalność , mierząc względną intensywność każdej z 12 klas skali równotemperaturowej w ramce analizy. Często dwanaście atrybutów pisowni wysokości tonu jest również określanych jako chrominancja a cechy HPCP są ściśle związane z tak zwanymi cechami chrominancji lub chromagramami .
Przetwarzając sygnały muzyczne, oprogramowanie może identyfikować cechy HPCP i wykorzystywać je do oszacowania tonacji utworu, pomiaru podobieństwa między dwoma utworami muzycznymi (identyfikacja wersji okładki), wyszukiwania dźwięku na podstawie zawartości (dopasowywanie dźwięku), wyodrębniania muzycznego struktury (analiza struktury dźwięku) oraz klasyfikować muzykę pod względem kompozytora, gatunku lub nastroju. Proces ten jest związany z analizą czasowo-częstotliwościową . Ogólnie rzecz biorąc, chrominancja jest odporna na szum (np. hałas otoczenia lub dźwięki perkusyjne), niezależnie od barwy i instrumentacji oraz głośności i dynamiki.
HPCP są niezależne od strojenia i uwzględniają obecność częstotliwości harmonicznych, dzięki czemu częstotliwość odniesienia może różnić się od standardowej A 440 Hz. Wynikiem obliczeń HPCP jest histogram niezależny od oktawy 12, 24 lub 36 bin, w zależności od pożądanej rozdzielczości, reprezentujący względną intensywność każdego 1, 1/2 lub 1/3 z 12 półtonów jednakowej temperowanej skali .
Ogólna procedura wyodrębniania cech HPCP
Schemat blokowy procedury jest pokazany na ryc. 1 i jest szczegółowo omówiony w.
Ogólna procedura wyodrębniania cech HPCP jest podsumowana w następujący sposób:
- Wejściowy sygnał muzyczny.
- Wykonaj analizę widmową , aby uzyskać składowe częstotliwości sygnału muzycznego.
- Użyj transformaty Fouriera , aby przekształcić sygnał w spektrogram. (Transformata Fouriera to rodzaj analizy czasowo-częstotliwościowej ).
- Wykonaj filtrowanie częstotliwości . Stosowany jest zakres częstotliwości od 100 do 5000 Hz.
- Wykonaj wykrywanie pików . Uwzględniane są tylko lokalne wartości maksymalne widma.
- Wykonaj procedurę obliczania częstotliwości odniesienia . Oszacuj odchylenie w odniesieniu do 440 Hz.
- Wykonaj mapowanie klasy Pitch w odniesieniu do szacowanej częstotliwości odniesienia. Jest to procedura określania wartości klasy wysokości tonu na podstawie wartości częstotliwości. Stosowany jest schemat ważenia z funkcją cosinus. Uwzględnia obecność częstotliwości harmonicznych (procedura sumowania harmonicznych), biorąc pod uwagę łącznie 8 harmonicznych dla każdej częstotliwości. Aby odwzorować wartość na jedną trzecią półtonu , rozmiar wektorów rozkładu klasy wysokości tonu musi być równy 36 .
- Normalizuj cechę klatka po klatce, dzieląc przez maksymalną wartość, aby wyeliminować zależność od globalnej głośności. A następnie możemy uzyskać wynikową sekwencję HPCP, taką jak na ryc.2.
System pomiaru podobieństwa między dwoma utworami
Po uzyskaniu funkcji HPCP znana jest wysokość tonu sygnału w odcinku czasowym. Funkcja HPCP została wykorzystana do obliczenia podobieństwa między dwoma utworami w wielu artykułach naukowych. System pomiaru podobieństwa między dwoma utworami przedstawiono na ryc. 3 . Po pierwsze, analiza czasowo-częstotliwościowa, aby wyodrębnić cechę HPCP. A następnie ustaw funkcję HPCP dwóch utworów na globalny HPCP, aby istniał standard porównywania. Następnym krokiem jest użycie tych dwóch cech do skonstruowania binarnej macierzy podobieństwa . Algorytm Smitha-Watermana służy do konstruowania lokalnej macierzy wyrównania H w programie Dynamic Programming Local Alignment . Wreszcie, po wykonaniu przetwarzania końcowego, można obliczyć odległość między dwoma utworami.
Zobacz też
- Analiza czasowo-częstotliwościowa
- Analiza czasowo-częstotliwościowa sygnału muzycznego
- Skok (muzyka)
- Teoria muzyki
Linki zewnętrzne
- HPCP — wtyczka Harmonic Pitch Class Profile dostępna do pobrania http://mtg.upf.edu/technologies/hpcp
- Chroma Toolbox Bezpłatne implementacje MATLAB różnych typów funkcji audio opartych na wysokości tonu i chrominancji