Wieloliniowa analiza składowych głównych

W ramach statystyki wieloliniowa analiza głównych składowych ( MPCA ) jest wieloliniowym rozszerzeniem analizy głównych składowych (PCA). MPCA jest wykorzystywany do analizy tablic M-way, czyli sześcianu lub hipersześcianu liczb, nieformalnie nazywanego także „tensorem danych”. Macierze M-way mogą być modelowane przez

  • liniowe modele tensorowe, takie jak CANDECOMP/Parafac, lub
  • wieloliniowe modele tensorowe, takie jak wieloliniowa analiza składowych głównych (MPCA) lub wieloliniowa analiza składowych niezależnych (MICA) itp.

Pochodzenie MPCA można prześledzić wstecz do rozkładu Tuckera i pracy Petera Kroonenberga „3-mode PCA”. W 2000 roku De Lathauwer i in. ponownie przedstawili pracę Tuckera i Kroonenberga w jasnych i zwięzłych numerycznych terminach obliczeniowych w ich artykule SIAM zatytułowanym „Multilinear Singular Value Decomposition” (HOSVD) oraz w artykule „On the Best Rank-1 and Rank-(R 1 , R 2 , .. ., R N ) Aproksymacja tensorów wyższego rzędu”.

Około 2001 roku Vasilescu i Terzopoulos przeformułowali problemy analizy, rozpoznawania i syntezy danych jako wieloliniowe problemy tensorowe. Analiza czynnikowa tensorów jest kompozycyjną konsekwencją kilku czynników przyczynowych tworzenia danych i dobrze nadaje się do multimodalnej analizy tensorów danych. Moc struktury tensorowej została zademonstrowana poprzez analizę kątów ruchów człowieka w stawach, obrazów twarzy lub tekstur pod kątem ich przyczynowych czynników tworzenia danych w następujących pracach: Human Motion Signatures (CVPR 2001, ICPR 2002), rozpoznawanie twarzy – TensorFaces, ( ECCV 2002, CVPR 2003 itd.) oraz grafiki komputerowej – TensorTextures (Siggraph 2004).

W przeszłości MPCA była określana jako „M-mode PCA”, terminologia ukuta przez Petera Kroonenberga w 1980 r. W 2005 r. Vasilescu i Terzopoulos wprowadzili terminologię Multilinear PCA jako sposób na lepsze rozróżnienie między liniowym i wieloliniowym dekompozycja tensora, a także w celu lepszego rozróżnienia między pracą, która obliczała statystyki drugiego rzędu związane z każdym trybem (osią) tensora danych, a późniejszą pracą nad wieloliniową analizą niezależnych komponentów, która obliczała statystyki wyższego rzędu związane z każdym trybem / osią tensora.

Multilinear PCA może być stosowany do obliczania czynników przyczynowych tworzenia danych lub jako narzędzie do przetwarzania sygnałów na tensorach danych, których indywidualne obserwacje zostały albo poddane wektoryzacji, albo których obserwacje są traktowane jako zbiór obserwacji kolumna/wiersz, „macierz danych” i połączone w tensor danych. Główną wadą tego podejścia jest to, że zamiast obliczać wszystkie możliwe kombinacje

MPCA oblicza zestaw macierzy ortonormalnych powiązanych z każdym trybem tensora danych, które są analogiczne do ortonormalnej przestrzeni wierszy i kolumn macierzy obliczanej przez macierz SVD. Ta transformacja ma na celu uchwycenie jak największej wariancji, uwzględniającej jak najwięcej zmienności danych związanych z każdym trybem (osią) tensora danych.

Algorytm

Rozwiązanie MPCA jest zgodne z metodą naprzemiennych najmniejszych kwadratów (ALS). Ma charakter iteracyjny. Podobnie jak w PCA, MPCA działa na wyśrodkowanych danych. Centrowanie jest nieco bardziej skomplikowane w przypadku tensorów i zależy od problemu.

Wybór funkcji

Cechy MPCA: Nadzorowany MPCA jest wykorzystywany w analizie przyczynowo-czynnikowej, która ułatwia rozpoznawanie obiektów, podczas gdy częściowo nadzorowany wybór funkcji MPCA jest wykorzystywany w zadaniach wizualizacyjnych.

Rozszerzenia

Różne rozszerzenia MPCA:

  • Solidny MPCA (RMPCA)
  • Faktoryzacja wielotensorowa, która również automatycznie wyszukuje liczbę komponentów (MTF)

Linki zewnętrzne