Pogoń za projekcją

Dążenie do projekcji (PP) to rodzaj techniki statystycznej polegającej na znajdowaniu najbardziej „interesujących” możliwych projekcji w danych wielowymiarowych. Często za bardziej interesujące uważa się projekcje bardziej odbiegające od rozkładu normalnego . Po znalezieniu każdego rzutu dane są redukowane poprzez usunięcie komponentu wzdłuż tego rzutu, a proces jest powtarzany w celu znalezienia nowych rzutów; jest to aspekt „pogoni”, który motywował technikę znaną jako pogoń za dopasowaniem .

Ideą poszukiwania projekcji jest zlokalizowanie projekcji lub projekcji z przestrzeni wielowymiarowej do przestrzeni niskowymiarowej, które ujawniają najwięcej szczegółów na temat struktury zbioru danych. Po znalezieniu interesującego zestawu rzutów istniejące struktury (klastry, powierzchnie itp.) można wyodrębnić i oddzielnie przeanalizować.

Dążenie projekcyjne jest szeroko stosowane do ślepej separacji źródeł , dlatego jest bardzo ważne w niezależnej analizie składowych . Pogoń za projekcją poszukuje jednej projekcji na raz, tak aby wyodrębniony sygnał był jak najbardziej niegaussowski.

Historia

Technika pogoni za projekcją została pierwotnie zaproponowana i eksperymentowana przez Kruskala. Powiązane pomysły pojawiają się u Switzera (1970) „Numericalclassification”, s. 31–43, w „Computer Applications in the Earth Sciences: Geostatistics oraz Switzer and Wright (1971) „Numericalclassification of eocene nummulitids”, Mathematical Geology, s. 297–311. Pierwsza pomyślne wdrożenie jest zasługą Jerome’a H. Friedmana i Johna Tukeya (1974), którzy nazwali dążenie do projekcji.

Pierwotnym celem poszukiwania projekcji było wybranie przez maszynę „interesujących” niskowymiarowych projekcji wielowymiarowej chmury punktów poprzez numeryczną maksymalizację określonej funkcji celu lub wskaźnika projekcji.

Kilka lat później Friedman i Stuetzle rozszerzyli koncepcję poszukiwania projekcji i dodali regresję poszukiwania projekcji (PPR), klasyfikację poszukiwania projekcji (PPC) i estymację gęstości poszukiwania projekcji (PPDE).

Funkcja

Najbardziej ekscytującą cechą poszukiwania projekcji jest to, że jest to jedna z niewielu metod wielowymiarowych, które są w stanie ominąć „przekleństwo wymiarowości” spowodowane faktem, że przestrzeń wielowymiarowa jest w większości pusta. Ponadto w dążeniu do projekcji można zignorować nieistotne (tj. zaszumione i ubogie w informacje) zmienne. Jest to wyraźna przewaga nad metodami opartymi na odległościach między punktami, takimi jak minimalne drzewa rozpinające, skalowanie wielowymiarowe i większość technik grupowania.

Wiele metod klasycznej analizy wielowymiarowej okazuje się szczególnymi przypadkami dążenia do projekcji. Przykładami są analiza głównych składowych i analiza dyskryminacyjna oraz metody quartimax i oblimax w analizie czynnikowej .

Poważną wadą metod poszukiwania projekcji jest duże zapotrzebowanie na czas komputera.

Zobacz też