Ukierunkowana pogoń za projekcją

An example of targeted projection pursuit
W tym przykładzie ukierunkowana pogoń za projekcją jest wykorzystywana do eksploracji projekcji zestawu danych dotyczących ekspresji genów . Każdy ze 122 punktów odpowiada próbce pobranej z guza nowotworowego czterech klas diagnostycznych (reprezentowanych kolorem). Dla każdej próbki zarejestrowano poziom ekspresji 100 genów (reprezentowanych przez osie). Animacja pokazuje, że TPP jest w stanie wyraźnie rozdzielić dwie z klas (czerwoną i fioletową), ale dwóch pozostałych nie udało się rozróżnić (niebieska i zielona). Pozycja osi wskazuje następnie aktywację, które geny są najbardziej związane z każdą klasą.

Ukierunkowana pogoń za projekcją to rodzaj techniki statystycznej używanej do eksploracyjnej analizy danych , wizualizacji informacji i selekcji cech . Pozwala użytkownikowi na interaktywne eksplorowanie bardzo złożonych danych (zwykle zawierających od dziesiątek do setek atrybutów) w celu znalezienia cech lub wzorców, które mogą ich zainteresować.

Konwencjonalne lub „ślepe” poszukiwanie projekcji znajduje najbardziej „interesujące” możliwe projekcje w danych wielowymiarowych, używając algorytmu wyszukiwania , który optymalizuje pewne ustalone kryterium „interesowności” – takie jak odchylenie od rozkładu normalnego . W przeciwieństwie do tego ukierunkowana pogoń za projekcjami pozwala użytkownikowi eksplorować przestrzeń projekcji poprzez manipulowanie punktami danych bezpośrednio na interaktywnym wykresie punktowym .

Ukierunkowana pogoń za projekcją znalazła zastosowanie w analizie danych z mikromacierzy DNA , analizie sekwencji białek , układzie wykresów i cyfrowym przetwarzaniu sygnałów . Jest dostępny jako pakiet dla do uczenia maszynowego WEKA .

Dalsza lektura

Linki zewnętrzne