Mapowanie Sammona

Mapowanie Sammona lub projekcja Sammona to algorytm, który odwzorowuje przestrzeń wielowymiarową na przestrzeń o niższej wymiarowości (patrz skalowanie wielowymiarowe ), próbując zachować strukturę odległości między punktami w przestrzeni wielowymiarowej w projekcji o niższym wymiarze.

Szczególnie nadaje się do wykorzystania w eksploracyjnej analizie danych .

Metoda została zaproponowana przez Johna W. Sammona w 1969 roku.

Jest uważane za podejście nieliniowe, ponieważ mapowanie nie może być reprezentowane jako liniowa kombinacja pierwotnych zmiennych, jak to możliwe w technikach takich jak analiza głównych składowych , co również utrudnia wykorzystanie go do zastosowań klasyfikacyjnych.

Oznacz odległość między i- tymi i j - obiektami w oryginalnej przestrzeni przez a odległość między ich rzutami przez .

Mapowanie Sammona ma na celu zminimalizowanie następującej funkcji błędu, która jest często określana jako stres Sammona lub błąd Sammona :

Minimalizację można przeprowadzić albo metodą opadania gradientu , jak zaproponowano na początku, albo innymi sposobami, zwykle obejmującymi metody iteracyjne.

Liczbę iteracji należy określić eksperymentalnie, a zbieżne rozwiązania nie zawsze są gwarantowane.

Wiele implementacji woli używać pierwszych głównych komponentów jako początkowej konfiguracji.

Mapowanie Sammona było jedną z najbardziej udanych nieliniowych metod wielowymiarowego skalowania metrycznego od czasu jego pojawienia się w 1969 roku, ale wysiłki koncentrowały się raczej na ulepszeniu algorytmu niż na formie funkcji stresu.

Wydajność mapowania Sammona została poprawiona poprzez rozszerzenie jego funkcji naprężeń przy użyciu lewej dywergencji Bregmana i prawej dywergencji Bregmana.

Zobacz też

Linki zewnętrzne