Geometryczne rozmieszczenie oparte na idealnych odległościach
Majoryzacja naprężeń to strategia optymalizacji w skalowaniu wielowymiarowym MDS zbioru elementów danych konfiguracja punkty w jest tak zwaną funkcję . Zwykle jest to 2 lub , tj. wymienia punkty lub wymiarowa przestrzeń euklidesowa tak aby wynik mógł być zwizualizowany (tj. wykres MDS ). Funkcja funkcją kosztu lub , która mierzy kwadratowe różnice między idealnymi ( a rzeczywistymi odległościami w przestrzeni r -wymiarowej. Jest zdefiniowany jako:
w pomiaru między parą punktów , to odległość euklidesowa między i i jest idealną odległością między punktami (ich separacją) w danych. Zauważ, że użyć do określenia stopnia pewności co do podobieństwa między punktami (np. 0 można określić, jeśli nie ma informacji dla określonej
Konfiguracja , która minimalizuje, wykres, na którym punkty, które są blisko siebie, odpowiadają punktom, -wymiarowa przestrzeń danych.
Istnieje wiele sposobów, które można zminimalizować. Na przykład Kruskal zalecił iteracyjne podejście do najbardziej stromego zejścia . Jednak znacznie lepszą (pod względem gwarancji i tempa konwergencji) metodę minimalizacji stresu wprowadził Jan de Leeuw . Iteracyjna metoda majoryzacji De Leeuw każdym kroku minimalizuje prostą funkcję wypukłą, która zarówno ogranicza z góry, jak i dotyka powierzchni w punkcie , zwanym punktem W analizie wypukłej taką funkcję nazywamy funkcją majoryzującą . Ten iteracyjny proces majoryzacji jest również nazywany algorytmem SMACOF („Skalowanie przez MAjorowanie złożonej funkcji”).
Algorytm SMACOF
Funkcję stresu można rozwinąć w następujący sposób:
że pierwszy człon jest stałą drugi człon jest kwadratowy w dla Hesji drugi człon jest równoważny tr ) i dlatego stosunkowo łatwo rozwiązać. Trzeci wyraz jest ograniczony przez:
gdzie ma:
-
dla re
i dla
i .
Dowodem tej nierówności jest nierówność Cauchy'ego-Schwarza , patrz Borg (s. 152–153).
Mamy więc prostą funkcję kwadratową , która zwiększa naprężenie:
Iteracyjna procedura minimalizacji wygląda wtedy następująco:
- k ustawiamy
- przestań, jeśli w przeciwnym razie powtórz.
Wykazano, że ten algorytm zmniejsza stres monotonicznie (patrz de Leeuw).
Użyj w rysowaniu wykresów
Majoryzacja naprężeń i algorytmy podobne do SMACOF mają również zastosowanie w dziedzinie rysowania wykresów . Oznacza to, że można znaleźć dość atrakcyjny estetycznie układ sieci lub wykresu, minimalizując funkcję naprężeń względem pozycji węzłów na wykresie. tym przypadku są zwykle ustawiane na teoretyczne odległości między węzłami i grafami δ ja jot . Tutaj wybiera się jako kompromis między zachowaniem idealnych odległości dalekiego lub krótkiego Dobre wyniki zostały pokazane dla .