Majoryzacja stresu

Majoryzacja naprężeń to strategia optymalizacji w skalowaniu wielowymiarowym MDS zbioru elementów danych konfiguracja punkty w jest tak zwaną funkcję . Zwykle jest to 2 lub , tj. wymienia punkty lub wymiarowa przestrzeń euklidesowa tak aby wynik mógł być zwizualizowany (tj. wykres MDS ). Funkcja funkcją kosztu lub , która mierzy kwadratowe różnice między idealnymi ( a rzeczywistymi odległościami w przestrzeni r -wymiarowej. Jest zdefiniowany jako:

w pomiaru między parą punktów , to odległość euklidesowa między i i jest idealną odległością między punktami (ich separacją) w danych. Zauważ, że użyć do określenia stopnia pewności co do podobieństwa między punktami (np. 0 można określić, jeśli nie ma informacji dla określonej

Konfiguracja , która minimalizuje, wykres, na którym punkty, które są blisko siebie, odpowiadają punktom, -wymiarowa przestrzeń danych.

Istnieje wiele sposobów, które można zminimalizować. Na przykład Kruskal zalecił iteracyjne podejście do najbardziej stromego zejścia . Jednak znacznie lepszą (pod względem gwarancji i tempa konwergencji) metodę minimalizacji stresu wprowadził Jan de Leeuw . Iteracyjna metoda majoryzacji De Leeuw każdym kroku minimalizuje prostą funkcję wypukłą, która zarówno ogranicza z góry, jak i dotyka powierzchni w punkcie , zwanym punktem W analizie wypukłej taką funkcję nazywamy funkcją majoryzującą . Ten iteracyjny proces majoryzacji jest również nazywany algorytmem SMACOF („Skalowanie przez MAjorowanie złożonej funkcji”).

Algorytm SMACOF

Funkcję stresu można rozwinąć w następujący sposób:

że pierwszy człon jest stałą drugi człon jest kwadratowy w dla Hesji drugi człon jest równoważny tr ) i dlatego stosunkowo łatwo rozwiązać. Trzeci wyraz jest ograniczony przez:

gdzie ma:

dla re

i dla

i .

Dowodem tej nierówności jest nierówność Cauchy'ego-Schwarza , patrz Borg (s. 152–153).

Mamy więc prostą funkcję kwadratową , która zwiększa naprężenie:


Iteracyjna procedura minimalizacji wygląda wtedy następująco:

  • k ustawiamy
  • przestań, jeśli w przeciwnym razie powtórz.

Wykazano, że ten algorytm zmniejsza stres monotonicznie (patrz de Leeuw).

Użyj w rysowaniu wykresów

Majoryzacja naprężeń i algorytmy podobne do SMACOF mają również zastosowanie w dziedzinie rysowania wykresów . Oznacza to, że można znaleźć dość atrakcyjny estetycznie układ sieci lub wykresu, minimalizując funkcję naprężeń względem pozycji węzłów na wykresie. tym przypadku są zwykle ustawiane na teoretyczne odległości między węzłami i grafami δ ja jot . Tutaj wybiera się jako kompromis między zachowaniem idealnych odległości dalekiego lub krótkiego Dobre wyniki zostały pokazane dla .