Współczynnik RV

W statystyce współczynnik RV jest wielowymiarowym uogólnieniem kwadratu współczynnika korelacji Pearsona (ponieważ współczynnik RV przyjmuje wartości od 0 do 1). Mierzy bliskość dwóch zestawów punktów, z których każdy może być reprezentowany w macierzy .

główne podejścia stosowane w statystycznej analizie danych wielowymiarowych można ująć we wspólne ramy, w których współczynnik RV jest maksymalizowany, z zastrzeżeniem odpowiednich ograniczeń. W szczególności te metodologie statystyczne obejmują:

Jednym z zastosowań współczynnika RV jest neuroobrazowanie funkcjonalne , w którym można zmierzyć podobieństwo między seriami skanów mózgu dwóch osób lub między różnymi skanami tego samego pacjenta.

Definicje

Definicja współczynnika RV wykorzystuje pomysły dotyczące definicji wielkości skalarnych, które nazywane są „wariancją” i „kowariancją” zmiennych losowych o wartościach wektorowych . Należy zauważyć, że standardowym zastosowaniem jest posiadanie macierzy wariancji i kowariancji wektorowych zmiennych losowych. Biorąc pod uwagę te innowacyjne definicje, współczynnik RV jest wówczas po prostu współczynnikiem korelacji zdefiniowanym w zwykły sposób.

Załóżmy, że X i Y są macierzami wyśrodkowanych wektorów losowych (wektorów kolumnowych) z macierzą kowariancji określoną wzorem

wówczas kowariancja o wartości skalarnej (oznaczona jako COVV) jest definiowana przez

Wariancję o wartości skalarnej definiuje się odpowiednio:

W przypadku tych definicji wariancja i kowariancja mają pewne właściwości addytywne w odniesieniu do tworzenia nowych wielkości wektorowych poprzez rozszerzenie istniejącego wektora o elementy innego.

Następnie współczynnik RV jest definiowany przez

Wada współczynnika i wersji dostosowanej

Chociaż współczynnik konstrukcyjnie przyjmuje wartości od 0 do 1, rzadko osiąga wartości bliskie 1, ponieważ mianownik jest często zbyt duży w stosunku do maksymalnej osiągalnej wartości mianownika.

znane bloki ukośne i wymiary i _ że bez utraty , udowodniono, że maksymalny osiągalny licznik gdzie (odpowiednio macierz diagonalną wartości własnych posortowanych malejąco Σ od lewego górnego rogu do prawego dolnego rogu i jest matrycą .

W świetle tego Mordant i Segers zaproponowali skorygowaną wersję współczynnika RV, w której mianownikiem jest maksymalna wartość osiągalna przez licznik. To czyta

Wpływ tej korekty jest wyraźnie widoczny w praktyce.

Zobacz też