Test Kaisera-Meyera-Olkina
Kaisera -Meyera-Olkina (KMO) jest miarą statystyczną służącą do określenia, w jakim stopniu dane nadają się do analizy czynnikowej . Test mierzy adekwatność próbkowania dla każdej zmiennej w modelu iw całym modelu. Statystyka jest miarą proporcji wariancji między zmiennymi, która może być wariancją wspólną. Im wyższy odsetek, tym wyższa wartość KMO, tym lepiej dane nadają się do analizy czynnikowej.
Historia
Henry Kaiser wprowadził miarę adekwatności pobierania próbek (MSA) macierzy danych analizy czynnikowej w 1970 r. Następnie Kaiser i Rice zmodyfikowali ją w 1974 r.
Miara adekwatności pobierania próbek
Miara adekwatności losowania jest obliczana dla każdego wskaźnika jako
i wskazuje, w jakim stopniu wskaźnik nadaje się do analizy czynnikowej.
Kryterium Kaisera-Meyera-Olkina
- Kryterium Kaisera-Meyera-Olkina jest obliczane i zwraca wartości od 0 do 1.
Tutaj jest korelacją między daną zmienną a inną, a częściową
Jest to funkcja kwadratów elementów macierzy „obrazu” w porównaniu z kwadratami pierwotnych korelacji. Ogólny MSA, jak również szacunki dla każdej pozycji są znalezione. Indeks jest znany jako indeks Kaisera-Meyera-Olkina (KMO).
Interpretacja wyniku
W ekstrawagancki sposób Kaiser zaproponował, że KMO > 0,9 był cudowny, w 0,80 s zasłużony, w 0,70 s średni, w 0,60 s przeciętny, w 0,50 s żałosny, a mniej niż 0,5 byłoby nie do przyjęcia. Ogólnie rzecz biorąc, wartości KMO między 0,8 a 1 wskazują, że pobieranie próbek jest odpowiednie. Wartości KMO mniejsze niż 0,6 wskazują, że pobieranie próbek nie jest odpowiednie i że należy podjąć działania naprawcze. Z kolei inni ustalają tę wartość odcięcia na 0,5. Wartość KMO bliska zeru oznacza, że występują duże korelacje cząstkowe w porównaniu z sumą korelacji. Innymi słowy, istnieją powszechne korelacje, które byłyby dużym problemem dla analizy czynnikowej.
Alternatywną miarą tego, czy macierz jest rozkładana na czynniki, jest test Bartletta , który sprawdza, w jakim stopniu macierz odbiega od macierzy tożsamości .
Przykład w r
Jeśli poniższe jest uruchamiane w R z biblioteką (REdaS)
set.seed ( 5L ) pięć.próbek <- data.frame ( "A" = rnorm ( 100 ), "B" = rnorm ( 100 ), "C" = rnorm ( 100 ), "D" = rnorm ( 100 ) , "E" = rnorm ( 100 )) cor ( pięć.próbek )
KMOS ( pięć.próbek , użyj = "parami.kompletne.obs" )
Produkuje się:
Kaiser – Meyer – Olkin Statistics Call : KMOS ( x = five.samples , use = "pairwise.complete.obs" ) Miary adekwatności pobierania próbek ( MSA ) : A B C D E 0,5173978 0,5563367 0,5240787 0,4796702 0,5416592 KMO - Kryterium : 0,5 269849
To pokazuje, że dane nie nadają się do analizy czynnikowej.