Test Kaisera-Meyera-Olkina

Kaisera -Meyera-Olkina (KMO) jest miarą statystyczną służącą do określenia, w jakim stopniu dane nadają się do analizy czynnikowej . Test mierzy adekwatność próbkowania dla każdej zmiennej w modelu iw całym modelu. Statystyka jest miarą proporcji wariancji między zmiennymi, która może być wariancją wspólną. Im wyższy odsetek, tym wyższa wartość KMO, tym lepiej dane nadają się do analizy czynnikowej.

Historia

Henry Kaiser wprowadził miarę adekwatności pobierania próbek (MSA) macierzy danych analizy czynnikowej w 1970 r. Następnie Kaiser i Rice zmodyfikowali ją w 1974 r.

Miara adekwatności pobierania próbek

Miara adekwatności losowania jest obliczana dla każdego wskaźnika jako


i wskazuje, w jakim stopniu wskaźnik nadaje się do analizy czynnikowej.

Kryterium Kaisera-Meyera-Olkina

Kryterium Kaisera-Meyera-Olkina jest obliczane i zwraca wartości od 0 do 1.

Tutaj jest korelacją między daną zmienną a inną, a częściową

Jest to funkcja kwadratów elementów macierzy „obrazu” w porównaniu z kwadratami pierwotnych korelacji. Ogólny MSA, jak również szacunki dla każdej pozycji są znalezione. Indeks jest znany jako indeks Kaisera-Meyera-Olkina (KMO).

Interpretacja wyniku

W ekstrawagancki sposób Kaiser zaproponował, że KMO > 0,9 był cudowny, w 0,80 s zasłużony, w 0,70 s średni, w 0,60 s przeciętny, w 0,50 s żałosny, a mniej niż 0,5 byłoby nie do przyjęcia. Ogólnie rzecz biorąc, wartości KMO między 0,8 a 1 wskazują, że pobieranie próbek jest odpowiednie. Wartości KMO mniejsze niż 0,6 wskazują, że pobieranie próbek nie jest odpowiednie i że należy podjąć działania naprawcze. Z kolei inni ustalają tę wartość odcięcia na 0,5. Wartość KMO bliska zeru oznacza, że ​​występują duże korelacje cząstkowe w porównaniu z sumą korelacji. Innymi słowy, istnieją powszechne korelacje, które byłyby dużym problemem dla analizy czynnikowej.

Alternatywną miarą tego, czy macierz jest rozkładana na czynniki, jest test Bartletta , który sprawdza, w jakim stopniu macierz odbiega od macierzy tożsamości .

Przykład w r

Jeśli poniższe jest uruchamiane w R z biblioteką (REdaS)


    
                            
 set.seed  (  5L  )  pięć.próbek  <-  data.frame  (  "A"  =  rnorm  (  100  ),  "B"  =  rnorm  (  100  ),  "C"  =  rnorm  (  100  ),  "D"  =  rnorm  (  100  ) ,  "E"  =  rnorm  (  100  ))  cor  (  pięć.próbek  ) 
    KMOS  (  pięć.próbek  ,  użyj  =  "parami.kompletne.obs"  ) 

Produkuje się:

 
      
   
                                             
     
  Kaiser  Meyer  Olkin  Statistics  Call  :  KMOS  (  x  =  five.samples  ,  use  =  "pairwise.complete.obs"  )  Miary  adekwatności pobierania  próbek  (  MSA  )  :  A  B  C  D  E  0,5173978  0,5563367  0,5240787  0,4796702  0,5416592  KMO  -  Kryterium  :  0,5  269849 

To pokazuje, że dane nie nadają się do analizy czynnikowej.

Zobacz też