Kendall W

W Kendalla (znany również jako współczynnik zgodności Kendalla ) jest nieparametryczną statystyką korelacji rang . Jest to normalizacja statystyki testu Friedmana i może być wykorzystana do oceny zgodności między oceniającymi, aw szczególności rzetelności między oceniającymi . W Kendalla waha się od 0 (brak porozumienia) do 1 (całkowita zgodność).

Załóżmy na przykład, że kilka osób zostało poproszonych o uszeregowanie listy spraw politycznych, od najważniejszych do najmniej ważnych. Na podstawie tych danych można obliczyć W Kendalla . Jeśli statystyka testowa W wynosi 1, to wszyscy respondenci byli jednomyślni i każdy respondent przypisał tę samą kolejność do listy obaw. Jeśli W wynosi 0, to nie ma ogólnego trendu zgodności wśród respondentów, a ich odpowiedzi można uznać za zasadniczo losowe. Wartości pośrednie W wskazują na większy lub mniejszy stopień jednomyślności wśród różnych odpowiedzi.

Podczas gdy testy wykorzystujące standardowy współczynnik korelacji Pearsona zakładają wartości o rozkładzie normalnym i porównują jednocześnie dwie sekwencje wyników, W Kendalla nie przyjmuje żadnych założeń dotyczących natury rozkładu prawdopodobieństwa i może obsłużyć dowolną liczbę różnych wyników.

Kroki Kendalla W

Załóżmy, że obiekt i otrzymuje rangę r _i,j od sędziego o numerze j , gdzie w sumie jest n obiektów i m sędziów. Wtedy całkowita ranga nadana obiektowi i wynosi

{\ Displaystyle R_ {i} = \ suma _ {j = 1} ^ {m} r_ {i, j},}

a średnia wartość tych całkowitych rang wynosi

{\ Displaystyle {\ bar {R}} = {\ Frac {1} {n}} \ suma _ {i = 1} ^ {n} R_ {i}.}

Suma kwadratów odchyleń S jest zdefiniowana jako

{\ Displaystyle S = \ suma _ {i = 1} ^ {n} (R_ {i} - {\ bar {R}}) ^ {2 },}

W Kendalla jest zdefiniowane jako

{\ Displaystyle W = {\ Frac {12S} {m ^ {2} (n ^ {3} -n)}}.}

Jeśli statystyka testowa W wynosi 1, to wszyscy sędziowie lub respondenci byli jednomyślni i każdy sędzia lub respondent przypisał tę samą kolejność do listy obiektów lub obaw. Jeśli W wynosi 0, to nie ma ogólnego trendu zgodności wśród respondentów, a ich odpowiedzi można uznać za zasadniczo losowe. Wartości pośrednie W wskazują na większy lub mniejszy stopień jednomyślności wśród różnych sędziów lub respondentów.

Kendall i Gibbons (1990) również pokazują, że W jest liniowo związane ze średnią wartością współczynników korelacji rang Spearmana między wszystkimi możliwymi parami rankingów między sędziami ${\ Displaystyle m \ wybierz {2}}$

{\ Displaystyle {\ bar {r}} _ {s} = {\ Frac {mW-1} {m-1}}}

Niekompletne bloki

Gdy sędziowie oceniają tylko niektóre podzbiory n obiektów i gdy odpowiednim układem bloków jest układ (n, m, r, p, λ) (zwróć uwagę na inną notację) . Innymi słowy, kiedy

każdy sędzia ocenia tę samą liczbę p obiektów dla niektórych , ${\ displaystyle p <n$ }
każdy obiekt jest klasyfikowany dokładnie tak samo łącznie r razy,
$przedstawiana$ razem niektórym sędziom w sumie dokładnie λ razy, dla wszystkich par.

W Kendalla jest zdefiniowane jako

{\ Displaystyle W = {\ Frac {12 \ suma _ {i = 1} ^ {n} (R_ {i} ^ {2}) -3r ^ {2} n \ lewo (p + 1 \ prawo) ^ { 2}}{\lambda ^{2}n(n^{2}-1)}}.}

Jeśli $równoważny$ tak $powyższy$ ocenia wszystkie n obiektów, wzór

Korekta dla krawatów

Gdy występują wartości remisowe, każdemu z nich przypisuje się średnią rang, które zostałyby przyznane, gdyby nie wystąpiły remisy. Na przykład zbiór danych {80,76,34,80,73,80} ma wartości 80 związane z 4., 5. i 6. miejscem; ponieważ średnia {4,5,6} = 5, wartościom surowych danych zostałyby przypisane rangi w następujący sposób: {5,3,1,5,2,5}.

Efektem więzi jest zmniejszenie wartości W ; jednak efekt ten jest niewielki, chyba że istnieje duża liczba remisów. Aby skorygować remisy, przypisz rangi do powiązanych wartości jak powyżej i oblicz współczynniki korygujące

{\ Displaystyle T_ {j} = \ suma _ {i = 1} ^ {g_ {j}} (t_ {i} ^ {3} -t_{i}),}

gdzie t _i to liczba rang remisowych w i - tej grupie rang remisowych, (gdzie grupa to zbiór wartości o stałej (związanej) randze), a g _j to liczba grup więzi w zbiorze rang (w zakresie od 1 do n ) dla sędziego j . Zatem Tj _. jest współczynnikiem korygującym wymaganym dla zbioru rang dla sędziego j , tj. j -tego zbioru rang Zauważ, że jeśli nie ma równych rang dla sędziego j , T _j równa się 0.

Z poprawką na więzi, wzór na W staje się

{\ Displaystyle W = {\frac {12\sum _{i=1}^{n}(R_{i}^{2})-3m^{2}n(n+1)^{2}}{m^{2} n(n^{2}-1)-m\suma _{j=1}^{m}(T_{j})}},}

gdzie R _ja jest sumą rang dla obiektu ja i jest sumą ${\ Displaystyle \ suma _ {j = 1} ^ {m} (T_ {j})}$ wartości T _j na wszystkich m zestawach rang.

Kroki Weighted Kendalla W

W niektórych przypadkach znaczenie oceniających (ekspertów) może nie być takie samo. W takim przypadku należy użyć ważonego W Kendalla . Załóżmy $j$ że obiekt $i$ rangę $sumie$ sędziego numer gdzie jest w $\$ m $} sędziowie displaystyle m}$ . Również waga sędziego $pokazana$ przez ${\ Displaystyle \ vartheta _ {j}}$ (w rzeczywistej sytuacji znaczenie każdego oceniającego może być różne). Rzeczywiście, waga sędziów wynosi ${\ Displaystyle \ vartheta _ {j} (j = 1,2, ..., m)}$ . Następnie całkowita ranga nadana obiektowi wynosi ja $\ displaystyle i}$

{\ Displaystyle R_ {i} = \ suma _ {j = 1} ^ {m} \ vartheta _ {j} r_ {ij}}

a średnia wartość tych całkowitych rang to:

{\ Displaystyle {\ bar {R}} = {\ Frac {1} {n}} \ suma _ {i = 1} ^ {n} R_ {i}}

Suma kwadratów odchyleń jest zdefiniowana jako ${\ displaystyle S}$

{\ Displaystyle S = \ suma _ {i = 1} ^ {n} (R_ {i} - {\ bar {R}}) ^ {2} }

a następnie W ważonego Kendalla jest zdefiniowane jako,

{\ Displaystyle W_ {w} = {\ Frac {12S} {(n ^ {3} -n)}}}

Powyższy wzór jest odpowiedni, gdy nie mamy żadnego tie ranka.

Korekta dla krawatów

W przypadku tie ranku musimy to uwzględnić w powyższym wzorze. Aby skorygować remisy, powinniśmy obliczyć współczynniki korygujące,

{\ Displaystyle T_ {j} = \ suma _ {i = 1} ^ {n} (t_ {ij} ^ {3} - t_{ij})\;\;\;\;\;\;\;\dla wszystkich j}

gdzie $ij}}$ ${\ displaystyle t_ {ij}$ reprezentuje liczbę rang remisowych u sędziego dla obiektu ${\ displaystyle i} t ja jot$ } ${\ displaystyle T_ {j}}$ pokazuje całkowitą liczbę remisów u sędziego ${\ displaystyle j}$ . Z poprawką na remisy, wzór na W ważonego Kendalla przyjmuje postać:

{\ Displaystyle W_ {w} = {\ Frac {12S} {(n ^ {3} -n) - \ suma _ { j=1}^{m}\vartheta _{j}T_{j}}}}

Jeżeli wagi oceniających są równe (rozkład wag jest równomierny), wartości W ważonego Kendalla i W Kendalla są równe.

Testy istotności

W przypadku pełnych rang, powszechnie stosowany test istotności dla W w porównaniu z hipotezą zerową o braku zgodności (tj. rankingi losowe) podają Kendall i Gibbons (1990)

{\ Displaystyle \ chi ^ {2} = m (n-1) W}

$swobody$ rozkład chi stopniami

W przypadku niepełnych rankingów (patrz wyżej) tak się dzieje

{\ Displaystyle \ chi ^ {2} = {\ Frac {\ lambda (n ^ {2} -1)} {k + 1}} W}

Gdzie znowu są stopnie swobody $\ displaystyle df = n-1} .$

Legendre porównał za pomocą symulacji moc podejścia do testowania chi-kwadrat i permutacji w celu określenia istotności W Kendalla . Wyniki wskazywały, że metoda chi-kwadrat była zbyt konserwatywna w porównaniu z testem permutacji, gdy ${\ displaystyle m <20}$ . Marozzi rozszerzył to, rozważając również F , jak zaproponowano w oryginalnej publikacji wprowadzającej statystykę W autorstwa Kendalla i Babingtona Smitha (1939):

{\ Displaystyle F = {\ Frac {W (m-1)} {1-W}}}

Gdzie statystyka testowa jest zgodna z rozkładem F z ${\ Displaystyle v_ {1} = n-1- (2/m)}$ i ${\ displaystyle v_ {2} = (m-1) v_ {1}}$ stopni swobody. Marozzi stwierdził, że F działa mniej więcej tak dobrze, jak metoda testu permutacyjnego i może być preferowany, gdy ${\ displaystyle m}$ jest mały, ponieważ jest prostszy obliczeniowo.

Oprogramowanie

Kendall's W i Weighted Kendall's W są zaimplementowane w MATLAB , SPSS , R i innych pakietach oprogramowania statystycznego.

Zobacz też

Notatki

Kendall, MG; Babington Smith, B. (wrzesień 1939). „Problem m Rankingi” . Roczniki statystyki matematycznej . 10 (3): 275–287. doi : 10.1214/aoms/1177732186 . JSTOR 2235668 .
Kendall, MG i Gibbons, JD (1990). Metody korelacji rang. Nowy Jork, NY: Oxford University Press.
Corder, GW, Foreman, DI (2009). Statystyki nieparametryczne dla nie-statystyków: podejście krok po kroku Wiley, ISBN 978-0-470-45461-9
Dodge, Y. (2003). Oksfordzki słownik terminów statystycznych , OUP. ISBN 0-19-920613-9
Legendre, P (2005) Powiązania gatunków: ponowne odwiedzenie współczynnika zgodności Kendalla. Journal of Agricultural, Biological and Environmental Statistics , 10 (2), 226–245. [1]
Siegel, Sidney; Kasztelan, N. John, Jr. (1988). Statystyki nieparametryczne dla nauk behawioralnych (wyd. 2). Nowy Jork: McGraw-Hill. P. 266. ISBN 978-0-07-057357-4 .
Gibbons, Jean Dickinson; Chakraborti, Subhabrata (2003). Nieparametryczne wnioskowanie statystyczne (wyd. 4). Nowy Jork: Marcel Dekker. s. 476–482. ISBN 978-0-8247-4052-8 .