Gamma Goodmana i Kruskala

W statystyce gamma Goodmana i Kruskala jest miarą korelacji rang , tj . podobieństwa uporządkowania danych przy uszeregowaniu według każdej z wielkości. Mierzy siłę powiązania danych zestawionych w tabeli krzyżowej , gdy obie zmienne są mierzone na poziomie porządkowym . Nie ma regulacji ani rozmiaru stołu, ani krawatów. Wartości mieszczą się w zakresie od -1 (100% skojarzenia negatywnego lub idealnego odwrócenia) do +1 (100% skojarzenia pozytywnego lub idealnej zgodności). Wartość zero wskazuje na brak powiązania.

Ta statystyka (która różni się od lambda Goodmana i Kruskala ) została nazwana na cześć Leo Goodmana i Williama Kruskala , którzy zaproponowali ją w serii artykułów z lat 1954-1972.

Definicja

Oszacowanie gamma, G , zależy od dwóch wielkości:

  • N s , liczba par przypadków uszeregowanych w tej samej kolejności na obu zmiennych (liczba zgodnych par ),
  • N d , liczba par przypadków uszeregowanych w odwrotnej kolejności na obu zmiennych (liczba odwróconych par),

gdzie „remisy” (przypadki, w których jedna z dwóch zmiennych w parze jest równa) są odrzucane. Następnie

Statystykę tę można uznać za estymator największej wiarygodności dla wielkości teoretycznej , gdzie

i gdzie P s i P d są prawdopodobieństwem, że losowo wybrana para obserwacji umieści odpowiednio w tej samej lub przeciwnej kolejności, gdy zostaną uszeregowane według obu zmiennych.

Krytyczne wartości statystyki gamma są czasami znajdowane za pomocą przybliżenia, w którym przekształcona wartość statystyki t jest odnoszona do rozkładu t Studenta , gdzie [ potrzebne źródło ]

i gdzie n to liczba obserwacji (nie liczba par):

Pytanie Yule'a

Szczególnym przypadkiem gamma Goodmana i Kruskala jest Q Yule'a , znany również jako współczynnik asocjacji Yule'a , który jest specyficzny dla macierzy 2 × 2. Rozważmy poniższą tabelę kontyngencji zdarzeń, w której każda wartość jest liczbą częstotliwości zdarzenia:

Tak NIE sumy
Pozytywny A B a + b
Negatywny C D do + re
sumy a + do b + d N

Q Yule jest podane przez:

Chociaż jest obliczana w taki sam sposób jak gamma Goodmana i Kruskala, ma nieco szerszą interpretację, ponieważ rozróżnienie między skalami nominalnymi i porządkowymi staje się kwestią arbitralnego etykietowania rozróżnień dychotomicznych. Zatem to, czy Q jest dodatnie, czy ujemne, zależy jedynie od tego, które pary analityk uważa za zgodne, ale poza tym jest symetryczne.

Q waha się od -1 do +1. −1 odzwierciedla całkowite skojarzenie negatywne, +1 odzwierciedla doskonałe skojarzenie pozytywne, a 0 oznacza całkowity brak skojarzenia. Znak zależy od tego, które pary analityk początkowo uznał za zgodne, ale wybór ten nie wpływa na wielkość.

Pod względem ilorazu szans OR, Q Yule jest określone przez

więc Q Yule i Y Yule są powiązane przez

Zobacz też

Dalsza lektura

  •   Sheskin, DJ (2007) Podręcznik parametrycznych i nieparametrycznych procedur statystycznych . Chapman & Hall/CRC, ISBN 9781584888147