ANOVA na rangach
W statystyce jednym z celów analizy wariancji (ANOVA) jest analiza różnic średnich między grupami. Statystyka testowa F zakłada niezależność obserwacji, jednorodne wariancje i normalność populacji . ANOVA na rangach jest statystyką przeznaczoną dla sytuacji, w których zostało naruszone założenie o normalności.
Logika testu F na średnich
Statystyka F to stosunek licznika do mianownika. Rozważ losowo wybrane osoby, które są następnie losowo przydzielane do grup A, B i C. Zgodnie z prawdą hipotezy zerowej zmienność (lub suma kwadratów) wyników pewnej zmiennej zależnej będzie taka sama w każdej grupie. Po podzieleniu przez stopnie swobody (tj. na podstawie liczby osobników na grupę) otrzymuje się mianownik stosunku F.
Traktuj średnią dla każdej grupy jako wynik i oblicz zmienność (ponownie sumę kwadratów) tych trzech wyników. Po podzieleniu przez jego stopnie swobody (tj. na podstawie liczby grup) otrzymuje się licznik stosunku F.
Zgodnie z prawdą hipotezy zerowej rozkład próbkowania współczynnika F zależy od stopni swobody licznika i mianownika.
Modeluj leczenie zastosowane do grupy A, zwiększając każdy wynik o X. (Model ten utrzymuje leżące u jego podstaw założenie o jednorodnych wariancjach. W praktyce rzadko – jeśli nie jest to niemożliwe – wzrost X w średniej grupie następuje poprzez wzrost wynik każdego członka o X.) To przesunie rozkład X jednostek w kierunku dodatnim, ale nie będzie miało żadnego wpływu na zmienność w obrębie grupy. Jednak zmienność między średnimi wynikami trzech grup będzie teraz wzrastać. Jeśli wynikowy współczynnik F podnosi wartość do takiego stopnia, że przekracza próg tego, co stanowi rzadkie zdarzenie (nazywane poziomem alfa), mówi się, że test Anova F odrzuca hipotezę zerową równych średnich między trzema grupami, w na korzyść alternatywnej hipotezy, że co najmniej jedna z grup ma większą średnią (w tym przykładzie jest to grupa A).
Postępowanie z naruszeniem normalności populacji
Ranking jest jedną z wielu procedur służących do przekształcania danych, które nie spełniają założeń normalności . Conover i Iman przedstawili przegląd czterech głównych typów transformacji rang (RT). Jedna metoda zastępuje każdą oryginalną wartość danych jej rangą (od 1 dla najmniejszej do N dla największej). Ta procedura oparta na rangach została zalecona jako odporna na błędy inne niż normalne, odporna na wartości odstające i wysoce wydajna dla wielu dystrybucji. Może to skutkować znaną statystyką (np. w wynikach rankingu układu dwóch niezależnych próbek w teście sumy rang Wilcoxona / testu U Manna-Whitneya ) i zapewnia pożądaną solidność i zwiększoną moc statystyczną , która jest poszukiwana. Na przykład badania Monte Carlo wykazały, że transformacja rang w dwóch niezależnych próbach T2 Hotellinga Komercyjne układ testu t może być z powodzeniem rozszerzona na jednokierunkową niezależną analizę ANOVA, jak również dwie niezależne próby wielowymiarowe układy pakiety oprogramowania statystycznego (np. SAS), a następnie zalecenia dla analityków danych, aby przed przeprowadzeniem standardowych analiz przy użyciu procedur parametrycznych przeprowadzili swoje zbiory danych przez procedurę rankingową (np. PROC RANK).
Niepowodzenie rankingu w czynnikowej ANOVA i innych złożonych układach
ANOVA rang oznacza, że standardowa analiza wariancji jest obliczana na danych przekształconych w rangi. Sugerowano również przeprowadzenie czynnikowej ANOVA na rangach oryginalnych wyników. Jednak badania Monte Carlo i późniejsze badania asymptotyczne wykazały, że transformacja rang jest nieodpowiednia do testowania efektów interakcji w układzie czynnikowym 4x3 i 2x2x2. W miarę jak liczba efektów (tj. główny, interakcja) staje się niezerowa, a wielkość efektów niezerowych wzrasta, następuje wzrost błędu typu I , co skutkuje całkowitym niepowodzeniem statystyki przy tak wysokim jak 100% prawdopodobieństwo podjęcia fałszywie pozytywnej decyzji. Podobnie stwierdzono, że transformacja rang coraz częściej kończy się niepowodzeniem w układzie dwóch zależnych próbek, gdy wzrasta korelacja między wynikami przed i po teście. Odkryto również, że problem poziomu błędu typu I nasilił się w kontekście analizy kowariancji, zwłaszcza gdy wzrosła korelacja między współzmienną a zmienną zależną.
Transformacja szeregów
Wariantem transformacji rang jest „normalizacja kwantyli”, w której do rang stosuje się dalsze przekształcenie, tak że wynikowe wartości mają określony rozkład (często rozkład normalny z określoną średnią i wariancją). Dalsze analizy danych znormalizowanych kwantylowo mogą następnie założyć, że rozkład do obliczenia wartości istotności. Wykazano jednak, że dwa specyficzne typy transformacji wtórnych, losowe wyniki normalne i transformacja oczekiwanych wyników normalnych, znacznie zwiększają błędy typu I i poważnie zmniejszają moc statystyczną.
Naruszenie homoskedastyczności
ANOVA na rangach nigdy nie była zalecana, gdy podstawowe założenie o jednorodnych wariancjach zostało naruszone, samo w sobie lub w połączeniu z naruszeniem założenia o normalności populacji. [ Potrzebne źródło ] Ogólnie rzecz biorąc, statystyki oparte na rangach stają się niesolidne w odniesieniu do błędów typu I dla odstępstw od homoskedastyczności nawet szybciej niż ich odpowiedniki parametryczne, które podzielają to samo założenie. [ potrzebne źródło ]
Dalsza informacja
Kepner i Wackerly podsumowali literaturę, zauważając, że „pod koniec lat 80. XX wieku objętość literatury na temat metod RT szybko się powiększała, ponieważ uzyskano nowe spostrzeżenia, zarówno pozytywne, jak i negatywne, dotyczące użyteczności tej metody. Obawiając się, że metody RT będą nadużywane, Sawilowsky i wsp. (1989, s. 255) ostrzegali praktyków, aby unikali stosowania tych testów „z wyjątkiem tych konkretnych sytuacji, w których charakterystyka testów jest dobrze zrozumiana”. Według Hettmanspergera i McKeana, „Sawilowsky (1990) zapewnia doskonały przegląd nieparametrycznych podejść do testowania interakcji” w ANOVA.