Test C Cochrana

W statystyce test C Cochrana , nazwany na cześć Williama G. Cochrana , jest jednostronnym testem odstającym wariancji górnej granicy . Test C służy do określenia, czy pojedyncze oszacowanie wariancji (lub odchylenia standardowego ) jest znacznie większe niż grupa wariancji (lub odchyleń standardowych), z którą pojedyncze oszacowanie ma być porównywalne . Test C jest omawiany w wielu podręcznikach i jest zalecany przez IUPAC i ISO . Testu C Cochrana nie należy mylić z testem Q Cochrana , który ma zastosowanie do analizy dwukierunkowych losowych układów blokowych .

Test C zakłada zrównoważony projekt, tzn. rozpatrywany pełny zbiór danych powinien składać się z pojedynczych serii danych, które wszystkie mają jednakową wielkość. Test C zakłada ponadto, że każda pojedyncza seria danych ma rozkład normalny . Chociaż jest to przede wszystkim test odstający, test C jest również używany jako prosta alternatywa dla zwykłych homoskedastyczności , takich jak test Bartletta , test Levene'a i test Browna-Forsythe'a w celu sprawdzenia zestawu danych statystycznych pod kątem jednorodności wariancji . Jeszcze prostszym sposobem sprawdzenia homoskedastyczności jest test _Fmax Hartleya , ale test _Fmax Hartleya ma tę wadę, że uwzględnia tylko minimum i maksimum zakresu wariancji, podczas gdy test C uwzględnia wszystkie wariancje w tym zakresie.

Opis

Test C wykrywa jednocześnie jedną wyjątkowo dużą wartość wariancji. Odpowiednie serie danych są następnie pomijane w pełnym zestawie danych. Zgodnie z normą ISO 5725 test C można powtarzać , aż nie zostaną wykryte dalsze wyjątkowo duże wartości wariancji, ale taka praktyka może prowadzić do nadmiernych odrzuceń, jeśli podstawowe serie danych nie mają rozkładu normalnego. Test C ocenia stosunek :

{\ Displaystyle C_ {j} = {\ Frac {S_ {j} ^ {2}} {\ Displaystyle \ suma _ {i = 1} ^ {N

Gdzie:

C _j = statystyka C Cochrana dla serii danych j

S _j = odchylenie standardowe serii danych j

N = liczba serii danych, które pozostają w zbiorze danych; N zmniejsza się w krokach co 1 po każdej iteracji testu C

S _i = odchylenie standardowe serii danych i (1 ≤ i ≤ N )

₀ Test C porównuje hipotezę zerową (H ) z hipotezą alternatywną (H _a ):

₀ H : Wszystkie wariancje są równe.

H _a : Co najmniej jedna wartość wariancji jest znacznie większa niż inne wartości wariancji.

Wartości krytyczne

Wariancja próbki serii danych _j jest Cj _uważana za wartość odstającą na poziomie istotności α , jeżeli przekracza górną granicę wartości krytycznej CUL . CUL zależy od pożądanego poziomu istotności α , liczby rozpatrywanych serii danych N oraz liczby punktów danych ( n ) _{przypadających} na serię danych. Wybory wartości dla CUL _zestawiono w tabeli na poziomach istotności α = 0,01, α = 0,025 i α = 0,05. C _UL można również obliczyć z:

{\ Displaystyle C _ {\ tekst {UL}} (\ alfa, n, N) = \ lewo [1 + {\ Frac {N-1} {F _ {\ tekst {c}} (1- \ alfa / N, (n-1),(N-1)(n-1))}}\prawo]^{-1}.}

Tutaj:

C _UL = górna granica wartości krytycznej dla testu jednostronnego na zrównoważonym projekcie

α = poziom istotności, np. 0,05

n = liczba punktów danych na serię danych

F _c = wartość krytyczna współczynnika F Fishera ; F _c można uzyskać z tablic rozkładu F lub za pomocą oprogramowania komputerowego dla tej funkcji.

Uogólnienie

Test C można uogólnić tak, aby obejmował układy niezrównoważone, jednostronne testy dolnej granicy i testy dwustronne na dowolnym poziomie istotności α , dla dowolnej liczby serii danych N oraz dla dowolnej liczby pojedynczych punktów danych n _j w serii danych j .

Zobacz też

Linki zewnętrzne