Test C Cochrana

W statystyce test C Cochrana , nazwany na cześć Williama G. Cochrana , jest jednostronnym testem odstającym wariancji górnej granicy . Test C służy do określenia, czy pojedyncze oszacowanie wariancji (lub odchylenia standardowego ) jest znacznie większe niż grupa wariancji (lub odchyleń standardowych), z którą pojedyncze oszacowanie ma być porównywalne . Test C jest omawiany w wielu podręcznikach i jest zalecany przez IUPAC i ISO . Testu C Cochrana nie należy mylić z testem Q Cochrana , który ma zastosowanie do analizy dwukierunkowych losowych układów blokowych .

Test C zakłada zrównoważony projekt, tzn. rozpatrywany pełny zbiór danych powinien składać się z pojedynczych serii danych, które wszystkie mają jednakową wielkość. Test C zakłada ponadto, że każda pojedyncza seria danych ma rozkład normalny . Chociaż jest to przede wszystkim test odstający, test C jest również używany jako prosta alternatywa dla zwykłych homoskedastyczności , takich jak test Bartletta , test Levene'a i test Browna-Forsythe'a w celu sprawdzenia zestawu danych statystycznych pod kątem jednorodności wariancji . Jeszcze prostszym sposobem sprawdzenia homoskedastyczności jest test Fmax Hartleya , ale test Fmax Hartleya ma tę wadę, że uwzględnia tylko minimum i maksimum zakresu wariancji, podczas gdy test C uwzględnia wszystkie wariancje w tym zakresie.

Opis

Test C wykrywa jednocześnie jedną wyjątkowo dużą wartość wariancji. Odpowiednie serie danych są następnie pomijane w pełnym zestawie danych. Zgodnie z normą ISO 5725 test C można powtarzać , aż nie zostaną wykryte dalsze wyjątkowo duże wartości wariancji, ale taka praktyka może prowadzić do nadmiernych odrzuceń, jeśli podstawowe serie danych nie mają rozkładu normalnego. Test C ocenia stosunek :

Gdzie:

C j = statystyka C Cochrana dla serii danych j
S j = odchylenie standardowe serii danych j
N = liczba serii danych, które pozostają w zbiorze danych; N zmniejsza się w krokach co 1 po każdej iteracji testu C
S i = odchylenie standardowe serii danych i (1 ≤ i N )

0 Test C porównuje hipotezę zerową (H ) z hipotezą alternatywną (H a ):

0 H : Wszystkie wariancje są równe.
H a : Co najmniej jedna wartość wariancji jest znacznie większa niż inne wartości wariancji.

Wartości krytyczne

Wariancja próbki serii danych j jest Cj uważana za wartość odstającą na poziomie istotności α , jeżeli przekracza górną granicę wartości krytycznej CUL . CUL zależy od pożądanego poziomu istotności α , liczby rozpatrywanych serii danych N oraz liczby punktów danych ( n ) przypadających na serię danych. Wybory wartości dla CUL zestawiono w tabeli na poziomach istotności α = 0,01, α = 0,025 i α = 0,05. C UL można również obliczyć z:

Tutaj:

C UL = górna granica wartości krytycznej dla testu jednostronnego na zrównoważonym projekcie
α = poziom istotności, np. 0,05
n = liczba punktów danych na serię danych
F c = wartość krytyczna współczynnika F Fishera ; F c można uzyskać z tablic rozkładu F lub za pomocą oprogramowania komputerowego dla tej funkcji.

Uogólnienie

Test C można uogólnić tak, aby obejmował układy niezrównoważone, jednostronne testy dolnej granicy i testy dwustronne na dowolnym poziomie istotności α , dla dowolnej liczby serii danych N oraz dla dowolnej liczby pojedynczych punktów danych n j w serii danych j .

Zobacz też

Linki zewnętrzne