Test C Cochrana
W statystyce test C Cochrana , nazwany na cześć Williama G. Cochrana , jest jednostronnym testem odstającym wariancji górnej granicy . Test C służy do określenia, czy pojedyncze oszacowanie wariancji (lub odchylenia standardowego ) jest znacznie większe niż grupa wariancji (lub odchyleń standardowych), z którą pojedyncze oszacowanie ma być porównywalne . Test C jest omawiany w wielu podręcznikach i jest zalecany przez IUPAC i ISO . Testu C Cochrana nie należy mylić z testem Q Cochrana , który ma zastosowanie do analizy dwukierunkowych losowych układów blokowych .
Test C zakłada zrównoważony projekt, tzn. rozpatrywany pełny zbiór danych powinien składać się z pojedynczych serii danych, które wszystkie mają jednakową wielkość. Test C zakłada ponadto, że każda pojedyncza seria danych ma rozkład normalny . Chociaż jest to przede wszystkim test odstający, test C jest również używany jako prosta alternatywa dla zwykłych homoskedastyczności , takich jak test Bartletta , test Levene'a i test Browna-Forsythe'a w celu sprawdzenia zestawu danych statystycznych pod kątem jednorodności wariancji . Jeszcze prostszym sposobem sprawdzenia homoskedastyczności jest test Fmax Hartleya , ale test Fmax Hartleya ma tę wadę, że uwzględnia tylko minimum i maksimum zakresu wariancji, podczas gdy test C uwzględnia wszystkie wariancje w tym zakresie.
Opis
Test C wykrywa jednocześnie jedną wyjątkowo dużą wartość wariancji. Odpowiednie serie danych są następnie pomijane w pełnym zestawie danych. Zgodnie z normą ISO 5725 test C można powtarzać , aż nie zostaną wykryte dalsze wyjątkowo duże wartości wariancji, ale taka praktyka może prowadzić do nadmiernych odrzuceń, jeśli podstawowe serie danych nie mają rozkładu normalnego. Test C ocenia stosunek :
Gdzie:
- C j = statystyka C Cochrana dla serii danych j
- S j = odchylenie standardowe serii danych j
- N = liczba serii danych, które pozostają w zbiorze danych; N zmniejsza się w krokach co 1 po każdej iteracji testu C
- S i = odchylenie standardowe serii danych i (1 ≤ i ≤ N )
0 Test C porównuje hipotezę zerową (H ) z hipotezą alternatywną (H a ):
- 0 H : Wszystkie wariancje są równe.
- H a : Co najmniej jedna wartość wariancji jest znacznie większa niż inne wartości wariancji.
Wartości krytyczne
Wariancja próbki serii danych j jest Cj uważana za wartość odstającą na poziomie istotności α , jeżeli przekracza górną granicę wartości krytycznej CUL . CUL zależy od pożądanego poziomu istotności α , liczby rozpatrywanych serii danych N oraz liczby punktów danych ( n ) przypadających na serię danych. Wybory wartości dla CUL zestawiono w tabeli na poziomach istotności α = 0,01, α = 0,025 i α = 0,05. C UL można również obliczyć z:
Tutaj:
- C UL = górna granica wartości krytycznej dla testu jednostronnego na zrównoważonym projekcie
- α = poziom istotności, np. 0,05
- n = liczba punktów danych na serię danych
- F c = wartość krytyczna współczynnika F Fishera ; F c można uzyskać z tablic rozkładu F lub za pomocą oprogramowania komputerowego dla tej funkcji.
Uogólnienie
Test C można uogólnić tak, aby obejmował układy niezrównoważone, jednostronne testy dolnej granicy i testy dwustronne na dowolnym poziomie istotności α , dla dowolnej liczby serii danych N oraz dla dowolnej liczby pojedynczych punktów danych n j w serii danych j .