Test Cochrana-Armitage'a dla trendu
Test Cochrana-Armitage'a dla trendu , nazwany na cześć Williama Cochrana i Petera Armitage'a , jest używany w analizie danych kategorialnych , gdy celem jest ocena obecności związku między zmienną z dwiema kategoriami a zmienną porządkową z k kategoriami. Modyfikuje test chi-kwadrat Pearsona , aby uwzględnić podejrzewane uporządkowanie w efektach k kategorii drugiej zmiennej. Na przykład dawki leku można zamówić jako „niskie”, „średnie” i „wysokie” i możemy podejrzewać, że korzyść z leczenia nie może maleć wraz ze wzrostem dawki. Test trendu jest często używany jako genotypie w genetycznych badaniach asocjacyjnych z kontrolą przypadku .
Wstęp
Test trendu stosuje się, gdy dane przybierają postać tabeli kontyngencji 2 × k . Na przykład, jeśli k = 3 mamy
B = 1 | B = 2 | B = 3 | |
---|---|---|---|
= 1 | N 11 | N 12 | N 13 |
= 2 | N 21 | N 22 | N 23 |
Tabelę tę można uzupełnić krańcowymi sumami dwóch zmiennych
B = 1 | B = 2 | B = 3 | Suma | |
---|---|---|---|---|
= 1 | N 11 | N 12 | N 13 | R 1 |
= 2 | N 21 | N 22 | N 23 | R2 _ |
Suma | C 1 | C 2 | C 3 | N |
gdzie R 1 = N 11 + N 12 + N 13 i C 1 = N 11 + N 21 itd.
Statystyka testu trendu to
gdzie t i to wagi, a różnicę N 1 i R 2 − N 2 i R 1 można postrzegać jako różnicę między N 1 i a N 2 i po ponownym zważeniu wierszy w celu uzyskania tej samej sumy.
Hipotezę braku związku ( hipotezę zerową ) można wyrazić jako:
Zakładając, że tak jest, to stosując iterowane oczekiwanie ,
Wariancję można obliczyć przez dekompozycję , uzyskując
i jako przybliżenie dużej próbki,
Wagi t i można wybrać w taki sposób, aby test trendu był lokalnie najpotężniejszy do wykrywania określonych typów powiązań. Na przykład, jeśli k = 3 i podejrzewamy, że B = 1 i B = 2 mają podobne częstości (w każdym rzędzie), ale B = 3 ma inną częstość, to wagi t = (1,1,0) powinny być użytym. Jeśli podejrzewamy liniowy trend częstotliwości, wówczas należy zastosować wagi t = (0,1,2). Wagi te są również często używane, gdy podejrzewa się, że częstotliwości zmieniają się monotonicznie wraz z B , nawet jeśli trend niekoniecznie jest liniowy.
Interpretacja i rola
Test trendu będzie miał większą moc niż test chi-kwadrat, gdy podejrzewany trend jest prawidłowy, ale poświęcana jest zdolność wykrywania nieoczekiwanych trendów. Jest to przykład ogólnej techniki kierowania testów hipotez w stronę wąskich alternatyw . Test trendu wykorzystuje podejrzewany kierunek efektu w celu zwiększenia mocy, ale nie ma to wpływu na rozkład próbkowania statystyki testowej przy hipotezie zerowej . Tak więc podejrzewany trend w efektach nie jest założeniem, które musi być spełnione, aby wyniki testu były miarodajne.
Zastosowanie w genetyce
Załóżmy, że istnieją trzy możliwe genotypy w pewnym locus i określamy je jako aa, Aa i AA. Rozkład zliczeń genotypów można umieścić w tabeli kontyngencji 2 × 3. Rozważmy na przykład następujące dane, w których częstości genotypów zmieniają się liniowo w przypadkach i są stałe w kontrolach:
Genotyp aa | Genotyp Aa | Genotyp AA | Suma | |
---|---|---|---|---|
Sterownica | 20 | 20 | 20 | 60 |
Sprawy | 10 | 20 | 30 | 60 |
Suma | 30 | 40 | 50 | 120 |
W zastosowaniach genetycznych wagi dobiera się zgodnie z podejrzewanym trybem dziedziczenia . Na przykład, aby sprawdzić, czy allel a dominuje nad allelem A, wybór t = (1, 1, 0) jest lokalnie optymalny. Aby sprawdzić, czy allel a jest recesywny w stosunku do allelu A, optymalnym wyborem jest t = (0, 1, 1). Aby sprawdzić, czy allele a i A są kodominujące , wybór t = (0, 1, 2) jest lokalnie optymalny. W przypadku złożonych chorób podstawowy model genetyczny jest często nieznany. W badaniach asocjacyjnych całego genomu często stosuje się addytywną (lub kodominującą) wersję testu.
W przykładzie numerycznym wystandaryzowane statystyki testowe dla różnych wektorów wag są następujące
Wagi | Standaryzowana statystyka testowa |
---|---|
1,1,0 | 1,85 |
0,1,1 | −2.1 |
0,1,2 | −4,67 |
a test chi-kwadrat Pearsona daje standaryzowaną statystykę testową równą 2. W ten sposób uzyskujemy silniejszy poziom istotności, jeśli stosuje się wagi odpowiadające dziedziczeniu addytywnemu (kodominującemu). Należy zauważyć, że aby poziom istotności dał wartość p przy zwykłej interpretacji probabilistycznej, wagi muszą być określone przed zbadaniem danych i można użyć tylko jednego zestawu wag.
Zobacz też
- Agresti, Alan (2002). Analiza danych kategorycznych (wyd. Drugie). Wileya. ISBN 0-471-36093-7 .
- Sasieni, P (1997). „Od genotypów do genów: podwojenie wielkości próby”. Biometria . Międzynarodowe Towarzystwo Biometryczne. 53 (4): 1253–61. doi : 10.2307/2533494 . JSTOR 2533494 . PMID 9423247 .
- statgen.org (2007). „Wyprowadzenie testu trendu Armitage'a dla tabeli genotypów 2 × 3” (PDF) . Źródło 6 lutego 2009 . –
- ^ Cochran, WG (1954). „Niektóre metody wzmacniania typowych testów chi-kwadrat”. Biometria . Międzynarodowe Towarzystwo Biometryczne. 10 (4): 417–451. doi : 10.2307/3001616 . JSTOR 3001616 .
- ^ Armitage, P. (1955). „Testy dla trendów liniowych w proporcjach i częstotliwościach”. Biometria . Międzynarodowe Towarzystwo Biometryczne. 11 (3): 375–386. doi : 10.2307/3001775 . JSTOR 3001775 .
- ^ Purcell S, Neale B, Todd-Brown K i in. (wrzesień 2007). „PLINK: zestaw narzędzi do asocjacji całego genomu i analiz powiązań opartych na populacji” . Jestem. J. Hum. Genet . 81 (3): 559–75. doi : 10.1086/519795 . PMC 1950838 . PMID 17701901 .