Test Cochrana-Armitage'a dla trendu

Test Cochrana-Armitage'a dla trendu , nazwany na cześć Williama Cochrana i Petera Armitage'a , jest używany w analizie danych kategorialnych , gdy celem jest ocena obecności związku między zmienną z dwiema kategoriami a zmienną porządkową z k kategoriami. Modyfikuje test chi-kwadrat Pearsona , aby uwzględnić podejrzewane uporządkowanie w efektach k kategorii drugiej zmiennej. Na przykład dawki leku można zamówić jako „niskie”, „średnie” i „wysokie” i możemy podejrzewać, że korzyść z leczenia nie może maleć wraz ze wzrostem dawki. Test trendu jest często używany jako genotypie w genetycznych badaniach asocjacyjnych z kontrolą przypadku .

Wstęp

Test trendu stosuje się, gdy dane przybierają postać tabeli kontyngencji 2 × k . Na przykład, jeśli k = 3 mamy

B = 1 B = 2 B = 3
= 1 N 11 N 12 N 13
= 2 N 21 N 22 N 23

Tabelę tę można uzupełnić krańcowymi sumami dwóch zmiennych

B = 1 B = 2 B = 3 Suma
= 1 N 11 N 12 N 13 R 1
= 2 N 21 N 22 N 23 R2 _
Suma C 1 C 2 C 3 N

gdzie R 1 = N 11 + N 12 + N 13 i C 1 = N 11 + N 21 itd.

Statystyka testu trendu to

gdzie t i to wagi, a różnicę N 1 i R 2 N 2 i R 1 można postrzegać jako różnicę między N 1 i a N 2 i po ponownym zważeniu wierszy w celu uzyskania tej samej sumy.

Hipotezę braku związku ( hipotezę zerową ) można wyrazić jako:

Zakładając, że tak jest, to stosując iterowane oczekiwanie ,

Wariancję można obliczyć przez dekompozycję , uzyskując

i jako przybliżenie dużej próbki,

Wagi t i można wybrać w taki sposób, aby test trendu był lokalnie najpotężniejszy do wykrywania określonych typów powiązań. Na przykład, jeśli k = 3 i podejrzewamy, że B = 1 i B = 2 mają podobne częstości (w każdym rzędzie), ale B = 3 ma inną częstość, to wagi t = (1,1,0) powinny być użytym. Jeśli podejrzewamy liniowy trend częstotliwości, wówczas należy zastosować wagi t = (0,1,2). Wagi te są również często używane, gdy podejrzewa się, że częstotliwości zmieniają się monotonicznie wraz z B , nawet jeśli trend niekoniecznie jest liniowy.

Interpretacja i rola

Test trendu będzie miał większą moc niż test chi-kwadrat, gdy podejrzewany trend jest prawidłowy, ale poświęcana jest zdolność wykrywania nieoczekiwanych trendów. Jest to przykład ogólnej techniki kierowania testów hipotez w stronę wąskich alternatyw . Test trendu wykorzystuje podejrzewany kierunek efektu w celu zwiększenia mocy, ale nie ma to wpływu na rozkład próbkowania statystyki testowej przy hipotezie zerowej . Tak więc podejrzewany trend w efektach nie jest założeniem, które musi być spełnione, aby wyniki testu były miarodajne.

Zastosowanie w genetyce

Załóżmy, że istnieją trzy możliwe genotypy w pewnym locus i określamy je jako aa, Aa i AA. Rozkład zliczeń genotypów można umieścić w tabeli kontyngencji 2 × 3. Rozważmy na przykład następujące dane, w których częstości genotypów zmieniają się liniowo w przypadkach i są stałe w kontrolach:

Genotyp aa Genotyp Aa Genotyp AA Suma
Sterownica 20 20 20 60
Sprawy 10 20 30 60
Suma 30 40 50 120

W zastosowaniach genetycznych wagi dobiera się zgodnie z podejrzewanym trybem dziedziczenia . Na przykład, aby sprawdzić, czy allel a dominuje nad allelem A, wybór t = (1, 1, 0) jest lokalnie optymalny. Aby sprawdzić, czy allel a jest recesywny w stosunku do allelu A, optymalnym wyborem jest t = (0, 1, 1). Aby sprawdzić, czy allele a i A są kodominujące , wybór t = (0, 1, 2) jest lokalnie optymalny. W przypadku złożonych chorób podstawowy model genetyczny jest często nieznany. W badaniach asocjacyjnych całego genomu często stosuje się addytywną (lub kodominującą) wersję testu.

W przykładzie numerycznym wystandaryzowane statystyki testowe dla różnych wektorów wag są następujące

Wagi Standaryzowana statystyka testowa
1,1,0 1,85
0,1,1 −2.1
0,1,2 −4,67

a test chi-kwadrat Pearsona daje standaryzowaną statystykę testową równą 2. W ten sposób uzyskujemy silniejszy poziom istotności, jeśli stosuje się wagi odpowiadające dziedziczeniu addytywnemu (kodominującemu). Należy zauważyć, że aby poziom istotności dał wartość p przy zwykłej interpretacji probabilistycznej, wagi muszą być określone przed zbadaniem danych i można użyć tylko jednego zestawu wag.

Zobacz też

  •   Agresti, Alan (2002). Analiza danych kategorycznych (wyd. Drugie). Wileya. ISBN 0-471-36093-7 .
  •    Sasieni, P (1997). „Od genotypów do genów: podwojenie wielkości próby”. Biometria . Międzynarodowe Towarzystwo Biometryczne. 53 (4): 1253–61. doi : 10.2307/2533494 . JSTOR 2533494 . PMID 9423247 .
  • statgen.org (2007). „Wyprowadzenie testu trendu Armitage'a dla tabeli genotypów 2 × 3” (PDF) . Źródło 6 lutego 2009 .
  1. ^   Cochran, WG (1954). „Niektóre metody wzmacniania typowych testów chi-kwadrat”. Biometria . Międzynarodowe Towarzystwo Biometryczne. 10 (4): 417–451. doi : 10.2307/3001616 . JSTOR 3001616 .
  2. ^   Armitage, P. (1955). „Testy dla trendów liniowych w proporcjach i częstotliwościach”. Biometria . Międzynarodowe Towarzystwo Biometryczne. 11 (3): 375–386. doi : 10.2307/3001775 . JSTOR 3001775 .
  3. ^    Purcell S, Neale B, Todd-Brown K i in. (wrzesień 2007). „PLINK: zestaw narzędzi do asocjacji całego genomu i analiz powiązań opartych na populacji” . Jestem. J. Hum. Genet . 81 (3): 559–75. doi : 10.1086/519795 . PMC 1950838 . PMID 17701901 .