Statystyka Cochrana – Mantela – Haenszela
W statystyce test Cochrana -Mantela-Haenszela (CMH) jest testem stosowanym w analizie warstwowych lub dopasowanych danych kategorycznych . Pozwala badaczowi przetestować związek między binarnym predyktorem lub leczeniem a wynikiem binarnym, takim jak stan przypadku lub kontroli, biorąc pod uwagę stratyfikację. W przeciwieństwie do testu McNemara , który może obsługiwać tylko pary, test CMH obsługuje dowolną wielkość warstw. Jej nazwa pochodzi od Williama G. Cochrana , Nathana Mantela i Williama Haenszela . Rozszerzenia tego testu na odpowiedź kategoryczną i / lub kilka grup są powszechnie nazywane statystykami Cochrana – Mantela – Haenszela. Jest często używany w badaniach obserwacyjnych , w których nie można kontrolować losowego przydziału pacjentów do różnych terapii, ale można zmierzyć zakłócające współzmienne.
Definicja
Rozważamy binarną zmienną wynikową, taką jak status przypadku (np. rak płuc) oraz binarny predyktor, taki jak status leczenia (np. palenie). Obserwacje są pogrupowane w warstwy. Uwarstwione dane podsumowuje się w serii tabel kontyngencji 2 × 2, po jednej dla każdej warstwy. I -ta taka tablica kontyngencji to:
Leczenie | Brak leczenia | Suma wierszy | |
Sprawa | ja _ | B _ | N 1 i |
Sterownica | C i | D i | N 2 i |
Suma kolumn | M 1 i | M 2 i | T ja |
Wspólny iloraz szans K tabel kontyngencji jest zdefiniowany jako:
Hipoteza zerowa głosi, że nie ma związku między leczeniem a wynikiem. Dokładniej, hipoteza zerowa to , a hipoteza alternatywna to . Statystyka testowa to:
Wynika z zerowej.
Stabilność podzbioru
Standardowy iloraz szans lub ryzyka dla wszystkich warstw można obliczyć, podając współczynniki ryzyka gdzie to liczba warstw. Gdyby usunięto stratyfikację, w zwiniętej tabeli istniałby jeden zagregowany współczynnik ryzyka; niech to będzie .
Ogólnie oczekuje się, że ryzyko zdarzenia bezwarunkowego w warstwie będzie ograniczone między najwyższym a najniższym ryzykiem w warstwach (lub identycznie z ilorazami szans). Łatwo jest skonstruować przykłady, w których tak nie jest, a jest większy lub mniejszy niż wszystkie dla . Jest to porównywalne, ale nie identyczne z paradoksem Simpsona i podobnie jak w przypadku paradoksu Simpsona, trudno jest interpretować statystyki i decydować o polityce na ich podstawie.
jako podzbiór stabilny iff jest między a , a dobrze wychowana statystyka jako nieskończenie różniczkowalna i niezależna od kolejności warstw. Zatem statystyka CMH jest unikalną statystyką dobrego zachowania, spełniającą stabilność podzbioru.
Powiązane testy
- Test McNemara obsługuje tylko pary. Test CMH jest uogólnieniem testu McNemara , ponieważ ich statystyki testowe są identyczne, gdy każda warstwa pokazuje parę.
- Warunkowa regresja logistyczna jest bardziej ogólna niż test CMH, ponieważ może obsługiwać zmienną ciągłą i przeprowadzać analizę wielowymiarową. Gdy można zastosować test CMH, statystyka testowa CMH i statystyka testu punktowego warunkowej regresji logistycznej są identyczne.
- Test Breslowa-Daya na asocjację jednorodną. Test CMH zakłada, że efekt zabiegu jest jednorodny we wszystkich warstwach. Test Breslowa-Day'a pozwala zweryfikować to założenie. Nie stanowi to problemu, jeśli warstwy są małe, np. pary.