Warunkowa regresja logistyczna

Warunkowa regresja logistyczna jest rozszerzeniem regresji logistycznej , które pozwala uwzględnić stratyfikację i dopasowanie . Jej głównym obszarem zastosowania są badania obserwacyjne , aw szczególności epidemiologia . Został opracowany w 1978 roku przez Normana Breslowa , Nicholasa Daya , Katherine Halvorsen , Rossa L. Prentice'a i C. Sabai. Jest to najbardziej elastyczna i ogólna procedura dla dopasowanych danych.

Motywacja

Badania obserwacyjne wykorzystują stratyfikację lub dopasowywanie jako sposób kontrolowania zakłóceń . Kilka testów istniało przed warunkową regresją logistyczną dla dopasowanych danych, jak pokazano w powiązanych testach . Nie pozwoliły one jednak na analizę predyktorów ciągłych o dowolnej wielkości warstwy. Wszystkim tym procedurom brakuje również elastyczności warunkowej regresji logistycznej, aw szczególności możliwości kontroli współzmiennych.

Regresja logistyczna może uwzględniać rozwarstwienie, mając inny stały składnik dla każdej warstwy. Oznaczmy etykietę (np. status sprawy) obserwacji th obserwacji th warstwa odpowiednich predyktorów Wtedy prawdopodobieństwo jednej obserwacji wynosi

gdzie terminem . Chociaż działa to zadowalająco dla ograniczonej liczby warstw, zachowanie patologiczne występuje, gdy warstwy są małe. Gdy warstwy są parami, liczba parametrów rośnie wraz z liczbą obserwacji jest równa się . Wyniki asymptotyczne, na których oszacowanie maksymalnego prawdopodobieństwa, są zatem nieważne, a oszacowanie jest obciążone. W rzeczywistości można wykazać, że bezwarunkowa analiza danych dopasowanych par daje oszacowanie ilorazu szans, który jest kwadratem poprawnego, warunkowego.

Prawdopodobieństwo warunkowe

Podejście warunkowej wiarygodności zajmuje się powyższym patologicznym zachowaniem poprzez warunkowanie liczby przypadków w każdej warstwie, a tym samym eliminowanie potrzeby szacowania parametrów warstw. W przypadku, gdy warstwy są parami, gdzie pierwsza obserwacja jest przypadkiem, a druga kontrolą, można to zobaczyć w następujący sposób

Przy podobnych obliczeniach warunkowe prawdopodobieństwo warstwy o rozmiarze z pierwszymi obserwacjami będącymi przypadkami, wynosi

gdzie do jest zbiorem wszystkich podzbiorów o zbioru .

Pełny logarytm wiarygodności warunkowej jest wtedy po prostu sumą logarytmów wiarygodności dla każdej warstwy. Estymator jest następnie definiowany jako który maksymalizuje prawdopodobieństwo logarytmu warunkowego.

Realizacja

Warunkowa regresja logistyczna jest dostępna w R jako funkcja clogit w pakiecie przetrwania . Znajduje się w przetrwania , ponieważ logarytm wiarygodności warunkowego modelu logistycznego jest taki sam, jak logarytm wiarygodności modelu Coxa z określoną strukturą danych.

Powiązane testy

Notatki