Ten artykuł dotyczy modelowania kilku skorelowanych wyników binarnych. Aby uzyskać informacje na temat modelowania pojedynczego zdarzenia z wieloma wynikami, zobacz wielomianowy probit .
W statystyce i ekonometrii wielowymiarowy model probitowy jest uogólnieniem modelu probitowego używanego do wspólnego oszacowania kilku skorelowanych wyników binarnych. Na przykład, jeśli uważa się, że decyzje o wysłaniu co najmniej jednego dziecka do szkoły publicznej i decyzja o głosowaniu za budżetem szkoły są skorelowane (obie decyzje są binarne), to wielowymiarowy model probitowy byłby odpowiedni do łącznego przewidywania tych decyzji. dwie opcje na podstawie indywidualnej. JR Ashford i RR Sowden początkowo zaproponowali podejście do wielowymiarowej analizy probitowej. Siddhartha Chib i Edward Greenberg rozszerzyli tę ideę, a także zaproponowali metody wnioskowania oparte na symulacji dla wielowymiarowego modelu probitowego, który uprościł i uogólnił estymację parametrów.
istnieje tylko jedna binarna zmienna zależna więc używana jest zmienna utajona . Natomiast w dwuwymiarowym modelu probitowym istnieją dwie binarne zmienne zależne i , więc istnieją dwie zmienne latentne: i . Zakłada się, że każda obserwowana zmienna przyjmuje wartość 1 wtedy i tylko wtedy, gdy leżąca u jej podstaw zmienna ciągła latentna przyjmuje wartość dodatnią:
zmiennych ukrytych funkcjach prawdopodobieństwa i wzięcie logów daje 1
Po pewnym przepisaniu funkcja logarytmu wiarygodności przyjmuje postać:
Zauważ, że funkcją dystrybucji dwuwymiarowego rozkładu normalnego . w logarytmu wiarygodności są obserwowanymi zmiennymi równymi jeden lub zero.
Probit wielowymiarowy
W ogólnym przypadku gdzie możemy przyjąć i jako jednostki lub obserwacje, prawdopodobieństwo zaobserwowania wybór jest
gdzie i
log
Z wyjątkiem tego nie ma rozwiązania całek w równaniu logarytmu wiarygodności w postaci Zamiast tego do symulacji prawdopodobieństw wyboru można zastosować metody symulacyjne. Metody wykorzystujące próbkowanie ważności obejmują algorytm GHK (Geweke, Hajivassilou, McFadden i Keane), AR (akceptacja-odrzucenie), metoda Sterna. Istnieją również podejścia MCMC do tego problemu, w tym CRB (metoda Chiba z Rao-Blackwellization), CRT (Chib, Ritter, Tanner), ARK (jądro akceptacji-odrzucenia) i ASK (jądro adaptacyjnego próbkowania). W Probit-LMM zaproponowano podejście wariacyjne skalujące się do dużych zbiorów danych (Mandt, Wenzel, Nakajima i in.).