Model ułamkowy
W statystyce stosowanej modele ułamkowe są w pewnym stopniu powiązane z modelami odpowiedzi binarnych . Jednak zamiast szacować prawdopodobieństwo znalezienia się w jednym przedziale zmiennej dychotomicznej , model ułamkowy zwykle zajmuje się zmiennymi, które przyjmują wszystkie możliwe wartości w przedziale jednostkowym . Można łatwo uogólnić ten model na wartości z dowolnego innego przedziału za pomocą odpowiednich przekształceń. Przykłady obejmują wskaźniki uczestnictwa w planach 401 (k) po telewizyjne oceny meczów NBA .
Opis
Istnieją dwa podejścia do modelowania tego problemu. Mimo że oba opierają się na indeksie , który jest liniowy w x i w połączeniu z funkcją łączącą , nie jest to bezwzględnie konieczne. Pierwsze transformację logarytmu y funkcję x ja tj . Takie podejście jest problematyczne z dwóch różnych powodów. Zmienna y nie może przyjmować wartości brzegowych 1 i 0, a interpretacja współczynników nie jest prosta. Drugie podejście omija te problemy, wykorzystując regresję logistyczną jako funkcję łączenia. Dokładniej,
Natychmiast staje się jasne, że ten układ jest bardzo podobny do binarnego modelu logitowego , z tą różnicą, że zmienna y może faktycznie przyjmować wartości w przedziale jednostkowym. Wiele estymacji dla binarnego modelu logitowego, takich jak nieliniowa metoda najmniejszych kwadratów i quasi-MLE , jest przenoszonych w naturalny sposób, podobnie jak korekty heteroskedastyczności i obliczenia efektów cząstkowych.
rozszerzenia tego przekrojowego modelu, które pozwalają uwzględnić ważne kwestie ekonometryczne, takie jak endogeniczne zmienne objaśniające i nieobserwowane efekty heterogeniczne. Przy ścisłych założeniach egzogeniczności możliwe jest rozróżnienie tych nieobserwowanych efektów za pomocą danych panelowych , chociaż słabsze założenia egzogeniczności mogą również skutkować spójnymi estymatorami. Zaproponowano również techniki funkcji kontrolnych w celu rozwiązania problemów związanych z endogenicznością.