Quasi-prawdopodobieństwo

W statystyce metody quasi-wiarygodności są używane do oszacowania parametrów w modelu statystycznym, gdy metody dokładnej wiarygodności, na przykład oszacowanie największej wiarygodności , są obliczeniowo niewykonalne. Ze względu na zastosowanie niewłaściwego prawdopodobieństwa estymatory quasi-wiarygodności tracą skuteczność asymptotyczną w porównaniu np. z estymatorami największej wiarygodności. W szeroko stosowanych warunkach estymatory quasi-wiarygodności są spójne i asymptotycznie normalne. Asymptotyczną macierz kowariancji można otrzymać za pomocą tzw. estymatora kanapkowego. Przykładami metod quasi-wiarygodności są uogólnione równania estymacji i podejścia oparte na prawdopodobieństwie parami.

Historia

Termin funkcja quasi-wiarygodności został wprowadzony przez Roberta Wedderburna w 1974 roku w celu opisania funkcji, która ma podobne właściwości do funkcji logarytmu wiarygodności, ale nie jest logarytmem wiarygodności odpowiadającym jakiemukolwiek rzeczywistemu rozkładowi prawdopodobieństwa . Zaproponował dopasowanie pewnych modeli quasi-wiarygodności za pomocą prostego rozszerzenia algorytmów używanych do dopasowania uogólnionych modeli liniowych .

Zastosowanie w modelowaniu naddyspersyjnym

Oszacowanie quasi-wiarygodności jest jednym ze sposobów uwzględnienia nadmiernej dyspersji , to znaczy większej zmienności danych, niż można by oczekiwać na podstawie zastosowanego modelu statystycznego . Jest najczęściej używany z modelami danych liczbowych lub pogrupowanych danych binarnych, tj. danych, które w innym przypadku byłyby modelowane przy użyciu rozkładu Poissona lub rozkładu dwumianowego .

Zamiast określać rozkład prawdopodobieństwa danych, określa się jedynie związek między średnią a wariancją w postaci funkcji wariancji , podając wariancję jako funkcję średniej. Ogólnie rzecz biorąc, ta funkcja może zawierać mnożnik znany jako parametr nadmiernej dyspersji lub parametr skali , który jest szacowany na podstawie danych. Najczęściej funkcja wariancji ma taką postać, że ustalenie parametru nadmiernej dyspersji na poziomie jedności daje zależność wariancja-średnia rzeczywistego rozkładu prawdopodobieństwa, takiego jak dwumian lub Poissona. (Aby zapoznać się z formułami, zobacz przykład danych dwumianowych i przykład danych liczbowych w ramach uogólnionych modeli liniowych ).

Porównanie z alternatywami

Modele z efektami losowymi i bardziej ogólnie modele mieszane ( modele hierarchiczne ) zapewniają alternatywną metodę dopasowywania danych wykazujących nadmierne rozproszenie przy użyciu w pełni określonych modeli prawdopodobieństwa. Jednak metody te często stają się złożone i wymagają dużej mocy obliczeniowej, aby dopasować je do danych binarnych lub liczbowych. Zaletą metod quasi-wiarygodności jest względna prostota obliczeniowa, szybkość i solidność, ponieważ mogą one wykorzystywać prostsze algorytmy opracowane w celu dopasowania do uogólnionych modeli liniowych .

Zobacz też

Notatki

McCullagh, Peter; Nelder, John (1989). Uogólnione modele liniowe (wyd. Drugie). Londyn: Chapman i Hall. ISBN 0-412-31760-5 .
Hardin, James; Hilbe, Józef (2007). Uogólnione modele liniowe i rozszerzenia (wyd. Drugie). Stacja College: Stata Press.