Wiarygodny interwał
Część serii |
statystyk bayesowskich |
---|
Posterior = Prawdopodobieństwo × Prior ÷ dowodowe |
Tło |
Budynek modelowy |
Przybliżenie tylne |
estymatory |
Ocena modelu |
W statystyce bayesowskiej wiarygodny przedział to przedział , w którym nieobserwowana wartość parametru mieści się z określonym prawdopodobieństwem . Jest to przedział w dziedzinie późniejszego rozkładu prawdopodobieństwa lub rozkładu predykcyjnego . Uogólnienie na problemy wielowymiarowe to region wiarygodny .
Wiarygodne przedziały są analogiczne do przedziałów ufności i regionów ufności w statystyce częstości , chociaż różnią się pod względem filozoficznym: przedziały bayesowskie traktują swoje granice jako stałe, a oszacowany parametr jako zmienną losową, podczas gdy częstościowe przedziały ufności traktują swoje granice jako zmienne losowe, a parametr jako stałą wartość. Ponadto wiarygodne przedziały bayesowskie wykorzystują (i rzeczywiście wymagają) wiedzę na temat rozkładu wcześniejszego specyficznego dla sytuacji , podczas gdy częstościowe przedziały ufności nie.
Na przykład w eksperymencie, który określa rozkład możliwych wartości parametru jeśli subiektywne prawdopodobieństwo , że między 35 a 45, wynosi 0,95 to 95% wiarygodny przedział.
Wybór wiarygodnego interwału
Wiarygodne przedziały nie są unikalne w dystrybucji późniejszej. Metody definiowania odpowiedniego wiarygodnego przedziału obejmują:
- Wybór najwęższego przedziału, który dla rozkładu unimodalnego będzie polegał na wybraniu wartości o największej gęstości prawdopodobieństwa uwzględniając modę ( maksimum a posteriori ). Nazywa się to czasem najwyższym tylnym przedziałem gęstości (HPDI).
- Wybór przedziału, w którym prawdopodobieństwo znalezienia się poniżej przedziału jest równie prawdopodobne, jak znalezienie się powyżej niego. Ten przedział będzie zawierał medianę . Nazywa się to czasem przedziałem równoogoniastym .
- Zakładając, że średnia istnieje, wybierając przedział, dla którego średnia jest punktem środkowym.
Możliwe jest sformułowanie wyboru wiarygodnego przedziału w ramach teorii decyzji iw tym kontekście optymalny przedział zawsze będzie zbiorem o najwyższej gęstości prawdopodobieństwa.
Wiarygodne interwały można również oszacować za pomocą technik symulacyjnych, takich jak łańcuch Markowa Monte Carlo .
Kontrastuje z przedziałem ufności
Częsty 95% przedział ufności oznacza, że przy dużej liczbie powtarzanych próbek 95% tak obliczonych przedziałów ufności zawierałoby prawdziwą wartość parametru. W kategoriach częstości parametr jest stały (nie można uznać, że ma rozkład możliwych wartości), a przedział ufności jest losowy (ponieważ zależy od losowej próby).
Przedziały wiarygodności bayesowskiej mogą znacznie różnić się od częstościowych przedziałów ufności z dwóch powodów:
- wiarygodne przedziały obejmują informacje kontekstowe specyficzne dla problemu z wcześniejszej dystrybucji , podczas gdy przedziały ufności są oparte tylko na danych;
- wiarygodne przedziały i przedziały ufności traktują uciążliwe parametry na radykalnie różne sposoby.
W przypadku pojedynczego parametru i danych, które można podsumować w jednej wystarczającej statystyce , można wykazać, że przedział wiarygodności i przedział ufności będą się pokrywać, jeśli nieznany parametr jest parametrem lokalizacji (tj. funkcja prawdopodobieństwa przodu ma postać , z wcześniejszym rozkładem płaskim; a także jeśli nieznany parametr jest parametrem skali (tj. funkcja prawdopodobieństwa naprzód ma postać ), z wcześniejszym Jeffreysem - ten ostatni następuje, ponieważ logarytmowanie takiego parametru skali zamienia go w parametr lokalizacji o rozkładzie równomiernym. Są to jednak wyraźnie szczególne (choć ważne) przypadki; na ogół nie można dokonać takiej równoważności.
Dalsza lektura
- Morey, RD; Hoekstra, R.; Rouder, JN; Lee, doktor medycyny; Wagenmakers, E.-J. (2016). „Błąd polegający na zaufaniu do przedziałów ufności” . Biuletyn i przegląd psychonomiczny . 23 (1): 103–123. doi : 10.3758/s13423-015-0947-8 . PMC 4742505 . PMID 26450628 .