Wiarygodny interwał

W statystyce bayesowskiej wiarygodny przedział to przedział , w którym nieobserwowana wartość parametru mieści się z określonym prawdopodobieństwem . Jest to przedział w dziedzinie późniejszego rozkładu prawdopodobieństwa lub rozkładu predykcyjnego . Uogólnienie na problemy wielowymiarowe to region wiarygodny .

Wiarygodne przedziały są analogiczne do przedziałów ufności i regionów ufności w statystyce częstości , chociaż różnią się pod względem filozoficznym: przedziały bayesowskie traktują swoje granice jako stałe, a oszacowany parametr jako zmienną losową, podczas gdy częstościowe przedziały ufności traktują swoje granice jako zmienne losowe, a parametr jako stałą wartość. Ponadto wiarygodne przedziały bayesowskie wykorzystują (i rzeczywiście wymagają) wiedzę na temat rozkładu wcześniejszego specyficznego dla sytuacji , podczas gdy częstościowe przedziały ufności nie.

Na przykład w eksperymencie, który określa rozkład możliwych wartości parametru jeśli subiektywne prawdopodobieństwo , że między 35 a 45, wynosi 0,95 to 95% wiarygodny przedział.

Wybór wiarygodnego interwału

Wiarygodne przedziały nie są unikalne w dystrybucji późniejszej. Metody definiowania odpowiedniego wiarygodnego przedziału obejmują:

  • Wybór najwęższego przedziału, który dla rozkładu unimodalnego będzie polegał na wybraniu wartości o największej gęstości prawdopodobieństwa uwzględniając modę ( maksimum a posteriori ). Nazywa się to czasem najwyższym tylnym przedziałem gęstości (HPDI).
  • Wybór przedziału, w którym prawdopodobieństwo znalezienia się poniżej przedziału jest równie prawdopodobne, jak znalezienie się powyżej niego. Ten przedział będzie zawierał medianę . Nazywa się to czasem przedziałem równoogoniastym .
  • Zakładając, że średnia istnieje, wybierając przedział, dla którego średnia jest punktem środkowym.

Możliwe jest sformułowanie wyboru wiarygodnego przedziału w ramach teorii decyzji iw tym kontekście optymalny przedział zawsze będzie zbiorem o najwyższej gęstości prawdopodobieństwa.

Wiarygodne interwały można również oszacować za pomocą technik symulacyjnych, takich jak łańcuch Markowa Monte Carlo .

Kontrastuje z przedziałem ufności

Częsty 95% przedział ufności oznacza, że ​​przy dużej liczbie powtarzanych próbek 95% tak obliczonych przedziałów ufności zawierałoby prawdziwą wartość parametru. W kategoriach częstości parametr jest stały (nie można uznać, że ma rozkład możliwych wartości), a przedział ufności jest losowy (ponieważ zależy od losowej próby).

Przedziały wiarygodności bayesowskiej mogą znacznie różnić się od częstościowych przedziałów ufności z dwóch powodów:

  • wiarygodne przedziały obejmują informacje kontekstowe specyficzne dla problemu z wcześniejszej dystrybucji , podczas gdy przedziały ufności są oparte tylko na danych;
  • wiarygodne przedziały i przedziały ufności traktują uciążliwe parametry na radykalnie różne sposoby.

  W przypadku pojedynczego parametru i danych, które można podsumować w jednej wystarczającej statystyce , można wykazać, że przedział wiarygodności i przedział ufności będą się pokrywać, jeśli nieznany parametr jest parametrem lokalizacji (tj. funkcja prawdopodobieństwa przodu ma postać , z wcześniejszym rozkładem płaskim; a także jeśli nieznany parametr jest parametrem skali (tj. funkcja prawdopodobieństwa naprzód ma postać ), z wcześniejszym Jeffreysem - ten ostatni następuje, ponieważ logarytmowanie takiego parametru skali zamienia go w parametr lokalizacji o rozkładzie równomiernym. Są to jednak wyraźnie szczególne (choć ważne) przypadki; na ogół nie można dokonać takiej równoważności.

Dalsza lektura