Prawdopodobieństwo empiryczne
Empiryczne prawdopodobieństwo , względna częstość lub eksperymentalne prawdopodobieństwo zdarzenia to stosunek liczby wyników , w których występuje określone zdarzenie, do całkowitej liczby prób, nie w teoretycznej przestrzeni próbki, ale w rzeczywistym eksperymencie. Mówiąc bardziej ogólnie, prawdopodobieństwo empiryczne szacuje prawdopodobieństwa na podstawie doświadczenia i obserwacji .
Biorąc pod uwagę zdarzenie A w przestrzeni próbki, względna częstość A to stosunek m/n , gdzie m to liczba wyników, w których zachodzi zdarzenie A , a n to całkowita liczba wyników eksperymentu.
W ujęciu statystycznym prawdopodobieństwo empiryczne jest oszacowaniem lub estymatorem prawdopodobieństwa. W prostych przypadkach, gdy wynik próby decyduje tylko o tym, czy określone zdarzenie miało miejsce, odpowiednie może być modelowanie przy użyciu rozkładu dwumianowego , a wtedy oszacowanie empiryczne jest oszacowaniem maksymalnego prawdopodobieństwa . Jest to oszacowanie bayesowskie dla tego samego przypadku, jeśli przyjmuje się pewne założenia dotyczące wcześniejszego rozkładu prawdopodobieństwa. Jeśli próba daje więcej informacji, prawdopodobieństwo empiryczne można poprawić, przyjmując dalsze założenia w postaci modelu statystycznego : jeśli taki model jest dopasowany, można go wykorzystać do oszacowania prawdopodobieństwa określonego zdarzenia
Zalety i wady
Zalety
Zaletą szacowania prawdopodobieństw za pomocą prawdopodobieństw empirycznych jest to, że ta procedura jest stosunkowo wolna od założeń.
Rozważmy na przykład oszacowanie prawdopodobieństwa wśród populacji mężczyzn, że spełnią oni dwa warunki:
- że mają ponad 6 stóp wysokości.
- że wolą dżem truskawkowy od dżemu malinowego.
Bezpośrednie oszacowanie można znaleźć, licząc liczbę mężczyzn spełniających oba warunki, aby uzyskać empiryczne prawdopodobieństwo złożonego warunku. Alternatywne oszacowanie można znaleźć, mnożąc odsetek mężczyzn, którzy mają ponad 6 stóp wzrostu, przez odsetek mężczyzn, którzy wolą dżem truskawkowy od dżemu malinowego, ale oszacowanie to opiera się na założeniu, że te dwa warunki są statystycznie niezależne .
Niedogodności
Wadą korzystania z prawdopodobieństw empirycznych jest szacowanie prawdopodobieństw, które są albo bardzo bliskie zeru, albo bardzo bliskie jedności. W takich przypadkach potrzebne byłyby bardzo duże rozmiary próbek w celu oszacowania takich prawdopodobieństw z dobrym standardem względnej dokładności. Tutaj modele statystyczne mogą pomóc, w zależności od kontekstu, i ogólnie można mieć nadzieję, że takie modele zapewnią poprawę dokładności w porównaniu z prawdopodobieństwem empirycznym, pod warunkiem, że przyjęte założenia faktycznie się sprawdzą.
Rozważmy na przykład oszacowanie prawdopodobieństwa, że najniższa z dziennych maksymalnych temperatur w danym miejscu w lutym w dowolnym roku będzie niższa od zera stopni Celsjusza. Do oszacowania tego prawdopodobieństwa można wykorzystać zapis takich temperatur w ostatnich latach. Alternatywą opartą na modelu byłoby wybranie rodziny rozkładów prawdopodobieństwa i dopasowanie jej do zbioru danych zawierającego wartości z poprzednich lat. Dopasowany rozkład zapewniłby alternatywne oszacowanie pożądanego prawdopodobieństwa. Ta alternatywna metoda może zapewnić oszacowanie prawdopodobieństwa, nawet jeśli wszystkie wartości w rekordzie są większe od zera.
Nomenklatura mieszana
Wyrażenie prawdopodobieństwo a-posteriori jest również używane jako alternatywa dla prawdopodobieństwa empirycznego lub częstotliwości względnej. Użycie wyrażenia „a-posteriori” przypomina terminy stosowane w statystyce bayesowskiej , ale nie jest bezpośrednio związane z wnioskowaniem bayesowskim , gdzie prawdopodobieństwo a-posteriori jest czasami używane w odniesieniu do prawdopodobieństwa późniejszego , które jest inne, mimo że ma myląco podobna nazwa.
Termin prawdopodobieństwo a-posteriori , w znaczeniu równoważnym z prawdopodobieństwem empirycznym , może być używany w połączeniu z prawdopodobieństwem a priori , które reprezentuje oszacowanie prawdopodobieństwa nie oparte na żadnych obserwacjach, ale oparte na rozumowaniu dedukcyjnym .