Rozkład Behrensa-Fisher'a

W statystyce rozkład Behrensa – Fishera , nazwany na cześć Ronalda Fishera i Waltera Behrensa , to sparametryzowana rodzina rozkładów prawdopodobieństwa wynikająca z rozwiązania problemu Behrensa – Fishera zaproponowanego najpierw przez Behrensa, a kilka lat później przez Fishera. Problem Behrensa-Fishera polega na wnioskowaniu statystycznym dotyczącym różnicy między średnimi dwóch populacji o rozkładzie normalnym , gdy stosunek ich wariancji nie jest znany (aw szczególności nie wiadomo, czy ich wariancje są równe).

Definicja

Rozkład Behrensa – Fishera to rozkład zmiennej losowej postaci

gdzie T 1 i T 2 niezależnymi zmiennymi losowymi , każda z rozkładem t- Studenta , z odpowiednimi stopniami swobody ν 1 = n 1 - 1 i ν 2 = n 2 - 1, a θ jest stałą. Zatem rodzina rozkładów Behrensa-Fishera jest sparametryzowana przez ν 1 , ν 2 i θ .

Pochodzenie

Załóżmy, że wiadomo, że dwie wariancje populacji są równe, a próbki o rozmiarach n 1 i n 2 są pobierane z dwóch populacji:

gdzie „iid” to niezależne zmienne losowe o identycznym rozkładzie, a N oznacza rozkład normalny . Dwa przykładowe średnie to

Zwykłe „ połączone nieobciążone oszacowanie wspólnej wariancji σ 2 jest wtedy równe

gdzie S 1 2 i S 2 2 są zwykłymi nieobciążonymi ( skorygowanymi Besselem ) oszacowaniami dwóch wariancji populacji.

Przy tych założeniach kluczowa ilość

ma rozkład t z n 1 + n 2 − 2 stopniami swobody . W związku z tym można znaleźć przedział ufności dla μ 2 μ 1 , którego punkty końcowe to

gdzie A jest odpowiednim kwantylem rozkładu t.

Jednak w problemie Behrensa – Fishera nie wiadomo, czy dwie wariancje populacji są równe, ani nie jest znany ich stosunek. Fisher uważał [ potrzebne źródło ] za kluczową wielkość

Można to zapisać jako

Gdzie

są zwykłymi statystykami t dla jednej próby i

i przyjmuje się, że θ znajduje się w pierwszej ćwiartce. Szczegóły algebraiczne są następujące:

Fakt, że suma kwadratów wyrażeń w nawiasach powyżej wynosi 1, oznacza, że ​​są to cosinus do kwadratu i sinus do kwadratu pewnego kąta.

Rozkład Behrena – Fishera jest w rzeczywistości rozkładem warunkowym wielkości (1) powyżej, biorąc pod uwagę wartości wielkości oznaczonych cos θ i grzech θ . W efekcie warunki Fishera dotyczące informacji pomocniczych .

Fisher następnie znalazł „ przedział odniesienia ”, którego punkty końcowe są

gdzie A jest odpowiednim punktem procentowym rozkładu Behrensa – Fishera. Fisher twierdził [ potrzebne źródło ] , że prawdopodobieństwo, że μ 2 - μ 1 znajduje się w tym przedziale, biorąc pod uwagę dane (ostatecznie X s), jest prawdopodobieństwem, że zmienna losowa o rozkładzie Behrensa-Fishera mieści się między - A i A .

Przedziały odniesienia a przedziały ufności

Bartlett [ potrzebne źródło ] wykazał, że ten „przedział odniesienia” nie jest przedziałem ufności, ponieważ nie ma stałego współczynnika pokrycia. Fisher nie uważał tego za przekonujący sprzeciw wobec użycia odstępu czasu. [ potrzebne źródło ]


Dalsza lektura

  •   Kendall, Maurice G., Stuart, Alan (1973) Zaawansowana teoria statystyki, tom 2: Wnioskowanie i relacje, wydanie 3 , Griffin. ISBN 0-85264-215-6 (rozdział 21)