Prawie pewne testowanie hipotez
W statystyce prawie pewne testowanie hipotez lub testowanie hipotez wykorzystuje prawie pewną zbieżność w celu określenia ważności hipotezy statystycznej z prawdopodobieństwem jeden. Oznacza to, że ilekroć hipoteza zerowa jest prawdziwa, wówczas test hipotezy as nie odrzuci hipotezy zerowej wp 1 dla wszystkich wystarczająco dużych próbek. Podobnie, ilekroć hipoteza alternatywna jest prawdziwa, test jako hipotezy odrzuci hipotezę zerową z prawdopodobieństwem jeden dla wszystkich wystarczająco dużych próbek. Podobnie przedział ufności as ostatecznie zawiera interesujący nas parametr z prawdopodobieństwem 1. Dembo i Peres (1994) udowodnili istnienie prawie pewnych testów hipotez.
Opis
Dla uproszczenia załóżmy, że mamy sekwencję niezależnych i identycznie rozłożonych normalnych zmiennych losowych, \ i wariancja jednostek. Załóżmy, że natura lub symulacja wybrały prawdziwą średnią na to funkcja rozkładu prawdopodobieństwa średniej jest dana przez
gdzie zastosowano zamek Iverson . Naiwnym podejściem do oszacowania zastąpienie prawdziwej średniej po prawej stronie oszacowaniem, takim jak średnia próbki ale
co oznacza, że przybliżenie do prawdziwej funkcji rozkładu będzie się różnić o 0,5 przy prawdziwej średniej. Jednak niż jednostronny bardziej ogólnie, niech wartością krytyczną używaną w jednostronnym wtedy przedział ufności
Jeśli ustawimy to błąd przybliżenia zmniejszy się z 0,5 do 0,05, co stanowi współczynnik 10. , więc
Jednak to tylko pokazuje, że oczekiwanie jest bliskie wartości granicznej. Naaman (2016) wykazał, że ustawienie poziomu istotności na z wynikami w skończonej liczbie błędów typu I i typu II wp1 w dość łagodnych warunkach regularności. Oznacza to, że dla każdego istnieje , takie, że dla wszystkich ,
gdzie równość zachodzi wp 1. Tak więc funkcja wskaźnika jednostronnego przedziału ufności jest dobrym przybliżeniem prawdziwej funkcji rozkładu.
Aplikacje
Opcjonalne zatrzymanie
Załóżmy na przykład, że badacz przeprowadził eksperyment na próbie o wielkości 10 i nie znalazł statystycznie istotnego wyniku. Następnie załóżmy, że postanowiła dodać jeszcze jedną obserwację i ponownie przetestować ten proces, aż do uzyskania znaczącego wyniku. że eksperyment zostanie zatrzymany przy jakiejś skończonej wielkości próby, ograniczyć za pomocą nierówności Boole'a
gdzie . Wypada to korzystnie w porównaniu z testowaniem na ustalonym poziomie istotności, które ma skończony czas zatrzymania z prawdopodobieństwem jeden; jednak ta granica nie będzie miała znaczenia dla wszystkich sekwencji o poziomie istotności, ponieważ powyższa suma może być większa niż jeden (ustawienie byłoby \ być jednym z przykładów). Ale nawet przy tej przepustowości, jeśli testy przeprowadzono w partiach po 10, to
co skutkuje stosunkowo dużym prawdopodobieństwem, że proces ten nigdy się nie zakończy.
Stronniczość publikacji
Jako kolejny przykład siły tego podejścia, jeśli czasopismo akademickie akceptuje tylko artykuły z wartościami p mniejszymi niż 0,05, to mniej więcej 1 na 20 niezależnych badań o tym samym efekcie znalazłoby znaczący wynik, gdy go nie było. Jeśli a maksymalny poziom istotności jest określony wzorem to można by się spodziewać mniej w 250 badaniach znalazłoby efekt, gdy go nie było (jeśli minimalna wielkość próby wynosiła 30, nadal wynosiłaby 1 na 60). Jeśli maksymalny poziom istotności został podany przez dla małych próbek w odniesieniu do błędu typu I, obaw), można by oczekiwać, że mniej więcej 1 na 10000 badań przyniesie efekt, gdy go nie będzie (jeśli minimalna wielkość próby wynosiłaby 30, byłby to 1 na 900). Ponadto testowanie hipotez AS jest odporne na wielokrotne porównania.
Paradoks Jeffreysa-Lindleya
Paradoks Lindleya występuje, gdy
- Wynik jest „znaczący” w teście częstości, na przykład na poziomie 5%, co wskazuje na wystarczające dowody, aby odrzucić hipotezę zerową, oraz
- Późniejsze prawdopodobieństwo hipotezy zerowej jest wysokie, co wskazuje na mocne dowody na to, że hipoteza zerowa jest lepiej zgodna z danymi niż hipoteza alternatywna.
Paradoks ten nie dotyczy jednak testów hipotez. Badacz bayesowski i bywalca ostatecznie dojdą do tego samego wniosku.
Zobacz też
- Naaman, Michael (2016). „Prawie pewne testowanie hipotez i rozwiązanie paradoksu Jeffreysa – Lindleya”. Elektroniczny Dziennik Statystyczny . 10 (1): 1526–1550.
- Dembo, Amir; Peres, Yuval (1994). „Topologiczne kryterium testowania hipotez”. Roczniki statystyki . 22 (1): 106–117.