Metoda w statystyce
W statystyce metoda delta jest wynikiem przybliżonego rozkładu prawdopodobieństwa funkcji asymptotycznie normalnego estymatora statystycznego ze znajomości granicznej wariancji tego estymatora.
Historia
Metoda delta wywodzi się z propagacji błędu , a jej idea była znana na początku XIX wieku. Jego statystyczne zastosowanie można prześledzić już w 1928 roku przez TL Kelleya . Formalny opis metody przedstawił JL Doob w 1935 r. Robert Dorfman opisał również jej wersję w 1938 r.
Jednowymiarowa metoda delta
Podczas gdy metodę delta można łatwo uogólnić na ustawienie wielowymiarowe, staranne motywowanie techniki jest łatwiejsze do wykazania w kategoriach jednowymiarowych. Z grubsza, jeśli istnieje sekwencja zmiennych losowych X n satysfakcjonująca
gdzie θ i σ 2 są stałymi o skończonych wartościach i oznaczają zbieżność w rozkładzie , a następnie
dla dowolnej funkcji g spełniającej właściwość, że g′ ( θ ) istnieje i ma wartość niezerową.
Dowód w przypadku jednowymiarowym
Wykazanie tego wyniku jest dość proste przy założeniu, że g′ ( θ ) jest ciągłe . Na początek użyjemy twierdzenia o wartości średniej (tj. przybliżenia pierwszego rzędu szeregu Taylora za pomocą twierdzenia Taylora ):
gdzie między X n θ . _ że _ → a ponieważ g′ ( θ ) jest ciągłe, zastosowanie twierdzenia o ciągłym odwzorowaniu daje
gdzie oznacza zbieżność .
Zmiana kolejności terminów i pomnożenie przez daje
Od
z założenia wynika natychmiast z odwołania się do twierdzenia Słuckiego, że
To kończy dowód.
Dowód z wyraźnym porządkiem przybliżenia
Alternatywnie można dodać jeszcze jeden krok na końcu, aby uzyskać kolejność aproksymacji :
Sugeruje to, że błąd przybliżenia jest zbieżny do 0 w prawdopodobieństwie.
Wielowymiarowa metoda delta
Z definicji spójny estymator B jest zbieżny pod względem prawdopodobieństwa do swojej wartości prawdziwej β i często można zastosować centralne twierdzenie graniczne , aby uzyskać asymptotyczną normalność :
gdzie n to liczba obserwacji, a Σ to (symetryczna dodatnia półokreślona) macierz kowariancji. Załóżmy, że chcemy oszacować wariancję funkcji skalarnej h estymatora B . Zachowując tylko dwa pierwsze wyrazy szeregu Taylora i stosując notację wektorową dla gradientu , możemy oszacować h(B) jako
co implikuje, że wariancja h(B) wynosi w przybliżeniu
Można użyć twierdzenia o wartości średniej (dla funkcji wielu zmiennych o wartościach rzeczywistych), aby zobaczyć, że nie polega to na przyjęciu aproksymacji pierwszego rzędu.
Metoda delta implikuje zatem to
lub w kategoriach jednowymiarowych,
Przykład: proporcja dwumianowa
Załóżmy, że X n jest dwumianem z parametrami i n .
możemy zastosować metodę Delta z g ( θ ) = log ( θ ) , aby zobaczyć
, chociaż dla dowolnego , wariancja nie X n może , asymptotyczna
Zauważ, że ponieważ p > 0 , jako , więc z prawdopodobieństwem zbieżnym do jednego } skończony dla dużego n .
Ponadto, jeśli i są oszacowaniami różnych wskaźników grupowych z niezależnych próbek o rozmiarach { \ displaystyle { oszacowane ryzyko względne ma asymptotyczną wariancję równą
Jest to przydatne do skonstruowania testu hipotezy lub do wyznaczenia przedziału ufności dla względnego ryzyka.
Alternatywna forma
Metoda delta jest często używana w postaci, która jest zasadniczo identyczna z powyższą, ale bez założenia, że X n lub B jest asymptotycznie normalny. Często jedynym kontekstem jest to, że wariancja jest „mała”. Wyniki dają wtedy tylko przybliżenia średnich i kowariancji przekształconych wielkości. Na przykład formuły przedstawione w Klein (1953, s. 258) to:
gdzie h r jest r- tym elementem h ( B ) a B i jest i -tym elementem B .
Metoda delta drugiego rzędu
Gdy g′ ( θ ) = 0 nie można zastosować metody delta. Jednakże, jeśli g′′ ( θ ) istnieje i nie jest równe zeru, można zastosować metodę delta drugiego rzędu. Przez rozwinięcie Taylora , tak że wariancja zależy od sol czwarty moment .
dokładniejszego przybliżenia rozkładu, próby jest . Na przykład gdy ze standardowym rozkładem normalnym jako normalnej i chi-kwadrat o stopniu swobody równym 1.
Nieparametryczna metoda delta
Wersja metody delta istnieje w statystyce nieparametrycznej . Niech będzie niezależną zmienną losową o identycznym rozkładzie z próbką o rozmiarze funkcją rozkładu empirycznego i niech . Jeśli jest różniczkowalna Hadamarda względem metryki Czebyszewa , to
gdzie i , gdzie funkcję wpływu empirycznego dla . Nieparametryczny asymptotyczny przedział ufności dla jest więc przez
gdzie oznacza -kwantyl standardowej normalnej. Patrz Wasserman (2006) s. 19f. po szczegóły i przykłady.
Zobacz też
Dalsza lektura
Linki zewnętrzne