Statystyka V

Statystyki V to klasa statystyk nazwana na cześć Richarda von Misesa , który rozwinął swoją teorię rozkładu asymptotycznego w fundamentalnym artykule z 1947 r. Statystyki V są blisko spokrewnione ze statystykami U (U oznacza „ nieobciążony ”) wprowadzonymi przez Wassily'ego Hoeffdinga w 1948 r. Statystyka V to funkcja statystyczna (próby) zdefiniowana przez określony funkcjonał statystyczny rozkładu prawdopodobieństwa.

Funkcje statystyczne

które można przedstawić jako funkcjonały rozkładu empirycznego ( n ) Różniczkowalność funkcjonału T odgrywa kluczową rolę w podejściu von Misesa; dlatego von Mises rozważa różniczkowalne funkcjonały statystyczne .

Przykłady funkcji statystycznych

  1. K -ty centralny moment to funkcja } , gdzie jest oczekiwaną wartością X . Powiązaną funkcją statystyczną jest próba k -ty centralny moment,
  2. Statystyka chi-kwadrat dobroci dopasowania jest funkcją statystyczną T ( F n ), odpowiadającą funkcjonałowi statystycznemu
    gdzie A i to komórki k i pi to określone prawdopodobieństwa komórek w ramach hipotezy zerowej.
  3. Statystyki dobroci dopasowania Craméra -von-Misesa i Andersona-Darlinga oparte są na funkcji
    gdzie w ( x 00 ; F ) jest określoną funkcją wagi, a F jest określonym rozkładem zerowym. Jeśli w jest funkcją identyczności, to T ( Fn ) jest dobrze znaną statystyką dobroci dopasowania Craméra-von-Misesa ; jeśli fa n ) to Anderson - Darling Statystyczny.

Reprezentacja jako statystyka V

Załóżmy, że x 1 , ..., x n jest próbką. W typowych zastosowaniach funkcja statystyczna ma reprezentację jako statystyka V

gdzie h jest symetryczną funkcją jądra. Serfling omawia, jak znaleźć jądro w praktyce. V mn nazywamy statystyką V stopnia m .

Jądro symetryczne stopnia 2 jest funkcją h ( x , y ) taką, że h ( x , y ) = h ( y , x ) dla wszystkich x i y w dziedzinie h. Dla próbek x 1 , ..., x n zdefiniowana jest odpowiednia statystyka V

Przykład statystyki V

  1. Przykładem statystyki V stopnia 2 jest drugi moment centralny m 2 . Jeśli h ( x , y ) = ( x y ) 2 /2, odpowiednią statystyką V jest
    estymatorem największej wiarygodności wariancji . Przy tym samym jądrze odpowiednia statystyka U jest (nieobciążoną) wariancją próbki:
    .

Rozkład asymptotyczny

W przykładach 1–3 asymptotyczny rozkład statystyki jest inny: w (1) jest to rozkład normalny , w (2) chi-kwadrat , aw (3) jest to ważona suma zmiennych chi-kwadrat.

Podejście von Misesa jest jednoczącą teorią, która obejmuje wszystkie powyższe przypadki. Nieformalnie typ rozkładu asymptotycznego funkcji statystycznej zależy od rzędu „degeneracji”, który jest określony przez to, który składnik jest pierwszym niezerującym wyrazem w rozwinięciu Taylora funkcjonału T . W przypadku, gdy jest to składnik liniowy, rozkład graniczny jest normalny; w przeciwnym razie powstają typy rozkładów wyższego rzędu (w odpowiednich warunkach, takich jak centralne twierdzenie graniczne).

Istnieje hierarchia przypadków równoległa do asymptotycznej teorii statystyki U. Niech A ( m ) będzie właściwością zdefiniowaną przez:

A ( m ):
  1. Var( h ( X 1 , ..., X k )) = 0 dla k < m , i Var ( h ( X 1 , ..., X k )) > 0 dla k = m ;
  2. n m /2 R mn dąży do zera (w prawdopodobieństwie). ( R mn jest resztą z szeregu Taylora dla T .)

Przypadek m = 1 (jądro niezdegenerowane):

Jeśli A (1) jest prawdziwe, statystyka jest średnią z próby, a z centralnego twierdzenia granicznego wynika, że ​​T(Fn ) jest asymptotycznie normalne .

W przykładzie wariancji (4) m 2 jest asymptotycznie normalne ze średnią wariancją , gdzie .

Przypadek m = 2 (zdegenerowane jądro):

Załóżmy, że A (2) jest prawdziwe i i . Wtedy nV 2,n zbiega się w rozkładzie do sumy ważonej niezależnych zmiennych chi-kwadrat:

gdzie niezależnymi standardowymi zmiennymi normalnymi i od rozkładu F i T . W tym przypadku rozkład asymptotyczny nazywany jest kwadratową postacią wyśrodkowanych zmiennych losowych Gaussa . Statystyka V 2, n nazywana jest zdegenerowaną statystyką jądra V . Statystyka V powiązana z funkcjonałem Cramera-von Misesa (Przykład 3) jest przykładem zdegenerowanej statystyki V jądra.

Zobacz też

Notatki

  •   Hoeffding, W. (1948). „Klasa statystyk z asymptotycznie normalnym rozkładem” . Roczniki statystyki matematycznej . 19 (3): 293–325. doi : 10.1214/aoms/1177730196 . JSTOR 2235637 .
  •   Koroljuk VS; Borowskich, Yu.V. (1994). Theory of U -statistics (angielskie tłumaczenie PVMalysheva i DVMalysheva z wydania ukraińskiego z 1989 r.). Dordrecht: wydawcy akademiccy Kluwer. ISBN 0-7923-2608-3 .
  •   Lee, AJ (1990). U -Statystyka: teoria i praktyka . Nowy Jork: Marcel Dekker, Inc. ISBN 0-8247-8253-4 .
  • Neuhaus, G. (1977). „Funkcjonalne twierdzenia graniczne dla statystyk U w przypadku zdegenerowanym” . Dziennik analizy wielowymiarowej . 7 (3): 424–439. doi : 10.1016/0047-259X(77)90083-5 .
  •   Rosenblatt, M. (1952). „Twierdzenia graniczne związane z wariantami statystyki von Misesa” . Roczniki statystyki matematycznej . 23 (4): 617–623. doi : 10.1214/aoms/1177729341 . JSTOR 2236587 .
  •   Serfling, RJ (1980). Twierdzenia aproksymacyjne statystyki matematycznej . Nowy Jork: John Wiley & Sons. ISBN 0-471-02403-1 .
  • Taylor, RL; Daffer, PZ; Patterson, RF (1985). Twierdzenia graniczne dla sum wymiennych zmiennych losowych . New Jersey: Rowman i Allanheld.
  •   von Mises, R. (1947). „O asymptotycznym rozkładzie różniczkowalnych funkcji statystycznych” . Roczniki statystyki matematycznej . 18 (2): 309–348. doi : 10.1214/aoms/1177730385 . JSTOR 2235734 .