Kluczowa ilość
W statystyce wielkość kluczowa lub oś jest funkcją obserwacji i nieobserwowalnych parametrów, tak że rozkład prawdopodobieństwa tej funkcji nie zależy od nieznanych parametrów (w tym parametrów uciążliwych ). Wielkość przestawna nie musi być statystyką — funkcja i jej wartość mogą zależeć od parametrów modelu, ale jej rozkład nie może. Jeśli jest to statystyka, nazywa się ją statystyką pomocniczą .
Bardziej formalnie, niech będzie losową próbką z rozkładu to zależy od parametrów) . Niech zmienną losową . Następnie nazywa się wielkością kluczową lub po prostu ) .
Wielkości kluczowe są powszechnie używane do normalizacji , aby umożliwić porównanie danych z różnych zbiorów danych. Stosunkowo łatwo jest skonstruować przeguby dla parametrów lokalizacji i skali: w pierwszym przypadku tworzymy różnice tak, że lokalizacja się znosi, w przypadku drugich współczynniki tak, że skala się znosi.
Wielkości kluczowe mają fundamentalne znaczenie przy konstruowaniu statystyk testowych , ponieważ pozwalają na niezależność statystyki od parametrów – na przykład statystyka t-Studenta dotyczy rozkładu normalnego z nieznaną wariancją (i średnią). Zapewniają one także jedną z metod konstruowania przedziałów ufności , a użycie wielkości kluczowych poprawia wydajność metody ładowania początkowego . W formie statystyk pomocniczych można je wykorzystać do konstruowania częstościowych przedziałów predykcji (predykcyjnych przedziałów ufności).
Przykłady
Normalna dystrybucja
Jedną z najprostszych wielkości kluczowych jest wynik z ; biorąc uwagę rozkład normalny ze średnią wariancją obserwacją x, wynik z: μ {\ displaystyle \
ma rozkład - rozkład normalny ze średnią 0 i wariancją 1. Podobnie, ponieważ średnia próbki z n -próbki ma rozkład próbkowania wynik Z średniej
ma również rozkład , że chociaż funkcje te zależą od parametrów - a zatem można je obliczyć tylko wtedy, gdy parametry są znane (nie są to statystyki) - rozkład jest niezależny od parametrów.
Biorąc , identycznie rozłożone (iid) obserwacje z rozkładu normalnego o nieznanej średniej wariancji , wielkość kluczową można otrzymać funkcji: μ {
Gdzie
I
bezstronnymi szacunkami odpowiednio i Funkcja jest statystyką t-Studenta dla nowej wartości ma zostać wylosowana z tej samej populacji, co już zaobserwowany zbiór wartości .
Używając kluczową, która jest również rozdzielana przez -Studenta z \ . razie potrzeby, chociaż pojawia się jako argument funkcji , rozkład od parametrów normalnego rozkładu prawdopodobieństwa, który rządzi obserwacjami, lub .
Można to wykorzystać do obliczenia przedziału predykcji dla następnej obserwacji patrz Przedział przewidywania: rozkład normalny .
Dwuwymiarowy rozkład normalny
W bardziej skomplikowanych przypadkach nie da się skonstruować dokładnych czopów. Jednak posiadanie przybliżonych osi poprawia zbieżność do asymptotycznej normalności .
próbka wektorów o została pobrana z dwuwymiarowego rozkładu normalnego nieznanej korelacji .
Estymatorem jest korelacja próbki (Pearsona, moment)
gdzie są przykładowymi wariancjami i . s \ Y Przykładowa statystyka ma asymptotycznie rozkład normalny:
- .
Jednakże transformacja stabilizująca wariancję
znana jako transformacja Fishera z współczynnika korelacji, umożliwia utworzenie rozkładu asymptotycznie niezależnego od nieznanych parametrów:
gdzie jest odpowiednim parametrem rozkładu próbek o skończonych rozmiarach miała bliższy normalnemu niż . Jeszcze bliższe przybliżenie standardowego rozkładu normalnego uzyskuje się, stosując lepsze przybliżenie dokładnej wariancji: zwykła postać to
Krzepkość
Z punktu widzenia solidnej statystyki wielkości kluczowe są odporne na zmiany parametrów – w istocie niezależne od parametrów – ale ogólnie nie są odporne na zmiany w modelu, takie jak naruszenia założenia normalności. Ma to fundamentalne znaczenie dla zdecydowanej krytyki niezbyt solidnych statystyk, często wyprowadzanych z kluczowych wielkości: takie statystyki mogą być solidne w obrębie rodziny, ale nie są solidne poza nią.