ranking

W statystyce rankingi zbioru danych to oczekiwane wartości statystyk porządkowych próbki ze standardowego rozkładu normalnego o tej samej wielkości co dane. Są one używane przede wszystkim w normalnym wykresie prawdopodobieństwa , graficznej technice testowania normalności .

Przykładowy wykres prawdopodobieństwa normalnego ; współrzędne osi poziomej to rangity.

Przykład

Być może najłatwiej będzie to zrozumieć na przykładzie. Jeśli iid składająca się z sześciu pozycji zostanie pobrana z populacji o rozkładzie normalnym o wartości oczekiwanej 0 i wariancji 1 ( standardowy rozkład normalny ), a następnie posortowana w kolejności rosnącej, oczekiwane wartości wynikowej statystyki uporządkowania są następujące:

−1,2672, −0,6418, −0,2016, 0,2016, 0,6418, 1,2672.

Załóżmy, że liczby w zbiorze danych są

65, 75, 16, 22, 43, 40.

Następnie można je posortować i ustawić w szeregu z odpowiednimi rankingami; w kolejności są

16, 22, 40, 43, 65, 75,

co daje punkty:

punkt danych ranga
16 −1,2672
22 −0,6418
40 −0.2016
43 0.2016
65 0,6418
75 1,2672

Punkty te są następnie wykreślane jako pionowe i poziome współrzędne wykresu punktowego .

Alternatywna metoda

Alternatywnie, zamiast sortować punkty danych, można je uszeregować i odpowiednio zmienić kolejność rankingów. Daje to te same pary liczb, ale w innej kolejności.

Dla:

65, 75, 16, 22, 43, 40,

odpowiednie stopnie to:

5, 6, 1, 2, 4, 3,

tj. liczba pojawiająca się jako pierwsza jest piątą najmniejszą, liczba pojawiająca się jako druga jest szóstą najmniejszą, liczba pojawiająca się jako trzecia jest najmniejsza, liczba pojawiająca się jako czwarta jest drugą najmniejszą itd. Odpowiednio zmienia się oczekiwane statystyki porządku normalnego, otrzymując rankingi tego zestawu danych:

punkt danych ranga ranga
65 5 0,6418
75 6 1,2672
16 1 −1,2672
22 2 −0,6418
43 4 0.2016
40 3 −0.2016

Fabuła Rankita

Wykres przedstawiający rankingi na osi poziomej i punkty danych na osi pionowej nazywany jest wykresem rankingowym lub wykresem normalnego prawdopodobieństwa . Taki wykres jest z konieczności niemalejący. W dużych próbach z populacji o rozkładzie normalnym taki wykres będzie przybliżał linię prostą. Znaczne odchylenia od prostoliniowości są uważane za dowód przeciwko normalności rozkładu.

Wykresy Rankita są zwykle używane do wizualnego zademonstrowania, czy dane pochodzą z określonego rozkładu prawdopodobieństwa .

Wykres rangitów jest rodzajem wykresu Q – Q – przedstawia statystyki kolejności (kwantyle) próby względem określonych kwantyli (rankytów) zakładanego rozkładu normalnego. Wykresy Q – Q mogą jednak wykorzystywać inne kwantyle do rozkładu normalnego.

Historia

Wykres rankit i słowo rankit zostały wprowadzone przez biologa i statystyka Chestera Ittnera Blissa (1899–1979).

Zobacz też

Linki zewnętrzne