ranking
W statystyce rankingi zbioru danych to oczekiwane wartości statystyk porządkowych próbki ze standardowego rozkładu normalnego o tej samej wielkości co dane. Są one używane przede wszystkim w normalnym wykresie prawdopodobieństwa , graficznej technice testowania normalności .
Przykład
Być może najłatwiej będzie to zrozumieć na przykładzie. Jeśli iid składająca się z sześciu pozycji zostanie pobrana z populacji o rozkładzie normalnym o wartości oczekiwanej 0 i wariancji 1 ( standardowy rozkład normalny ), a następnie posortowana w kolejności rosnącej, oczekiwane wartości wynikowej statystyki uporządkowania są następujące:
- −1,2672, −0,6418, −0,2016, 0,2016, 0,6418, 1,2672.
Załóżmy, że liczby w zbiorze danych są
- 65, 75, 16, 22, 43, 40.
Następnie można je posortować i ustawić w szeregu z odpowiednimi rankingami; w kolejności są
- 16, 22, 40, 43, 65, 75,
co daje punkty:
punkt danych | ranga |
---|---|
16 | −1,2672 |
22 | −0,6418 |
40 | −0.2016 |
43 | 0.2016 |
65 | 0,6418 |
75 | 1,2672 |
Punkty te są następnie wykreślane jako pionowe i poziome współrzędne wykresu punktowego .
Alternatywna metoda
Alternatywnie, zamiast sortować punkty danych, można je uszeregować i odpowiednio zmienić kolejność rankingów. Daje to te same pary liczb, ale w innej kolejności.
Dla:
- 65, 75, 16, 22, 43, 40,
odpowiednie stopnie to:
- 5, 6, 1, 2, 4, 3,
tj. liczba pojawiająca się jako pierwsza jest piątą najmniejszą, liczba pojawiająca się jako druga jest szóstą najmniejszą, liczba pojawiająca się jako trzecia jest najmniejsza, liczba pojawiająca się jako czwarta jest drugą najmniejszą itd. Odpowiednio zmienia się oczekiwane statystyki porządku normalnego, otrzymując rankingi tego zestawu danych:
punkt danych | ranga | ranga |
---|---|---|
65 | 5 | 0,6418 |
75 | 6 | 1,2672 |
16 | 1 | −1,2672 |
22 | 2 | −0,6418 |
43 | 4 | 0.2016 |
40 | 3 | −0.2016 |
Fabuła Rankita
Wykres przedstawiający rankingi na osi poziomej i punkty danych na osi pionowej nazywany jest wykresem rankingowym lub wykresem normalnego prawdopodobieństwa . Taki wykres jest z konieczności niemalejący. W dużych próbach z populacji o rozkładzie normalnym taki wykres będzie przybliżał linię prostą. Znaczne odchylenia od prostoliniowości są uważane za dowód przeciwko normalności rozkładu.
Wykresy Rankita są zwykle używane do wizualnego zademonstrowania, czy dane pochodzą z określonego rozkładu prawdopodobieństwa .
Wykres rangitów jest rodzajem wykresu Q – Q – przedstawia statystyki kolejności (kwantyle) próby względem określonych kwantyli (rankytów) zakładanego rozkładu normalnego. Wykresy Q – Q mogą jednak wykorzystywać inne kwantyle do rozkładu normalnego.
Historia
Wykres rankit i słowo rankit zostały wprowadzone przez biologa i statystyka Chestera Ittnera Blissa (1899–1979).
Zobacz też
- probitowa opracowana przez CI Bliss w 1934 roku.