Średnia międzykwartylowa

Średnia międzykwartylowa (IQM) (lub średnia ) to statystyczna miara tendencji centralnej oparta na średniej obciętej rozstępu międzykwartylowego . IQM jest bardzo podobny do metody punktacji stosowanej w sporcie, która jest oceniana przez panel sędziów: odrzuć najniższe i najwyższe wyniki; obliczyć średnią wartość pozostałych wyników .

Obliczenie

Przy obliczaniu IQM wykorzystywane są tylko dane między pierwszym a trzecim kwartylem , a najniższe 25% i najwyższe 25% danych jest odrzucane.

zakładając, że wartości zostały uporządkowane.

Przykłady

Rozmiar zbioru danych podzielny przez cztery

Metodę najlepiej wyjaśnić na przykładzie. Rozważ następujący zestaw danych:

5, 8, 4, 38, 8, 6, 9, 7, 7, 3, 1, 6

Najpierw posortuj listę od najniższej do najwyższej:

1, 3, 4, 5, 6, 6, 7, 7, 8, 8, 9, 38

W zbiorze danych jest 12 obserwacji (punktów danych), więc mamy 4 kwartyle po 3 liczby. Odrzuć najniższą i najwyższą 3 wartości:

1, 3, 4 , 5, 6, 6, 7, 7, 8, 8, 9, 38

Pozostało nam teraz 6 z 12 obserwacji; następnie obliczamy średnią arytmetyczną tych liczb:

x IQM = (5 + 6 + 6 + 7 + 7 + 8) / 6 = 6,5

To jest średnia międzykwartylowa.

Dla porównania, średnia arytmetyczna oryginalnego zbioru danych wynosi

(5 + 8 + 4 + 38 + 8 + 6 + 9 + 7 + 7 + 3 + 1 + 6) / 12 = 8,5

ze względu na silny wpływ wartości odstającej, 38.

Rozmiar zbioru danych niepodzielny przez cztery

Powyższy przykład składał się z 12 obserwacji w zbiorze danych, co bardzo ułatwiło wyznaczenie kwartyli. Oczywiście nie wszystkie zbiory danych mają liczbę obserwacji podzielną przez 4. Możemy dostosować metodę obliczania IQM, aby to uwzględnić. Idealnie więc chcemy mieć IQM równy średniej dla rozkładów symetrycznych, np.:

1, 2, 3, 4, 5

ma wartość średnią x średnia = 3, a ponieważ jest to rozkład symetryczny, pożądane byłoby x IQM = 3.

Możemy to rozwiązać, używając średniej ważonej kwartyli i zbioru danych międzykwartylowych:

Rozważmy następujący zestaw danych z 9 obserwacjami:

1, 3, 5, 7, 9, 11, 13, 15, 17

W każdym kwartylu jest 9/4 = 2,25 obserwacji i 4,5 obserwacji w rozstępie międzykwartylowym. Skróć ułamkowy rozmiar kwartyla i usuń tę liczbę z 1. i 4. kwartyla (2,25 obserwacji w każdym kwartylu, a zatem usunięto 2 najniższe i 2 najwyższe).

1, 3 , (5), 7, 9, 11, (13), 15, 17

Zatem są 3 pełne obserwacje w przedziale międzykwartylowym i 2 obserwacje ułamkowe. Ponieważ mamy w sumie 4,5 obserwacji w przedziale międzykwartylowym, każda z dwóch obserwacji ułamkowych liczy się jako 0,75 (a zatem 3 × 1 + 2 × 0,75 = 4,5 obserwacji).

IQM jest teraz obliczany w następujący sposób:

x IQM = {(7 + 9 + 11) + 0,75 × (5 + 13)} / 4,5 = 9

W powyższym przykładzie średnia ma wartość x średnia = 9. Taka sama jak IQM, zgodnie z oczekiwaniami. Metoda obliczania IQM dla dowolnej liczby obserwacji jest analogiczna; ułamkowe składki na IQM mogą wynosić 0, 0,25, 0,50 lub 0,75.

Porównanie ze średnią i medianą

Średnia międzykwartylowa ma pewne właściwości zarówno średniej, jak i mediany :

  • Podobnie jak mediana , IQM jest niewrażliwy na wartości odstające ; w podanym przykładzie najwyższa wartość (38) była oczywistą wartością odstającą w zbiorze danych, ale jej wartość nie jest wykorzystywana do obliczania IQM. Z drugiej strony wspólna średnia ( średnia arytmetyczna ) jest wrażliwa na te wartości odstające: średnia x = 8,5.
  • Podobnie jak średnia , IQM jest odrębnym parametrem, opartym na dużej liczbie obserwacji ze zbioru danych. Mediana jest zawsze równa jednej z obserwacji w zbiorze danych (przy założeniu nieparzystej liczby obserwacji) . Średnia może być równa dowolnej wartości między najniższą a najwyższą obserwacją, w zależności od wartości wszystkich innych obserwacji. IQM może być równa dowolnej wartości między pierwszym a trzecim kwartylem, w zależności od wszystkich obserwacji w przedziale międzykwartylnym.

Zobacz też

Powiązane statystyki

Aplikacje