Średnia arytmetyczna
W matematyce i statystyce średnia arytmetyczna ( / ˌ æ r ɪ θ ˈ m ɛ t ɪ k ˈ m iː n / arr -ith- MET -ik ), średnia arytmetyczna lub po prostu średnia lub średnia (gdy kontekst jest jasny ) to suma zbioru liczb podzielona przez liczbę liczb w zbiorze. Kolekcja jest często zbiorem wyników eksperymentu , badania obserwacyjnego lub ankiety . Termin „średnia arytmetyczna” jest preferowany w niektórych kontekstach matematyki i statystyki, ponieważ pomaga odróżnić ją od innych rodzajów średnich, takich jak geometryczne i harmoniczne .
Oprócz matematyki i statystyki, średnia arytmetyczna jest często używana w ekonomii , antropologii , historii i prawie każdej dziedzinie akademickiej do pewnego stopnia. Na przykład dochód na mieszkańca to średni arytmetyczny dochód ludności danego kraju.
Chociaż średnia arytmetyczna jest często używana do zgłaszania tendencji centralnych , nie jest to solidna statystyka : duży wpływ na nią mają wartości odstające (wartości znacznie większe lub mniejsze niż większość innych). W przypadku rozkładów skośnych , takich jak rozkład dochodów, w przypadku których dochody kilku osób są znacznie wyższe niż dochody większości ludzi, średnia arytmetyczna może nie pokrywać się z pojęciem „środka”. W takim przypadku solidne statystyki, takie jak mediana , mogą zapewnić lepszy opis tendencji centralnej.
Definicja
Biorąc danych średnia arytmetyczna lub _ _ _ _ (czytaj bar ), jest średnią wartości n .
Średnia arytmetyczna jest najczęściej używaną i łatwo zrozumiałą miarą tendencji centralnej zbioru danych. W statystyce termin średnia odnosi się do dowolnego pomiaru tendencji centralnej. Średnia arytmetyczna zbioru zaobserwowanych danych jest równa sumie wartości liczbowych każdej obserwacji podzielonej przez całkowitą liczbę obserwacji. Symbolicznie, dla zbioru danych składającego się z wartości , średnia arytmetyczna jest zdefiniowana wzorem:
(Aby uzyskać wyjaśnienie operatora sumowania, zobacz sumowanie .)
miesięczne pracowników , to średnia arytmetyczna to:
Jeśli zbiór danych jest populacją statystyczną (tj. składa się z każdej możliwej obserwacji, a nie tylko ich podzbioru), wówczas średnia tej populacji nazywana jest średnią populacji i oznaczana grecką literą . Jeśli zbiór danych jest próbą statystyczną (podzbiorem populacji), nazywa się to z próby (która dla zbioru danych jest oznaczona jako ).
Średnią arytmetyczną można podobnie zdefiniować dla wektorów w wielu wymiarach, nie tylko wartości skalarnych ; jest to często określane jako środek ciężkości . Mówiąc bardziej ogólnie, ponieważ średnia arytmetyczna jest kombinacją wypukłą (co oznacza, że jej współczynniki sumują ), można ją zdefiniować w przestrzeni wypukłej , a nie tylko w przestrzeni wektorowej.
Właściwości motywujące
Średnia arytmetyczna ma kilka właściwości, które czynią ją interesującą, zwłaszcza jako miara tendencji centralnej. Obejmują one:
- mają średnią { , to . Ponieważ odległością od danej liczby do średniej, jednym ze sposobów interpretacji tej właściwości jest stwierdzenie, średnie są równoważone liczbami po prawej stronie. Średnia jest jedyną liczbą, dla której reszty (odchylenia od oszacowania) sumują się do zera. Można to również interpretować jako stwierdzenie, że średnia jest niezmienna translacyjnie w tym sensie, że dla dowolnej liczby rzeczywistej za x .
- zbioru znanych liczb arytmetyczna liczby robią to najlepiej, ponieważ minimalizują sumę kwadratów odchyleń od typowej wartości: suma . Średnia z próby jest również najlepszym pojedynczym predyktorem, ponieważ ma najniższy pierwiastek średniokwadratowego błędu . Jeśli pożądana jest średnia arytmetyczna populacji liczb, to jej oszacowanie, które jest nieobciążone , jest średnią arytmetyczną próby pobranej z populacji.
- Średnia arytmetyczna jest niezależna od skali jednostek miary w tym sensie, że Na przykład obliczenie średniej z litrów, a następnie przeliczenie na galony, jest tym samym, co przeliczenie najpierw na galony, a następnie obliczenie średniej. Nazywa się to również jednorodnością pierwszego rzędu .
Dodatkowe właściwości
- Średnia arytmetyczna próbki jest zawsze między największą a najmniejszą wartością w tej próbce.
- Średnia arytmetyczna dowolnej liczby równych grup liczbowych razem jest średnią arytmetyczną średnich arytmetycznych każdej grupy.
Porównaj z medianą
Średnia arytmetyczna może być skontrastowana z medianą . Mediana jest zdefiniowana w taki sposób, że nie więcej niż połowa wartości jest większa i nie więcej niż połowa jest od niej mniejsza. Jeśli elementy w danych zwiększają się arytmetycznie po umieszczeniu w jakiejś kolejności, to mediana i średnia arytmetyczna są sobie równe. Rozważmy na przykład próbkę danych. . Średnia wynosi , podobnie jak mediana. Jeśli jednak weźmiemy pod próbkę, której nie można ułożyć tak, aby zwiększała się arytmetycznie, na przykład { średnia może się znacznie różnić. W tym przypadku średnia arytmetyczna wynosi , podczas gdy mediana wynosi . Średnia wartość może się znacznie różnić od większości wartości w próbce i może być większa lub mniejsza niż większość.
Istnieją zastosowania tego zjawiska w wielu dziedzinach. Na przykład od lat 80. mediana dochodu w Stanach Zjednoczonych rosła wolniej niż średnia arytmetyczna dochodu.
Uogólnienia
Średnia ważona
Średnia ważona lub średnia ważona to średnia, w której niektóre punkty danych liczą się bardziej niż inne, ponieważ mają większą wagę w obliczeniach. Na przykład średnia arytmetyczna i wynosi lub równoważnie . Natomiast średnia ważona, w której pierwsza liczba ma na przykład dwa razy większą wagę niż druga (być może dlatego, że zakłada się, że występuje dwa razy częściej w populacji ogólnej, z której te liczby zostały pobrane), zostałaby obliczona jako . Tutaj wagi, które z konieczności sumują się do jednego, to ta dwukrotnie końcowy. Średnia arytmetyczna (czasami nazywana „średnią nieważoną” lub „średnią jednakowo ważoną”) może być interpretowana jako szczególny przypadek średniej ważonej, w której wszystkie wagi są równe tej samej liczbie ( 1 2 {\ displaystyle {\ w powyższym przykładzie sytuacji uśredniania liczb
Ciągłe rozkłady prawdopodobieństwa
Jeśli właściwość liczbowa i dowolna próbka danych z niej może przyjmować dowolną wartość z ciągłego zakresu zamiast, na przykład, tylko liczb całkowitych, to prawdopodobieństwo, że liczba mieści się w pewnym zakresie możliwych wartości, można opisać całkując ciągły rozkład prawdopodobieństwa w tym zakresie, nawet jeśli naiwne prawdopodobieństwo dla liczby próbek przyjmującej jedną pewną wartość z nieskończenie wielu wynosi zero. W tym kontekście odpowiednikiem średniej ważonej, w której istnieje nieskończenie wiele możliwości dokładnego określenia wartości zmiennej w każdym przedziale, nazywamy średnią rozkładu prawdopodobieństwa . Najszerzej spotykany rozkład prawdopodobieństwa nazywany jest rozkładem normalnym ; ma tę właściwość, że wszystkie miary jego tendencji centralnej, w tym nie tylko średnia, ale także wspomniana powyżej mediana i tryb (trzy M), są sobie równe. Ta równość nie obowiązuje dla innych rozkładów prawdopodobieństwa, jak pokazano tutaj dla rozkładu logarytmiczno-normalnego.
Kąty
kąty , należy zachować szczególną ostrożność . Biorąc średnią arytmetyczną 1° i 359°, otrzymujemy wynik 180 ° . Jest to błędne z dwóch powodów:
- do stałej addytywnej 360 ° ( lub , jeśli mierzy się radianach ) Tak więc można je łatwo nazwać 1° i -1° lub 361° i 719°, ponieważ każdy z nich daje inną średnią.
- Po drugie, w tej sytuacji 0 ° (lub 360 °) jest geometrycznie lepszą wartością średnią : jest wokół niej mniejsza dyspersja (punkty znajdują się zarówno 1 ° od tego, jak i 179 ° od 180 °, domniemanej średniej).
W powszechnym zastosowaniu takie przeoczenie doprowadzi do sztucznego przesunięcia wartości średniej w kierunku środka przedziału liczbowego. Rozwiązaniem tego problemu jest zastosowanie sformułowania optymalizacyjnego (to znaczy zdefiniowanie średniej jako punktu centralnego: punktu, wokół którego ma się najmniejszą dyspersję) i ponowne zdefiniowanie różnicy jako odległości modularnej (tj. odległości na okręgu: więc modułowa odległość między 1 ° a 359 ° wynosi 2 °, a nie 358 °).
Symbole i kodowanie
Średnia arytmetyczna jest często oznaczana kreską ( vinculum lub macron ), jak w .
Niektóre programy ( procesory tekstowe , przeglądarki internetowe ) mogą nieprawidłowo wyświetlać symbol „x̄”. Na przykład HTML „x̄” łączy w sobie dwa kody — literę podstawową „x” oraz kod dla wiersza powyżej (̄ lub ¯).
W niektórych formatach dokumentów (takich jak PDF ) symbol może zostać zastąpiony symbolem „¢” ( cent ) podczas kopiowania do edytora tekstu, takiego jak Microsoft Word .
Zobacz też
- oznacza Frécheta
- Średnia uogólniona
- Średnia geometryczna
- Średnia harmoniczna
- Nierówność średnich arytmetycznych i geometrycznych
- Próbka średnia i kowariancja
- Odchylenie standardowe
- Błąd standardowy średniej
- Statystyki podsumowujące
Dalsza lektura
- Huff, Darrell (1993). Jak kłamać ze statystykami . WWNorton. ISBN 978-0-393-31072-6 .
Linki zewnętrzne
- Obliczenia i porównania średniej arytmetycznej i średniej geometrycznej dwóch liczb
- Oblicz średnią arytmetyczną serii liczb na fxSolver