Empiryczne prawa statystyczne
Empiryczne prawo statystyczne lub (w popularnej terminologii) prawo statystyki reprezentuje typ zachowania, który został znaleziony w wielu zbiorach danych, a nawet w wielu typach zestawów danych. Wiele z tych obserwacji zostało sformułowanych i udowodnionych jako twierdzenia statystyczne lub probabilistyczne, a termin „prawo” został przeniesiony do tych twierdzeń. Istnieją inne twierdzenia statystyczne i probabilistyczne, które również mają w swojej nazwie „prawo”, które nie wywodzą się w sposób oczywisty z obserwacji empirycznych. Jednak oba rodzaje „prawa” można uznać za przypadki prawa naukowego w dziedzinie statystyki . Tym, co odróżnia empiryczne prawo statystyczne od formalnego twierdzenia statystycznego, jest sposób, w jaki wzorce te po prostu pojawiają się w rozkładzie naturalnym, bez uprzedniego teoretycznego uzasadnienia danych.
Przykłady
Takich popularnych „praw statystyki” jest kilka.
Popularnym przykładem takiego „prawa” jest zasada Pareto . Stwierdza ona, że około 80% skutków pochodzi z 20% przyczyn i dlatego jest również znana jako zasada 80/20. W biznesie zasada 80/20 mówi, że 80% Twojej firmy pochodzi od zaledwie 20% Twoich klientów. W inżynierii oprogramowania często mówi się, że 80% błędów jest spowodowanych zaledwie 20% błędów. 20% świata tworzy około 80% światowego PKB. 80% wydatków na opiekę zdrowotną w USA ponosi 20% populacji.
prawo Zipfa , określane jako „empiryczne prawo statystyczne” językoznawstwa . Zgodnie z „prawem”, biorąc pod uwagę pewien zbiór danych tekstowych, częstotliwość słowa jest odwrotnie proporcjonalna do jego rangi częstotliwości. Innymi słowy, drugie najpowszechniejsze słowo powinno pojawiać się mniej więcej o połowę rzadziej niż najpowszechniejsze słowo, a piąty najczęściej występujący świat pojawiałby się mniej więcej raz na pięć razy, gdy pojawia się najczęstsze słowo. Jednak tym, co określa prawo Zipfa jako „empiryczne prawo statystyczne”, a nie tylko twierdzenie lingwistyki, jest to, że odnosi się ono również do zjawisk spoza jego dziedziny. Na przykład lista rankingowa populacji metropolitalnych Stanów Zjednoczonych również podlega prawu Zipfa, a nawet zapominanie podlega prawu Zipfa. Ten akt podsumowania kilku naturalnych wzorców danych za pomocą prostych reguł jest cechą charakterystyczną tych „empirycznych praw statystycznych”.
Przykłady inspirowanych empirycznie praw statystycznych, które mają mocne podstawy teoretyczne, obejmują:
Przykłady „praw” o słabszych podstawach obejmują:
Przykłady "praw" które są bardziej ogólnymi obserwacjami niż posiadającymi podstawy teoretyczne:
Przykłady rzekomych „praw”, które są niepoprawne, obejmują:
Zobacz też
Notatki
- ^ Kitcher i łosoś (2009) s. 51
- ^ Bunkley, Nick (2008-03-03). „Joseph Juran, 103 lata, pionier w dziedzinie kontroli jakości, nie żyje” . New York Timesa . ISSN 0362-4331 . Źródło 2017-05-05 .
- ^ Personel, Investopedia (2010-11-04). „Reguła 80-20” . Inwestopedia . Źródło 2017-05-05 .
- ^ Rooney, Paula (2002-10-03). „Dyrektor generalny firmy Microsoft: zasada 80-20 dotyczy błędów, a nie tylko funkcji” . CRN . Źródło 2017-05-05 .
-
^
Raport o rozwoju społecznym z 1992 r . Program Narodów Zjednoczonych ds. Rozwoju. Nowy Jork: Oxford University Press. 1992.
{{ cytuj książkę }}
: CS1 maint: inni ( link ) - ^ „Procent całkowitych wydatków na opiekę zdrowotną poniesionych przez różne procenty populacji USA: 2002” . Badania w działaniu . Wydanie 19: Rysunek 1. Czerwiec 2006.
- ^ Gelbuch i Sidorow (2008)
- ^ Gabaix, Ksawery (2011). „Obszar i ludność miast: nowe spojrzenie na miasta z innej perspektywy” (PDF) . Amerykański Przegląd Ekonomiczny . 101 (5): 2205–2225. ar Xiv : 1001.5289 . doi : 10.1257/aer.101.5.2205 . S2CID 4998367 .
- Bibliografia _ Schooler, Lael J. (listopad 1991). „Odbicia środowiska w pamięci” (PDF) . Nauka psychologiczna . 2 (6): 396–408. doi : 10.1111/j.1467-9280.1991.tb00174.x . S2CID 8511110 .
- Kitcher, P., Łosoś, WC (redakcja) (2009) Wyjaśnienie naukowe . Wydawnictwo Uniwersytetu Minnesoty. ISBN 978-0-8166-5765-0
- Gelbukh, A., Sidorov, G. (2008). Współczynniki praw Zipfa i Heapsa zależą od języka. W: Lingwistyka komputerowa i inteligentne przetwarzanie tekstu (s. 332–335), Springer. ISBN 978-3-540-41687-6 . link do abstraktu