Prawo naprawdę wielkich liczb

Prawo naprawdę dużych liczb ( przysłowie statystyczne ), przypisywane Persi Diaconisowi i Frederickowi Mostellerowi , mówi, że przy dostatecznie dużej liczbie niezależnych próbek każda wysoce nieprawdopodobna (tj. w dowolnej próbce) prawdopodobnie zostanie zaobserwowany wynik. Ponieważ nigdy nie zauważamy, kiedy mają miejsce prawdopodobne zdarzenia, podkreślamy zdarzenia mało prawdopodobne i częściej je zauważamy. Prawo jest często wykorzystywane do fałszowania różnych pseudonaukowych twierdzeń; jako taki jest czasami krytykowany przez skrajni naukowcy .

Prawo ma na celu stwierdzenie prawdopodobieństwa i istotności statystycznej: w wystarczająco dużych zbiorach danych statystycznych nawet niewielkie fluktuacje osiągają znaczenie statystyczne. Tak więc w naprawdę dużej liczbie obserwacji paradoksalnie łatwo jest znaleźć istotne korelacje, w dużej liczbie, które wciąż nie prowadzą do teorii przyczynowych (patrz: korelacja fałszywa ), a które przez swoją zbiorczą liczbę mogą również prowadzić do zaciemnienia.

Prawo można przeformułować jako „duże liczby również oszukują”, co jest sprzeczne z intuicją statystyka opisowego . Mówiąc dokładniej, sceptyk Penn Jillette powiedział: „W Nowym Jorku osiem razy dziennie zdarzają się szanse milion do jednego ” (populacja około 8 000 000).

Przykłady

Wykresy prawdopodobieństwa P niezaobserwowania niezależnych zdarzeń , każdy o prawdopodobieństwie 1/ n po n próbach Bernoulliego i 1 − P vs n . Gdy n rośnie, prawdopodobieństwo, że zdarzenie o szansie 1/ n nigdy się nie pojawi po n próbach, gwałtownie zbiega się do 1/ e .

Dla uproszczonego przykładu prawa załóżmy, że dane zdarzenie zachodzi z prawdopodobieństwem wystąpienia 0,1% w ramach jednej próby. Wtedy prawdopodobieństwo, że to tzw. mało prawdopodobne zdarzenie nie wystąpi (nieprawdopodobieństwo) w pojedynczej próbie, wynosi 99,9% (0,999).

   Jednak dla próby składającej się tylko z 1000 niezależnych prób prawdopodobieństwo, że zdarzenie nie wystąpi w żadnej z nich, nawet raz (nieprawdopodobieństwo), wynosi tylko 0,999 1000 ≈ 0,3677, czyli 36,77%. Wtedy prawdopodobieństwo, że zdarzenie wystąpi przynajmniej raz na 1000 prób, wynosi ( 1 - 0,999 1000 ≈ 0,6323, lub )   63,23%. Oznacza to, że prawdopodobieństwo wystąpienia tego „nieprawdopodobnego zdarzenia” wynosi 63,23%, jeśli przeprowadzi się 1000 niezależnych prób. Jeśli liczbę prób zwiększono do 10 000, prawdopodobieństwo, że zdarzy się to przynajmniej raz na 10 000 prób, wzrośnie do ( 1 − 0,999 10000 ≈ 0,99995, czyli ) 99,995%. Innymi słowy, wysoce nieprawdopodobne zdarzenie, biorąc pod uwagę wystarczającą liczbę niezależnych prób z pewną stałą liczbą losowań na próbę, jest jeszcze bardziej prawdopodobne.

Dla zdarzenia X, które występuje z bardzo niskim prawdopodobieństwem 0,0000001% (w dowolnej pojedynczej próbce, patrz też prawie nigdy ), uznanie 1 000 000 000 za „naprawdę dużą” liczbę niezależnych próbek daje prawdopodobieństwo wystąpienia X równe 1 - 0,999999999 1000000000 ≈ 0,63 = 63% , a liczba niezależnych prób równa wielkości populacji ludzkiej (w 2021 r.) daje prawdopodobieństwo zdarzenia X: 1 − 0,999999999 7900000000 ≈ 0,9996 = 99,96%.

Obliczenia te można sformalizować w języku matematycznym jako: „prawdopodobieństwo wystąpienia mało prawdopodobnego zdarzenia X w N niezależnych próbach może dowolnie zbliżyć się do 1, bez względu na to, jak małe jest prawdopodobieństwo zdarzenia X w jednej próbie, pod warunkiem, że N jest naprawdę duży”.

Na przykład, gdy prawdopodobieństwo mało prawdopodobnego zdarzenia X nie jest małą stałą, ale zmniejsza się w funkcji N, patrz wykres.

W rozmnażaniu płciowym szanse na dotarcie mikroskopijnego , pojedynczego plemnika do komórki jajowej w celu jej zapłodnienia są bardzo małe. Tak więc podczas każdego spotkania plemniki uwalniane są jednocześnie w liczbie milionów milionów (u ssaków ), podnosząc szanse zapłodnienia do niemal pewnego zdarzenia.

W systemach wysokiej dostępności należy brać pod uwagę nawet bardzo mało prawdopodobne zdarzenia (aby zmniejszyć prawdopodobieństwo awarii systemu można zastosować redundancję ).

W krytyce pseudonauki

Prawo pojawia się w krytyce pseudonauki i jest czasami nazywane efektem Jeane Dixon (patrz także Postdiction ). Utrzymuje, że im więcej przewidywań przewiduje medium, tym większe są szanse, że jeden z nich „trafi”. Tak więc, jeśli jedno się spełni, psychika oczekuje, że zapomnimy o ogromnej większości, która się nie wydarzyła ( błąd potwierdzenia ). Ludzie mogą być podatni na to błędne przekonanie.

Inny podobny przejaw prawa można znaleźć w grach hazardowych , gdzie gracze mają tendencję do zapamiętywania swoich wygranych i zapominania o przegranych, nawet jeśli tych drugich znacznie przewyższa liczebnie tych pierwszych (chociaż w zależności od konkretnej osoby może być również odwrotnie, gdy myślą, że potrzebują więcej analizy swoich strat, aby uzyskać precyzyjne dostrojenie swojego systemu gry). Mikal Aasved łączy to z „selektywnym błędem pamięci”, umożliwiając graczom mentalne zdystansowanie się od konsekwencji hazardu poprzez utrzymywanie zawyżonego obrazu ich prawdziwych wygranych (lub strat w przeciwnym przypadku - „selektywnego błędu pamięci w dowolnym kierunku”).

Zobacz też

Notatki

Linki zewnętrzne