Prawo naprawdę wielkich liczb
Prawo naprawdę dużych liczb ( przysłowie statystyczne ), przypisywane Persi Diaconisowi i Frederickowi Mostellerowi , mówi, że przy dostatecznie dużej liczbie niezależnych próbek każda wysoce nieprawdopodobna (tj. w dowolnej próbce) prawdopodobnie zostanie zaobserwowany wynik. Ponieważ nigdy nie zauważamy, kiedy mają miejsce prawdopodobne zdarzenia, podkreślamy zdarzenia mało prawdopodobne i częściej je zauważamy. Prawo jest często wykorzystywane do fałszowania różnych pseudonaukowych twierdzeń; jako taki jest czasami krytykowany przez skrajni naukowcy .
Prawo ma na celu stwierdzenie prawdopodobieństwa i istotności statystycznej: w wystarczająco dużych zbiorach danych statystycznych nawet niewielkie fluktuacje osiągają znaczenie statystyczne. Tak więc w naprawdę dużej liczbie obserwacji paradoksalnie łatwo jest znaleźć istotne korelacje, w dużej liczbie, które wciąż nie prowadzą do teorii przyczynowych (patrz: korelacja fałszywa ), a które przez swoją zbiorczą liczbę mogą również prowadzić do zaciemnienia.
Prawo można przeformułować jako „duże liczby również oszukują”, co jest sprzeczne z intuicją statystyka opisowego . Mówiąc dokładniej, sceptyk Penn Jillette powiedział: „W Nowym Jorku osiem razy dziennie zdarzają się szanse milion do jednego ” (populacja około 8 000 000).
Przykłady
Dla uproszczonego przykładu prawa załóżmy, że dane zdarzenie zachodzi z prawdopodobieństwem wystąpienia 0,1% w ramach jednej próby. Wtedy prawdopodobieństwo, że to tzw. mało prawdopodobne zdarzenie nie wystąpi (nieprawdopodobieństwo) w pojedynczej próbie, wynosi 99,9% (0,999).
Jednak dla próby składającej się tylko z 1000 niezależnych prób prawdopodobieństwo, że zdarzenie nie wystąpi w żadnej z nich, nawet raz (nieprawdopodobieństwo), wynosi tylko 0,999 1000 ≈ 0,3677, czyli 36,77%. Wtedy prawdopodobieństwo, że zdarzenie wystąpi przynajmniej raz na 1000 prób, wynosi ( 1 - 0,999 1000 ≈ 0,6323, lub ) 63,23%. Oznacza to, że prawdopodobieństwo wystąpienia tego „nieprawdopodobnego zdarzenia” wynosi 63,23%, jeśli przeprowadzi się 1000 niezależnych prób. Jeśli liczbę prób zwiększono do 10 000, prawdopodobieństwo, że zdarzy się to przynajmniej raz na 10 000 prób, wzrośnie do ( 1 − 0,999 10000 ≈ 0,99995, czyli ) 99,995%. Innymi słowy, wysoce nieprawdopodobne zdarzenie, biorąc pod uwagę wystarczającą liczbę niezależnych prób z pewną stałą liczbą losowań na próbę, jest jeszcze bardziej prawdopodobne.
Dla zdarzenia X, które występuje z bardzo niskim prawdopodobieństwem 0,0000001% (w dowolnej pojedynczej próbce, patrz też prawie nigdy ), uznanie 1 000 000 000 za „naprawdę dużą” liczbę niezależnych próbek daje prawdopodobieństwo wystąpienia X równe 1 - 0,999999999 1000000000 ≈ 0,63 = 63% , a liczba niezależnych prób równa wielkości populacji ludzkiej (w 2021 r.) daje prawdopodobieństwo zdarzenia X: 1 − 0,999999999 7900000000 ≈ 0,9996 = 99,96%.
Obliczenia te można sformalizować w języku matematycznym jako: „prawdopodobieństwo wystąpienia mało prawdopodobnego zdarzenia X w N niezależnych próbach może dowolnie zbliżyć się do 1, bez względu na to, jak małe jest prawdopodobieństwo zdarzenia X w jednej próbie, pod warunkiem, że N jest naprawdę duży”.
Na przykład, gdy prawdopodobieństwo mało prawdopodobnego zdarzenia X nie jest małą stałą, ale zmniejsza się w funkcji N, patrz wykres.
W rozmnażaniu płciowym szanse na dotarcie mikroskopijnego , pojedynczego plemnika do komórki jajowej w celu jej zapłodnienia są bardzo małe. Tak więc podczas każdego spotkania plemniki uwalniane są jednocześnie w liczbie milionów milionów (u ssaków ), podnosząc szanse zapłodnienia do niemal pewnego zdarzenia.
W systemach wysokiej dostępności należy brać pod uwagę nawet bardzo mało prawdopodobne zdarzenia (aby zmniejszyć prawdopodobieństwo awarii systemu można zastosować redundancję ).
W krytyce pseudonauki
Prawo pojawia się w krytyce pseudonauki i jest czasami nazywane efektem Jeane Dixon (patrz także Postdiction ). Utrzymuje, że im więcej przewidywań przewiduje medium, tym większe są szanse, że jeden z nich „trafi”. Tak więc, jeśli jedno się spełni, psychika oczekuje, że zapomnimy o ogromnej większości, która się nie wydarzyła ( błąd potwierdzenia ). Ludzie mogą być podatni na to błędne przekonanie.
Inny podobny przejaw prawa można znaleźć w grach hazardowych , gdzie gracze mają tendencję do zapamiętywania swoich wygranych i zapominania o przegranych, nawet jeśli tych drugich znacznie przewyższa liczebnie tych pierwszych (chociaż w zależności od konkretnej osoby może być również odwrotnie, gdy myślą, że potrzebują więcej analizy swoich strat, aby uzyskać precyzyjne dostrojenie swojego systemu gry). Mikal Aasved łączy to z „selektywnym błędem pamięci”, umożliwiając graczom mentalne zdystansowanie się od konsekwencji hazardu poprzez utrzymywanie zawyżonego obrazu ich prawdziwych wygranych (lub strat w przeciwnym przypadku - „selektywnego błędu pamięci w dowolnym kierunku”).
Zobacz też
- Teoria czarnego łabędzia
- Mózg Boltzmanna
- Korekta Bonferroniego
- Zbieg okoliczności
- Twierdzenie o nieskończonej małpie
- Tornado na złomowisku
- Prawo wielkich liczb
- Prawo małych liczb
- Biblioteka Babel
- Prawo Littlewooda
- Efekt szukania gdzie indziej
- Cud
- prawo Murphy'ego
- Zjawiska psychiczne
- Zasada totalitarna
Notatki
- Weisstein, Eric W. „Prawo naprawdę dużych liczb” . MathWorld .
- Diaconis, P .; Mosteller, F. (1989). „Metody badania zbiegów okoliczności” (PDF) . Dziennik Amerykańskiego Towarzystwa Statystycznego . 84 (408): 853–61. doi : 10.2307/2290058 . JSTOR 2290058 . MR 1134485 . Zarchiwizowane od oryginału (PDF) w dniu 12.07.2010 . Źródło 2009-04-28 .
- Everitt, BS (2002). Cambridge Dictionary of Statistics (wyd. 2). ISBN 978-0521810999 .
- David J. Hand , (2014), Zasada nieprawdopodobieństwa: dlaczego zbiegi okoliczności, cuda i rzadkie zdarzenia zdarzają się każdego dnia
Linki zewnętrzne
- Matematyka wyjaśnia prawdopodobne strzały z dystansu, cuda i wygraną na loterii (fragment) w Scientific American , David Hand 2014
- skepdic.com na temat prawa naprawdę dużych liczb
- o Prawie Prawdziwie Wielkich Liczb
- The On-Line Encyclopedia of Integer Sequences - powiązana sekwencja liczb całkowitych