Centralne twierdzenie graniczne
W teorii prawdopodobieństwa centralne twierdzenie graniczne ( CLT ) ustala, że w wielu sytuacjach dla niezależnych zmiennych losowych o jednakowym rozkładzie rozkład średniej próby standaryzowanej zmierza w stronę standardowego rozkładu normalnego, nawet jeśli same pierwotne zmienne nie mają rozkładu normalnego .
Twierdzenie to jest kluczowym pojęciem w teorii prawdopodobieństwa, ponieważ implikuje, że metody probabilistyczne i statystyczne, które działają w przypadku rozkładów normalnych, można zastosować do wielu problemów obejmujących inne typy rozkładów.
Twierdzenie to uległo wielu zmianom w trakcie formalnego rozwoju teorii prawdopodobieństwa. Poprzednie wersje tego twierdzenia pochodzą z 1811 r., ale w jego współczesnej ogólnej formie ten fundamentalny wynik teorii prawdopodobieństwa został precyzyjnie sformułowany dopiero w 1920 r., służąc w ten sposób jako pomost między klasyczną i współczesną teorią prawdopodobieństwa.
Elementarna postać twierdzenia stwierdza, co następuje. Niech oznaczają losową próbkę niezależnych z populacji o całkowitej wartości } wartość oczekiwana (średnia) skończona wariancja i niech oznaczają średnią próbki tej próbki (która sama jest losową ) Następnie granica rozkładu } gdzie .
Innymi słowy, załóżmy, że otrzymano dużą próbkę obserwacji , przy czym każda obserwacja została wygenerowana losowo w sposób niezależny od wartości innych obserwacji i że obliczona została średnia ( średnia arytmetyczna ) zaobserwowanych wartości. Jeśli tę procedurę wykona się wiele razy, w wyniku czego uzyskany zostanie zbiór zaobserwowanych średnich, centralne twierdzenie graniczne mówi, że jeśli wielkość próby była wystarczająco duża, rozkład prawdopodobieństwa tych średnich będzie bardzo zbliżony do rozkładu normalnego.
Centralne twierdzenie graniczne ma kilka wariantów. W swojej powszechnej postaci zmienne losowe muszą być niezależne i mieć jednakowy rozkład (iid). Wymóg ten można osłabić; zbieżność średniej do rozkładu normalnego występuje także w przypadku rozkładów nieidentycznych lub niesamodzielnych obserwacji, jeśli spełniają one określone warunki.
Najwcześniejszą wersją tego twierdzenia, w której rozkład normalny może być zastosowany jako przybliżenie rozkładu dwumianowego , jest twierdzenie de Moivre’a – Laplace’a .
Niezależne sekwencje
Klasyczny CLT
Niech będzie ciągiem zmiennych losowych iid o rozkładzie o wartości oczekiwanej określonej przez i skończona wariancja określona przez że interesuje nas średnia z próby
Zgodnie z prawem wielkich liczb średnia próbki zbiega się prawie na pewno (a zatem również zbiega się pod względem prawdopodobieństwa do wartości jako
Klasyczne centralne twierdzenie graniczne opisuje wielkość i postać rozkładu fluktuacji stochastycznych wokół liczby deterministycznej tej zbieżności Dokładniej stwierdza, że w miarę się rozkładu różnicy między średnią próbki a jej granicą pomnożone przez współczynnik \ to znaczy, przybliża rozkład normalny ze średnią i wariancja dużego rozkład staje się arbitralnie do rozkładu normalnego ze średnią i wariancja
Przydatność twierdzenia polega na tym, że rozkład zbliża się do normalności niezależnie od kształt rozkładu jednostki Formalnie twierdzenie można sformułować w następujący sposób:
Lindeberg — Załóżmy ciągiem zmiennych losowych i Następnie, gdy zbliża się do nieskończoności, losowe { zbiegają się w rozkładzie normalnym :
W przypadku , że skumulowane funkcje rozkładu są zbiegają się punktowo do cdf rozkładu: dla każdej liczby rzeczywistej
Łapunow CLT
Twierdzenie zostało nazwane na cześć rosyjskiego matematyka Aleksandra Lapunowa . tym wariancie centralnego twierdzenia granicznego zmienne losowe niezależne, ale niekoniecznie mają identyczny rozkład. Twierdzenie wymaga również, aby zmienne losowe } textstyle | | i że tempo wzrostu tych momentów jest ograniczone przez warunek Lapunowa podany poniżej.
CLT - Załóżmy ciągiem niezależnych zmiennych wartość i wariancja . Definiować
Jeśli przez stan
dla jest sprawdzić warunek
Jeśli ciąg zmiennych losowych spełnia warunek Lapunowa, to spełnia również warunek Lindeberga. Jednak implikacja odwrotna nie zachodzi.
Lindeberg CLT
W tym samym ustawieniu i z tym samym zapisem co powyżej, warunek Lapunowa można zastąpić następującym, słabszym (od Lindeberga w 1920 r.).
Załóżmy, że dla każdego
Wielowymiarowy CLT
funkcje charakterystyczne można rozszerzyć na przypadki w których każdy jest losowym wektorem w k wektor średni i macierz kowariancji (wśród składników wektora), a te losowe wektory są niezależne i mają jednakowy rozkład. Sumowanie tych wektorów odbywa się składowo. Wielowymiarowe centralne twierdzenie graniczne stwierdza, że po przeskalowaniu sumy zbiegają się do wielowymiarowego rozkładu normalnego .
Pozwalać
Stwierdza to centralne twierdzenie graniczne o wielowymiarach
Szybkość zbieżności wyraża następujący wynik typu Berry’ego – Esseena :
Twierdzenie - Niech będzie niezależne . będą losowe wektory, z których każdy ma średnią zero. Zapisz i załóż jest odwracalny. Niech będzie z tą samą średnią i tą samą macierzą kowariancji co . Następnie dla wszystkich zbiorów wypukłych , }
Nie wiadomo czy
Uogólnione centralne twierdzenie graniczne
Uogólnione Centralne Twierdzenie Graniczne (GCLT) było dziełem wielu matematyków ( Bernsteina , Lindeberga , Lévy’ego , Fellera , Kolmogorowa i innych) w latach 1920–1937. Pierwszy opublikowany kompletny dowód GCLT został opublikowany w 1937 r. przez Paula Lévy’ego po francusku. Angielska wersja pełnego dowodu GCLT jest dostępna w tłumaczeniu Gnedenki i Kołmogorowa z 1954 roku.
Oświadczenie GCLT jest następujące:
- Niezdegenerowana zmienna losowa Z jest α-stabilna dla pewnego 0 < α ≤ 2 wtedy i tylko wtedy, gdy istnieje niezależny, identycznie rozłożony ciąg zmiennych losowych X 1 , X 2 , X 3 , ... i stałych a n > 0, b n ∈ ℝ z
- a n (X 1 + ... + X n ) - b n → Z.
- Tutaj → oznacza, że ciąg sum zmiennych losowych jest zbieżny w rozkładzie; tj. odpowiednie rozkłady spełniają F n (y) → F(y) we wszystkich punktach ciągłości F.
Innymi słowy, jeśli sumy niezależnych zmiennych losowych o identycznym rozkładzie zbiegają się w rozkładzie do pewnego Z , to Z musi być rozkładem stabilnym .
Procesy zależne
CLT w słabej zależności
Przydatnym uogólnieniem sekwencji niezależnych zmiennych losowych o jednakowym rozkładzie jest losowy proces mieszania w czasie dyskretnym; „mieszanie” oznacza z grubsza, że zmienne losowe znajdujące się czasowo daleko od siebie są prawie niezależne. W teorii ergodycznej i teorii prawdopodobieństwa stosuje się kilka rodzajów mieszania. Zobacz szczególnie silne mieszanie (zwane także α-mieszaniem) zdefiniowane przez gdzie jest tak zwane silny współczynnik mieszania .
Uproszczone sformułowanie centralnego twierdzenia granicznego przy silnym mieszaniu to:
Twierdzenie - Załóżmy, że nieruchomy i miesza się z i że i . Oznacz _ _
W rzeczywistości,
założenia , ponieważ asymptotyczna normalność zawodzi dla gdzie kolejna sekwencja .
twierdzenia _ i założenie zostaje zastąpione przez
takiego . Encyklopedyczne podejście do twierdzeń granicznych w warunkach mieszania można znaleźć w artykule ( Bradley 2007 ).
Różnica Martingale CLT
Twierdzenie — Niech martyngał _
- z prawdopodobieństwem jako n → ∞ ,
- dla każdego ε > 0 , as n → ∞ ,
wówczas w rozkładzie jako n
Uwagi
Dowód klasycznego CLT
Centralne twierdzenie graniczne ma dowód za pomocą funkcji charakterystycznych . Przypomina to dowód (słabego) prawa wielkich liczb .
Załóżmy, rozłożonymi zmiennymi losowymi i skończona wariancja } Suma _ _ i wariancja } Rozważ zmienną losową
Wszystkie terminy wyższego rzędu znikają w granicy. } Prawa strona jest równa charakterystycznej funkcji standardowego rozkładu normalnego , co z twierdzenia o ciągłości Lévy'ego wynika, rozkład Z zbliży się do } . Dlatego średnia z próby
Konwergencja do granic możliwości
Centralne twierdzenie graniczne podaje jedynie rozkład asymptotyczny . Jako przybliżenie skończonej liczby obserwacji, zapewnia rozsądne przybliżenie tylko wtedy, gdy jest blisko szczytu rozkładu normalnego; wymaga bardzo dużej liczby obserwacji, aby rozciągnąć się do ogonów. [ potrzebne źródło ]
Zbieżność w centralnym twierdzeniu granicznym jest jednostajna , ponieważ ograniczająca funkcja rozkładu skumulowanego jest ciągła. Jeśli trzeci moment centralny istnieje i jest skończony, mi rzędu (patrz Berry’ego – Esseena Metoda Steina można wykorzystać nie tylko do udowodnienia centralnego twierdzenia granicznego, ale także do wyznaczenia granic współczynników zbieżności dla wybranych metryk.
Zbieżność do rozkładu normalnego jest monotoniczna w tym sensie, że wzrasta do entropii rozkładu normalnego
Centralne twierdzenie graniczne ma zastosowanie w szczególności do sum niezależnych i jednakowo rozłożonych dyskretnych zmiennych losowych . Suma dyskretnych zmiennych losowych jest nadal dyskretną zmienną losową , tak więc mamy do czynienia z sekwencją dyskretnych zmiennych losowych , których skumulowana funkcja rozkładu prawdopodobieństwa zbiega się w kierunku skumulowanej funkcji rozkładu prawdopodobieństwa odpowiadającej zmiennej ciągłej (mianowicie rozkładu normalnego ) . Oznacza to, że jeśli zbudujemy histogram realizacji sumy n niezależnych identycznych zmiennych dyskretnych, krzywa odcinkowo-liniowa łącząca środki górnych ścian prostokątów tworzących histogram zbiega się w kierunku krzywej Gaussa, gdy n zbliża się do nieskończoności; zależność ta jest znana jako twierdzenie de Moivre’a – Laplace’a . Artykuł o rozkładzie dwumianowym szczegółowo opisuje takie zastosowanie centralnego twierdzenia granicznego w prostym przypadku zmiennej dyskretnej przyjmującej tylko dwie możliwe wartości.
Wspólne nieporozumienia
Badania wykazały, że centralne twierdzenie graniczne jest obarczone kilkoma powszechnymi, ale poważnymi błędami, z których część pojawia się w powszechnie używanych podręcznikach. Należą do nich przekonania, że:
- Twierdzenie to ma zastosowanie do losowego próbkowania dowolnej zmiennej, a nie do średnich wartości (lub sum) iid zmiennych losowych wyodrębnionych z populacji poprzez wielokrotne próbkowanie. Oznacza to, że twierdzenie zakłada, że losowe próbkowanie tworzy rozkład próbkowania utworzony z różnych wartości średnich (lub sum) takich zmiennych losowych.
- Twierdzenie zapewnia, że losowe próbkowanie prowadzi do powstania rozkładu normalnego dla dostatecznie dużych próbek dowolnej zmiennej losowej, niezależnie od rozkładu populacji. W rzeczywistości takie próbkowanie asymptotycznie odtwarza właściwości populacji, co jest intuicyjnym wynikiem popartym twierdzeniem Glivenki-Cantellego .
- Że twierdzenie prowadzi do dobrego przybliżenia rozkładu normalnego dla liczebności prób większych niż około 30, umożliwiając wiarygodne wnioskowanie niezależnie od charakteru populacji. W rzeczywistości ta empiryczna zasada nie ma żadnego uzasadnienia i może prowadzić do poważnych błędnych wniosków.
Związek z prawem wielkich liczb
Prawo wielkich liczb oraz centralne twierdzenie graniczne stanowią częściowe rozwiązania ogólnego problemu: „Jakie jest ograniczające zachowanie S n , gdy n dąży do nieskończoności?” W analizie matematycznej szeregi asymptotyczne są jednym z najpopularniejszych narzędzi stosowanych do rozwiązywania takich problemów.
Załóżmy, że mamy asymptotyczną ekspansję : }
Dzielenie obu części przez φ 1 ( n ) i przyjęcie granicy da 1 jego , współczynnik składnika najwyższego rzędu w rozwinięciu, który reprezentuje szybkość, z jaką f ( n ) zmienia się w członie wiodącym.
Nieformalnie można powiedzieć: „ f ( n ) rośnie w przybliżeniu jako 1 φ 1 ( n ) ” . Biorąc różnicę między f ( n ) i jej przybliżenie, a następnie dzieląc przez kolejny wyraz w rozwinięciu, dochodzimy do bardziej wyrafinowanego stwierdzenia na temat f ( n ) :
Można tu powiedzieć, że różnica pomiędzy funkcją a jej przybliżeniem rośnie w przybliżeniu jako 2 φ 2 ( n ) . Pomysł jest taki, że podzielenie funkcji przez odpowiednie funkcje normalizujące i przyjrzenie się ograniczającemu zachowaniu wyniku może nam wiele powiedzieć o ograniczającym zachowaniu samej pierwotnej funkcji.
Nieformalnie coś podobnego dzieje się, gdy suma Sn , niezależnych zmiennych losowych o identycznym rozkładzie, X 1 , ..., X n jest badana w klasycznej teorii prawdopodobieństwa. [ potrzebne źródło ] Jeśli każdy X i ma skończoną średnią μ , to zgodnie z prawem wielkich liczb S n / n → μ . Jeżeli dodatkowo każde X i ma skończoną wariancję σ 2 , to według centralnego twierdzenia granicznego
W przypadku, gdy X i nie ma skończonej średniej lub wariancji, zbieżność przesuniętej i przeskalowanej sumy może również nastąpić przy różnych współczynnikach centrowania i skalowania:
Rozkłady Ξ , które mogą powstać w ten sposób, nazywane są stabilnymi . Oczywiście rozkład normalny jest stabilny, ale istnieją również inne stabilne rozkłady, takie jak rozkład Cauchy'ego , dla których nie zdefiniowano średniej ani wariancji. Współczynnik skalujący c ≥ 1/2 być bn może dowolnego proporcjonalny do nc ; , dla można go również pomnożyć przez wolno zmieniającą się funkcję n .
Prawo logarytmu iterowanego określa, co dzieje się „pomiędzy” prawem wielkich liczb a centralnym twierdzeniem granicznym. W szczególności mówi, że funkcja normalizująca √ n log log n , o rozmiarze pośrednim pomiędzy n prawa wielkich liczb a √ n centralnego twierdzenia granicznego, zapewnia nietrywialne zachowanie ograniczające.
Alternatywne stwierdzenia twierdzenia
Funkcje gęstości
Gęstość sumy dwóch lub więcej zmiennych niezależnych jest splotem ich gęstości (jeśli takie gęstości istnieją) . Zatem centralne twierdzenie graniczne można interpretować jako stwierdzenie dotyczące właściwości funkcji gęstości w stanie splotu: splot szeregu funkcji gęstości zmierza do gęstości normalnej, gdy liczba funkcji gęstości rośnie bez ograniczeń. Twierdzenia te wymagają silniejszych hipotez niż podane powyżej formy centralnego twierdzenia granicznego. Twierdzenia tego typu nazywane są często lokalnymi twierdzeniami granicznymi. Zobacz Petrova, aby zapoznać się z konkretnym lokalnym twierdzeniem granicznym dla sum niezależne i jednakowo rozłożone zmienne losowe .
Funkcje charakterystyczne
Ponieważ funkcja charakterystyczna splotu jest iloczynem funkcji charakterystycznych zaangażowanych gęstości, centralne twierdzenie graniczne ma jeszcze jedno przekształcenie: iloczyn funkcji charakterystycznych szeregu funkcji gęstości zbliża się do funkcji charakterystycznej gęstości normalnej gdy liczba funkcji gęstości rośnie bez ograniczeń, w warunkach określonych powyżej. W szczególności należy zastosować odpowiedni współczynnik skalujący do argumentu funkcji charakterystycznej.
Równoważne stwierdzenie można sformułować na temat transformat Fouriera , ponieważ funkcja charakterystyczna jest zasadniczo transformatą Fouriera.
Obliczanie wariancji
Niech S n będzie sumą n zmiennych losowych. Wiele centralnych twierdzeń granicznych zapewnia takie warunki, że S n / √ Var( S n ) zbiega się w rozkładzie do N (0,1) (rozkład normalny ze średnią 0, wariancja 1) jako n → ∞ . W niektórych przypadkach można znaleźć stałą σ 2 i funkcję f(n) taką, że S n /(σ √ n⋅f ( n ) ) zbiega się w rozkładzie do N (0,1) jako n → ∞ .
Lemat - Załóżmy rzeczywistych i ściśle stacjonarnych, w których dla wszystkich , } do . Skonstruować
- Jeśli jest absolutnie zbieżny, i wtedy jak gdzie .
- Jeśli dodatkowo zbiega się w rozkładzie do jak wtedy również zbiega się w dystrybucji do jak \
Rozszerzenia
Iloczyny dodatnich zmiennych losowych
Logarytm iloczynu to po prostu suma logarytmów czynników. Dlatego też, gdy logarytm iloczynu zmiennych losowych, które przyjmują tylko wartości dodatnie, zbliża się do rozkładu normalnego, sam iloczyn zbliża się do rozkładu logarytmiczno-normalnego . Wiele wielkości fizycznych (zwłaszcza masa lub długość, które są kwestią skali i nie mogą być ujemne) są iloczynami różnych losowych , zatem mają rozkład logarytmiczno-normalny. Ta multiplikatywna wersja centralnego twierdzenia granicznego jest czasami nazywana prawem Gibrata .
Podczas gdy centralne twierdzenie graniczne dla sum zmiennych losowych wymaga warunku skończonej wariancji, odpowiadające mu twierdzenie dla iloczynów wymaga odpowiedniego warunku, aby funkcja gęstości była całkowalna do kwadratu.
Poza klasycznymi ramami
Asymptotyczna normalność, czyli zbieżność do rozkładu normalnego po odpowiednim przesunięciu i przeskalowaniu, jest zjawiskiem znacznie bardziej ogólnym niż omówiony powyżej klasyczny układ, czyli sumy niezależnych zmiennych losowych (lub wektorów). Od czasu do czasu ujawniane są nowe ramy; na razie nie jest dostępna żadna pojedyncza struktura ujednolicająca.
Korpus wypukły
Twierdzenie — Istnieje ciąg ε n ↓ 0 , dla którego zachodzi następujące twierdzenie. Niech n ≥ 1 i niech zmienne losowe X 1 , ..., X n mają logarytmicznie wklęsłą gęstość spoiny f taką, że f ( x 1 , ..., x n ) = f (| x 1 |, .. ., | x n |) dla wszystkich x 1 , ..., x n i E( X
2 k ) = 1 dla wszystkich k = 1, ..., n . Następnie dystrybucja
Te dwa rozkłady ε n -bliskie mają gęstości (w rzeczywistości gęstości logarytmiczno-wklęsłe), zatem całkowita odległość wariancji między nimi jest całką z wartości bezwzględnej różnicy między gęstościami. Zbieżność w całkowitej zmienności jest silniejsza niż słaba zbieżność.
Ważnym przykładem gęstości log-wklęsłej jest funkcja stała wewnątrz danego ciała wypukłego i zanikająca na zewnątrz; odpowiada to równomiernemu rozkładowi na ciele wypukłym, co wyjaśnia termin „centralne twierdzenie graniczne dla ciał wypukłych”.
Inny przykład: f ( x 1 , ..., x n ) = const · exp(−(| x 1 | α + ⋯ + | x n | α ) β ) gdzie α > 1 i αβ > 1 . Jeśli β = 1 , to f ( x 1 , ..., x n ) rozkłada się na czynniki na const · exp (−| x 1 | α ) … exp(−| x n | α ), co oznacza, że X 1 , ..., X n są niezależne. Generalnie jednak są one zależne.
Warunek f ( x 1 , ..., x n ) = f (| x 1 |, ..., | x n |) gwarantuje, że X 1 , ..., X n mają średnią zerową i są nieskorelowane ; [ potrzebne źródło ] mimo to nie muszą być niezależne, ani nawet niezależne parami . [ potrzebne źródło ] Nawiasem mówiąc, niezależność parami nie może zastąpić niezależności w klasycznym centralnym twierdzeniu granicznym.
Oto wynik typu Berry-Esseen .
Twierdzenie — Niech zatem X 1 , ..., X n spełniają założenia poprzedniego twierdzenia
+ 1 ⋯ + do
2 n = 1 ,
Rozkład
X 1 + ⋯ + X n / √ n nie musi być w przybliżeniu normalny (w rzeczywistości może być równomierny). Jednak rozkład do 1 X 1 + ⋯ + do n X n jest bliski (w całkowitej odległości zmiany) dla większości wektorów ( do 1 , ..., do n ) według równomiernego rozkładu na kuli c
2 1 + ⋯ + do
2 n = 1 .
Lakunarne szeregi trygonometryczne
Twierdzenie ( Salem – Zygmund ) — Niech U będzie zmienną losową o rozkładzie jednostajnym na (0,2π) , oraz X k = r k cos( n k U + a k ) , gdzie
- n k spełniają warunek lakunarności: istnieje q > 1 takie, że n k + 1 ≥ qn k dla wszystkich k ,
-
r k są takie, że
- 0 ≤ a k < 2π .
Następnie
Polytopy Gaussa
Twierdzenie — Niech A 1 , ..., An n będą niezależnymi punktami losowymi na płaszczyźnie R 2 , z których każdy ma dwuwymiarowy standardowy rozkład normalny. Niech K n będzie wypukłą powłoką tych punktów, a X n polem K n Wtedy
To samo dotyczy wszystkich wymiarów większych niż 2.
Polytop K n nazywany jest losowym Polytopem Gaussa.
Podobny wynik dotyczy liczby wierzchołków (polytopu Gaussa), liczby krawędzi i właściwie ścian wszystkich wymiarów.
Funkcje liniowe macierzy ortogonalnych
Funkcja liniowa macierzy M jest liniową kombinacją jej elementów (o podanych współczynnikach), M ↦ tr( AM ) gdzie A jest macierzą współczynników; zobacz Ślad (algebra liniowa) #Iloczyn wewnętrzny .
losowa macierz ortogonalna ma rozkład jednostajny, jeśli jej rozkład jest znormalizowaną miarą Haara na grupie ortogonalnej O( n , R ) ; zobacz Macierz rotacji # Jednolite losowe macierze rotacji .
Twierdzenie — Niech M będzie losową ortogonalną macierzą n × n o rozkładzie równomiernym, a A stałą macierzą n × n taką, że tr( AA *) = n i niech X = tr( AM ) . Następnie rozkład X jest bliski całkowitej metryki zmienności aż do [ potrzebne wyjaśnienie ] 2 √ 3 / n - 1 .
Podciągi
Twierdzenie — Niech zmienne losowe X 1 , X 2 , ... ∈ L 2 (Ω) będą takie, że X n → 0 słabo w L 2 (Ω) i X
n → 1 słabo w L 1 (Ω) . Wtedy istnieją liczby całkowite n 1 < n 2 < ⋯ takie, że
Losowy spacer po sieci kryształowej
Centralne twierdzenie graniczne można ustalić dla prostego błądzenia losowego po sieci krystalicznej (nieskończenie krotny abelowy wykres pokrywający graf skończony) i służy do projektowania struktur krystalicznych.
Zastosowania i przykłady
Prostym przykładem centralnego twierdzenia granicznego jest rzut wieloma identycznymi, bezstronnymi kostkami. Rozkład sumy (lub średniej) wyrzuconych liczb będzie dobrze przybliżony rozkładem normalnym. Ponieważ ilości w świecie rzeczywistym są często zrównoważoną sumą wielu niezaobserwowanych zdarzeń losowych, centralne twierdzenie graniczne zapewnia również częściowe wyjaśnienie przewagi normalnego rozkładu prawdopodobieństwa. Uzasadnia to także przybliżanie statystyk dużych prób do rozkładu normalnego w kontrolowanych eksperymentach.
Regresja
Analiza regresji , a w szczególności zwykła metoda najmniejszych kwadratów, określa, że zmienna zależna zależy, zgodnie z pewną funkcją, od jednej lub większej liczby zmiennych niezależnych , z dodatkiem błędu . Różne rodzaje wnioskowania statystycznego na temat regresji zakładają, że składnik błędu ma rozkład normalny. Założenie to można uzasadnić założeniem, że składnik błędu jest w rzeczywistości sumą wielu niezależnych składników błędu; nawet jeśli poszczególne składniki błędu nie mają rozkładu normalnego, dzięki centralnemu twierdzeniu granicznemu ich sumę można dobrze przybliżyć rozkładem normalnym.
Inne ilustracje
Biorąc pod uwagę jego znaczenie dla statystyki, dostępnych jest wiele artykułów i pakietów komputerowych, które demonstrują zbieżność związaną z centralnym twierdzeniem granicznym.
Historia
Holenderski matematyk Henk Tijms pisze:
Centralne twierdzenie graniczne ma ciekawą historię. Pierwsza wersja tego twierdzenia została postulowana przez urodzonego we Francji matematyka Abrahama de Moivre , który w niezwykłym artykule opublikowanym w 1733 roku wykorzystał rozkład normalny do przybliżenia rozkładu liczby orłów wynikających z wielu rzutów uczciwą monetą. Odkrycie to znacznie wyprzedziło swoje czasy i zostało prawie zapomniane, dopóki słynny francuski matematyk Pierre-Simon Laplace nie wybawił go z zapomnienia w swoim monumentalnym dziele Théorie analytique des probabilités , opublikowany w 1812 r. Laplace rozszerzył ustalenia De Moivre'a, przybliżając rozkład dwumianowy do rozkładu normalnego. Jednak podobnie jak w przypadku De Moivre’a, odkryciu Laplace’a w jego czasach nie poświęcono zbyt wiele uwagi. Znaczenie centralnego twierdzenia granicznego dostrzeżono dopiero pod koniec XIX wieku, kiedy w 1901 roku rosyjski matematyk Aleksandr Lapunow zdefiniował je w sposób ogólny i dokładnie udowodnił, jak działa ono matematycznie. Obecnie centralne twierdzenie graniczne uważane jest za nieoficjalnego władcę teorii prawdopodobieństwa.
Sir Francis Galton tak opisał Centralne Twierdzenie Graniczne:
Nie znam nic, co tak wywierałoby wpływ na wyobraźnię, jak cudowna forma kosmicznego porządku wyrażona przez „Prawo częstotliwości błędów”. Prawo zostałoby uosobione przez Greków i ubóstwione, gdyby o nim wiedzieli. Króluje ze spokojem i całkowitym zatarciem, pośród najdzikszego zamieszania. Im większy tłum i im większa pozorna anarchia, tym doskonalsza jest jego władza. Jest to najwyższe prawo nierozsądku. Ilekroć bierze się do ręki dużą próbkę elementów chaotycznych i porządkuje według ich wielkości, niespodziewana i najpiękniejsza forma regularności okazuje się przez cały czas ukryta.
Właściwy termin „centralne twierdzenie graniczne” (w języku niemieckim: „zentraler Grenzwertsatz”) został po raz pierwszy użyty przez George'a Pólyę w 1920 r. w tytule artykułu. Pólya nazwał twierdzenie „centralnym” ze względu na jego znaczenie w teorii prawdopodobieństwa. Według Le Cama francuska szkoła prawdopodobieństwa interpretuje słowo centralny w tym sensie, że „opisuje zachowanie środka rozkładu, a nie jego ogonów”. Streszczenie artykułu O centralnym twierdzeniu granicznym rachunku prawdopodobieństwa i problemie momentów autorstwa Pólyi z 1920 r. tłumaczy się następująco.
Występowanie gęstości prawdopodobieństwa Gaussa 1 = e − x 2 w powtarzanych eksperymentach, w błędach pomiarów skutkujących kombinacją bardzo wielu i bardzo małych błędów elementarnych, w procesach dyfuzji itp. można wyjaśnić, jak dobrze- znane z tego samego twierdzenia granicznego, które odgrywa kluczową rolę w rachunku prawdopodobieństwa. Rzeczywisty odkrywca tego twierdzenia granicznego ma nazywać się Laplace; jest prawdopodobne, że jego rygorystyczny dowód został po raz pierwszy przedstawiony przez Tschebyscheffa, a jego najostrzejsze sformułowanie można znaleźć, o ile mi wiadomo, w artykule Liapounoffa . ...
Hald dostarcza dokładnego opisu historii twierdzenia, szczegółowo opisującego podstawowe prace Laplace'a, a także wkład Cauchy'ego , Bessela i Poissona . Dwie relacje historyczne, jedna obejmująca rozwój od Laplace'a do Cauchy'ego, druga wkład von Misesa , Pólyi , Lindeberga , Lévy'ego i Craméra w latach dwudziestych XX wieku podaje Hans Fischer. Le Cam opisuje okres około 1935 roku. Bernstein przedstawia dyskusję historyczną skupiającą się na twórczości Pafnuty'ego Czebyszewa i jego uczniów Andrieja Markowa i Aleksandra Łapunowa , która doprowadziła do pierwszych dowodów CLT w kontekście ogólnym.
Ciekawym przypisem do historii Centralnego Twierdzenia Granicznego jest to, że dowód wyniku podobnego do CLT Lindeberga z 1922 r. był tematem rozprawy doktorskiej Alana Turinga z 1934 r. o stypendium w King's College na Uniwersytecie w Cambridge . Dopiero po przesłaniu pracy Turing dowiedział się, że zostało to już udowodnione. W rezultacie rozprawa Turinga nie została opublikowana.
Zobacz też
- Właściwość asymptotycznej ekwipartycji
- Rozkład asymptotyczny
- Dystrybucja Batesa
- Prawo Benforda – Wynik rozszerzenia CLT na iloczyn zmiennych losowych.
- Twierdzenie Berry’ego – Esseena
- Centralne twierdzenie graniczne dla statystyki kierunkowej – Centralne twierdzenie graniczne zastosowane w przypadku statystyki kierunkowej
- Metoda delta – do obliczania rozkładu granicznego funkcji zmiennej losowej.
- Twierdzenie Erdősa – Kaca – łączy liczbę czynników pierwszych liczby całkowitej z normalnym rozkładem prawdopodobieństwa
- Twierdzenie Fishera – Tippetta – Gnedenko – twierdzenie graniczne dla wartości ekstremalnych (takich jak max{ X n } )
- Rozkład Irwina – Halla
- Centralne twierdzenie graniczne łańcucha Markowa
- Normalna dystrybucja
- Twierdzenie Tweediego o zbieżności - twierdzenie, które można uznać za pomost między centralnym twierdzeniem granicznym a twierdzeniem o zbieżności Poissona
Notatki
- Bárány, Imre ; Vu, Van (2007). „Centralne twierdzenia graniczne dla wielotopów Gaussa”. Roczniki prawdopodobieństwa . Instytut Statystyki Matematycznej. 35 (4): 1593–1621. arXiv : math/0610192 . doi : 10.1214/009117906000000791 . S2CID 9128253 .
- Bauera, Heinza (2001). Teoria miary i integracji . Berlin: de Gruytera. ISBN 3110167190 .
- Billingsley, Patrick (1995). Prawdopodobieństwo i miara (wyd. 3). Johna Wileya i synów. ISBN 0-471-00710-2 .
- Bradley, Richard (2005). „Podstawowe właściwości silnych warunków mieszania. Ankieta i kilka pytań otwartych”. Badania prawdopodobieństwa . 2 : 107–144. arXiv : math/0511078 . Bibcode : 2005math.....11078B . doi : 10.1214/154957805100000104 . S2CID 8395267 .
- Bradley, Richard (2007). Wprowadzenie do silnych warunków mieszania (wyd. 1). Heber City, Utah: Kendrick Press. ISBN 978-0-9740427-9-4 .
- Dinow, Iwo; Christou, Nicolas; Sanchez, Juana (2008). „Centralne twierdzenie graniczne: nowy aplet SOCR i aktywność demonstracyjna” . Journal of Statystyka Edukacji . JAK. 16 (2): 1–15. doi : 10.1080/10691898.2008.11889560 . PMC 3152447 . PMID 21833159 . Zarchiwizowane od oryginału w dniu 2016-03-03 . Źródło: 23.08.2008 .
- Durrett, Richard (2004). Prawdopodobieństwo: teoria i przykłady (wyd. 3). Wydawnictwo Uniwersytetu Cambridge. ISBN 0521765390 .
- Fischer, Hans (2011). Historia centralnego twierdzenia granicznego: od klasycznej do współczesnej teorii prawdopodobieństwa (PDF) . Źródła i opracowania z historii matematyki i nauk fizycznych. Nowy Jork: Springer. doi : 10.1007/978-0-387-87857-7 . ISBN 978-0-387-87856-0 . MR 2743162 . Zbl 1226.60004 . Zarchiwizowane (PDF) od oryginału w dniu 31.10.2017 r.
- Gaposzkin, VF (1966). „Seria Lacunary i funkcje niezależne”. Rosyjskie badania matematyczne . 21 (6): 1–82. Kod Bib : 1966RuMaS..21....1G . doi : 10.1070/RM1966v021n06ABEH001196 . S2CID 250833638 . .
- Klartag, Bo'az (2007). „Centralne twierdzenie graniczne dla zbiorów wypukłych”. Wynalazki matematyczne . 168 (1): 91–131. arXiv : math/0605014 . Bibcode : 2007InMat.168...91K . doi : 10.1007/s00222-006-0028-8 . S2CID 119169773 .
- Klartag, Bo’az (2008). „Nierówność typu Berry’ego – Esseena dla ciał wypukłych o bezwarunkowej podstawie”. Teoria prawdopodobieństwa i dziedziny pokrewne . 145 (1–2): 1–33. arXiv : 0705.0832 . doi : 10.1007/s00440-008-0158-6 . S2CID 10163322 .
Linki zewnętrzne
- Centralne twierdzenie graniczne w Khan Academy
- „Centralne twierdzenie graniczne” , Encyklopedia matematyki , EMS Press , 2001 [1994]
- Weisstein, Eric W. „Centralne twierdzenie graniczne” . Świat Matematyki .
- Teledysk przedstawiający centralne twierdzenie graniczne z tablicą Galtona autorstwa Carla McTague'a