Centralne twierdzenie graniczne

W teorii prawdopodobieństwa centralne twierdzenie graniczne ( CLT ) ustala, że ​​w wielu sytuacjach dla niezależnych zmiennych losowych o jednakowym rozkładzie rozkład średniej próby standaryzowanej zmierza w stronę standardowego rozkładu normalnego, nawet jeśli same pierwotne zmienne nie mają rozkładu normalnego .

Twierdzenie to jest kluczowym pojęciem w teorii prawdopodobieństwa, ponieważ implikuje, że metody probabilistyczne i statystyczne, które działają w przypadku rozkładów normalnych, można zastosować do wielu problemów obejmujących inne typy rozkładów.

Twierdzenie to uległo wielu zmianom w trakcie formalnego rozwoju teorii prawdopodobieństwa. Poprzednie wersje tego twierdzenia pochodzą z 1811 r., ale w jego współczesnej ogólnej formie ten fundamentalny wynik teorii prawdopodobieństwa został precyzyjnie sformułowany dopiero w 1920 r., służąc w ten sposób jako pomost między klasyczną i współczesną teorią prawdopodobieństwa.

Elementarna postać twierdzenia stwierdza, co następuje. Niech oznaczają losową próbkę niezależnych z populacji o całkowitej wartości } wartość oczekiwana (średnia) skończona wariancja i niech oznaczają średnią próbki tej próbki (która sama jest losową ) Następnie granica rozkładu } gdzie .

Innymi słowy, załóżmy, że otrzymano dużą próbkę obserwacji , przy czym każda obserwacja została wygenerowana losowo w sposób niezależny od wartości innych obserwacji i że obliczona została średnia ( średnia arytmetyczna ) zaobserwowanych wartości. Jeśli tę procedurę wykona się wiele razy, w wyniku czego uzyskany zostanie zbiór zaobserwowanych średnich, centralne twierdzenie graniczne mówi, że jeśli wielkość próby była wystarczająco duża, rozkład prawdopodobieństwa tych średnich będzie bardzo zbliżony do rozkładu normalnego.

Centralne twierdzenie graniczne ma kilka wariantów. W swojej powszechnej postaci zmienne losowe muszą być niezależne i mieć jednakowy rozkład (iid). Wymóg ten można osłabić; zbieżność średniej do rozkładu normalnego występuje także w przypadku rozkładów nieidentycznych lub niesamodzielnych obserwacji, jeśli spełniają one określone warunki.

Najwcześniejszą wersją tego twierdzenia, w której rozkład normalny może być zastosowany jako przybliżenie rozkładu dwumianowego , jest twierdzenie de Moivre’a – Laplace’a .

Niezależne sekwencje

Niezależnie od formy rozkładu populacji, rozkład próbkowania ma tendencję do Gaussa, a jego rozproszenie jest określone przez centralne twierdzenie graniczne.

Klasyczny CLT

Niech będzie ciągiem zmiennych losowych iid o rozkładzie o wartości oczekiwanej określonej przez i skończona wariancja określona przez że interesuje nas średnia z próby

Zgodnie z prawem wielkich liczb średnia próbki zbiega się prawie na pewno (a zatem również zbiega się pod względem prawdopodobieństwa do wartości jako

Klasyczne centralne twierdzenie graniczne opisuje wielkość i postać rozkładu fluktuacji stochastycznych wokół liczby deterministycznej tej zbieżności Dokładniej stwierdza, że ​​w miarę się rozkładu różnicy między średnią próbki a jej granicą pomnożone przez współczynnik \ to znaczy, przybliża rozkład normalny ze średnią i wariancja dużego rozkład staje się arbitralnie do rozkładu normalnego ze średnią i wariancja

Przydatność twierdzenia polega na tym, że rozkład zbliża się do normalności niezależnie od kształt rozkładu jednostki Formalnie twierdzenie można sformułować w następujący sposób:

Lindeberg Załóżmy ciągiem zmiennych losowych i Następnie, gdy zbliża się do nieskończoności, losowe { zbiegają się w rozkładzie normalnym :

W przypadku , że ​​skumulowane funkcje rozkładu zbiegają się punktowo do cdf rozkładu: dla każdej liczby rzeczywistej

gdzie jest standardowym normalnym cdf ocenianym przy jest jednolita w sensie,
gdzie najmniejszą górną granicę (lub supremum ) zbioru.

Łapunow CLT

Twierdzenie zostało nazwane na cześć rosyjskiego matematyka Aleksandra Lapunowa . tym wariancie centralnego twierdzenia granicznego zmienne losowe niezależne, ale niekoniecznie mają identyczny rozkład. Twierdzenie wymaga również, aby zmienne losowe } textstyle | | i że tempo wzrostu tych momentów jest ograniczone przez warunek Lapunowa podany poniżej.

CLT - Załóżmy ciągiem niezależnych zmiennych wartość i wariancja . Definiować

Jeśli przez stan

suma normalnej , gdy zmierza do nieskończoności:

dla jest sprawdzić warunek

Jeśli ciąg zmiennych losowych spełnia warunek Lapunowa, to spełnia również warunek Lindeberga. Jednak implikacja odwrotna nie zachodzi.

Lindeberg CLT

W tym samym ustawieniu i z tym samym zapisem co powyżej, warunek Lapunowa można zastąpić następującym, słabszym (od Lindeberga w 1920 r.).

Załóżmy, że dla każdego

gdzie jest funkcją wskaźnika . Następnie podział standaryzowanych kwot
zbiega się w kierunku standardowego rozkładu normalnego. .

Wielowymiarowy CLT

funkcje charakterystyczne można rozszerzyć na przypadki w których każdy jest losowym wektorem w k wektor średni i macierz kowariancji (wśród składników wektora), a te losowe wektory są niezależne i mają jednakowy rozkład. Sumowanie tych wektorów odbywa się składowo. Wielowymiarowe centralne twierdzenie graniczne stwierdza, że ​​po przeskalowaniu sumy zbiegają się do wielowymiarowego rozkładu normalnego .

Pozwalać

być wektorem k . Pogrubienie że ​​jest to wektor losowy, a nie zmienna losowa (jednowymiarowa Wtedy będzie suma losowych wektorów
i średnia jest
i dlatego

Stwierdza to centralne twierdzenie graniczne o wielowymiarach

gdzie macierz kowariancji jest równa

Szybkość zbieżności wyraża następujący wynik typu Berry’ego – Esseena :

Twierdzenie - Niech będzie niezależne . będą losowe wektory, z których każdy ma średnią zero. Zapisz i załóż jest odwracalny. Niech będzie z tą samą średnią i tą samą macierzą kowariancji co . Następnie dla wszystkich zbiorów wypukłych , }

gdzie jest uniwersalną, } i oznacza normę euklidesową na }

Nie wiadomo czy

Uogólnione centralne twierdzenie graniczne

Uogólnione Centralne Twierdzenie Graniczne (GCLT) było dziełem wielu matematyków ( Bernsteina , Lindeberga , Lévy’ego , Fellera , Kolmogorowa i innych) w latach 1920–1937. Pierwszy opublikowany kompletny dowód GCLT został opublikowany w 1937 r. przez Paula Lévy’ego po francusku. Angielska wersja pełnego dowodu GCLT jest dostępna w tłumaczeniu Gnedenki i Kołmogorowa z 1954 roku.

Oświadczenie GCLT jest następujące:

Niezdegenerowana zmienna losowa Z jest α-stabilna dla pewnego 0 < α ≤ 2 wtedy i tylko wtedy, gdy istnieje niezależny, identycznie rozłożony ciąg zmiennych losowych X 1 , X 2 , X 3 , ... i stałych a n > 0, b n ∈ ℝ z
a n (X 1 + ... + X n ) - b n → Z.
Tutaj → oznacza, że ​​ciąg sum zmiennych losowych jest zbieżny w rozkładzie; tj. odpowiednie rozkłady spełniają F n (y) → F(y) we wszystkich punktach ciągłości F.

Innymi słowy, jeśli sumy niezależnych zmiennych losowych o identycznym rozkładzie zbiegają się w rozkładzie do pewnego Z , to Z musi być rozkładem stabilnym .

Procesy zależne

CLT w słabej zależności

Przydatnym uogólnieniem sekwencji niezależnych zmiennych losowych o jednakowym rozkładzie jest losowy proces mieszania w czasie dyskretnym; „mieszanie” oznacza z grubsza, że ​​zmienne losowe znajdujące się czasowo daleko od siebie są prawie niezależne. W teorii ergodycznej i teorii prawdopodobieństwa stosuje się kilka rodzajów mieszania. Zobacz szczególnie silne mieszanie (zwane także α-mieszaniem) zdefiniowane przez gdzie jest tak zwane silny współczynnik mieszania .

Uproszczone sformułowanie centralnego twierdzenia granicznego przy silnym mieszaniu to:

Twierdzenie - Załóżmy, że nieruchomy i miesza się z i że i . Oznacz _ _

istnieje i jeśli zbiega do .

W rzeczywistości,

gdzie szereg jest zbieżny bezwzględnie.

założenia , ponieważ asymptotyczna normalność zawodzi dla gdzie kolejna sekwencja .

twierdzenia _ i założenie zostaje zastąpione przez

takiego . Encyklopedyczne podejście do twierdzeń granicznych w warunkach mieszania można znaleźć w artykule ( Bradley 2007 ).

Różnica Martingale CLT

Twierdzenie Niech martyngał _

  • z prawdopodobieństwem jako n → ∞ ,
  • dla każdego ε > 0 , as n → ∞ ,

wówczas w rozkładzie jako n

Uwagi

Dowód klasycznego CLT

Centralne twierdzenie graniczne ma dowód za pomocą funkcji charakterystycznych . Przypomina to dowód (słabego) prawa wielkich liczb .

Załóżmy, rozłożonymi zmiennymi losowymi i skończona wariancja } Suma _ _ i wariancja } Rozważ zmienną losową

w zdefiniowaliśmy każda i wariancja jednostkowa ( ). Charakterystyczną funkcję podaje Z
wykorzystaliśmy fakt, że wszystkie rozłożone. Charakterystyczną funkcją jest, zgodnie z twierdzeniem Taylora, Y
gdzie to „ mała notacja o ” dla jakiejś funkcji która dąży do zera szybciej niż . Przez granicę funkcji wykładniczej ( charakterystyczna funkcja jest równe

Wszystkie terminy wyższego rzędu znikają w granicy. } Prawa strona jest równa charakterystycznej funkcji standardowego rozkładu normalnego , co z twierdzenia o ciągłości Lévy'ego wynika, ​​rozkład Z zbliży się do } . Dlatego średnia z próby

jest takie, że
zbiega się do rozkładu normalnego wynika twierdzenie

Konwergencja do granic możliwości

Centralne twierdzenie graniczne podaje jedynie rozkład asymptotyczny . Jako przybliżenie skończonej liczby obserwacji, zapewnia rozsądne przybliżenie tylko wtedy, gdy jest blisko szczytu rozkładu normalnego; wymaga bardzo dużej liczby obserwacji, aby rozciągnąć się do ogonów. [ potrzebne źródło ]

Zbieżność w centralnym twierdzeniu granicznym jest jednostajna , ponieważ ograniczająca funkcja rozkładu skumulowanego jest ciągła. Jeśli trzeci moment centralny istnieje i jest skończony, mi rzędu (patrz Berry’ego – Esseena Metoda Steina można wykorzystać nie tylko do udowodnienia centralnego twierdzenia granicznego, ale także do wyznaczenia granic współczynników zbieżności dla wybranych metryk.

Zbieżność do rozkładu normalnego jest monotoniczna w tym sensie, że wzrasta do entropii rozkładu normalnego

Centralne twierdzenie graniczne ma zastosowanie w szczególności do sum niezależnych i jednakowo rozłożonych dyskretnych zmiennych losowych . Suma dyskretnych zmiennych losowych jest nadal dyskretną zmienną losową , tak więc mamy do czynienia z sekwencją dyskretnych zmiennych losowych , których skumulowana funkcja rozkładu prawdopodobieństwa zbiega się w kierunku skumulowanej funkcji rozkładu prawdopodobieństwa odpowiadającej zmiennej ciągłej (mianowicie rozkładu normalnego ) . Oznacza to, że jeśli zbudujemy histogram realizacji sumy n niezależnych identycznych zmiennych dyskretnych, krzywa odcinkowo-liniowa łącząca środki górnych ścian prostokątów tworzących histogram zbiega się w kierunku krzywej Gaussa, gdy n zbliża się do nieskończoności; zależność ta jest znana jako twierdzenie de Moivre’a – Laplace’a . Artykuł o rozkładzie dwumianowym szczegółowo opisuje takie zastosowanie centralnego twierdzenia granicznego w prostym przypadku zmiennej dyskretnej przyjmującej tylko dwie możliwe wartości.

Wspólne nieporozumienia

Badania wykazały, że centralne twierdzenie graniczne jest obarczone kilkoma powszechnymi, ale poważnymi błędami, z których część pojawia się w powszechnie używanych podręcznikach. Należą do nich przekonania, że:

  • Twierdzenie to ma zastosowanie do losowego próbkowania dowolnej zmiennej, a nie do średnich wartości (lub sum) iid zmiennych losowych wyodrębnionych z populacji poprzez wielokrotne próbkowanie. Oznacza to, że twierdzenie zakłada, że ​​losowe próbkowanie tworzy rozkład próbkowania utworzony z różnych wartości średnich (lub sum) takich zmiennych losowych.
  • Twierdzenie zapewnia, że ​​losowe próbkowanie prowadzi do powstania rozkładu normalnego dla dostatecznie dużych próbek dowolnej zmiennej losowej, niezależnie od rozkładu populacji. W rzeczywistości takie próbkowanie asymptotycznie odtwarza właściwości populacji, co jest intuicyjnym wynikiem popartym twierdzeniem Glivenki-Cantellego .
  • Że twierdzenie prowadzi do dobrego przybliżenia rozkładu normalnego dla liczebności prób większych niż około 30, umożliwiając wiarygodne wnioskowanie niezależnie od charakteru populacji. W rzeczywistości ta empiryczna zasada nie ma żadnego uzasadnienia i może prowadzić do poważnych błędnych wniosków.

Związek z prawem wielkich liczb

Prawo wielkich liczb oraz centralne twierdzenie graniczne stanowią częściowe rozwiązania ogólnego problemu: „Jakie jest ograniczające zachowanie S n , gdy n dąży do nieskończoności?” W analizie matematycznej szeregi asymptotyczne są jednym z najpopularniejszych narzędzi stosowanych do rozwiązywania takich problemów.

Załóżmy, że mamy asymptotyczną ekspansję : }

Dzielenie obu części przez φ 1 ( n ) i przyjęcie granicy da 1 jego , współczynnik składnika najwyższego rzędu w rozwinięciu, który reprezentuje szybkość, z jaką f ( n ) zmienia się w członie wiodącym.

Nieformalnie można powiedzieć: „ f ( n ) rośnie w przybliżeniu jako 1 φ 1 ( n ) . Biorąc różnicę między f ( n ) i jej przybliżenie, a następnie dzieląc przez kolejny wyraz w rozwinięciu, dochodzimy do bardziej wyrafinowanego stwierdzenia na temat f ( n ) :

Można tu powiedzieć, że różnica pomiędzy funkcją a jej przybliżeniem rośnie w przybliżeniu jako 2 φ 2 ( n ) . Pomysł jest taki, że podzielenie funkcji przez odpowiednie funkcje normalizujące i przyjrzenie się ograniczającemu zachowaniu wyniku może nam wiele powiedzieć o ograniczającym zachowaniu samej pierwotnej funkcji.

Nieformalnie coś podobnego dzieje się, gdy suma Sn , niezależnych zmiennych losowych o identycznym rozkładzie, X 1 , ..., X n jest badana w klasycznej teorii prawdopodobieństwa. [ potrzebne źródło ] Jeśli każdy X i ma skończoną średnią μ , to zgodnie z prawem wielkich liczb S n / n μ . Jeżeli dodatkowo każde X i ma skończoną wariancję σ 2 , to według centralnego twierdzenia granicznego

gdzie ξ rozkłada się jako N (0, σ 2 ) . Zapewnia to wartości pierwszych dwóch stałych w nieformalnym rozwinięciu

W przypadku, gdy X i nie ma skończonej średniej lub wariancji, zbieżność przesuniętej i przeskalowanej sumy może również nastąpić przy różnych współczynnikach centrowania i skalowania:

lub nieformalnie

Rozkłady Ξ , które mogą powstać w ten sposób, nazywane są stabilnymi . Oczywiście rozkład normalny jest stabilny, ale istnieją również inne stabilne rozkłady, takie jak rozkład Cauchy'ego , dla których nie zdefiniowano średniej ani wariancji. Współczynnik skalujący c 1/2 być bn może dowolnego proporcjonalny do nc ; , dla można go również pomnożyć przez wolno zmieniającą się funkcję n .

Prawo logarytmu iterowanego określa, co dzieje się „pomiędzy” prawem wielkich liczb a centralnym twierdzeniem granicznym. W szczególności mówi, że funkcja normalizująca n log log n , o rozmiarze pośrednim pomiędzy n prawa wielkich liczb a n centralnego twierdzenia granicznego, zapewnia nietrywialne zachowanie ograniczające.

Alternatywne stwierdzenia twierdzenia

Funkcje gęstości

Gęstość sumy dwóch lub więcej zmiennych niezależnych jest splotem ich gęstości (jeśli takie gęstości istnieją) . Zatem centralne twierdzenie graniczne można interpretować jako stwierdzenie dotyczące właściwości funkcji gęstości w stanie splotu: splot szeregu funkcji gęstości zmierza do gęstości normalnej, gdy liczba funkcji gęstości rośnie bez ograniczeń. Twierdzenia te wymagają silniejszych hipotez niż podane powyżej formy centralnego twierdzenia granicznego. Twierdzenia tego typu nazywane są często lokalnymi twierdzeniami granicznymi. Zobacz Petrova, aby zapoznać się z konkretnym lokalnym twierdzeniem granicznym dla sum niezależne i jednakowo rozłożone zmienne losowe .

Funkcje charakterystyczne

Ponieważ funkcja charakterystyczna splotu jest iloczynem funkcji charakterystycznych zaangażowanych gęstości, centralne twierdzenie graniczne ma jeszcze jedno przekształcenie: iloczyn funkcji charakterystycznych szeregu funkcji gęstości zbliża się do funkcji charakterystycznej gęstości normalnej gdy liczba funkcji gęstości rośnie bez ograniczeń, w warunkach określonych powyżej. W szczególności należy zastosować odpowiedni współczynnik skalujący do argumentu funkcji charakterystycznej.

Równoważne stwierdzenie można sformułować na temat transformat Fouriera , ponieważ funkcja charakterystyczna jest zasadniczo transformatą Fouriera.

Obliczanie wariancji

Niech S n będzie sumą n zmiennych losowych. Wiele centralnych twierdzeń granicznych zapewnia takie warunki, że S n / Var( S n ) zbiega się w rozkładzie do N (0,1) (rozkład normalny ze średnią 0, wariancja 1) jako n → ∞ . W niektórych przypadkach można znaleźć stałą σ 2 i funkcję f(n) taką, że S n /(σ n⋅f ( n ) ) zbiega się w rozkładzie do N (0,1) jako n → ∞ .

Lemat - Załóżmy rzeczywistych i ściśle stacjonarnych, w których dla wszystkich , } do . Skonstruować

  1. Jeśli jest absolutnie zbieżny, i wtedy jak gdzie .
  2. Jeśli dodatkowo zbiega się w rozkładzie do jak wtedy również zbiega się w dystrybucji do jak \

Rozszerzenia

Iloczyny dodatnich zmiennych losowych

Logarytm iloczynu to po prostu suma logarytmów czynników. Dlatego też, gdy logarytm iloczynu zmiennych losowych, które przyjmują tylko wartości dodatnie, zbliża się do rozkładu normalnego, sam iloczyn zbliża się do rozkładu logarytmiczno-normalnego . Wiele wielkości fizycznych (zwłaszcza masa lub długość, które są kwestią skali i nie mogą być ujemne) są iloczynami różnych losowych , zatem mają rozkład logarytmiczno-normalny. Ta multiplikatywna wersja centralnego twierdzenia granicznego jest czasami nazywana prawem Gibrata .

Podczas gdy centralne twierdzenie graniczne dla sum zmiennych losowych wymaga warunku skończonej wariancji, odpowiadające mu twierdzenie dla iloczynów wymaga odpowiedniego warunku, aby funkcja gęstości była całkowalna do kwadratu.

Poza klasycznymi ramami

Asymptotyczna normalność, czyli zbieżność do rozkładu normalnego po odpowiednim przesunięciu i przeskalowaniu, jest zjawiskiem znacznie bardziej ogólnym niż omówiony powyżej klasyczny układ, czyli sumy niezależnych zmiennych losowych (lub wektorów). Od czasu do czasu ujawniane są nowe ramy; na razie nie jest dostępna żadna pojedyncza struktura ujednolicająca.

Korpus wypukły

Twierdzenie Istnieje ciąg ε n ↓ 0 , dla którego zachodzi następujące twierdzenie. Niech n ≥ 1 i niech zmienne losowe X 1 , ..., X n mają logarytmicznie wklęsłą gęstość spoiny f taką, że f ( x 1 , ..., x n ) = f (| x 1 |, .. ., | x n |) dla wszystkich x 1 , ..., x n i E( X
2 k
) = 1
dla wszystkich k = 1, ..., n . Następnie dystrybucja

wynosi ε n -blisko całkowitej odległości zmiany .

Te dwa rozkłady ε n -bliskie mają gęstości (w rzeczywistości gęstości logarytmiczno-wklęsłe), zatem całkowita odległość wariancji między nimi jest całką z wartości bezwzględnej różnicy między gęstościami. Zbieżność w całkowitej zmienności jest silniejsza niż słaba zbieżność.

Ważnym przykładem gęstości log-wklęsłej jest funkcja stała wewnątrz danego ciała wypukłego i zanikająca na zewnątrz; odpowiada to równomiernemu rozkładowi na ciele wypukłym, co wyjaśnia termin „centralne twierdzenie graniczne dla ciał wypukłych”.

Inny przykład: f ( x 1 , ..., x n ) = const · exp(−(| x 1 | α + ⋯ + | x n | α ) β ) gdzie α > 1 i αβ > 1 . Jeśli β = 1 , to f ( x 1 , ..., x n ) rozkłada się na czynniki na const · exp (−| x 1 | α ) … exp(−| x n | α ), co oznacza, że ​​X 1 , ..., X n są niezależne. Generalnie jednak są one zależne.

Warunek f ( x 1 , ..., x n ) = f (| x 1 |, ..., | x n |) gwarantuje, że X 1 , ..., X n mają średnią zerową i są nieskorelowane ; [ potrzebne źródło ] mimo to nie muszą być niezależne, ani nawet niezależne parami . [ potrzebne źródło ] Nawiasem mówiąc, niezależność parami nie może zastąpić niezależności w klasycznym centralnym twierdzeniu granicznym.

Oto wynik typu Berry-Esseen .

Twierdzenie Niech zatem X 1 , ..., X n spełniają założenia poprzedniego twierdzenia

dla wszystkich a < b ; tutaj C jest uniwersalną (absolutną) stałą . Ponadto dla każdego c 1 , ..., do n R takiego, że do 2
+
1 ⋯ + do
2 n
= 1
,

Rozkład X 1 + ⋯ + X n / n nie musi być w przybliżeniu normalny (w rzeczywistości może być równomierny). Jednak rozkład do 1 X 1 + ⋯ + do n X n jest bliski (w całkowitej odległości zmiany) dla większości wektorów ( do 1 , ..., do n ) według równomiernego rozkładu na kuli c
2 1
+ ⋯ + do
2 n
= 1
.

Lakunarne szeregi trygonometryczne

Twierdzenie ( Salem Zygmund ) Niech U będzie zmienną losową o rozkładzie jednostajnym na (0,2π) , oraz X k = r k cos( n k U + a k ) , gdzie

  • n k spełniają warunek lakunarności: istnieje q > 1 takie, że n k + 1 qn k dla wszystkich k ,
  • r k są takie, że
  • 0 ≤ a k < 2π .

Następnie

zbiega się w rozkładzie do .

Polytopy Gaussa

Twierdzenie Niech A 1 , ..., An n będą niezależnymi punktami losowymi na płaszczyźnie R 2 , z których każdy ma dwuwymiarowy standardowy rozkład normalny. Niech K n będzie wypukłą powłoką tych punktów, a X n polem K n Wtedy

się w rozkładzie gdy do

To samo dotyczy wszystkich wymiarów większych niż 2.

Polytop K n nazywany jest losowym Polytopem Gaussa.

Podobny wynik dotyczy liczby wierzchołków (polytopu Gaussa), liczby krawędzi i właściwie ścian wszystkich wymiarów.

Funkcje liniowe macierzy ortogonalnych

Funkcja liniowa macierzy M jest liniową kombinacją jej elementów (o podanych współczynnikach), M ↦ tr( AM ) gdzie A jest macierzą współczynników; zobacz Ślad (algebra liniowa) #Iloczyn wewnętrzny .

losowa macierz ortogonalna ma rozkład jednostajny, jeśli jej rozkład jest znormalizowaną miarą Haara na grupie ortogonalnej O( n , R ) ; zobacz Macierz rotacji # Jednolite losowe macierze rotacji .

Twierdzenie Niech M będzie losową ortogonalną macierzą n × n o rozkładzie równomiernym, a A stałą macierzą n × n taką, że tr( AA *) = n i niech X = tr( AM ) . Następnie rozkład X jest bliski całkowitej metryki zmienności aż do [ potrzebne wyjaśnienie ] 2 3 / n - 1 .

Podciągi

Twierdzenie Niech zmienne losowe X 1 , X 2 , ... ∈ L 2 (Ω) będą takie, że X n → 0 słabo w L 2 (Ω) i X
n
→ 1
słabo w L 1 (Ω) . Wtedy istnieją liczby całkowite n 1 < n 2 < ⋯ takie, że

w gdy k .

Losowy spacer po sieci kryształowej

Centralne twierdzenie graniczne można ustalić dla prostego błądzenia losowego po sieci krystalicznej (nieskończenie krotny abelowy wykres pokrywający graf skończony) i służy do projektowania struktur krystalicznych.

Zastosowania i przykłady

Prostym przykładem centralnego twierdzenia granicznego jest rzut wieloma identycznymi, bezstronnymi kostkami. Rozkład sumy (lub średniej) wyrzuconych liczb będzie dobrze przybliżony rozkładem normalnym. Ponieważ ilości w świecie rzeczywistym są często zrównoważoną sumą wielu niezaobserwowanych zdarzeń losowych, centralne twierdzenie graniczne zapewnia również częściowe wyjaśnienie przewagi normalnego rozkładu prawdopodobieństwa. Uzasadnia to także przybliżanie statystyk dużych prób do rozkładu normalnego w kontrolowanych eksperymentach.

Porównanie funkcji gęstości prawdopodobieństwa p ( k ) dla sumy n uczciwych kości 6-ściennych w celu wykazania ich zbieżności do rozkładu normalnego wraz ze wzrostem n , zgodnie z centralnym twierdzeniem granicznym. Na wykresie w prawym dolnym rogu wygładzone profile poprzednich wykresów zostały przeskalowane, nałożone i porównane z rozkładem normalnym (czarna krzywa).
Rysunek ten przedstawia centralne twierdzenie graniczne. Średnie próbki są generowane przy użyciu generatora liczb losowych, który losuje liczby od 0 do 100 z jednolitego rozkładu prawdopodobieństwa. Pokazuje, że zwiększenie wielkości próby powoduje, że 500 zmierzonych średnich próbek jest bliżej rozłożonych wokół średniej populacji (w tym przypadku 50). Porównuje także zaobserwowane rozkłady z rozkładami, których można by oczekiwać dla znormalizowanego rozkładu Gaussa i pokazuje chi-kwadrat , które określają ilościowo dobroć dopasowania (dopasowanie jest dobre, jeśli zredukowany współczynnik chi-kwadrat wartość jest mniejsza lub w przybliżeniu równa jeden). Dane wejściowe do znormalizowanej funkcji Gaussa to średnia średnich z próbki (~50) i średnie odchylenie standardowe próbki podzielone przez pierwiastek kwadratowy z wielkości próbki (~28,87/ √ n ), co nazywa się odchyleniem standardowym średniej ( ponieważ odnosi się do rozrzutu średnich z próby).
Kolejna symulacja z wykorzystaniem rozkładu dwumianowego. Wygenerowano losowe wartości 0 i 1, a następnie obliczono ich średnie dla próbek o liczebności od 1 do 512. Należy zauważyć, że wraz ze wzrostem wielkości próbki ogony stają się cieńsze, a rozkład staje się bardziej skoncentrowany wokół średniej.

Regresja

Analiza regresji , a w szczególności zwykła metoda najmniejszych kwadratów, określa, że ​​zmienna zależna zależy, zgodnie z pewną funkcją, od jednej lub większej liczby zmiennych niezależnych , z dodatkiem błędu . Różne rodzaje wnioskowania statystycznego na temat regresji zakładają, że składnik błędu ma rozkład normalny. Założenie to można uzasadnić założeniem, że składnik błędu jest w rzeczywistości sumą wielu niezależnych składników błędu; nawet jeśli poszczególne składniki błędu nie mają rozkładu normalnego, dzięki centralnemu twierdzeniu granicznemu ich sumę można dobrze przybliżyć rozkładem normalnym.

Inne ilustracje

Biorąc pod uwagę jego znaczenie dla statystyki, dostępnych jest wiele artykułów i pakietów komputerowych, które demonstrują zbieżność związaną z centralnym twierdzeniem granicznym.

Historia

Holenderski matematyk Henk Tijms pisze:

Centralne twierdzenie graniczne ma ciekawą historię. Pierwsza wersja tego twierdzenia została postulowana przez urodzonego we Francji matematyka Abrahama de Moivre , który w niezwykłym artykule opublikowanym w 1733 roku wykorzystał rozkład normalny do przybliżenia rozkładu liczby orłów wynikających z wielu rzutów uczciwą monetą. Odkrycie to znacznie wyprzedziło swoje czasy i zostało prawie zapomniane, dopóki słynny francuski matematyk Pierre-Simon Laplace nie wybawił go z zapomnienia w swoim monumentalnym dziele Théorie analytique des probabilités , opublikowany w 1812 r. Laplace rozszerzył ustalenia De Moivre'a, przybliżając rozkład dwumianowy do rozkładu normalnego. Jednak podobnie jak w przypadku De Moivre’a, odkryciu Laplace’a w jego czasach nie poświęcono zbyt wiele uwagi. Znaczenie centralnego twierdzenia granicznego dostrzeżono dopiero pod koniec XIX wieku, kiedy w 1901 roku rosyjski matematyk Aleksandr Lapunow zdefiniował je w sposób ogólny i dokładnie udowodnił, jak działa ono matematycznie. Obecnie centralne twierdzenie graniczne uważane jest za nieoficjalnego władcę teorii prawdopodobieństwa.

Sir Francis Galton tak opisał Centralne Twierdzenie Graniczne:

Nie znam nic, co tak wywierałoby wpływ na wyobraźnię, jak cudowna forma kosmicznego porządku wyrażona przez „Prawo częstotliwości błędów”. Prawo zostałoby uosobione przez Greków i ubóstwione, gdyby o nim wiedzieli. Króluje ze spokojem i całkowitym zatarciem, pośród najdzikszego zamieszania. Im większy tłum i im większa pozorna anarchia, tym doskonalsza jest jego władza. Jest to najwyższe prawo nierozsądku. Ilekroć bierze się do ręki dużą próbkę elementów chaotycznych i porządkuje według ich wielkości, niespodziewana i najpiękniejsza forma regularności okazuje się przez cały czas ukryta.

Właściwy termin „centralne twierdzenie graniczne” (w języku niemieckim: „zentraler Grenzwertsatz”) został po raz pierwszy użyty przez George'a Pólyę w 1920 r. w tytule artykułu. Pólya nazwał twierdzenie „centralnym” ze względu na jego znaczenie w teorii prawdopodobieństwa. Według Le Cama francuska szkoła prawdopodobieństwa interpretuje słowo centralny w tym sensie, że „opisuje zachowanie środka rozkładu, a nie jego ogonów”. Streszczenie artykułu O centralnym twierdzeniu granicznym rachunku prawdopodobieństwa i problemie momentów autorstwa Pólyi z 1920 r. tłumaczy się następująco.

Występowanie gęstości prawdopodobieństwa Gaussa 1 = e x 2 w powtarzanych eksperymentach, w błędach pomiarów skutkujących kombinacją bardzo wielu i bardzo małych błędów elementarnych, w procesach dyfuzji itp. można wyjaśnić, jak dobrze- znane z tego samego twierdzenia granicznego, które odgrywa kluczową rolę w rachunku prawdopodobieństwa. Rzeczywisty odkrywca tego twierdzenia granicznego ma nazywać się Laplace; jest prawdopodobne, że jego rygorystyczny dowód został po raz pierwszy przedstawiony przez Tschebyscheffa, a jego najostrzejsze sformułowanie można znaleźć, o ile mi wiadomo, w artykule Liapounoffa . ...

Hald dostarcza dokładnego opisu historii twierdzenia, szczegółowo opisującego podstawowe prace Laplace'a, a także wkład Cauchy'ego , Bessela i Poissona . Dwie relacje historyczne, jedna obejmująca rozwój od Laplace'a do Cauchy'ego, druga wkład von Misesa , Pólyi , Lindeberga , Lévy'ego i Craméra w latach dwudziestych XX wieku podaje Hans Fischer. Le Cam opisuje okres około 1935 roku. Bernstein przedstawia dyskusję historyczną skupiającą się na twórczości Pafnuty'ego Czebyszewa i jego uczniów Andrieja Markowa i Aleksandra Łapunowa , która doprowadziła do pierwszych dowodów CLT w kontekście ogólnym.

Ciekawym przypisem do historii Centralnego Twierdzenia Granicznego jest to, że dowód wyniku podobnego do CLT Lindeberga z 1922 r. był tematem rozprawy doktorskiej Alana Turinga z 1934 r. o stypendium w King's College na Uniwersytecie w Cambridge . Dopiero po przesłaniu pracy Turing dowiedział się, że zostało to już udowodnione. W rezultacie rozprawa Turinga nie została opublikowana.

Zobacz też

Notatki

Linki zewnętrzne