Centralne twierdzenie graniczne łańcucha Markowa
W matematycznej teorii procesów losowych centralne twierdzenie graniczne łańcucha Markowa ma wniosek nieco podobny w formie do klasycznego centralnego twierdzenia granicznego (CLT) teorii prawdopodobieństwa, ale wielkość w roli, jaką odgrywa wariancja w klasycznym CLT ma bardziej skomplikowaną definicję. Zobacz także ogólną formę tożsamości Bienaymé .
Oświadczenie
Przypuszczam, że:
- ciąg losowych elementów pewnego zbioru jest łańcuchem Markowa , który ma stacjonarny rozkład prawdopodobieństwa ; I
- początkowy rozkład procesu, tj. rozkład , jest rozkładem stacjonarnym, tak że mają identyczny rozkład. W klasycznym centralnym twierdzeniu granicznym zakłada się, że te zmienne losowe są niezależne , ale tutaj mamy tylko słabsze założenie, że proces ma własność Markowa ; I
- to pewna (mierzalna) funkcja o wartościach rzeczywistych, dla której
Teraz pozwól
Wtedy jako mamy
gdzie ozdobiona strzałka wskazuje na zbieżność rozkładu .
To znaczy że
gdzie ~ oznacza „jest dystrybuowany jak”.
Ustawienie Monte Carlo
Centralne twierdzenie graniczne łańcucha Markowa może być zagwarantowane dla funkcjonałów ogólnej przestrzeni stanów Łańcuchy Markowa pod pewnymi warunkami. W szczególności można to zrobić, koncentrując się na ustawieniach Monte Carlo. Przykład zastosowania w ustawieniu MCMC (Markov Chain Monte Carlo) jest następujący:
Rozważmy prosty model twardych kul na siatce. Załóżmy, że . Właściwa konfiguracja na lub biało w taki sposób, aby żadne dwa sąsiednie punkty nie były białe. Niech oznacza zbiór wszystkich właściwych konfiguracji na , gdzie będzie całkowitą liczbą właściwych konfiguracji, a π będzie równomiernym rozkładem na , aby każda właściwa konfiguracja była równie prawdopodobna. Załóżmy, że naszym celem jest obliczenie typowej liczby białych punktów we właściwej konfiguracji; to znaczy, jeśli to liczba białych punktów w wtedy chcemy wartość
Jeśli nawet umiarkowanie duże, to będziemy musieli zastosować przybliżenie do mi . Rozważ następujący łańcuch Markowa na . Naprawić i ustawić gdzie to dowolna właściwa konfiguracja. Losowo wybierz punkt i niezależnie narysuj . u a wszystkie sąsiednie punkty są czarne, a następnie kolor inne punkty w W przeciwnym razie pokoloruj inne punkty w Wywołaj wynikową konfigurację . Kontynuując w ten sposób otrzymujemy ergodyczny łańcuch Markowa Harrisa mając jako niezmienną dystrybucję Mi z . Ponadto, ponieważ jest skończony (choć potencjalnie duży), dobrze wiadomo, że zbiegnie się wykładniczo szybko do , co oznacza, że CLT obowiązuje dla .
Implikacje
Nieuwzględnienie dodatkowych składników w wariancji, które wynikają z korelacji (np. korelacji szeregowych w symulacjach Monte Carlo łańcucha Markowa) może skutkować problemem pseudoreplikacji przy obliczaniu np. przedziałów ufności dla średniej z próby .
Źródła
- Gordin, MI i Lifšic, BA (1978). „Centralne twierdzenie graniczne dla stacjonarnych procesów Markowa”. Matematyka radziecka, Doklady , 19 , 392–394. (angielskie tłumaczenie rosyjskiego oryginału).
- Geyer, Charles J. (2011). „Wprowadzenie do MCMC”. W Handbook of Markov Chain Monte Carlo , pod redakcją SP Brooks, AE Gelman, GL Jones i XL Meng. Chapman & Hall/CRC, Boca Raton, s. 3–48.