Równanie Walda
W teorii prawdopodobieństwa równanie Walda , tożsamość Walda lub lemat Walda jest ważną tożsamością , która upraszcza obliczenie wartości oczekiwanej sumy losowej liczby losowych wielkości . W swojej najprostszej postaci wiąże oczekiwanie sumy losowo wielu skończonych średnich, niezależnych i identycznie rozłożonych zmiennych losowych z oczekiwaną liczbą wyrazów w sumie i wspólną wartością oczekiwaną zmiennych losowych pod warunkiem, że liczba wyrazów w suma jest niezależny od sum.
Równanie nosi imię matematyka Abrahama Walda . Tożsamość dla drugiego momentu jest określona przez równanie Blackwella-Girshicka.
Wersja podstawowa
Niech ( X n ) n ∈ będzie sekwencją niezależnych zmiennych losowych o identycznym rozkładzie o wartościach rzeczywistych i niech N ≥ 0 będzie zmienną losową o wartości całkowitej, która jest niezależna od sekwencji ( X n ) n ∈ N {\ Displaystyle \ mathbb {N} } X n ) n ∈ . Załóżmy, że N i X n mają skończone oczekiwania. Następnie
Przykład
Rzuć sześciościenną kostką . Weź liczbę na kostce (nazwij ją N ) i rzuć tą liczbą sześciennych kostek, aby otrzymać liczby X 1 , . . . , X N i dodaj ich wartości. Z równania Walda wynikowa wartość wynosi średnio
Wersja ogólna
Niech ( X n ) n ∈ będzie nieskończoną sekwencją zmiennych losowych o wartościach rzeczywistych i niech N będzie nieujemną zmienną losową o wartościach całkowitych.
Zakładać, że:
- . ( X n ) n ∈ są całkowalnymi (o skończonej średniej) zmiennymi losowymi,
- . E[ X n 1 { N ≥ n } ] = E[ X n ] P( N ≥ n ) dla każdej liczby naturalnej n , i
- . nieskończony szereg spełnia
Następnie losowe sumy
są całkowalne i
Jeśli dodatkowo
- . ( X n ) n ∈ wszyscy mają takie same oczekiwania i
- . N ma skończone oczekiwanie,
Następnie
Uwaga: Zwykle nazwa równania Walda odnosi się do tej ostatniej równości.
Omówienie założeń
Oczywiście założenie ( 1 ) jest potrzebne do sformułowania założenia ( 2 ) i równania Walda. Założenie ( 2 ) kontroluje wielkość dozwolonej zależności między sekwencją ( X n ) n ∈ a liczbą N wyrazów; zobacz kontrprzykład poniżej dla konieczności . Zauważ, że założenie ( 2 ) jest spełnione, gdy N jest czasem zatrzymania sekwencji ( X n ) n ∈ . [ potrzebne źródło ] Założenie ( 3 ) ma charakter bardziej techniczny, implikuje absolutną zbieżność , a tym samym pozwala na dowolne przegrupowanie nieskończonego szeregu w dowodzie.
Jeśli spełnione jest założenie ( 5 ), to założenie ( 3 ) można wzmocnić do prostszego warunku
- . istnieje rzeczywista stała C taka, że E[| Xn _ | 1 { N ≥ n } ] ≤ C P( N ≥ n ) dla wszystkich liczb naturalnych n .
Rzeczywiście, korzystając z założenia ( 6 ),
a ostatnia seria równa się wartości oczekiwanej N [ Dowód ] , która z założenia jest skończona ( 5 ). Dlatego ( 5 ) i ( 6 ) implikują założenie ( 3 ).
Załóżmy oprócz ( 1 ) i ( 5 ), że
- . N jest niezależne od sekwencji ( X n ) n ∈ i
- . istnieje stała C taka, że E[| X n |] ≤ C dla wszystkich liczb naturalnych n .
Wtedy wszystkie założenia ( 1 ), ( 2 ), ( 5 ) i ( 6 ), a więc i ( 3 ) są spełnione. W szczególności warunki ( 4 ) i ( 8 ) są spełnione, jeśli
- . wszystkie zmienne losowe ( X n ) n ∈ mają ten sam rozkład.
Zauważ, że zmienne losowe sekwencji ( X n ) n ∈ nie muszą być niezależne.
Interesującym punktem jest dopuszczenie pewnej zależności między losową liczbą N wyrazów a sekwencją ( X n ) n ∈ . Standardowa wersja zakłada ( 1 ), ( 5 ), ( 8 ) i istnienie filtracji ( fa n ) n ∈ N 0
- . N jest czasem zatrzymania w odniesieniu do filtracji, a
- . X n i fa n –1 są niezależne dla każdego n ∈ .
Wtedy ( 10 ) implikuje, że zdarzenie { N ≥ n } = { N ≤ n – 1} c jest w F n –1 , a więc przez ( 11 ) niezależne od X n . To implikuje ( 2 ) i razem z ( 8 ) implikuje ( 6 ).
Dla wygody (patrz dowód poniżej przy użyciu opcjonalnego twierdzenia o zatrzymaniu) i aby określić relację sekwencji ( X n ) n ∈ i filtracji ( fa n ) n ∈ 0 , często nakładane jest następujące dodatkowe założenie:
- . sekwencja ( X n ) n ∈ jest dostosowana do filtracji ( fa n ) n ∈ , co oznacza, że X n jest fa n -mierzalny dla co n ∈ .
Zauważ, że ( 11 ) i ( 12 ) razem oznaczają, że zmienne losowe ( X n ) n ∈ są niezależne.
Aplikacja
Zastosowanie znajduje się w naukach aktuarialnych , gdy rozważanie całkowitej kwoty roszczenia następuje po złożonym procesie Poissona
w określonym przedziale czasu, powiedzmy jednego roku, wynikającym z losowej liczby N indywidualnych roszczeń ubezpieczeniowych, których rozmiary są opisane zmiennymi losowymi ( X n ) n ∈ . Przy powyższych założeniach można zastosować równanie Walda do obliczenia oczekiwanej całkowitej kwoty odszkodowania, gdy dostępne są informacje o średniej liczbie szkód w ciągu roku i średniej wielkości szkody. Przy silniejszych założeniach i większej ilości informacji o podstawowych rozkładach, rekurencja Panjera można użyć do obliczenia rozkładu S N .
Przykłady
Przykład z warunkami zależnymi
Niech N będzie całkowalną zmienną losową o wartościach 0 o wartościach rzeczywistych przy E [ Z ] = 0 . Zdefiniuj X n = (–1) n Z dla wszystkich n ∈ . Następnie założenia ( 1 ), ( 5 ), ( 7 ) i ( 8 ) gdzie C := E[| Z |] są spełnione, stąd też ( 2 ) i ( 6 ) i obowiązuje równanie Walda. Jeśli rozkład Z nie jest symetryczny, to ( 9 ) nie zachodzi. Zauważ, że gdy Z nie jest prawie na pewno równe zerowej zmiennej losowej, to ( 11 ) i ( 12 ) nie mogą jednocześnie zachodzić dla żadnej filtracji ( fa n ) n ∈ , ponieważ Z nie może być niezależnym od siebie jako E[ Z 2 ] = (E[ Z ]) 2 = 0 jest niemożliwe.
Przykład, w którym liczba terminów zależy od sekwencji
Niech ( X n ) n ∈ będzie sekwencją niezależnych, symetrycznych i {–1, +1 } -wartościowych zmiennych losowych. Dla każdego niech F n przez σ algebrą generowaną X 1 , . . . , X n i zdefiniuj N = n , gdy X n jest pierwszą zmienną losową przyjmującą wartość +1 . Zauważ, że P( N = n ) = 1/2 n , stąd E[ N ] <∞ przez test ilorazowy . Założenia ( 1 ), ( 5 ) i ( 9 ), stąd ( 4 ) i ( 8 ) przy C = 1 , ( 10 ), ( 11 ) i ( 12 ) są spełnione, stąd też ( 2 ) i ( 6 ) ) i obowiązuje równanie Walda. Jednak ( 7 ) nie zachodzi, ponieważ N jest zdefiniowane w kategoriach sekwencji ( X n ) n ∈ . Intuicyjnie można by oczekiwać, że E[ S N ] > 0 , ponieważ sumowanie zatrzymuje się zaraz po jedynki, w ten sposób najwyraźniej tworzy się dodatnie odchylenie. Jednak równanie Walda pokazuje, że ta intuicja jest myląca.
kontrprzykłady
Kontrprzykład ilustrujący konieczność założenia ( 2 )
Rozważmy identycznie rozłożonych zmiennych losowych sekwencję iid ( niezależnych i 1 z prawdopodobieństwem 1/2 zmiennych losowych, przyjmując każdą z dwóch wartości 0 i właściwie tylko X 1 jest potrzebne w dalszej części). Zdefiniuj N = 1 – X 1 . Wtedy S N jest identycznie równe zeru, stąd E[ S N ] = 0 , ale E[ X 1 ] = 1 / 2 i E [ N ] = 1 / 2 , a zatem równanie Walda nie jest spełnione. Rzeczywiście, założenia ( 1 ), ( 3 ) , ( 4 ) i ( 5 ) wyjątkiem n spełnione, jednak równanie w założeniu ( ) zachodzi dla wszystkich z = 1 .
Kontrprzykład ilustrujący konieczność założenia ( 3 )
Bardzo podobnie do drugiego przykładu powyżej, niech ( X n ) n ∈ będzie sekwencją niezależnych, symetrycznych zmiennych losowych, gdzie X n przyjmuje każdą z wartości 2 n i –2 n z prawdopodobieństwo 1 / 2 . Niech N n będzie pierwszym takim że X = 2 . Wtedy, jak wyżej, N ma skończoną wartość oczekiwaną, stąd założenie ( 5 ) jest spełnione. Ponieważ mi [ X n ] = 0 dla wszystkich n ∈ , założenia ( 1 ) i ( 4 ) są spełnione. Ponieważ jednak S N = 1 prawie na pewno, równanie Walda nie może być spełnione.
Ponieważ N jest czasem zatrzymania w odniesieniu do filtracji generowanej przez ( X n ) n ∈ , założenie ( 2 ) jest spełnione, patrz wyżej. Dlatego tylko założenie ( 3 ) może zawieść, i rzeczywiście, ponieważ
a zatem P. ( N ≥ n ) = 1/2 n –1 dla każdego wynika z tego, że n ∈
Dowód z wykorzystaniem opcjonalnego twierdzenia o zatrzymaniu
Załóżmy ( 1 ), ( 5 ), ( 8 ), ( 10 ), ( 11 ) i ( 12 ). Korzystając z założenia ( 1 ), zdefiniuj sekwencję zmiennych losowych
Założenie ( 11 ) implikuje, że warunkowe oczekiwanie X n dane fa n –1 jest równe mi [ X n ] prawie na pewno dla każdego n ∈ , stąd ( M n ) n ∈ 0 jest martyngałem ze względu na filtrację ( F n ) n ∈ 0 z założenia ( 12 ). Założenia ( 5 ), ( 8 ) i ( 10 ) dają pewność , że możemy zastosować opcjonalne twierdzenie o stopowaniu , stąd M N = S N – T N jest całkowalne i
-
()
Z założenia ( 8 ),
iz powodu założenia ( 5 ) ta górna granica jest całkowalna. Stąd możemy dodać wartość oczekiwaną TN liniowość do obu stron równania ( 13 ) i otrzymać przez
Uwaga: Należy zauważyć, że ten dowód nie obejmuje powyższego przykładu terminami zależnymi .
Dowód ogólny
Dowód ten wykorzystuje tylko monotonne i zdominowane twierdzenia o zbieżności Lebesgue'a . Udowodnimy powyższe stwierdzenie w trzech krokach.
Krok 1: Całkowalność sumy losowej S N
Najpierw pokażemy, że losowa suma S N jest całkowalna. Zdefiniuj sumy częściowe
-
()
Ponieważ N przyjmuje swoje wartości w i ponieważ 0 S = 0 , wynika z tego, że 0
Wynika to z twierdzenia Lebesgue'a o zbieżności monotonicznej
Z nierówności trójkąta
Korzystając z tego górnego oszacowania i zmieniając kolejność sumowania (co jest dozwolone, ponieważ wszystkie wyrazy są nieujemne), otrzymujemy
-
()
gdzie następuje druga nierówność przy użyciu twierdzenia o zbieżności monotonicznej. Z założenia ( 3 ) nieskończony ciąg po prawej stronie ( 15 ) jest zbieżny, stąd S N jest całkowalny.
Krok 2: Całkowalność sumy losowej T N
Pokażemy teraz, że losowa suma T N jest całkowalna. Zdefiniuj sumy częściowe
-
()
liczb rzeczywistych. Ponieważ N przyjmuje swoje wartości w i ponieważ 0 T = 0 , wynika z tego, że 0
Podobnie jak w kroku 1, implikuje to twierdzenie Lebesgue'a o zbieżności monotonicznej
Z nierówności trójkąta
Korzystając z tego górnego oszacowania i zmieniając kolejność sumowania (co jest dozwolone, ponieważ wszystkie wyrazy są nieujemne), otrzymujemy
-
()
Z założenia ( 2 ),
Podstawiając to do ( 17 ) otrzymujemy
TN który jest skończony z założenia ( 3 ), stąd jest całkowalny.
Krok 3: Dowód tożsamości
Aby udowodnić równanie Walda, zasadniczo przechodzimy ponownie przez te same kroki bez wartości bezwzględnej, wykorzystując całkowalność sum losowych S N i T N , aby pokazać, że mają te same oczekiwania.
Wykorzystanie twierdzenia o zdominowanej zbieżności z dominującą zmienną losową | SN _ | a definicja sumy cząstkowej S i podana w ( 14 ), wynika z tego
Ze względu na absolutną zbieżność wykazaną w ( 15 ) powyżej przy użyciu założenia ( 3 ), możemy przeorganizować sumowanie i otrzymać, że
gdzie wykorzystaliśmy założenie ( 1 ) i twierdzenie o zbieżności zdominowanej z dominującą zmienną losową | Xn _ | dla drugiej równości. Ze względu na założenie ( 2 ) i σ-addytywność miary prawdopodobieństwa,
Podstawiając ten wynik do poprzedniego równania, przestawiając sumowanie (co jest dozwolone ze względu na zbieżność bezwzględną, patrz ( 15 ) powyżej), stosując liniowość oczekiwań i definicję częściowej sumy T i oczekiwań podaną w ( 16 ),
Używając ponownie zdominowanej zbieżności z dominującą zmienną losową | T N | ,
Jeżeli założenia ( 4 ) i ( 5 ) są spełnione, to przez liniowość oczekiwań,
To kończy dowód.
Dalsze uogólnienia
- zmienne stosując wersję składnika wartościach R Walda można przenieść na losowe o d , jednowymiarową do każdego
- Jeśli ( X n ) n ∈ są zmiennymi losowymi całkowalnymi Bochnera przyjmującymi wartości w przestrzeni Banacha , to powyższy ogólny dowód można odpowiednio dostosować.
Zobacz też
Notatki
- Wald, Abraham (wrzesień 1944). „O skumulowanych sumach zmiennych losowych” . Roczniki statystyki matematycznej . 15 (3): 283–296. doi : 10.1214/aoms/1177731235 . JSTOR 2236250 . MR 0010927 . Zbl 0063.08122 .
- Wald, Abraham (1945). „Niektóre uogólnienia teorii skumulowanych sum zmiennych losowych” . Roczniki statystyki matematycznej . 16 (3): 287–293. doi : 10.1214/aoms/1177731092 . JSTOR 2235707 . MR 0013852 . Zbl 0063.08129 .
- Blackwell, D.; Girshick, MA (1946). „O funkcjach ciągów niezależnych wektorów szans z zastosowaniami do problemu„ błądzenia losowego ”w k wymiarach” . Ann. Matematyka etatysta . 17 (3): 310–317. doi : 10.1214/aoms/1177730943 .
- Chan, Hock Peng; Fuh, Cheng-Der; Hu, Inchi (2006). „Problem wielorękiego bandyty z relacjami pierwszeństwa”. Szeregi czasowe i tematy pokrewne . Instytut Statystyki Matematycznej Notatki z wykładów - seria monografii. Tom. 52. s. 223–235. arXiv : matematyka/0702819 . doi : 10.1214/074921706000001067 . ISBN 978-0-940600-68-3 . S2CID 18813099 .
Linki zewnętrzne
- „Tożsamość Walda” , Encyklopedia matematyki , EMS Press , 2001 [1994]