Równanie Walda

W teorii prawdopodobieństwa równanie Walda , tożsamość Walda lub lemat Walda jest ważną tożsamością , która upraszcza obliczenie wartości oczekiwanej sumy losowej liczby losowych wielkości . W swojej najprostszej postaci wiąże oczekiwanie sumy losowo wielu skończonych średnich, niezależnych i identycznie rozłożonych zmiennych losowych z oczekiwaną liczbą wyrazów w sumie i wspólną wartością oczekiwaną zmiennych losowych pod warunkiem, że liczba wyrazów w suma jest niezależny od sum.

Równanie nosi imię matematyka Abrahama Walda . Tożsamość dla drugiego momentu jest określona przez równanie Blackwella-Girshicka.

Wersja podstawowa

Niech ( X n ) n będzie sekwencją niezależnych zmiennych losowych o identycznym rozkładzie o wartościach rzeczywistych i niech N ≥ 0 będzie zmienną losową o wartości całkowitej, która jest niezależna od sekwencji ( X n ) n ∈ N {\ Displaystyle \ mathbb {N} } X n ) n . Załóżmy, że N i X n mają skończone oczekiwania. Następnie

Przykład

Rzuć sześciościenną kostką . Weź liczbę na kostce (nazwij ją N ) i rzuć tą liczbą sześciennych kostek, aby otrzymać liczby X 1 , . . . , X N i dodaj ich wartości. Z równania Walda wynikowa wartość wynosi średnio

Wersja ogólna

Niech ( X n ) n będzie nieskończoną sekwencją zmiennych losowych o wartościach rzeczywistych i niech N będzie nieujemną zmienną losową o wartościach całkowitych.

Zakładać, że:

. ( X n ) n całkowalnymi (o skończonej średniej) zmiennymi losowymi,
. E[ X n 1 { N n } ] = E[ X n ] P( N n ) dla każdej liczby naturalnej n , i
. nieskończony szereg spełnia

Następnie losowe sumy

są całkowalne i

Jeśli dodatkowo

. ( X n ) n wszyscy mają takie same oczekiwania i
. N ma skończone oczekiwanie,

Następnie

Uwaga: Zwykle nazwa równania Walda odnosi się do tej ostatniej równości.

Omówienie założeń

Oczywiście założenie ( 1 ) jest potrzebne do sformułowania założenia ( 2 ) i równania Walda. Założenie ( 2 ) kontroluje wielkość dozwolonej zależności między sekwencją ( X n ) n a liczbą N wyrazów; zobacz kontrprzykład poniżej dla konieczności . Zauważ, że założenie ( 2 ) jest spełnione, gdy N jest czasem zatrzymania sekwencji ( X n ) n . [ potrzebne źródło ] Założenie ( 3 ) ma charakter bardziej techniczny, implikuje absolutną zbieżność , a tym samym pozwala na dowolne przegrupowanie nieskończonego szeregu w dowodzie.

Jeśli spełnione jest założenie ( 5 ), to założenie ( 3 ) można wzmocnić do prostszego warunku

. istnieje rzeczywista stała C taka, że ​​E[| Xn _ | 1 { N n } ] ≤ C P( N n ) dla wszystkich liczb naturalnych n .

Rzeczywiście, korzystając z założenia ( 6 ),

  a ostatnia seria równa się wartości oczekiwanej N [ Dowód ] , która z założenia jest skończona ( 5 ). Dlatego ( 5 ) i ( 6 ) implikują założenie ( 3 ).

Załóżmy oprócz ( 1 ) i ( 5 ), że

. N jest niezależne od sekwencji ( X n ) n i
. istnieje stała C taka, że ​​E[| X n |] ≤ C dla wszystkich liczb naturalnych n .

Wtedy wszystkie założenia ( 1 ), ( 2 ), ( 5 ) i ( 6 ), a więc i ( 3 ) są spełnione. W szczególności warunki ( 4 ) i ( 8 ) są spełnione, jeśli

. wszystkie zmienne losowe ( X n ) n mają ten sam rozkład.

Zauważ, że zmienne losowe sekwencji ( X n ) n nie muszą być niezależne.

Interesującym punktem jest dopuszczenie pewnej zależności między losową liczbą N wyrazów a sekwencją ( X n ) n . Standardowa wersja zakłada ( 1 ), ( 5 ), ( 8 ) i istnienie filtracji ( fa n ) n N 0

. N jest czasem zatrzymania w odniesieniu do filtracji, a
. X n i fa n –1 są niezależne dla każdego n .

Wtedy ( 10 ) implikuje, że zdarzenie { N n } = { N n – 1} c jest w F n –1 , a więc przez ( 11 ) niezależne od X n . To implikuje ( 2 ) i razem z ( 8 ) implikuje ( 6 ).

Dla wygody (patrz dowód poniżej przy użyciu opcjonalnego twierdzenia o zatrzymaniu) i aby określić relację sekwencji ( X n ) n i filtracji ( fa n ) n 0 , często nakładane jest następujące dodatkowe założenie:

. sekwencja ( X n ) n jest dostosowana do filtracji ( fa n ) n , co oznacza, że ​​X n jest fa n -mierzalny dla co n .

Zauważ, że ( 11 ) i ( 12 ) razem oznaczają, że zmienne losowe ( X n ) n są niezależne.

Aplikacja

Zastosowanie znajduje się w naukach aktuarialnych , gdy rozważanie całkowitej kwoty roszczenia następuje po złożonym procesie Poissona

w określonym przedziale czasu, powiedzmy jednego roku, wynikającym z losowej liczby N indywidualnych roszczeń ubezpieczeniowych, których rozmiary są opisane zmiennymi losowymi ( X n ) n . Przy powyższych założeniach można zastosować równanie Walda do obliczenia oczekiwanej całkowitej kwoty odszkodowania, gdy dostępne są informacje o średniej liczbie szkód w ciągu roku i średniej wielkości szkody. Przy silniejszych założeniach i większej ilości informacji o podstawowych rozkładach, rekurencja Panjera można użyć do obliczenia rozkładu S N .

Przykłady

Przykład z warunkami zależnymi

Niech N będzie całkowalną zmienną losową o wartościach 0 o wartościach rzeczywistych przy E [ Z ] = 0 . Zdefiniuj X n = (–1) n Z dla wszystkich n . Następnie założenia ( 1 ), ( 5 ), ( 7 ) i ( 8 ) gdzie C := E[| Z |] są spełnione, stąd też ( 2 ) i ( 6 ) i obowiązuje równanie Walda. Jeśli rozkład Z nie jest symetryczny, to ( 9 ) nie zachodzi. Zauważ, że gdy Z nie jest prawie na pewno równe zerowej zmiennej losowej, to ( 11 ) i ( 12 ) nie mogą jednocześnie zachodzić dla żadnej filtracji ( fa n ) n , ponieważ Z nie może być niezależnym od siebie jako E[ Z 2 ] = (E[ Z ]) 2 = 0 jest niemożliwe.

Przykład, w którym liczba terminów zależy od sekwencji

Niech ( X n ) n będzie sekwencją niezależnych, symetrycznych i {–1, +1 } -wartościowych zmiennych losowych. Dla każdego niech F n przez σ algebrą generowaną X 1 , . . . , X n i zdefiniuj N = n , gdy X n jest pierwszą zmienną losową przyjmującą wartość +1 . Zauważ, że P( N = n ) = 1/2 n , stąd E[ N ] <∞ przez test ilorazowy . Założenia ( 1 ), ( 5 ) i ( 9 ), stąd ( 4 ) i ( 8 ) przy C = 1 , ( 10 ), ( 11 ) i ( 12 ) są spełnione, stąd też ( 2 ) i ( 6 ) ) i obowiązuje równanie Walda. Jednak ( 7 ) nie zachodzi, ponieważ N jest zdefiniowane w kategoriach sekwencji ( X n ) n . Intuicyjnie można by oczekiwać, że E[ S N ] > 0 , ponieważ sumowanie zatrzymuje się zaraz po jedynki, w ten sposób najwyraźniej tworzy się dodatnie odchylenie. Jednak równanie Walda pokazuje, że ta intuicja jest myląca.

kontrprzykłady

Kontrprzykład ilustrujący konieczność założenia ( 2 )

Rozważmy identycznie rozłożonych zmiennych losowych sekwencję iid ( niezależnych i 1 z prawdopodobieństwem 1/2 zmiennych losowych, przyjmując każdą z dwóch wartości 0 i właściwie tylko X 1 jest potrzebne w dalszej części). Zdefiniuj N = 1 – X 1 . Wtedy S N jest identycznie równe zeru, stąd E[ S N ] = 0 , ale E[ X 1 ] = 1 / 2 i E [ N ] = 1 / 2 , a zatem równanie Walda nie jest spełnione. Rzeczywiście, założenia ( 1 ), ( 3 ) , ( 4 ) i ( 5 ) wyjątkiem n spełnione, jednak równanie w założeniu ( ) zachodzi dla wszystkich z = 1 .

Kontrprzykład ilustrujący konieczność założenia ( 3 )

Bardzo podobnie do drugiego przykładu powyżej, niech ( X n ) n będzie sekwencją niezależnych, symetrycznych zmiennych losowych, gdzie X n przyjmuje każdą z wartości 2 n i –2 n z prawdopodobieństwo 1 / 2 . Niech N n będzie pierwszym takim że X = 2 . Wtedy, jak wyżej, N ma skończoną wartość oczekiwaną, stąd założenie ( 5 ) jest spełnione. Ponieważ mi [ X n ] = 0 dla wszystkich n , założenia ( 1 ) i ( 4 ) są spełnione. Ponieważ jednak S N = 1 prawie na pewno, równanie Walda nie może być spełnione.

Ponieważ N jest czasem zatrzymania w odniesieniu do filtracji generowanej przez ( X n ) n , założenie ( 2 ) jest spełnione, patrz wyżej. Dlatego tylko założenie ( 3 ) może zawieść, i rzeczywiście, ponieważ

a zatem P. ( N n ) = 1/2 n –1 dla każdego wynika z tego, że n

Dowód z wykorzystaniem opcjonalnego twierdzenia o zatrzymaniu

Załóżmy ( 1 ), ( 5 ), ( 8 ), ( 10 ), ( 11 ) i ( 12 ). Korzystając z założenia ( 1 ), zdefiniuj sekwencję zmiennych losowych

Założenie ( 11 ) implikuje, że warunkowe oczekiwanie X n dane fa n –1 jest równe mi [ X n ] prawie na pewno dla każdego n , stąd ( M n ) n 0 jest martyngałem ze względu na filtrację ( F n ) n 0 z założenia ( 12 ). Założenia ( 5 ), ( 8 ) i ( 10 ) dają pewność , że możemy zastosować opcjonalne twierdzenie o stopowaniu , stąd M N = S N T N jest całkowalne i

 

 

 

 

()

Z założenia ( 8 ),

iz powodu założenia ( 5 ) ta górna granica jest całkowalna. Stąd możemy dodać wartość oczekiwaną TN liniowość do obu stron równania ( 13 ) i otrzymać przez

Uwaga: Należy zauważyć, że ten dowód nie obejmuje powyższego przykładu terminami zależnymi .

Dowód ogólny

Dowód ten wykorzystuje tylko monotonne i zdominowane twierdzenia o zbieżności Lebesgue'a . Udowodnimy powyższe stwierdzenie w trzech krokach.

Krok 1: Całkowalność sumy losowej S N

Najpierw pokażemy, że losowa suma S N jest całkowalna. Zdefiniuj sumy częściowe

 

 

 

 

()

Ponieważ N przyjmuje swoje wartości w i ponieważ 0 S = 0 , wynika z tego, że 0

Wynika to z twierdzenia Lebesgue'a o zbieżności monotonicznej

Z nierówności trójkąta

Korzystając z tego górnego oszacowania i zmieniając kolejność sumowania (co jest dozwolone, ponieważ wszystkie wyrazy są nieujemne), otrzymujemy

 

 

 

 

()

gdzie następuje druga nierówność przy użyciu twierdzenia o zbieżności monotonicznej. Z założenia ( 3 ) nieskończony ciąg po prawej stronie ( 15 ) jest zbieżny, stąd S N jest całkowalny.

Krok 2: Całkowalność sumy losowej T N

Pokażemy teraz, że losowa suma T N jest całkowalna. Zdefiniuj sumy częściowe

 

 

 

 

()

liczb rzeczywistych. Ponieważ N przyjmuje swoje wartości w i ponieważ 0 T = 0 , wynika z tego, że 0

Podobnie jak w kroku 1, implikuje to twierdzenie Lebesgue'a o zbieżności monotonicznej

Z nierówności trójkąta

Korzystając z tego górnego oszacowania i zmieniając kolejność sumowania (co jest dozwolone, ponieważ wszystkie wyrazy są nieujemne), otrzymujemy

 

 

 

 

()

Z założenia ( 2 ),

Podstawiając to do ( 17 ) otrzymujemy

TN który jest skończony z założenia ( 3 ), stąd jest całkowalny.

Krok 3: Dowód tożsamości

Aby udowodnić równanie Walda, zasadniczo przechodzimy ponownie przez te same kroki bez wartości bezwzględnej, wykorzystując całkowalność sum losowych S N i T N , aby pokazać, że mają te same oczekiwania.

Wykorzystanie twierdzenia o zdominowanej zbieżności z dominującą zmienną losową | SN _ | a definicja sumy cząstkowej S i podana w ( 14 ), wynika z tego

Ze względu na absolutną zbieżność wykazaną w ( 15 ) powyżej przy użyciu założenia ( 3 ), możemy przeorganizować sumowanie i otrzymać, że

gdzie wykorzystaliśmy założenie ( 1 ) i twierdzenie o zbieżności zdominowanej z dominującą zmienną losową | Xn _ | dla drugiej równości. Ze względu na założenie ( 2 ) i σ-addytywność miary prawdopodobieństwa,

Podstawiając ten wynik do poprzedniego równania, przestawiając sumowanie (co jest dozwolone ze względu na zbieżność bezwzględną, patrz ( 15 ) powyżej), stosując liniowość oczekiwań i definicję częściowej sumy T i oczekiwań podaną w ( 16 ),

Używając ponownie zdominowanej zbieżności z dominującą zmienną losową | T N | ,

Jeżeli założenia ( 4 ) i ( 5 ) są spełnione, to przez liniowość oczekiwań,

To kończy dowód.

Dalsze uogólnienia

  • zmienne stosując wersję składnika wartościach R Walda można przenieść na losowe o d , jednowymiarową do każdego
  • Jeśli ( X n ) n są zmiennymi losowymi całkowalnymi Bochnera przyjmującymi wartości w przestrzeni Banacha , to powyższy ogólny dowód można odpowiednio dostosować.

Zobacz też

Notatki

Linki zewnętrzne